王小川团队发布新的大模型Baichuan-53B,这是继Baichuan-7B和Baichuan-13B之后的第三个大模型产品,但与前两款不同,这次选择闭源商业化。这款53B模型规模达到530亿参数,是王小川团队迄今为止参数量最大的模型,结合了搜索技术,增强了对抗生成和时效性等方面的能力。王小川表示商业化的时机已到,53B闭源有利于直接面向企业客户商业化运营,开放模型权重被指将导致AI失控,Meta遭举牌抗议。AI领域开源与闭源选择存在分歧,但大模型时代开源力量崛起,Meta因开源陷入麻烦,抗议者质疑开放模型权重安全性,LeCun则表态开源AI不可阻挡。

港中大开发的MathCoder大模型在数学推理方面超过了GPT-4,能够无缝集成代码解决数学问题。MathCoder在MATH和GSM8K数据集上取得了优秀成绩,展现出强大的数学解题能力。论文地址:https://browse.arxiv.org/pdf/2310.03731.pdf

微软宣布将OpenAI最新模型DALL-E3集成在Bing Chat和Bing Image Create中,并免费提供给用户使用。DALL-E3是一款类Midjourney产品,通过文本就能生成二次元、3D、朋克、涂鸦等多种类型图片。微软表示,为了保证用户通过Bing Image Creator创建的内容的安全性,已经在生成的图片中内置了符合C2PA规范的数字水印。用户在创建图片的过程中,提供的文本细节越多、描述越丰富,最终生成的图片也就越精准。

百度宣布将于10月17日举行“百度世界大会2023”,李彦宏透露将带来文心一言、搜索、地图、网盘等应用产品的全新亮相。李彦宏将在主题演讲中分享AI原生应用的心得,重点介绍生成式AI的想象和创新空间。文心一言将进行再次升级,发挥在生活生产中的更重要作用。百度搜索、地图、网盘等应用将带来全新亮相,提供更好的用户体验。

微软OneDrive将迎来全新升级:Copilot将为用户提供更多AI功能。升级版OneDrive整合Copilot人工智能功能,帮助用户更便捷地管理文件。OneDrive Copilot可自动生成文件内容摘要,提高文件搜索效率。OneDrive Copilot可预测用户需求,建议将相关文件归类到同一文件夹。OneDrive将推出人工智能搜索功能,可在2024年初公测。

谷歌为Google Assistant注入AI新功能。谷歌在Made by Google活动上为Google Assistant注入了新的AI功能,如与Bard的融合、理解更自然的语音命令、电话体验优化等,以提升其在语音助手市场的地位。Assistant with Bard将成为更加智能的语音助手,可以理解更自然的语音交互方式,电话筛选和垃圾电话过滤功能加强。

原百度AI高管景鲲和朱凯华离职将联手创业。两人在语音交互领域积累了丰富经验,计划联手创业。据悉,他们的创业项目会结合大模型技术,目标是打造语音交互一体化解决方案。业内人士认为,两人在软硬件结合方面的经验,将会是创业过程中的优势。景鲲和朱凯华分别曾任小度科技CEO和CTO,景鲲被称为“小冰之父”,二人均有软硬件结合经验,擅长语音交互领域。

Windows12将于2024年推出:AI功能刺激更新需求。英特尔高管在公开场合透露,微软可能会在2024年推出Windows12操作系统,以刺激用户对新系统的更新需求。微软近期在Windows11中加入AI功能,Windows12可能会进一步整合AI。Windows12开发已在加速,正式发布时间表与2024年秋季吻合。

淘宝:国庆期间AI修图服务搜索量周环比暴增数十倍。淘宝数据显示,国庆期间淘宝上AI修图服务搜索量周环比暴增数十倍,景点代打卡等“懒人旅游”服务也大受欢迎。淘宝上境内外旅游门票预订大幅增长,代打卡、代P图等“懒人旅游”服务火爆。

百万网友围观DALL-E3新玩法!钢铁侠特斯拉皆“中招”。最近DALL-E3在网友手中玩出了多种新玩法,比如整齐摆放物品,生成各类难以拍摄的产品照片,配合提示词可生成不同风格图像。这种风格叫做knolling,重点在于摆放整齐,也是不少产品摄影的表达方式。DALL-E3可将物品整齐摆放,生成有趣的组合照片,比如电影人物的身体部件平铺照。DALL-E3可轻松生成正常拍摄困难的产品组合照,如特斯拉全系列车型。添加提示词可让DALL-E3生成不同风格的图像,非常适合产品摄影创作。

研究人员称,即使是最糟糕Claude AI版本也比GPT3.5更好。根据Chatbot Arena排行榜,Anthropic的Claude模型在性能上超越了OpenAI的GPT-3.5,即使是最差的Claude版本也优于ChatGPT免费版的GPT-3.5。Claude模型在排名上整体领先GPT-3.5,排名考量了上下文处理能力、长文本生成等多个维度,排名结果将影响用户选择ChatGPT或Claude。

宾夕法尼亚州立大学研发出“电子舌头”,有望赋能AI品尝美食。宾夕法尼亚州立大学研究团队最近研发出一种基于石墨烯的电子“舌头”,可以检测不同味道,为人工情感智能的发展带来重大突破。研究团队研发出基于石墨烯的电子“舌头”,能检测不同味道,实现AI“品尝”功能。研究关注将情感智能引入AI,通过仿效人类味觉过程使AI更人性化。创新可应用于智能饮食推荐等领域,未来可拓展到视觉、听觉等其他感官的AI。

AMD蓄势待发准备挑战英伟达的人工智能霸主地位。AMD正在加紧挑战英伟达在AI市场近乎垄断的地位,凭借与PyTorch的合作和微软的支持,有望颠覆现状。AMD一直在默默取得进展,开发了CUDA转换工具,即将推出的Instinct MI300A处理器具有竞争力。AMD与PyTorch合作,为后者提供AMD GPU支持,也获得了微软的战略支持。AMD有可能借助战略合作伙伴关系,在AI市场颠覆英伟达的垄断地位。

聚焦开发者浙大校友联手微软开源LLaVA-1.5,硬刚GPT-4V。最近威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员联手开源了新型多模态模型LLaVA-1.5,在多个基准测试中实现SOTA,展现出强大的多模态理解能力,被认为可与GPT-4V形成正面竞争。LLaVA-1.5在11项基准测试实现了SOTA,使用8块A100GPU,LLaVA-1.5的训练仅需1天时间即可完成。LLaVA-1.5在多模态理解上超越GPT-4V,可对其形成有力竞争。LLaVA-1.5采用最简单的架构和公开数据集,性能显著提升。

OnnxStream:可在树莓派Zero2上运行Stable Diffusion1.5。OnnxStream是一款内存占用极低的机器学习推理引擎,可在内存仅512MB的树莓派Zero2设备上运行Stable Diffusion1.5等大型深度学习模型。OnnxStream通过出色的内存管理,可极大降低模型运行时的RAM占用。OnnxStream支持多种功能以适应资源受限环境,如权重加载器、注意力切片等。OnnxStream实现了跨平台支持,可灵活运行在Linux、Windows、Mac和Termux等系统。

StreamingLLM:让AI模型无限期平稳运行的一种方法。Meta、麻省理工和卡内基梅隆的研究人员提出StreamingLLM技术,通过在对话不同阶段重新引入初始标记,解决了LLM在长时间对话中性能下降的问题,使其能够在无限长度文本上保持高性能。StreamingLLM利用attention sinks的概念,在对话不同阶段重新引入初始标记,使LLM能够在无限长度文本上保持高性能。研究人员提出了使用单个特殊标记作为attention sink来稳定LLM的关注机制,保持其在长时间对话中的高性能。

全新图文生成方式MiniGPT-5生成文本的同时创作匹配的图片。MiniGPT-5是一款基于大型语言模型的视觉与语言协同生成工具,通过生成vokens实现图像文本协同生成。MiniGPT-5实现图像文本协同生成,用户可输入文本生成图像或输入图像生成文本。MiniGPT-5通过两阶段训练提高模型鲁棒性,无需详细描述进行训练。MiniGPT-5在多个数据集上表现出色,是多模态生成有力工具。

轻量级代码库分析工具ctoc开源。ctoc是一个轻量级的代码库分析工具,基于gocloc,可以快速统计代码库中的令牌数量,支持多种语言和输出格式,对理解代码库复杂性和与不同LLM模型互操作很有帮助。ctoc可以快速统计代码库中的令牌数量,分析复杂性。支持多种编程语言,可以轻松统计不同语言的令牌数。提供多种输出格式,支持与不同LLM模型互操作。

最新快讯

2025年10月30日

00:52
2025年10月29日,全球领先的铜生产商南方铜业正式发布其未来资本支出计划,预计2026年度资本投入将达到约20亿美元。这一雄心勃勃的投资方案将重点投向产能扩张和矿山开发两大核心领域,旨在通过技术升级与资源整合,全面提升公司的生产效率与市场竞争力。 南方铜业表示,此次大规模资本投入的核心目标之一是加速实现其长期战略规划。公司明确将目标锁定在2030年代...
00:52
2025年10月30日,沙特主权财富基金PIF正式公布其未来发展战略,将集中资源打造六大核心产业生态系统。这一前瞻性计划全面覆盖旅游观光与娱乐体验、城市开发与宜居环境建设、高端制造与创新科技应用、工业物流体系现代化升级,以及清洁能源与可再生基础设施发展等关键领域。作为沙特经济转型的重要举措,该计划的核心目标在于推动经济多元化发展,逐步降低对石油产业的依赖,从...
00:52
2025年第四季度,南方铜业公司传来积极信号,预计铜产量将迎来局部性恢复。公司方面透露,通过实施精细化生产流程优化和设备维护升级方案,部分矿区的产能正逐步回升。此次产能恢复主要集中在运营条件得到显著改善的特定矿区,显示出公司对生产效率提升的坚定决心。 与此同时,南方铜业还宣布了降本增效的阶段性目标,预计现金成本将有效降低,整体运营效率得到显著提升。这一系...
00:10
2025年10月29日,通用汽车公司正式宣布了一项重大人事调整计划,将大幅裁减底特律电动车工厂的岗位数量,总计高达1200个。与此同时,位于田纳西州和俄亥俄州的电池生产工厂也将进行数百人的裁员。这一系列裁员措施主要聚焦于电动车型及电池制造部门,其核心目标在于通过优化成本结构,进一步调整和优化产能布局,以适应市场变化和公司战略需求。 通用汽车在公告中强调,对于...
00:10
北京现代全新纯电紧凑型SUV EO羿欧今日正式揭开神秘面纱,正式公布指导价11.98万元起,为消费者带来前所未有的电动出行体验。这款备受瞩目的新车不仅拥有极具吸引力的价格,更在续航能力、科技配置和设计美学上实现了全面突破,成为同级市场中不可多得的实力之选。 新车提供三种不同续航版本,充分满足不同用户的出行需求。其中CLTC标准下最长续航版本达到了惊人的722...
00:10
2025年10月28日,沙特阿美公司总裁阿明·纳赛尔在利雅得公开表示,全球能源需求正呈现持续增长态势,而这一增长趋势主要由发展中国家所推动。根据他的预测,到2026年,全球日均石油需求量预计将增加110万至140万桶。纳赛尔特别强调,尽管全球范围内能源转型正在不断推进,但发展中国家的工业化和人口增长仍然是能源消费持续上升的核心动力。这一观点深刻反映了国际能源...
00:10
2025年10月29日,一则引人注目的商业动态在汽车行业掀起波澜:备受瞩目的保时捷-皮耶希家族正积极酝酿对大众汽车旗下核心业务部门——估值高达60亿欧元的柴油发动机业务——进行战略投资。作为大众汽车的重要股东,这一潜在投资不仅彰显了该家族对传统动力技术的深厚兴趣,更凸显了其在汽车工业电动化转型浪潮中,对核心技术的坚守与布局。 据悉,此次潜在投资将聚焦于德国本...
00:10
央视财经最新报道显示,我国新能源汽车市场正经历前所未有的高速增长,今年9月渗透率已强势突破58%大关,展现出强劲的市场活力与消费潜力。在近日举办的金融街论坛年会上,新能源汽车保险议题成为行业热议焦点,引发与会嘉宾的深度探讨与广泛关注。 金融监管总局最新发布的数据进一步印证了这一趋势,今年前9个月新能源汽车商业险投保率高达91%,较传统燃油车高出6个百分点,这...

2025年10月29日

23:32
特斯拉最新发布的FSD V14版本在真实路况测试中遭遇重大挫折,其"脱手驾驶里程"表现远未达到市场预期。据汽车媒体electrek最新报道,该版本在实测中仅达到732英里,这一数据不仅远低于行业普遍期待的1000英里以上标准,更与特斯拉自身此前宣传的持续进步形成鲜明反差。部分内测车主反馈系统存在严重识别缺陷,例如将转向灯误判为停车信号的情况频发,导致车辆在路...
23:32
2025年10月29日,备受瞩目的具身智能3D数字人开放平台“魔珐星云”在北京盛大发布,正式宣告魔珐科技在虚拟人领域的重大突破。这一创新平台专为开发者量身打造,提供从3D虚拟人建模、驱动到交互的全栈式解决方案,彻底革新了数字人开发的技术生态。通过深度融合AIGC(人工智能生成内容)与具身智能技术,魔珐星云能够实现前所未有的高精度表情与动作生成,无论是细腻的面...
23:32
2025年10月29日,资本市场传来多家上市公司的最新业务动态,行业布局与技术进展备受关注。苏盐井神在互动平台表示,其储能业务目前仍处于发展初期,尚未形成稳定收益,但公司正积极拓展市场,加大研发投入,未来有望实现规模化盈利。多氟多则透露已成功布局全系列大圆柱电池产品线,覆盖不同应用场景,为新能源汽车和储能领域提供多样化解决方案。 在存储芯片领域,雅创电子强调...
23:32
2025年10月29日,广和通正式宣布其革命性的视觉融合激光雷达定位方案已成功实现大规模量产出货。该方案作为公司新一代Fibot具身智能机器人开发平台的核心配置,不仅大幅提升了机器人的环境感知与自主导航能力,更已成功应用于PI公司最新研发的通用视觉-语言-动作模型兀0.5的数据采集工作,为人工智能模型的训练提供了强大的硬件支持。 与此同时,广和通与前沿科技企...