欢迎来到【AI日报】栏目!这里是您每日探索人工智能世界的权威指南,我们为您精选并呈现AI领域的最新热点内容,始终聚焦开发者群体,助您洞悉前沿技术趋势,深入了解创新AI产品的实际应用。新鲜出炉的AI产品推荐,点击了解详情:https://top.aibase.com/1

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图

智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型
智谱公司正式宣布推出并开源了全球参数量达100B且效果最佳的视觉推理模型GLM-4.5V,这一重要成果标志着该公司在迈向通用人工智能(AGI)的道路上迈出了坚实一步。AiBase特别提要:? GLM-4.5V总参数量高达106B,在41个视觉多模态榜单中均达到SOTA(State-of-the-Art)性能水平;? 该模型具备全场景视觉推理能力,涵盖图像推理、视频理解、GUI任务等多种应用场景;? 新增”思考模式”开关,可灵活平衡推理效率与效果;? API调用价格极具竞争力,输入成本仅为2元/M tokens,输出成本为6元/M tokens。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图1

阿里达摩院开源三项具身智能核心技术
在世界机器人大会上,阿里达摩院隆重宣布开源三项自研的具身智能核心技术:VLA模型RynnVLA-001-7B、世界理解模型RynnEC以及机器人上下文协议RynnRCP。这一战略举措旨在推动数据、模型与机器人本体的兼容适配,为具身智能开发提供完整的解决方案。AiBase特别提要:? 开源的三项核心技术包括VLA模型、世界理解模型和机器人上下文协议;? RynnRCP实现了从传感器数据到机器人动作执行的完整工作流程;?️ RynnVLA-001从第一人称视角视频学习人类操作技能;? RynnEC从11个维度全面解析场景物体,无需依赖3D模型。详情链接:https://github.com/alibaba-damo-academy/RynnRCP

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图2

苹果即将升级 Apple Intelligence 至 GPT-5,推动 Siri 与写作工具智能化
苹果公司近日正式宣布,计划在即将发布的iOS26、iPadOS26和macOS Tahoe26系统更新中,将其Apple Intelligence中的ChatGPT核心模型升级至最新的GPT-5版本。这一重大升级将显著提升Siri、写作工具和视觉智能的整体性能。AiBase特别提要:? 苹果将在iOS26等系统更新中将ChatGPT模型升级至GPT-5,全面增强Siri、写作工具和视觉智能的功能;? 新版本将引入多语言实时翻译及屏幕内容分析功能,大幅提升设备在跨语言交流和信息处理方面的能力;? 苹果还首次向开发者开放设备端API,支持第三方应用接入,提供低延迟和高隐私的AI体验。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图3

高德全面接入通义大模型 推出首个地图AI原生Agent
阿里巴巴集团旗下高德地图联合通义实验室发布全球首个AI原生地图,正式推出”小高老师”智能体,实现全链路语音交互与复杂任务推理导航。AiBase特别提要:?️ 内置智能体”小高老师”,支持音频/文本等多模态交互,支持随时打断的全双工语音;? 基于36万亿token预训练的Qwen大模型,实现空间语义深度理解与高效调度近百种内部工具;?️ 联合推出复杂POI推理Agent,可拆解多重约束并整合实时信息,提供精准推荐与导航;? 依托自研DeepResearch框架,具备规划、反思、工具调用等完整Agent能力。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图4

宇树科技将出征首届世界人形机器人运动会,硬件将被多队采用
宇树科技将于8月14日至17日参加首届世界人形机器人运动会。宇树公司透露,除其自有团队外,赛场上还将有多支队伍使用宇树机器人硬件参赛,但会搭配各自自研的算法。AiBase特别提要:? 除宇树自有团队外,赛场上还将有多个队伍使用宇树的机器人硬件参赛,但会搭配各自研发的算法;?️ 此次运动会汇聚了天工、加速进化、松延动力、傅利叶、星海图等国内头部人形机器人企业,以及来自美国、德国、澳大利亚、巴西、日本等16个国家的共计280支队伍;? 宇树科技的参与不仅展示了其在人形机器人硬件方面的实力,也体现了其设备在开放生态中的广泛应用和竞争力。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图5

Claude AI推出历史对话记忆功能,支持多背景切换
Anthropic为Claude AI上线了”记忆功能”,可自动记忆并复用用户历史对话中的背景信息,实现跨会话无缝衔接,并支持多背景隔离切换,目前仅向付费用户开放。AiBase特别提要:? 支持为不同项目设定独立背景,工作/生活场景一键切换,保持上下文延续;? 先行面向Claude Max、Team、Enterprise付费用户,Pro版后续跟进,免费用户暂未开放;⚙️ 用户可在”设置—搜索和参考聊天”中手动启用或查看记忆内容;? 与ChatGPT手动预设不同,Claude采用自动提取机制,体验更”无感”但可控性稍弱。

360智脑推出Light-IF系列模型 显著提升复杂指令遵循能力
360智脑发布Light-IF系列模型,以”预览-自检式推理+信息熵控制”框架专治”懒惰推理”,在四大基准测试中全面领先,小参数模型即可越级挑战大模型,并全部开源。AiBase特别提要:? 创新Light-IF框架:难度感知指令生成→Zero-RL强化→推理模式过滤→熵保持冷启动→熵自适应正则,显著抑制”只会复述不检查”的懒惰推理;? 权威评测霸榜:Light-IF-32B在SuperCLUE拿下0.575分,领先第二名13.9个百分点;Light-IF-1.7B小模型反超Qwen3-235B-A22B等超大模型;? 全面开源:模型权重将陆续上线Hugging Face,冷启动数据集与训练代码同步发布GitHub,并联合SuperCLUE推出中文评测基准SuperCLUE-CPIFOpen。

字节跳动推出视频字幕无痕擦除方案 基于DiT大模型打造
字节跳动发布全球首个基于DiT大模型的”视频字幕无痕擦除”方案,实现像素级修复、多语言适配、一键”擦除-翻译-口型同步”,助力短剧出海与跨境电商全球化。AiBase特别提要:?️ 两大核心:DiT视频字幕擦除大模型+字体级分割模型,像素级精准修复,告别马赛克/模糊/闪烁;? 多语言支持:突破中英限制,覆盖小语种,形成”擦除-翻译-口型同步”一站式闭环;⚙️ 工程落地:万集数据验证,成功率100%;分布式分镜计算,效率提升数倍。详情地址:https://console.volcengine.com/vod/

昆仑万维发布开源世界模型Matrix-Game2.0:实时生成分钟级高连贯视频
昆仑万维发布全球首个开源交互式世界模型Matrix-Game2.0,实时生成分钟级25fps高连贯视频,支持无语言提示的纯视觉驱动交互,已在GTA、Minecraft等场景落地。AiBase特别提要:? 开源首发:业内首个通用场景实时长序列开源世界模型,持续迭代全面开放;? 分钟级生成:25fps连续视频,物理规律与场景语义理解大幅提升,可直接用于游戏/影视/VR;? 视觉驱动交互:摒弃语言提示,3D因果VAE+多模态扩散Transformer逐帧响应用户动作,跨域适应多风格场景。

昆仑万维开源Matrix-3D大模型:用单张图像可生成高质量全景视频
昆仑万维开源Matrix-3D:单张图像即可生成360°可漫游3D全景视频,轨迹一致、几何精准,全面开放代码与数据集。AiBase特别提要:? 单图生成3D世界:打破多视角依赖,直接由单张图像产出高质量全景视频与可探索3D场景;? 轨迹引导一致性:用Mesh渲染图驱动扩散模型,保证相机轨迹下的时空一致,减少伪影与遮挡;⚙️ 双路径重建:超分+结构优化慢工出细活;Transformer前馈网络极速推理,兼顾质量与效率。详情:https://github.com/SkyworkAI/Matrix-3D

最新快讯

2025年10月02日

20:25
2025年10月2日,OpenAI迎来历史性时刻,成功完成约66亿美元的股份转让,这一壮举使其估值飙升至令人惊叹的5000亿美元,正式跻身全球最贵初创公司的行列。这一里程碑不仅彰显了OpenAI在人工智能领域的卓越成就,更预示着AI技术的无限潜能与广阔前景。 在战略布局方面,OpenAI宣布与日本数字厅达成深度战略合作,双方将携手推动AI技术在公共领域的创新...
20:25
在汽车行业经历深刻变革的浪潮中,极氪凭借自主研发的尖端技术成功突破了传统豪华车市场的壁垒。该品牌推出的极氪9X车型采用不计成本的研发模式,搭载了1400匹马力的三电机混动电驱系统,其动力表现堪比顶级超跑,为消费者带来了前所未有的驾驶体验。 极氪9X的突破性进展不仅体现在动力系统上,更在于其与宁德时代联合研发的900V混动专用电池。这一创新技术使得该车型实...
19:54
2025年10月2日,黄海南部及山东南部、江苏北部近岸海域将迎来一次由出海气旋引发的风浪天气。受其影响,该区域预计将出现中到大浪,浪高可达2至3.4米,风力强劲。国家海洋预报台已紧急发布海浪蓝色警报,提醒公众密切关注天气变化。此次大浪预计将持续至10月3日上午,相关部门已启动应急响应机制。海事部门特别提醒海上作业船只加强航行安全管控,及时调整作业计划,沿海单...
19:54
2025年10月2日,国泰海通总裁郁伟君在重要场合发表观点,强调“并购六条”政策及退市制度的完善对并购市场环境的显著优化作用。他指出,这些改革不仅大幅提升了交易效率,更增强了市场灵活性,为各类企业提供了更为广阔的发展空间。郁伟君特别提到,国家正积极鼓励龙头企业通过并购手段在半导体、生物医药、新能源等战略性新兴产业中实现做优做强,这一战略导向为投行提供了前所未...
19:54
Steam最新公布的2025年9月软硬件调查报告揭示了令人瞩目的市场动态。在显卡领域,RTX 4060笔记本显卡凭借0.22%的份额增长强势回归,再次登顶显卡占有率榜首。值得注意的是,桌面版RTX 4060却出现0.6%的份额下滑,跌至第三位。这一变化反映出消费者对移动端高性能显卡需求的持续升温。 在操作系统方面,Windows 11的份额实现了显著增长,增...
19:54
2025年10月2日,备受瞩目的岚图汽车科技股份有限公司正式向香港联合交易所提交上市申请,计划以介绍方式登陆港股市场。作为东风公司倾力打造的高端智慧新能源品牌,岚图不仅是中国首个实现20万辆整车下线的央国企高端新能源车企,更以其卓越的市场表现和前瞻性的战略布局,在行业格局中占据重要地位。 自2022年至2024年,岚图汽车销量复合增长率高达103.2%,...
19:22
交通运输部最新监测数据显示,10月5日全国公路路网将迎来国庆假期第二个出行小高峰。今年国庆长假期间,中长距离公路出行需求显著攀升,小客车自驾出行比例高达近八成,成为假期主要出行方式。其中,新能源车辆表现尤为抢眼,日均使用量达到1250万辆,占日均总流量五分之一,较去年同期激增约30%,展现出强劲的增长势头。 国家能源局最新统计报告显示,国庆当日高速公路充电量...
19:22
行业消息人士透露,大疆将于今年11月迎来产品线的大规模更新,旗下Neo 2轻型无人机、Mic 3 Pro麦克风以及Osmo Mobile 8手机稳定器将同步亮相,为用户带来全方位的影像创作升级体验。 Neo 2无人机在续航能力上实现了显著突破,配备166 mAh电池可支持超18分钟的飞行时间,同时创新性地采用双层桨叶保护罩设计,大幅提升抗风与抗冲击性能。...
19:22
10月1日,国庆假期迎来客流首日,重庆火车站迎来年度客流高峰,当日累计发送旅客高达36.8万人次,刷新了该站单日客发量的历史纪录。这一数据不仅超越了往年的国庆假期客流峰值,更比2025年“五一”假期单日最高客发量增加了整整3.9万人次,充分展现了市民出行热情的持续高涨。面对如此庞大的客流压力,铁路部门迅速启动应急预案,采取了一系列有力措施确保旅客出行顺畅。具...
19:22
星展集团研究部最新发布的研究报告,对紫金黄金国际的未来发展前景给予了高度评价。报告指出,凭借其庞大的黄金储备规模以及卓越的海外资产整合能力,紫金黄金国际有望在盈利能力和增长表现上持续领跑行业。作为紫金矿业海外黄金资产的核心上市平台,该公司展现出令人瞩目的增长潜力,未来发展空间巨大。 报告详细分析了紫金黄金国际的财务状况和业务布局,认为其在黄金资源掌控、海外市...
19:22
斯巴鲁力狮轿车在美国市场掀起了一股意外热潮。尽管这款经典车型已于9月12日在印第安纳州工厂正式停产,但其在当月的销量却逆势上扬,售出1884辆,同比增长8.3%,成为斯巴鲁品牌当月唯一实现销量增长的车型。最后一辆下线的磁铁灰限量版力狮,不仅是一辆汽车,更是这款经典家用轿车时代的象征性落幕之作。 自1989年首次问世以来,力狮凭借其独特的水平对置发动机与AWD...
19:22
大和证券资深分析师John Choi近期发布了一份深度行业报告,指出随着人工智能技术的全面渗透,中国云基础设施市场正迎来前所未有的发展机遇。报告特别强调,作为中国云计算领域的领军企业,阿里巴巴凭借其前瞻性的战略布局,有望在未来几年内实现跨越式增长。 John Choi在报告中详细阐述了人工智能技术对各行业带来的颠覆性变革,并指出云基础设施作为AI发展的基...