欢迎来到【AI日报】栏目!这里是您每日探索人工智能世界的权威指南,我们为您精选并呈现AI领域的最新热点内容,始终聚焦开发者群体,助您洞悉前沿技术趋势,深入了解创新AI产品的实际应用。新鲜出炉的AI产品推荐,点击了解详情:https://top.aibase.com/1

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图

智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型
智谱公司正式宣布推出并开源了全球参数量达100B且效果最佳的视觉推理模型GLM-4.5V,这一重要成果标志着该公司在迈向通用人工智能(AGI)的道路上迈出了坚实一步。AiBase特别提要:? GLM-4.5V总参数量高达106B,在41个视觉多模态榜单中均达到SOTA(State-of-the-Art)性能水平;? 该模型具备全场景视觉推理能力,涵盖图像推理、视频理解、GUI任务等多种应用场景;? 新增”思考模式”开关,可灵活平衡推理效率与效果;? API调用价格极具竞争力,输入成本仅为2元/M tokens,输出成本为6元/M tokens。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图1

阿里达摩院开源三项具身智能核心技术
在世界机器人大会上,阿里达摩院隆重宣布开源三项自研的具身智能核心技术:VLA模型RynnVLA-001-7B、世界理解模型RynnEC以及机器人上下文协议RynnRCP。这一战略举措旨在推动数据、模型与机器人本体的兼容适配,为具身智能开发提供完整的解决方案。AiBase特别提要:? 开源的三项核心技术包括VLA模型、世界理解模型和机器人上下文协议;? RynnRCP实现了从传感器数据到机器人动作执行的完整工作流程;?️ RynnVLA-001从第一人称视角视频学习人类操作技能;? RynnEC从11个维度全面解析场景物体,无需依赖3D模型。详情链接:https://github.com/alibaba-damo-academy/RynnRCP

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图2

苹果即将升级 Apple Intelligence 至 GPT-5,推动 Siri 与写作工具智能化
苹果公司近日正式宣布,计划在即将发布的iOS26、iPadOS26和macOS Tahoe26系统更新中,将其Apple Intelligence中的ChatGPT核心模型升级至最新的GPT-5版本。这一重大升级将显著提升Siri、写作工具和视觉智能的整体性能。AiBase特别提要:? 苹果将在iOS26等系统更新中将ChatGPT模型升级至GPT-5,全面增强Siri、写作工具和视觉智能的功能;? 新版本将引入多语言实时翻译及屏幕内容分析功能,大幅提升设备在跨语言交流和信息处理方面的能力;? 苹果还首次向开发者开放设备端API,支持第三方应用接入,提供低延迟和高隐私的AI体验。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图3

高德全面接入通义大模型 推出首个地图AI原生Agent
阿里巴巴集团旗下高德地图联合通义实验室发布全球首个AI原生地图,正式推出”小高老师”智能体,实现全链路语音交互与复杂任务推理导航。AiBase特别提要:?️ 内置智能体”小高老师”,支持音频/文本等多模态交互,支持随时打断的全双工语音;? 基于36万亿token预训练的Qwen大模型,实现空间语义深度理解与高效调度近百种内部工具;?️ 联合推出复杂POI推理Agent,可拆解多重约束并整合实时信息,提供精准推荐与导航;? 依托自研DeepResearch框架,具备规划、反思、工具调用等完整Agent能力。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图4

宇树科技将出征首届世界人形机器人运动会,硬件将被多队采用
宇树科技将于8月14日至17日参加首届世界人形机器人运动会。宇树公司透露,除其自有团队外,赛场上还将有多支队伍使用宇树机器人硬件参赛,但会搭配各自自研的算法。AiBase特别提要:? 除宇树自有团队外,赛场上还将有多个队伍使用宇树的机器人硬件参赛,但会搭配各自研发的算法;?️ 此次运动会汇聚了天工、加速进化、松延动力、傅利叶、星海图等国内头部人形机器人企业,以及来自美国、德国、澳大利亚、巴西、日本等16个国家的共计280支队伍;? 宇树科技的参与不仅展示了其在人形机器人硬件方面的实力,也体现了其设备在开放生态中的广泛应用和竞争力。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图5

Claude AI推出历史对话记忆功能,支持多背景切换
Anthropic为Claude AI上线了”记忆功能”,可自动记忆并复用用户历史对话中的背景信息,实现跨会话无缝衔接,并支持多背景隔离切换,目前仅向付费用户开放。AiBase特别提要:? 支持为不同项目设定独立背景,工作/生活场景一键切换,保持上下文延续;? 先行面向Claude Max、Team、Enterprise付费用户,Pro版后续跟进,免费用户暂未开放;⚙️ 用户可在”设置—搜索和参考聊天”中手动启用或查看记忆内容;? 与ChatGPT手动预设不同,Claude采用自动提取机制,体验更”无感”但可控性稍弱。

360智脑推出Light-IF系列模型 显著提升复杂指令遵循能力
360智脑发布Light-IF系列模型,以”预览-自检式推理+信息熵控制”框架专治”懒惰推理”,在四大基准测试中全面领先,小参数模型即可越级挑战大模型,并全部开源。AiBase特别提要:? 创新Light-IF框架:难度感知指令生成→Zero-RL强化→推理模式过滤→熵保持冷启动→熵自适应正则,显著抑制”只会复述不检查”的懒惰推理;? 权威评测霸榜:Light-IF-32B在SuperCLUE拿下0.575分,领先第二名13.9个百分点;Light-IF-1.7B小模型反超Qwen3-235B-A22B等超大模型;? 全面开源:模型权重将陆续上线Hugging Face,冷启动数据集与训练代码同步发布GitHub,并联合SuperCLUE推出中文评测基准SuperCLUE-CPIFOpen。

字节跳动推出视频字幕无痕擦除方案 基于DiT大模型打造
字节跳动发布全球首个基于DiT大模型的”视频字幕无痕擦除”方案,实现像素级修复、多语言适配、一键”擦除-翻译-口型同步”,助力短剧出海与跨境电商全球化。AiBase特别提要:?️ 两大核心:DiT视频字幕擦除大模型+字体级分割模型,像素级精准修复,告别马赛克/模糊/闪烁;? 多语言支持:突破中英限制,覆盖小语种,形成”擦除-翻译-口型同步”一站式闭环;⚙️ 工程落地:万集数据验证,成功率100%;分布式分镜计算,效率提升数倍。详情地址:https://console.volcengine.com/vod/

昆仑万维发布开源世界模型Matrix-Game2.0:实时生成分钟级高连贯视频
昆仑万维发布全球首个开源交互式世界模型Matrix-Game2.0,实时生成分钟级25fps高连贯视频,支持无语言提示的纯视觉驱动交互,已在GTA、Minecraft等场景落地。AiBase特别提要:? 开源首发:业内首个通用场景实时长序列开源世界模型,持续迭代全面开放;? 分钟级生成:25fps连续视频,物理规律与场景语义理解大幅提升,可直接用于游戏/影视/VR;? 视觉驱动交互:摒弃语言提示,3D因果VAE+多模态扩散Transformer逐帧响应用户动作,跨域适应多风格场景。

昆仑万维开源Matrix-3D大模型:用单张图像可生成高质量全景视频
昆仑万维开源Matrix-3D:单张图像即可生成360°可漫游3D全景视频,轨迹一致、几何精准,全面开放代码与数据集。AiBase特别提要:? 单图生成3D世界:打破多视角依赖,直接由单张图像产出高质量全景视频与可探索3D场景;? 轨迹引导一致性:用Mesh渲染图驱动扩散模型,保证相机轨迹下的时空一致,减少伪影与遮挡;⚙️ 双路径重建:超分+结构优化慢工出细活;Transformer前馈网络极速推理,兼顾质量与效率。详情:https://github.com/SkyworkAI/Matrix-3D

最新快讯

2025年11月28日

13:39
微新创想11月28日专稿 杭州市中医院耳鼻喉科近日接诊了一位年轻患者小羽(化名),其经历揭示了冬季常见鼻部不适背后可能隐藏的严重健康风险。这位年仅20岁的年轻人长期被鼻痒困扰,近期因症状加剧而频繁用手指抠挖鼻腔,结果导致鼻腔黏膜破损出血并伴有明显肿胀。更令人担忧的是,次日清晨小羽面部肿胀情况急剧恶化,甚至出现眼睑闭合困难、剧烈疼痛等症状,紧急就医后被确诊为面...
13:39
2025年11月26日,香港大埔区宏福苑突发五级烈火,火势迅速蔓延,造成严重财产损失和人员伤亡。面对这场突如其来的灾难,商汤科技第一时间伸出援手,宣布向受灾地区捐赠300万港元善款。这笔资金将专项用于受灾群众的紧急安置、生活物资补给、医疗救助以及灾后重建等关键工作。公司方面在声明中沉痛哀悼遇难者,并向受伤人员及其家属致以深切慰问,同时高度致敬奋战在一线的救援...
13:39
2025年11月28日,备受瞩目的北京燕莎中心凯宾美食廊在万众期待中完成华丽转身,正式入驻位于一层亮马河畔花园的全新址并盛大启幕。这家拥有33年辉煌历史的老牌美食店此次焕新升级,营业面积实现了惊人的两倍增长,新增的109平方米室内用餐区与110平方米户外花园区域,为食客们带来了更加宽敞舒适的用餐环境。 新店精心设计了充满现代感的咖啡师岛台,让顾客可以近距...
13:39
2025年11月28日,中国生态环境部与中国人民银行联合宣布正式启动绿色发展投融资合作伙伴关系指导委员会的筹建工作。这一重要举措标志着我国在绿色金融领域的国际合作迈入新阶段,将有力推动绿色金融创新与可持续发展。该委员会的核心目标聚焦于三大关键领域:一是促进绿色投融资工具的多元化创新,二是积极探索海外碳资产的开发与交易机制,三是大力推进气候韧性基础设施的建设与...
13:38
2025年11月27日,韩国科技界迎来重大合作里程碑。在首尔,韩国科学技术信息通信部第二次官柳济明携手三星电子、现代汽车、SK电讯及Naver四大龙头企业代表,正式宣告成立GPU专项工作组。此举旨在统筹规划并高效推进大规模英伟达GPU的采购计划及其在关键领域的深度应用。 根据公布的合作方案,韩国政府与四大企业将组成史无前例的采购联盟,计划分阶段累计采购26万...
13:08
2025年11月28日,北京时间,行业消息人士遠坂小町在X平台发布惊人爆料,称AMD即将推出两款备受瞩目的新显卡——Radeon AI PRO R9700S与R9600D。尽管AMD官方尚未在官网公布任何产品信息,但细心的用户发现,这两款显卡的支持页面已经悄然上线。更有趣的是,当用户输入错误的型号名称时,系统会显示404页面不存在错误提示,这一细节有力地证实...
13:08
2025年11月27日,谷歌Pixel Watch用户群体中出现了一项令人担忧的普遍问题——步行模式下的距离记录严重失准。多位用户在社交媒体和科技论坛上纷纷发声,指出手表在记录步行数据时存在系统性偏差。Reddit平台上,一位名为almosttan的用户进行了严谨的测试,其结果显示步行模式下记录的距离仅为实际距离的四分之一左右,而切换至骑行或跑步模式后,数据...
12:38
2025年11月28日,国家能源局综合司正式发布通知,宣布全面启动“人工智能+”能源试点工作,标志着我国能源行业智能化转型进入全新阶段。此次试点聚焦于能源领域的八大核心应用场景和37项重点任务,旨在通过系统性布局推动能源产业与人工智能技术的深度融合。通知明确面向全国能源企业公开征集具有高价值的应用场景需求,并创新性地采用“揭榜挂帅”机制,鼓励人工智能技术供给...
12:38
2025年上海国际体育博览会盛大启幕,瑞士高端跑步品牌On昂跑以"空前之轻,未来之履"为核心主题,精心打造了引人注目的品牌展台。这一创新设计不仅完美融合了前沿空间美学与互动体验,更向全球观众全方位展示了On昂跑在跑步科技与时尚设计领域的最新突破与成果。展会期间,品牌特别宣布重新发售备受瞩目的高性能竞速跑鞋Cloudboom Strike LS,现场跑者不仅有...
12:38
2025年11月28日,中国科学院电工研究所传来振奋人心的消息,他们成功研制出一种具有突破性意义的大口径高场通用超导磁体。该磁体中心磁场强度达到了惊人的16.5特斯拉,内孔直径更是达到了150毫米,这一成就不仅刷新了国内同类磁体的最高磁场纪录,更标志着我国在超导技术领域迈出了坚实的一步。 为了实现这一突破,科研团队采用了多项创新技术。他们巧妙地运用了分层分级...
12:38
2026年初,备受期待的M&M'S®全新门店即将在上海迪士尼度假区迪士尼小镇盛大启幕。这家融合购物、餐饮与娱乐演出的复合型门店坐落于迪士尼小镇入口处,将成为游客体验迪士尼奇妙旅程的全新亮点。此次开业计划由玛氏中国正式宣布,不仅标志着品牌在中国市场的进一步扩张,更体现了其致力于为游客打造沉浸式互动体验的创新精神。通过将品牌元素与迪士尼经典场景深度融合,...
12:38
2025年11月28日,科技界传来振奋消息,谷歌推出的“凭据恢复API”已取得突破性进展,显著提升了安卓设备的换机体验。长期以来,安卓用户在更换手机后不得不逐一重新登录各种应用,而iOS用户却能享受无缝迁移登录状态的红利。为解决这一痛点,谷歌于2024年正式推出这项创新API,通过安全迁移旧设备的登录token至新设备,实现一键自动登录。目前,打车平台Ube...