欢迎来到【AI日报】栏目!这里是您每日探索人工智能世界的权威指南,我们为您精选并呈现AI领域的最新热点内容,始终聚焦开发者群体,助您洞悉前沿技术趋势,深入了解创新AI产品的实际应用。新鲜出炉的AI产品推荐,点击了解详情:https://top.aibase.com/1

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图

智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型
智谱公司正式宣布推出并开源了全球参数量达100B且效果最佳的视觉推理模型GLM-4.5V,这一重要成果标志着该公司在迈向通用人工智能(AGI)的道路上迈出了坚实一步。AiBase特别提要:? GLM-4.5V总参数量高达106B,在41个视觉多模态榜单中均达到SOTA(State-of-the-Art)性能水平;? 该模型具备全场景视觉推理能力,涵盖图像推理、视频理解、GUI任务等多种应用场景;? 新增”思考模式”开关,可灵活平衡推理效率与效果;? API调用价格极具竞争力,输入成本仅为2元/M tokens,输出成本为6元/M tokens。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图1

阿里达摩院开源三项具身智能核心技术
在世界机器人大会上,阿里达摩院隆重宣布开源三项自研的具身智能核心技术:VLA模型RynnVLA-001-7B、世界理解模型RynnEC以及机器人上下文协议RynnRCP。这一战略举措旨在推动数据、模型与机器人本体的兼容适配,为具身智能开发提供完整的解决方案。AiBase特别提要:? 开源的三项核心技术包括VLA模型、世界理解模型和机器人上下文协议;? RynnRCP实现了从传感器数据到机器人动作执行的完整工作流程;?️ RynnVLA-001从第一人称视角视频学习人类操作技能;? RynnEC从11个维度全面解析场景物体,无需依赖3D模型。详情链接:https://github.com/alibaba-damo-academy/RynnRCP

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图2

苹果即将升级 Apple Intelligence 至 GPT-5,推动 Siri 与写作工具智能化
苹果公司近日正式宣布,计划在即将发布的iOS26、iPadOS26和macOS Tahoe26系统更新中,将其Apple Intelligence中的ChatGPT核心模型升级至最新的GPT-5版本。这一重大升级将显著提升Siri、写作工具和视觉智能的整体性能。AiBase特别提要:? 苹果将在iOS26等系统更新中将ChatGPT模型升级至GPT-5,全面增强Siri、写作工具和视觉智能的功能;? 新版本将引入多语言实时翻译及屏幕内容分析功能,大幅提升设备在跨语言交流和信息处理方面的能力;? 苹果还首次向开发者开放设备端API,支持第三方应用接入,提供低延迟和高隐私的AI体验。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图3

高德全面接入通义大模型 推出首个地图AI原生Agent
阿里巴巴集团旗下高德地图联合通义实验室发布全球首个AI原生地图,正式推出”小高老师”智能体,实现全链路语音交互与复杂任务推理导航。AiBase特别提要:?️ 内置智能体”小高老师”,支持音频/文本等多模态交互,支持随时打断的全双工语音;? 基于36万亿token预训练的Qwen大模型,实现空间语义深度理解与高效调度近百种内部工具;?️ 联合推出复杂POI推理Agent,可拆解多重约束并整合实时信息,提供精准推荐与导航;? 依托自研DeepResearch框架,具备规划、反思、工具调用等完整Agent能力。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图4

宇树科技将出征首届世界人形机器人运动会,硬件将被多队采用
宇树科技将于8月14日至17日参加首届世界人形机器人运动会。宇树公司透露,除其自有团队外,赛场上还将有多支队伍使用宇树机器人硬件参赛,但会搭配各自自研的算法。AiBase特别提要:? 除宇树自有团队外,赛场上还将有多个队伍使用宇树的机器人硬件参赛,但会搭配各自研发的算法;?️ 此次运动会汇聚了天工、加速进化、松延动力、傅利叶、星海图等国内头部人形机器人企业,以及来自美国、德国、澳大利亚、巴西、日本等16个国家的共计280支队伍;? 宇树科技的参与不仅展示了其在人形机器人硬件方面的实力,也体现了其设备在开放生态中的广泛应用和竞争力。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图5

Claude AI推出历史对话记忆功能,支持多背景切换
Anthropic为Claude AI上线了”记忆功能”,可自动记忆并复用用户历史对话中的背景信息,实现跨会话无缝衔接,并支持多背景隔离切换,目前仅向付费用户开放。AiBase特别提要:? 支持为不同项目设定独立背景,工作/生活场景一键切换,保持上下文延续;? 先行面向Claude Max、Team、Enterprise付费用户,Pro版后续跟进,免费用户暂未开放;⚙️ 用户可在”设置—搜索和参考聊天”中手动启用或查看记忆内容;? 与ChatGPT手动预设不同,Claude采用自动提取机制,体验更”无感”但可控性稍弱。

360智脑推出Light-IF系列模型 显著提升复杂指令遵循能力
360智脑发布Light-IF系列模型,以”预览-自检式推理+信息熵控制”框架专治”懒惰推理”,在四大基准测试中全面领先,小参数模型即可越级挑战大模型,并全部开源。AiBase特别提要:? 创新Light-IF框架:难度感知指令生成→Zero-RL强化→推理模式过滤→熵保持冷启动→熵自适应正则,显著抑制”只会复述不检查”的懒惰推理;? 权威评测霸榜:Light-IF-32B在SuperCLUE拿下0.575分,领先第二名13.9个百分点;Light-IF-1.7B小模型反超Qwen3-235B-A22B等超大模型;? 全面开源:模型权重将陆续上线Hugging Face,冷启动数据集与训练代码同步发布GitHub,并联合SuperCLUE推出中文评测基准SuperCLUE-CPIFOpen。

字节跳动推出视频字幕无痕擦除方案 基于DiT大模型打造
字节跳动发布全球首个基于DiT大模型的”视频字幕无痕擦除”方案,实现像素级修复、多语言适配、一键”擦除-翻译-口型同步”,助力短剧出海与跨境电商全球化。AiBase特别提要:?️ 两大核心:DiT视频字幕擦除大模型+字体级分割模型,像素级精准修复,告别马赛克/模糊/闪烁;? 多语言支持:突破中英限制,覆盖小语种,形成”擦除-翻译-口型同步”一站式闭环;⚙️ 工程落地:万集数据验证,成功率100%;分布式分镜计算,效率提升数倍。详情地址:https://console.volcengine.com/vod/

昆仑万维发布开源世界模型Matrix-Game2.0:实时生成分钟级高连贯视频
昆仑万维发布全球首个开源交互式世界模型Matrix-Game2.0,实时生成分钟级25fps高连贯视频,支持无语言提示的纯视觉驱动交互,已在GTA、Minecraft等场景落地。AiBase特别提要:? 开源首发:业内首个通用场景实时长序列开源世界模型,持续迭代全面开放;? 分钟级生成:25fps连续视频,物理规律与场景语义理解大幅提升,可直接用于游戏/影视/VR;? 视觉驱动交互:摒弃语言提示,3D因果VAE+多模态扩散Transformer逐帧响应用户动作,跨域适应多风格场景。

昆仑万维开源Matrix-3D大模型:用单张图像可生成高质量全景视频
昆仑万维开源Matrix-3D:单张图像即可生成360°可漫游3D全景视频,轨迹一致、几何精准,全面开放代码与数据集。AiBase特别提要:? 单图生成3D世界:打破多视角依赖,直接由单张图像产出高质量全景视频与可探索3D场景;? 轨迹引导一致性:用Mesh渲染图驱动扩散模型,保证相机轨迹下的时空一致,减少伪影与遮挡;⚙️ 双路径重建:超分+结构优化慢工出细活;Transformer前馈网络极速推理,兼顾质量与效率。详情:https://github.com/SkyworkAI/Matrix-3D

最新快讯

2026年01月14日

05:38
2026年1月14日,一则重磅消息震惊了全球时尚界与零售市场——美国知名奢侈品连锁百货巨头萨克斯全球(Saks Global)或将率先启动破产保护程序。根据最新披露的财务报告显示,该公司计划于本周二正式向法院提交相关申请,此举旨在通过法律框架下的债务重组与业务优化,有效缓解当前面临的严峻财务困境。作为全球高端零售市场的标志性企业,萨克斯全球的这一决策不仅折射...
04:06
2026年1月13日,我国在海南商业航天发射场迎来了一场令人瞩目的航天壮举。长征八号甲运载火箭昂首升空,以精准的控制力将18组卫星互联网低轨星座顺利送入预定轨道,标志着我国航天事业迈出了新的坚实步伐。此次发射任务不仅圆满成功,更彰显了长征系列火箭的卓越性能与可靠品质,这是长征家族第625次发射任务,充分证明了其作为我国航天领域"主力军"的强大实力。 此次发射...
03:05
2026年1月14日,美国南卡罗来纳州卫生部门通报,该州单日新增麻疹病例124例,使本轮疫情的累计确诊病例数攀升至434例。这一数字令人担忧,因为此次疫情自2025年底悄然爆发,至今已波及该州多个社区,呈现出快速蔓延的趋势。值得注意的是,部分病例已出现在学校和医疗机构,这无疑加剧了防控压力。 本轮麻疹疫情主要集中在南卡罗来纳州的部分社区,但传播范围有扩大迹象...
03:05
2026年1月14日,全球知名私募机构Warburg正式宣布,正积极寻求以10亿美元的战略价格出售其核心资产——美国顶尖独立保险经纪公司MCGILL。此次出售行动标志着Warburg在投资组合优化战略上的重要布局,目前正全面评估潜在买家的资质与交易结构的可行性。 MCGILL作为美国保险经纪行业的标杆企业,凭借其卓越的市场声誉和广泛的服务网络,业务覆盖全...
02:03
2026年1月14日,阿斯利康首席财务官在重要会议上透露,备受瞩目的GLP-1减肥药第二阶段临床试验数据预计将在今年内正式公布。这款处于研发关键节点的创新药物,有望成为阿斯利康在代谢疾病治疗领域的重要布局,进一步巩固其在该领域的领先地位。虽然具体发布时间尚未确定,但市场普遍预期这一关键数据的公布将对后续研发进程及市场预期产生深远影响。阿斯利康方面表示,将继续...
02:03
2026年1月14日,美国白宫新闻秘书卡罗琳·莱维特在一场备受瞩目的新闻发布会上宣布了一项重大经济举措。根据她的声明,福特汽车公司将在当日正式宣布一项新增工作岗位计划,并重启汽油动力卡车的生产。这一决策背后,是美国政府对传统燃油车型持续强劲市场需求的高度重视,同时也是对加强本土制造业就业的坚定承诺。白宫方面表示,此举旨在通过振兴传统汽车产业,为美国工人创造更...
01:03
2025年,波音公司凭借不懈努力,成功交付了600架飞机,这一数字不仅彰显了其生产实力的稳步回升,更成为航空业复苏的重要里程碑。在众多机型中,737系列表现尤为突出,全年交付量高达447架,占据了总交付量的绝大部分,充分证明了该机型在全球市场依然保持着强大的竞争力。这一亮眼成绩的背后,是波音公司多年来的持续投入与艰难转型。面对过去生产瓶颈与安全事件带来的重重...
00:32
1月13日夜间,甘肃河西多地出现沙尘天气,局地发生沙尘暴。受西北气流中强风速下传影响,武威市民勤县出现明显沙尘暴,能见度显著下降。甘肃省气象局已监测到相关天气过程,提醒公众减少外出,注意防护。此次沙尘天气对交通和空气质量造成一定影响。
00:32
2026年1月14日,容百科技收到上交所问询函,被要求核实并补充披露与宁德时代签署的超1200亿元磷酸铁锂正极材料采购协议相关事项。根据公告,双方协议自2026年第一季度起至2031年,容百科技将向宁德时代供应约305万吨磷酸铁锂正极材料。问询函要求公司说明现有产能与协议产量差异较大的情况下,是否具备履约能力,并补充披露产能建设、年度交付计划、价格调整机制...
00:32
2026年1月13日,Meta启动新一轮裁员,主要涉及Reality Labs部门。此次裁员影响约10%员工,即超过1500个岗位,旨在将资源从元宇宙转向AI可穿戴设备和移动功能开发。公司首席技术官Andrew Bosworth确认,受影响员工自1月14日起陆续收到通知。Meta发言人表示,此举是为提升业务可持续性,将缩减虚拟现实项目投入,并将资金转移至今...
00:32
1月12日,《逃离鸭科夫》官方在B站及X平台暗示即将开启首次游戏联动。通过提及‘两个共通人格’‘强大战斗力’等线索,以及展示持锤与持枪的两只鸭子形象,明显指向《逃离塔科夫》中的经典Boss塔基拉和基拉。此举引发粉丝热烈猜测与互动,评论区普遍认定了此次联动角色。目前官方尚未正式官宣联动细节,但已引发广泛关注。

2026年01月13日

23:32
2026年1月13日,多位用户反馈在升级至macOS 26后,调整窗口大小功能出现响应问题。尽管窗口视觉上为圆角设计,但系统仍沿用方形窗口的19*19像素触发区域逻辑,导致75%的触发区落在窗口外部。开发者指出,用户习惯点击的绿色区域实际无法触发操作,仅红色区域有效。此设计不一致造成操作困扰,苹果尚未发布修复补丁。