欢迎来到【AI日报】栏目!这里是您每日探索人工智能世界的权威指南,我们为您精选并呈现AI领域的最新热点内容,始终聚焦开发者群体,助您洞悉前沿技术趋势,深入了解创新AI产品的实际应用。新鲜出炉的AI产品推荐,点击了解详情:https://top.aibase.com/1

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图

智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型
智谱公司正式宣布推出并开源了全球参数量达100B且效果最佳的视觉推理模型GLM-4.5V,这一重要成果标志着该公司在迈向通用人工智能(AGI)的道路上迈出了坚实一步。AiBase特别提要:🤖 GLM-4.5V总参数量高达106B,在41个视觉多模态榜单中均达到SOTA(State-of-the-Art)性能水平;🎯 该模型具备全场景视觉推理能力,涵盖图像推理、视频理解、GUI任务等多种应用场景;💡 新增”思考模式”开关,可灵活平衡推理效率与效果;💰 API调用价格极具竞争力,输入成本仅为2元/M tokens,输出成本为6元/M tokens。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图1

阿里达摩院开源三项具身智能核心技术
在世界机器人大会上,阿里达摩院隆重宣布开源三项自研的具身智能核心技术:VLA模型RynnVLA-001-7B、世界理解模型RynnEC以及机器人上下文协议RynnRCP。这一战略举措旨在推动数据、模型与机器人本体的兼容适配,为具身智能开发提供完整的解决方案。AiBase特别提要:🚀 开源的三项核心技术包括VLA模型、世界理解模型和机器人上下文协议;🔗 RynnRCP实现了从传感器数据到机器人动作执行的完整工作流程;👁️ RynnVLA-001从第一人称视角视频学习人类操作技能;🌍 RynnEC从11个维度全面解析场景物体,无需依赖3D模型。详情链接:https://github.com/alibaba-damo-academy/RynnRCP

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图2

苹果即将升级 Apple Intelligence 至 GPT-5,推动 Siri 与写作工具智能化
苹果公司近日正式宣布,计划在即将发布的iOS26、iPadOS26和macOS Tahoe26系统更新中,将其Apple Intelligence中的ChatGPT核心模型升级至最新的GPT-5版本。这一重大升级将显著提升Siri、写作工具和视觉智能的整体性能。AiBase特别提要:🚀 苹果将在iOS26等系统更新中将ChatGPT模型升级至GPT-5,全面增强Siri、写作工具和视觉智能的功能;🚀 新版本将引入多语言实时翻译及屏幕内容分析功能,大幅提升设备在跨语言交流和信息处理方面的能力;🚀 苹果还首次向开发者开放设备端API,支持第三方应用接入,提供低延迟和高隐私的AI体验。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图3

高德全面接入通义大模型 推出首个地图AI原生Agent
阿里巴巴集团旗下高德地图联合通义实验室发布全球首个AI原生地图,正式推出”小高老师”智能体,实现全链路语音交互与复杂任务推理导航。AiBase特别提要:🎙️ 内置智能体”小高老师”,支持音频/文本等多模态交互,支持随时打断的全双工语音;🧠 基于36万亿token预训练的Qwen大模型,实现空间语义深度理解与高效调度近百种内部工具;🗂️ 联合推出复杂POI推理Agent,可拆解多重约束并整合实时信息,提供精准推荐与导航;🔍 依托自研DeepResearch框架,具备规划、反思、工具调用等完整Agent能力。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图4

宇树科技将出征首届世界人形机器人运动会,硬件将被多队采用
宇树科技将于8月14日至17日参加首届世界人形机器人运动会。宇树公司透露,除其自有团队外,赛场上还将有多支队伍使用宇树机器人硬件参赛,但会搭配各自自研的算法。AiBase特别提要:🤖 除宇树自有团队外,赛场上还将有多个队伍使用宇树的机器人硬件参赛,但会搭配各自研发的算法;🏟️ 此次运动会汇聚了天工、加速进化、松延动力、傅利叶、星海图等国内头部人形机器人企业,以及来自美国、德国、澳大利亚、巴西、日本等16个国家的共计280支队伍;🔧 宇树科技的参与不仅展示了其在人形机器人硬件方面的实力,也体现了其设备在开放生态中的广泛应用和竞争力。

AI日报:智谱开源百亿级视觉推理模型GLM-4.5V,达摩院推具身智能技术,360智脑亮出Light-IF系列模型插图5

Claude AI推出历史对话记忆功能,支持多背景切换
Anthropic为Claude AI上线了”记忆功能”,可自动记忆并复用用户历史对话中的背景信息,实现跨会话无缝衔接,并支持多背景隔离切换,目前仅向付费用户开放。AiBase特别提要:🔄 支持为不同项目设定独立背景,工作/生活场景一键切换,保持上下文延续;💰 先行面向Claude Max、Team、Enterprise付费用户,Pro版后续跟进,免费用户暂未开放;⚙️ 用户可在”设置—搜索和参考聊天”中手动启用或查看记忆内容;🤖 与ChatGPT手动预设不同,Claude采用自动提取机制,体验更”无感”但可控性稍弱。

360智脑推出Light-IF系列模型 显著提升复杂指令遵循能力
360智脑发布Light-IF系列模型,以”预览-自检式推理+信息熵控制”框架专治”懒惰推理”,在四大基准测试中全面领先,小参数模型即可越级挑战大模型,并全部开源。AiBase特别提要:🎯 创新Light-IF框架:难度感知指令生成→Zero-RL强化→推理模式过滤→熵保持冷启动→熵自适应正则,显著抑制”只会复述不检查”的懒惰推理;📈 权威评测霸榜:Light-IF-32B在SuperCLUE拿下0.575分,领先第二名13.9个百分点;Light-IF-1.7B小模型反超Qwen3-235B-A22B等超大模型;🔓 全面开源:模型权重将陆续上线Hugging Face,冷启动数据集与训练代码同步发布GitHub,并联合SuperCLUE推出中文评测基准SuperCLUE-CPIFOpen。

字节跳动推出视频字幕无痕擦除方案 基于DiT大模型打造
字节跳动发布全球首个基于DiT大模型的”视频字幕无痕擦除”方案,实现像素级修复、多语言适配、一键”擦除-翻译-口型同步”,助力短剧出海与跨境电商全球化。AiBase特别提要:🎞️ 两大核心:DiT视频字幕擦除大模型+字体级分割模型,像素级精准修复,告别马赛克/模糊/闪烁;🌐 多语言支持:突破中英限制,覆盖小语种,形成”擦除-翻译-口型同步”一站式闭环;⚙️ 工程落地:万集数据验证,成功率100%;分布式分镜计算,效率提升数倍。详情地址:https://console.volcengine.com/vod/

昆仑万维发布开源世界模型Matrix-Game2.0:实时生成分钟级高连贯视频
昆仑万维发布全球首个开源交互式世界模型Matrix-Game2.0,实时生成分钟级25fps高连贯视频,支持无语言提示的纯视觉驱动交互,已在GTA、Minecraft等场景落地。AiBase特别提要:🚀 开源首发:业内首个通用场景实时长序列开源世界模型,持续迭代全面开放;📹 分钟级生成:25fps连续视频,物理规律与场景语义理解大幅提升,可直接用于游戏/影视/VR;🎮 视觉驱动交互:摒弃语言提示,3D因果VAE+多模态扩散Transformer逐帧响应用户动作,跨域适应多风格场景。

昆仑万维开源Matrix-3D大模型:用单张图像可生成高质量全景视频
昆仑万维开源Matrix-3D:单张图像即可生成360°可漫游3D全景视频,轨迹一致、几何精准,全面开放代码与数据集。AiBase特别提要:🌐 单图生成3D世界:打破多视角依赖,直接由单张图像产出高质量全景视频与可探索3D场景;🎥 轨迹引导一致性:用Mesh渲染图驱动扩散模型,保证相机轨迹下的时空一致,减少伪影与遮挡;⚙️ 双路径重建:超分+结构优化慢工出细活;Transformer前馈网络极速推理,兼顾质量与效率。详情:https://github.com/SkyworkAI/Matrix-3D

最新快讯

2025年08月12日

18:33
微新创想8月12日讯 魅族近日有两款新机成功入网,型号分别为M582Q和M582V,业界普遍猜测这两款机型或将归属魅族22系列。根据相关认证信息显示,这两款手机均未配备卫星通信终端,因此不支持卫星通信功能。 据悉,魅族此前已宣布这两款新机将于本月正式发布,预计将在月底召开发布会进行详细介绍。魅族22系列备受瞩目,其采用了6.3英寸黄金尺寸屏幕设计,更将挑...
18:33
微新创想8月12日重磅消息,知名数码博主数码闲聊站率先爆料,小米平板8系列已正式通过工信部入网认证,预示着这款备受期待的旗舰平板即将揭开神秘面纱。据悉,该系列平板将全面采用11.16英寸LCD高刷大屏,不仅带来震撼的视觉体验,更在充电技术上实现重大突破。标准版型号将配备45W有线快充,而高配版则支持更快的67W有线充电,确保用户随时随地高效续航。尤为引人注目...
18:33
近日,惠州市惠城区人民法院审理了一起因意外摔倒引发的侵权索赔案,案件细节引发社会广泛关注。这起案件的核心争议在于:当事人王姨在火车站因自身过错摔倒身亡,其家属却将顺行经过的旅客小张告上法庭,要求承担侵权责任。法院最终以严谨的法律逻辑给出了权威判决,为类似纠纷提供了重要参考。 2019年3月8日中午12时22分23秒,王姨与儿子小王前往火车站进站候车。当时两人...
18:33
微新创想8月12日重磅发布最新消息,昨晚一场备受瞩目的拍卖会中,价值9999元的灵童念NIA-F01人形机器人以1元起拍,最终成交价高达10580元,引发市场热烈反响。这款被誉为"全球首款AI具身人形桌面机器人"的创新产品,以其独特魅力吸引了众多关注。 NIA-F01机器人身高仅56厘米,相当于人类身高的三分之一,裸机重量控制在700克以内,轻盈便携。其皮肤...
18:33
微新创想8月12日讯 昨日,知名视频博主Tim以影视飓风创始人身份,正式启动了一场备受瞩目的孤岛生存100小时挑战。这场极限生存实验将全程进行网络直播,通过真实呈现野外取火、搭建庇护所、寻找水源与食物等高难度求生场景,为观众带来前所未有的视觉与精神震撼。据悉,Tim此次挑战的地点选在浙江杭州三白潭的一座偏远小岛,该地独特的地理环境与原始的自然风貌,使其成为...
18:33
MiniMax重磅发布全球首创的Agent Remix Marketplace平台,以革命性的商业模式重新定义AI智能体创作生态。该平台的核心创新在于支持用户对已发布的成熟AI作品进行一键式再创作,并通过创新的收益分享机制,确保原作者每完成一次Remix操作即可获得100Credits的丰厚回报。这一突破性平台的问世,标志着AI智能体创作模式从传统单一原创向...
18:33
8月12日,航天科技(股票代码:000901)正式发布最新经营状况公告,向投资者传递出稳健发展的积极信号。公告明确指出,公司近期整体经营情况保持良好态势,各项业务指标均符合预期,未出现任何异常波动。更为关键的是,公司内部管理机制运行顺畅,外部市场环境也展现出持续稳定的特征,不存在任何可能引发重大经营风险的因素。 在详细阐述当前经营状况时,航天科技特别强调业务...
18:33
2025年8月12日,中国船舶正式对外公布异议股东收购请求权的行权价格,确定为每股30.02元。这一消息公布当日,公司股票收盘价高达38.50元,较行权价溢价28.25%,显示出市场对该公司未来发展的强烈信心。值得注意的是,公司在此公告中特别提醒,若异议股东选择行使收购请求权,可能面临一定的投资亏损风险,建议相关投资者谨慎评估后做出决策。此次公告不仅明确了异...
18:33
近日,国内领先的地铁设计企业传来喜讯,其自主研发的"城市轨道交通智慧规划平台"成功在多个一线及新一线城市落地应用。该平台创新性地整合了时空大数据分析与智能规划算法两大核心技术,为城市轨道交通系统的高效规划提供了革命性解决方案。通过实时采集并分析海量客流、地质、气象等多源数据,平台能够精准预测交通需求变化,优化线路布局,显著提升轨道交通网络的运行效率与资源利用...
18:33
2025年8月12日,北京时间凌晨,小马智行在美国纳斯达克盘前交易中表现抢眼,股价涨幅突破3%。这一显著上涨不仅彰显了投资者对该公司近期发展成果的高度认可,更折射出市场对其未来前景的浓厚期待。作为全球领先的自动驾驶技术企业,小马智行近期在技术研发、商业化落地以及战略合作等方面取得的突破性进展,无疑是推动股价上涨的核心动力。分析师指出,随着小马智行在智能驾驶领...
18:33
银禧科技于8月12日发布公告,披露了公司高层及核心管理团队的减持计划。公告显示,公司董事兼总经理林登灿,以及职工代表董事张德清、傅轶、谭映儿,还有董事会秘书郑桂华,计划在未来三个月内通过集中竞价方式合计减持不超过273.85万股,该数量占公司总股本的0.57%。 此次减持的主要原因是个人资金需求,减持方式已明确为集中竞价交易。根据公告规定,上述减持行为将在公...
18:33
2025年8月12日,复旦复华正式发布重要公告,宣布其控股子公司复华信息将战略入股联光元和(上海)企业发展有限公司。根据公告内容,复华信息计划出资4887万元参与联光元和高达3.99亿元的增资计划。此次增资完成后,复华信息将成功获得联光元和3.06%的股权,进一步巩固双方的合作关系。 联光元和作为光学领域的技术先锋,长期专注于光学产品的研发与制造,致力于推动...