智谱开源全球最强视觉推理模型GLM-4.5V参数达106B

智谱AI重磅宣布推出并开源了全球参数规模达100B且效果最优的开源视觉推理模型GLM-4.5V,这一里程碑式成果标志着该公司在探索通用人工智能(AGI)道路上迈出了坚实一步。该模型已同步在魔搭社区与Hugging Face平台实现全面开源,其总参数量高达106B,激活参数为12B,这一规模不仅刷新了多模态推理技术的纪录,更代表了行业发展的最新高度。GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air构建,完美延续了GLM-4.1V-Thinking的技术传承与创新路径。

在41项公开视觉多模态榜单的激烈竞争中,GLM-4.5V以绝对优势斩获同级别开源模型的最高性能(SOTA),全面覆盖图像识别、视频分析、文档理解及GUI Agent等核心任务领域。值得注意的是,该模型不仅实验室数据表现卓越,更在真实场景应用中展现出惊人的实用价值。通过创新的高效混合训练机制,GLM-4.5V成功整合了各类视觉内容处理能力,实现了全场景视觉推理的突破,包括但不限于图像推理、视频理解、GUI任务处理、复杂图表与长文档解析,以及先进的Grounding能力。特别设计的”思考模式”开关,让用户可根据需求灵活切换快速响应或深度推理模式,在效率与效果之间实现完美平衡。

为让开发者直观感受GLM-4.5V的强大能力,智谱清言团队同步开源了一款创新桌面助手应用。该应用支持实时截屏与录屏功能,可精准捕捉屏幕信息,并依托GLM-4.5V高效处理各类视觉推理任务,如代码辅助生成、视频内容智能分析、游戏场景解答、文档深度解读等多元应用场景。这款应用将成为您工作娱乐中的智能伙伴,让屏幕互动体验进入全新维度。

智谱开源全球最强视觉推理模型GLM-4.5V参数达106B插图1

技术实力方面,GLM-4.5V的API现已全面上线智谱开放平台BigModel.cn,特别为所有用户准备了2000万Tokens的免费资源包。该模型在保持业界顶尖精度的同时,实现了推理速度与部署成本的完美平衡,为企业与开发者提供了极具性价比的多模态AI解决方案。API调用价格极具竞争力:输入仅2元/M tokens,输出6元/M tokens,响应速度高达60-80tokens/s。此外,模型在视觉定位、前端复刻、图像识别推理、复杂文档深度解读以及GUI Agent能力等方面均展现出超凡实力。

具体技术细节上,GLM-4.5V由视觉编码器、MLP适配器和语言解码器三部分精密组成,支持长达64K的多模态长上下文处理,兼容图像与视频双重输入模式。通过创新的三维卷积技术,显著提升了视频处理效率;采用双三次插值机制,大幅增强了高分辨率及极端宽高比图像的处理能力与稳定性;更引入三维旋转位置编码(3D-RoPE),全方位强化了多模态信息的三维空间感知与推理能力。

开放资源:
GitHub:https://github.com/zai-org/GLM-V
Hugging Face:https://huggingface.co/collections/zai-org/glm-45v-68999032ddf8ecf7dcdbc102
魔搭社区:https://modelscope.cn/collections/GLM-45V-8b471c8f97154e

最新快讯

2025年08月12日

13:16
声明:本文来自于微信公众号 定焦One(ID:dingjiaoone),作者:李梦冉,授权站长之家转载发布。一个手机壳,如何在2025年撬动百亿市场?这又是一个将兴趣转化为生意的励志故事。2011年,设计师出身的香港人吴培燊拿到最新款iPhone4S后,苦于没有心仪的手机壳,于是创立了一个名为Casetagram的App,用户可通过下载ins照片定制手机壳,...
13:16
近期,大学生兼职带娃这一话题在网络上掀起热议,有消息透露部分大学生通过此类兼职每日收入可达200元。随着现代生活节奏不断加快,越来越多的家长因工作繁忙等原因,在特定时段难以兼顾工作与育儿,因此将目光投向了大学生群体。这些年轻人凭借灵活的时间安排和扎实的知识基础,成为了不少家庭信赖的育儿帮手。这种兼职形式灵活多样,有的学生选择在课后或周末为周边家庭提供短时看护...
13:16
近日,一则充满趣味性的视频在社交平台上迅速走红,引发了网友们的高度关注和热烈讨论。这段令人捧腹的影像记录了2025年8月10日在四川发生的一幕奇趣场景,主角是一只可爱的柯基犬和一只智能机器狗。当时,柯基犬正被机器狗牵引着外出散步,本应是一段温馨和谐的互动,却意外出现了令人啼笑皆非的转折。 画面中,柯基犬突然毫无征兆地坐在地上,无论机器狗如何尝试牵引,它都固执...
13:16
8月11日,一则令人心碎的消息在网络上迅速传开,牵动着无数网友的心。8月9日,一位网友在网络平台上发布了一篇充满爱意的文章,为妻子的学生加油鼓劲,字里行间却透露出一个令人悲痛的真相——他的妻子“小瀛子”,一位年仅33岁的湖北女教师,已经永远地离开了这个世界。 这位悲痛的丈夫在文中深情地写道:“同学们老师会在天堂守护你们,同学们,你们要加油,老师会一直守护你们...
13:16
2025年8月12日,一项医疗科技领域的重大突破在上海交通大学医学院附属瑞金医院正式宣告完成——全球首台相控阵CT设备成功落成并投入使用。这一尖端设备由中国本土企业纳米维景独立研发,其采用的全新相控阵成像技术,不仅实现了传统CT技术的革命性升级,更在成像效率与分辨率上实现了质的飞跃。据中国科学院院士滕皋军高度评价,相控阵CT的问世堪称CT技术发展史上的里程碑...
13:16
8月12日,美团外卖正式宣布启动“堂食提振”计划,旨在加速线下餐饮消费的复苏步伐。该计划的首批举措将面向全量会员发放进店消费券,通过精准补贴刺激消费者到店就餐需求。这一策略的推出,不仅延续了美团在餐饮领域持续投入的态势,更体现了平台对恢复堂食消费信心的决心。 此前,美团已率先推出“小店助力金计划”,为餐饮小店提供最高5万元的运营资金支持。今年立秋前后,首批助...
13:16
摩根大通近日发布最新研报,正式将美光科技的目标价从165美元上调至185美元,这一举措彰显了该投行对美光科技未来业绩增长的坚定信心。在当前全球半导体市场持续复苏的背景下,摩根大通认为美光科技凭借其技术领先地位和强大的市场竞争力,有望在接下来的几年内实现更快的业务扩张。此次目标价上调不仅是对美光科技当前表现的高度认可,更是对其未来发展潜力的一次重要肯定。摩根大...
13:16
2025年8月12日,银河娱乐集团正式发布其2025年上半年度财务报告,数据显示公司整体业绩呈现稳健增长态势。报告显示,期内公司实现营收总额高达232亿港元,较去年同期增长8个百分点,展现出良好的发展势头。在盈利能力方面,净利润表现尤为亮眼,达到52.4亿港元,同比增长19%,这一成绩显著超越了行业平均水平。 业绩的持续向好主要归功于公司主营业务的深度拓展与...
13:16
2025年8月12日,香港知名企业九龙仓集团正式发布其上半年财务报告,数据显示营收出现显著下滑,同比减少19%至56.7亿港元。与此同时,股东应占盈利也大幅缩水至5.35亿港元。面对这一业绩变化,公司并未犹豫,迅速作出决策,宣布每股中期派息0.20港元,以稳定投资者信心。此次业绩下滑的主要原因,被归结为复杂多变的市场环境带来的挑战与压力。九龙仓集团作为香港重...
13:16
2025年8月13日,备受关注的 tropical cyclone "杨柳" 预计将进入香港800公里警戒范围,香港天文台正式宣布将发布一号戒备信号。这一预警信息意味着香港市民和各相关部门需立即提高警惕,密切关注天气动态并做好全面防范准备。作为香港气象监测的核心机构,天文台正通过先进的监测系统对"杨柳"的路径轨迹进行实时追踪,确保第一时间掌握其发展态势。据悉...
13:16
2025年8月12日,国家医疗保障局正式公示了通过2025年度基本医疗保险药品目录及商业健康险创新药目录初步审查的药品清单。此次公示的药品名单涵盖了在相关部门支持与指导下成功申报的药品,其核心目的在于广泛收集社会各界反馈意见,为后续的复核工作提供重要参考依据。值得注意的是,本次公示并非最终结果,最终确定的药品目录将根据收集到的意见进行必要调整,并将通过官方申...
13:16
《科创板日报》最新报道,Counterpoint研究机构发布的数据显示,2025年上半年全球智能眼镜市场出货量实现惊人增长,同比激增110%。这一突破性增长主要得益于Ray-Ban Meta智能眼镜的火爆销售,其强劲的市场需求成为行业发展的主要驱动力。与此同时,小米、雷鸟科技(TCL-RayNeo)等新兴品牌积极入局,以及众多小型品牌的涌现,进一步加速了市场...