智谱开源全球最强视觉推理模型GLM-4.5V参数达106B

智谱AI重磅宣布推出并开源了全球参数规模达100B且效果最优的开源视觉推理模型GLM-4.5V,这一里程碑式成果标志着该公司在探索通用人工智能(AGI)道路上迈出了坚实一步。该模型已同步在魔搭社区与Hugging Face平台实现全面开源,其总参数量高达106B,激活参数为12B,这一规模不仅刷新了多模态推理技术的纪录,更代表了行业发展的最新高度。GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air构建,完美延续了GLM-4.1V-Thinking的技术传承与创新路径。

在41项公开视觉多模态榜单的激烈竞争中,GLM-4.5V以绝对优势斩获同级别开源模型的最高性能(SOTA),全面覆盖图像识别、视频分析、文档理解及GUI Agent等核心任务领域。值得注意的是,该模型不仅实验室数据表现卓越,更在真实场景应用中展现出惊人的实用价值。通过创新的高效混合训练机制,GLM-4.5V成功整合了各类视觉内容处理能力,实现了全场景视觉推理的突破,包括但不限于图像推理、视频理解、GUI任务处理、复杂图表与长文档解析,以及先进的Grounding能力。特别设计的”思考模式”开关,让用户可根据需求灵活切换快速响应或深度推理模式,在效率与效果之间实现完美平衡。

为让开发者直观感受GLM-4.5V的强大能力,智谱清言团队同步开源了一款创新桌面助手应用。该应用支持实时截屏与录屏功能,可精准捕捉屏幕信息,并依托GLM-4.5V高效处理各类视觉推理任务,如代码辅助生成、视频内容智能分析、游戏场景解答、文档深度解读等多元应用场景。这款应用将成为您工作娱乐中的智能伙伴,让屏幕互动体验进入全新维度。

智谱开源全球最强视觉推理模型GLM-4.5V参数达106B插图1

技术实力方面,GLM-4.5V的API现已全面上线智谱开放平台BigModel.cn,特别为所有用户准备了2000万Tokens的免费资源包。该模型在保持业界顶尖精度的同时,实现了推理速度与部署成本的完美平衡,为企业与开发者提供了极具性价比的多模态AI解决方案。API调用价格极具竞争力:输入仅2元/M tokens,输出6元/M tokens,响应速度高达60-80tokens/s。此外,模型在视觉定位、前端复刻、图像识别推理、复杂文档深度解读以及GUI Agent能力等方面均展现出超凡实力。

具体技术细节上,GLM-4.5V由视觉编码器、MLP适配器和语言解码器三部分精密组成,支持长达64K的多模态长上下文处理,兼容图像与视频双重输入模式。通过创新的三维卷积技术,显著提升了视频处理效率;采用双三次插值机制,大幅增强了高分辨率及极端宽高比图像的处理能力与稳定性;更引入三维旋转位置编码(3D-RoPE),全方位强化了多模态信息的三维空间感知与推理能力。

开放资源:
GitHub:https://github.com/zai-org/GLM-V
Hugging Face:https://huggingface.co/collections/zai-org/glm-45v-68999032ddf8ecf7dcdbc102
魔搭社区:https://modelscope.cn/collections/GLM-45V-8b471c8f97154e

最新快讯

2025年10月02日

20:25
2025年10月2日,OpenAI迎来历史性时刻,成功完成约66亿美元的股份转让,这一壮举使其估值飙升至令人惊叹的5000亿美元,正式跻身全球最贵初创公司的行列。这一里程碑不仅彰显了OpenAI在人工智能领域的卓越成就,更预示着AI技术的无限潜能与广阔前景。 在战略布局方面,OpenAI宣布与日本数字厅达成深度战略合作,双方将携手推动AI技术在公共领域的创新...
20:25
在汽车行业经历深刻变革的浪潮中,极氪凭借自主研发的尖端技术成功突破了传统豪华车市场的壁垒。该品牌推出的极氪9X车型采用不计成本的研发模式,搭载了1400匹马力的三电机混动电驱系统,其动力表现堪比顶级超跑,为消费者带来了前所未有的驾驶体验。 极氪9X的突破性进展不仅体现在动力系统上,更在于其与宁德时代联合研发的900V混动专用电池。这一创新技术使得该车型实...
19:54
2025年10月2日,黄海南部及山东南部、江苏北部近岸海域将迎来一次由出海气旋引发的风浪天气。受其影响,该区域预计将出现中到大浪,浪高可达2至3.4米,风力强劲。国家海洋预报台已紧急发布海浪蓝色警报,提醒公众密切关注天气变化。此次大浪预计将持续至10月3日上午,相关部门已启动应急响应机制。海事部门特别提醒海上作业船只加强航行安全管控,及时调整作业计划,沿海单...
19:54
2025年10月2日,国泰海通总裁郁伟君在重要场合发表观点,强调“并购六条”政策及退市制度的完善对并购市场环境的显著优化作用。他指出,这些改革不仅大幅提升了交易效率,更增强了市场灵活性,为各类企业提供了更为广阔的发展空间。郁伟君特别提到,国家正积极鼓励龙头企业通过并购手段在半导体、生物医药、新能源等战略性新兴产业中实现做优做强,这一战略导向为投行提供了前所未...
19:54
Steam最新公布的2025年9月软硬件调查报告揭示了令人瞩目的市场动态。在显卡领域,RTX 4060笔记本显卡凭借0.22%的份额增长强势回归,再次登顶显卡占有率榜首。值得注意的是,桌面版RTX 4060却出现0.6%的份额下滑,跌至第三位。这一变化反映出消费者对移动端高性能显卡需求的持续升温。 在操作系统方面,Windows 11的份额实现了显著增长,增...
19:54
2025年10月2日,备受瞩目的岚图汽车科技股份有限公司正式向香港联合交易所提交上市申请,计划以介绍方式登陆港股市场。作为东风公司倾力打造的高端智慧新能源品牌,岚图不仅是中国首个实现20万辆整车下线的央国企高端新能源车企,更以其卓越的市场表现和前瞻性的战略布局,在行业格局中占据重要地位。 自2022年至2024年,岚图汽车销量复合增长率高达103.2%,...
19:22
交通运输部最新监测数据显示,10月5日全国公路路网将迎来国庆假期第二个出行小高峰。今年国庆长假期间,中长距离公路出行需求显著攀升,小客车自驾出行比例高达近八成,成为假期主要出行方式。其中,新能源车辆表现尤为抢眼,日均使用量达到1250万辆,占日均总流量五分之一,较去年同期激增约30%,展现出强劲的增长势头。 国家能源局最新统计报告显示,国庆当日高速公路充电量...
19:22
行业消息人士透露,大疆将于今年11月迎来产品线的大规模更新,旗下Neo 2轻型无人机、Mic 3 Pro麦克风以及Osmo Mobile 8手机稳定器将同步亮相,为用户带来全方位的影像创作升级体验。 Neo 2无人机在续航能力上实现了显著突破,配备166 mAh电池可支持超18分钟的飞行时间,同时创新性地采用双层桨叶保护罩设计,大幅提升抗风与抗冲击性能。...
19:22
10月1日,国庆假期迎来客流首日,重庆火车站迎来年度客流高峰,当日累计发送旅客高达36.8万人次,刷新了该站单日客发量的历史纪录。这一数据不仅超越了往年的国庆假期客流峰值,更比2025年“五一”假期单日最高客发量增加了整整3.9万人次,充分展现了市民出行热情的持续高涨。面对如此庞大的客流压力,铁路部门迅速启动应急预案,采取了一系列有力措施确保旅客出行顺畅。具...
19:22
星展集团研究部最新发布的研究报告,对紫金黄金国际的未来发展前景给予了高度评价。报告指出,凭借其庞大的黄金储备规模以及卓越的海外资产整合能力,紫金黄金国际有望在盈利能力和增长表现上持续领跑行业。作为紫金矿业海外黄金资产的核心上市平台,该公司展现出令人瞩目的增长潜力,未来发展空间巨大。 报告详细分析了紫金黄金国际的财务状况和业务布局,认为其在黄金资源掌控、海外市...
19:22
斯巴鲁力狮轿车在美国市场掀起了一股意外热潮。尽管这款经典车型已于9月12日在印第安纳州工厂正式停产,但其在当月的销量却逆势上扬,售出1884辆,同比增长8.3%,成为斯巴鲁品牌当月唯一实现销量增长的车型。最后一辆下线的磁铁灰限量版力狮,不仅是一辆汽车,更是这款经典家用轿车时代的象征性落幕之作。 自1989年首次问世以来,力狮凭借其独特的水平对置发动机与AWD...
19:22
大和证券资深分析师John Choi近期发布了一份深度行业报告,指出随着人工智能技术的全面渗透,中国云基础设施市场正迎来前所未有的发展机遇。报告特别强调,作为中国云计算领域的领军企业,阿里巴巴凭借其前瞻性的战略布局,有望在未来几年内实现跨越式增长。 John Choi在报告中详细阐述了人工智能技术对各行业带来的颠覆性变革,并指出云基础设施作为AI发展的基...