智谱开源全球最强视觉推理模型GLM-4.5V参数达106B

智谱AI重磅宣布推出并开源了全球参数规模达100B且效果最优的开源视觉推理模型GLM-4.5V,这一里程碑式成果标志着该公司在探索通用人工智能(AGI)道路上迈出了坚实一步。该模型已同步在魔搭社区与Hugging Face平台实现全面开源,其总参数量高达106B,激活参数为12B,这一规模不仅刷新了多模态推理技术的纪录,更代表了行业发展的最新高度。GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air构建,完美延续了GLM-4.1V-Thinking的技术传承与创新路径。

在41项公开视觉多模态榜单的激烈竞争中,GLM-4.5V以绝对优势斩获同级别开源模型的最高性能(SOTA),全面覆盖图像识别、视频分析、文档理解及GUI Agent等核心任务领域。值得注意的是,该模型不仅实验室数据表现卓越,更在真实场景应用中展现出惊人的实用价值。通过创新的高效混合训练机制,GLM-4.5V成功整合了各类视觉内容处理能力,实现了全场景视觉推理的突破,包括但不限于图像推理、视频理解、GUI任务处理、复杂图表与长文档解析,以及先进的Grounding能力。特别设计的”思考模式”开关,让用户可根据需求灵活切换快速响应或深度推理模式,在效率与效果之间实现完美平衡。

为让开发者直观感受GLM-4.5V的强大能力,智谱清言团队同步开源了一款创新桌面助手应用。该应用支持实时截屏与录屏功能,可精准捕捉屏幕信息,并依托GLM-4.5V高效处理各类视觉推理任务,如代码辅助生成、视频内容智能分析、游戏场景解答、文档深度解读等多元应用场景。这款应用将成为您工作娱乐中的智能伙伴,让屏幕互动体验进入全新维度。

智谱开源全球最强视觉推理模型GLM-4.5V参数达106B插图1

技术实力方面,GLM-4.5V的API现已全面上线智谱开放平台BigModel.cn,特别为所有用户准备了2000万Tokens的免费资源包。该模型在保持业界顶尖精度的同时,实现了推理速度与部署成本的完美平衡,为企业与开发者提供了极具性价比的多模态AI解决方案。API调用价格极具竞争力:输入仅2元/M tokens,输出6元/M tokens,响应速度高达60-80tokens/s。此外,模型在视觉定位、前端复刻、图像识别推理、复杂文档深度解读以及GUI Agent能力等方面均展现出超凡实力。

具体技术细节上,GLM-4.5V由视觉编码器、MLP适配器和语言解码器三部分精密组成,支持长达64K的多模态长上下文处理,兼容图像与视频双重输入模式。通过创新的三维卷积技术,显著提升了视频处理效率;采用双三次插值机制,大幅增强了高分辨率及极端宽高比图像的处理能力与稳定性;更引入三维旋转位置编码(3D-RoPE),全方位强化了多模态信息的三维空间感知与推理能力。

开放资源:
GitHub:https://github.com/zai-org/GLM-V
Hugging Face:https://huggingface.co/collections/zai-org/glm-45v-68999032ddf8ecf7dcdbc102
魔搭社区:https://modelscope.cn/collections/GLM-45V-8b471c8f97154e

最新快讯

2026年03月05日

11:18
微新创想3月5日消息,近日,广西贵港,一车主踩刹车时听到异响,次日送车保养时发现车底被老鼠塞满了红薯和玉米,估算约有20斤。当事人表示十分吃惊,好奇老鼠是怎么把这些东西搬上车的。不过,好在老鼠也比较懂事”,没有咬断线路。公开资料显示,老鼠不仅是人类的大敌,更是窃食粮食的元凶。这一物种在地球上比人类早出现四千七百多万年,凭借发达的...
11:18
微新创想3月5日消息,据博主定焦数码透露,华为AI眼镜预计将在4月发布,与Pura 90系列、阔折叠二代同期。此前爆料称,这款华为AI眼镜将提供流光银、钛银灰、摩登黑三款配色,支持拍照、拍视频、音频播放以及同声传译等功能。得益于鸿蒙OS系统加持,产品将支持跨端无缝协同,并将带来全新玩法,进一步拓展使用场景。眼镜内置3块锂电池,设...
11:18
微新创想3月5日消息,苹果公司正式发布了新款笔记本电脑MacBook Neo,起售价定为4599元。作为MacBook家族的全新成员,这款产品的出现进一步丰富了苹果入门级轻薄本的产品线。在核心配置上,MacBook Neo搭载了此前由iPhone 16 Pro系列首发的A18 Pro芯片。这标志着苹果手机芯片正式跨界进入了电脑终...
11:18
微新创想:近日福州一起民间借贷纠纷案在网络上引发热议。案件的核心在于原告仅凭微信转账记录提起诉讼,却未能提供充分证据证明借贷合意,最终法院驳回了其诉讼请求。 原告与被告是同学关系。2024年11月,被告以偿还信用卡为由向原告借款1万元,并承诺会在短期内归还。出于对同学的信任,原告并未要求对方出具借条,而是通过微信分两次各转账5000元。 然而在还款期限届满后...
11:18
微新创想:3月5日11时11分(当地时间)日本民营航天公司“太空一号”在和歌山县纪伊太空发射场进行“凯洛斯”3号火箭的发射任务,但最终以失败告终。火箭点火升空后出现异常,剧烈旋转并随后解体爆炸。公司随即启动飞行中止程序,确保了地面安全。 此次发射失败是“凯洛斯”3号型号连续第三次遭遇失利。此前一天,即3月4日,原定的发射任务也因安全系统自动触发而被迫中止,倒...
11:18
微新创想:2026年3月4日,微软面向Windows 10系统重新推送更新KB5075039,修复因2025年10月KB5066835更新引发的Windows恢复环境(WinRE)无法启动及USB键鼠失灵问题。该故障源于USBHUB3.SYS驱动异常,导致用户在WinRE中无法操作。此前1月发布的同版本更新未能有效解决。 本次修复特别针对安装了KB50681...
11:18
微新创想:2026年3月,超精密加工及检测装备制造商博众泰达完成A+轮融资,投资方为龙江基金。此次融资标志着公司在超精密制造领域迈出了重要一步,进一步巩固了其在行业内的领先地位。 公司总部位于中国,专注于超精密设备、精密轴承及精密测量设备的研发与制造,并提供工艺开发及技术服务。博众泰达凭借先进的技术实力和丰富的行业经验,赢得了众多客户的信赖与支持。 本轮融资...
11:18
微新创想:2026年3月,深圳佰为深科技有限公司宣布完成C+轮融资,由顺禧基金独家投资。此次融资标志着公司在点式光纤传感器及解调技术领域迈出了重要一步。 该公司专注于点式光纤传感器及解调技术的研发与产业化,致力于将先进的传感技术应用于多个行业。其核心技术包括MEMS法珀腔、光纤布拉格光栅(FBG)传感以及白光干涉和扫描光谱解调等,技术实力在国内处于领先地位。...
11:18
微新创想:3月5日,无人飞行平台研发商天晴空天宣布完成A+轮融资,由晨熹资本独家投资。此次融资标志着公司在无人飞行技术领域迈出了重要的一步。 公司总部位于中国,专注于先进无人飞行平台的研发与批量制造。凭借多年的技术积累和创新能力,天晴空天已建立起涵盖多种类型无人飞行器的产品体系。 产品线覆盖察打一体无人机、攻击蜂群无人机、复合翼无人机、无人战斗机、飞行汽车等...
11:18
微新创想:2026年3月,深圳南科天润科技有限公司宣布完成A轮融资,由国华投资和力鼎资本共同出资。此次融资为公司首次对外融资,标志着其固态电池关键材料技术进入规模化落地阶段。 该公司专注于固态电池核心材料的研发与产业化,致力于推动新能源技术的发展。其技术基础源于南方科技大学的科研成果,具备较强的技术实力和创新优势。 本轮融资将主要用于中试产线的建设,以加快技...
11:18
微新创想:3月5日,多名消费者反映iPhone 17 Pro/Pro Max星宇橙配色机型使用约一个月后,铝合金边框及相机区域的橙色涂层异常褪为粉色。该问题在多个用户中出现,但并未集中在某一特定地区或使用场景。涉事设备均处于正常使用状态,用户表示并未进行任何暴晒或使用化学清洁剂等可能影响外观的行为。 微新创想:苹果客服方面回应称,目前尚未接到关于该问题的集中...
11:18
微新创想:2026年3月5日,一加中国区总裁李杰宣布一加15T将于本月正式发布。这款新机被定位为“全能小钢炮”,旨在为用户提供一款兼具高性能与便携性的旗舰产品。作为一加品牌在小屏手机领域的又一力作,一加15T在外观设计上也下足了功夫。 一加15T配备了一块6.32英寸的超窄四等边屏幕,边框宽度仅1.xx毫米,是目前小屏手机中视觉体验最为紧凑的设计之一。这种极...