智谱开源全球最强视觉推理模型GLM-4.5V参数达106B

智谱AI重磅宣布推出并开源了全球参数规模达100B且效果最优的开源视觉推理模型GLM-4.5V,这一里程碑式成果标志着该公司在探索通用人工智能(AGI)道路上迈出了坚实一步。该模型已同步在魔搭社区与Hugging Face平台实现全面开源,其总参数量高达106B,激活参数为12B,这一规模不仅刷新了多模态推理技术的纪录,更代表了行业发展的最新高度。GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air构建,完美延续了GLM-4.1V-Thinking的技术传承与创新路径。

在41项公开视觉多模态榜单的激烈竞争中,GLM-4.5V以绝对优势斩获同级别开源模型的最高性能(SOTA),全面覆盖图像识别、视频分析、文档理解及GUI Agent等核心任务领域。值得注意的是,该模型不仅实验室数据表现卓越,更在真实场景应用中展现出惊人的实用价值。通过创新的高效混合训练机制,GLM-4.5V成功整合了各类视觉内容处理能力,实现了全场景视觉推理的突破,包括但不限于图像推理、视频理解、GUI任务处理、复杂图表与长文档解析,以及先进的Grounding能力。特别设计的”思考模式”开关,让用户可根据需求灵活切换快速响应或深度推理模式,在效率与效果之间实现完美平衡。

为让开发者直观感受GLM-4.5V的强大能力,智谱清言团队同步开源了一款创新桌面助手应用。该应用支持实时截屏与录屏功能,可精准捕捉屏幕信息,并依托GLM-4.5V高效处理各类视觉推理任务,如代码辅助生成、视频内容智能分析、游戏场景解答、文档深度解读等多元应用场景。这款应用将成为您工作娱乐中的智能伙伴,让屏幕互动体验进入全新维度。

智谱开源全球最强视觉推理模型GLM-4.5V参数达106B插图1

技术实力方面,GLM-4.5V的API现已全面上线智谱开放平台BigModel.cn,特别为所有用户准备了2000万Tokens的免费资源包。该模型在保持业界顶尖精度的同时,实现了推理速度与部署成本的完美平衡,为企业与开发者提供了极具性价比的多模态AI解决方案。API调用价格极具竞争力:输入仅2元/M tokens,输出6元/M tokens,响应速度高达60-80tokens/s。此外,模型在视觉定位、前端复刻、图像识别推理、复杂文档深度解读以及GUI Agent能力等方面均展现出超凡实力。

具体技术细节上,GLM-4.5V由视觉编码器、MLP适配器和语言解码器三部分精密组成,支持长达64K的多模态长上下文处理,兼容图像与视频双重输入模式。通过创新的三维卷积技术,显著提升了视频处理效率;采用双三次插值机制,大幅增强了高分辨率及极端宽高比图像的处理能力与稳定性;更引入三维旋转位置编码(3D-RoPE),全方位强化了多模态信息的三维空间感知与推理能力。

开放资源:
GitHub:https://github.com/zai-org/GLM-V
Hugging Face:https://huggingface.co/collections/zai-org/glm-45v-68999032ddf8ecf7dcdbc102
魔搭社区:https://modelscope.cn/collections/GLM-45V-8b471c8f97154e

最新快讯

2025年11月28日

12:38
2025年11月28日,国家能源局综合司正式发布通知,宣布全面启动“人工智能+”能源试点工作,标志着我国能源行业智能化转型进入全新阶段。此次试点聚焦于能源领域的八大核心应用场景和37项重点任务,旨在通过系统性布局推动能源产业与人工智能技术的深度融合。通知明确面向全国能源企业公开征集具有高价值的应用场景需求,并创新性地采用“揭榜挂帅”机制,鼓励人工智能技术供给...
12:38
2025年上海国际体育博览会盛大启幕,瑞士高端跑步品牌On昂跑以"空前之轻,未来之履"为核心主题,精心打造了引人注目的品牌展台。这一创新设计不仅完美融合了前沿空间美学与互动体验,更向全球观众全方位展示了On昂跑在跑步科技与时尚设计领域的最新突破与成果。展会期间,品牌特别宣布重新发售备受瞩目的高性能竞速跑鞋Cloudboom Strike LS,现场跑者不仅有...
12:38
2025年11月28日,中国科学院电工研究所传来振奋人心的消息,他们成功研制出一种具有突破性意义的大口径高场通用超导磁体。该磁体中心磁场强度达到了惊人的16.5特斯拉,内孔直径更是达到了150毫米,这一成就不仅刷新了国内同类磁体的最高磁场纪录,更标志着我国在超导技术领域迈出了坚实的一步。 为了实现这一突破,科研团队采用了多项创新技术。他们巧妙地运用了分层分级...
12:38
2026年初,备受期待的M&M'S®全新门店即将在上海迪士尼度假区迪士尼小镇盛大启幕。这家融合购物、餐饮与娱乐演出的复合型门店坐落于迪士尼小镇入口处,将成为游客体验迪士尼奇妙旅程的全新亮点。此次开业计划由玛氏中国正式宣布,不仅标志着品牌在中国市场的进一步扩张,更体现了其致力于为游客打造沉浸式互动体验的创新精神。通过将品牌元素与迪士尼经典场景深度融合,...
12:38
2025年11月28日,科技界传来振奋消息,谷歌推出的“凭据恢复API”已取得突破性进展,显著提升了安卓设备的换机体验。长期以来,安卓用户在更换手机后不得不逐一重新登录各种应用,而iOS用户却能享受无缝迁移登录状态的红利。为解决这一痛点,谷歌于2024年正式推出这项创新API,通过安全迁移旧设备的登录token至新设备,实现一键自动登录。目前,打车平台Ube...
12:38
2025年11月28日,中国领先的检测认证机构启迈QIMA正式宣布,已成功获得亚马逊官方授权,成为其玩具类目直接验证(Direct Verification)合作伙伴实验室网络的核心成员。这一重要里程碑标志着启迈QIMA在跨境电商服务领域迈出了关键一步,未来将面向全球亚马逊平台上的玩具类产品,提供全方位的合规检测与质量验证服务。 作为亚马逊官方认可的合作伙伴...
12:38
2025年11月28日,国际知名质量控制服务商QIMA正式发布关于装运前检验的权威解读。作为行业标杆企业,QIMA强调专业检验必须严格遵循ISO等国际标准体系,确保检验流程的科学性与权威性。其检验服务全面覆盖数量核查、包装检验、质量验证等核心环节,通过多维度检测保障货物符合国际贸易规范。特别值得一提的是,QIMA采用高效的检验流程,客户可在检验工作完成后当天...
12:38
2025年11月28日,备受瞩目的AI平台Model ML成功斩获7500万美元A轮融资,标志着其在金融科技领域的突破性进展。此次融资由知名投资机构FT Partners强势领投,13Books Capital、Y Combinator、QED Investors、LocalGlobe和Latitude等顶尖投资方联合参投,彰显了市场对Model ML创新能...
12:38
2025年,福建高速将斥资1.8亿元自有资金,积极参与海峡保险的年度增资扩股计划。此次增资规模宏大,海峡保险共获得10亿元资金注入,为未来的业务发展注入强劲动力。这笔资金将重点用于拓展机动车保险、企业财产险以及农业保险等核心业务领域,同时也会覆盖互联网保险等新兴业务板块,实现基础业务与扩展业务的协同增长。 在股权结构方面,福建高速此次增资后仍将持有海峡保...
12:07
2025年11月28日,去中心化稳定币借贷平台CreatorFi成功斩获200万美元战略投资,标志着其在Web3创作者经济领域的快速发展获得重要资本支持。本轮融资由业界领先的Aptos基金会与Aptos Labs联合领投,充分彰显了市场对CreatorFi创新模式的认可与期待。据悉,这笔资金将全面用于平台核心技术升级与生态建设,旨在进一步提升用户体验与市场竞...
12:07
2025年11月27日,科技媒体率先披露了一则令人振奋的消息:三星计划在即将推出的One UI 8.5系统中,彻底解决深色模式下应用图标过亮这一长期困扰用户的痛点。据悉,该系统更新将引入一项突破性算法,通过智能适配机制强制调整第三方应用图标的背景亮度,确保在暗色环境下实现视觉上的和谐统一。这一举措不仅能够有效缓解用户在夜间使用手机时的视觉疲劳,更将显著提升整...
12:07
2025年11月,摩尔线程重磅发布Torch-MUSA v2.7.0版本,正式宣布全面支持PyTorch深度学习框架。这一版本与PyTorch主版本号保持高度同步,标志着摩尔线程在深度学习领域的技术实力再上新台阶。 此次更新不仅引入了全新的muFFT与muSolver计算库,还显著强化了对统一内存设备(UMM)的支持。通过优化内存管理机制,Torch-M...