智谱AIChatGLM3硬刚OpenAI功能对标GPT-4V代码解释器全面上线

2023-10-31 09:14:01 互联网 64 次阅读

国产大模型领域估值最高的企业究竟为何是智谱AI？短短四个月内，这家公司用惊艳的成绩单证明了自己的实力——自研大模型ChatGLM3不仅底层架构全面升级，功能层面更是实现了全方位革新。性能表现堪称惊艳，在所有50个公开性能测评数据集中，ChatGLM3豪取44个全国第一；产品功能上，率先推出引爆用户关注的代码解释器，不仅能生成代码还能直接运行，这一创新功能现已向公众开放体验，我们亲自测试后发现，用它生成爱心表情包效果相当有趣，而且是国内首创。从智谱AI发布的ChatGLM3中，究竟隐藏着哪些技术突破？行业又将如何从中洞察大模型发展新趋势？让我们深入其发布会现场一探究竟。

ChatGLM3究竟有何过人之处？早在之前，量子位就获悉智谱AI将推出ChatGLM3迭代版本的消息。发布会上，全新升级的ChatGLM第三代正式亮相，在四个关键维度展现出显著提升。首先是性能突破。智谱AI独创多阶段增强训练方法，通过丰富训练数据与优化训练策略，使模型训练更为充分。评测数据显示，相较于ChatGLM2系列，ChatGLM3在同尺寸模型中横扫44个中英文公开数据集测试的国内第一。其次是推理效率提升，官方介绍ChatGLM3系列采用最新高效动态推理和显存优化技术，相同硬件条件下，推理速度比UC伯克利vLLM和Hugging Face TGI最新版本提升2-3倍，成本降低一倍，每千tokens推理成本仅需0.5分。第三大亮点是新增Agent智能体能力。通过自研AgentTuning技术，ChatGLM3原生支持工具调用、代码执行、游戏交互、数据库操作等复杂场景，智能规划执行能力比ChatGLM2系列提升1000%，ChatGLM3-turbo在最新AgentBench上表现接近GPT-3.5且略有优势。值得注意的是，尽管全面升级，智谱AI仍坚持开源理念，此次开源动作覆盖多个细分领域：对话模型ChatGLM3-6B、长文本模型ChatGLM3-6B-32K、多模态模型CogVLM-17B以及智能体AgentLM全部开源，其中60亿参数的ChatGLM3-6B在9个榜单中位列国内第一，32k版本ChatGLM3-6B-32K在LongBench中表现最佳。智谱AICEO张鹏透露，前期开源的ChatGLM-6B下载量已突破千万，这种开放姿态对智谱AI在4个月内推出新一代基座模型功不可没，通过发布领先实用的模型吸引开发者和B端用户，逐步构建自研大模型生态。

智谱AI对ChatGLM3的重视程度从全方位数据中可见一斑。其研发速度和开放态度背后，是长期的技术积累。作为清华KEG实验室成果转化企业，智谱AI兼具市场化大模型公司与学术研究机构的双重属性。作为国内最早投身大模型研究的团队之一，4年多的技术沉淀使其明确持续深耕方向。在百模混战中，智谱AI通过技术为核心竞争力拓展合作网络，践行大模型创企应有之义。

产品实际效果如何？从实用性、应用范围和适配能力三方面来看，ChatGLM3展现出显著优势。功能丰富度上，智谱清言已对标GPT-4V，新增三大核心功能：代码解释器、搜索增强和看图识语义。CEO张鹏强调”不做Demo只推上线”，功能已全面开放。我们实测发现：代码解释器不仅能分析读代码，还能在沙盒中运行代码并生成结果。生成大脑成分饼图时，系统调用Python库生成了幽默表情包；雷达图分析打工人能力时，对摸鱼能力总结精准；数据可视化测试中，系统自动识别财报数据并生成图表，还能直接上传Excel文件分析；函数可视化功能准确生成图像并附上ReLU函数用法说明。搜索增强能力通过WebGLM技术实现，能快速响应热点话题并溯源信息，可用来查找资料并附上链接。看图识语义功能基于CogVLM，识别菜品生成食谱效果良好，对表情包解读能力同样出色，能分析”跳过台阶”表情包中的场景元素，并准确判断其为meme模仿。

落地应用方面，智谱AI率先实现大模型小型化，推出可部署于汽车和手机的端侧模型ChatGLM3-1.5B和3B，支持Vivo、小米、三星等平台，在移动端CPU芯片上实现20tokens/s推理速度，性能接近ChatGLM2-6B模型。硬件适配能力上，全面支持昇腾、神威等10余种国产芯片，在昇腾生态上推理速度提升3倍多，展现出极强的硬件兼容性。

ChatGLM3的产品能力可用三个”更”来概括：更强的实用性、更广的应用范围、更高的硬件适配能力。智谱AI似乎正加速推进大模型落地，从底层技术到产品能力全面发力。这种雷厉风行的速度，既是对前期融资承诺的兑现，也是技术实力的体现。作为国内唯一拥有对标OpenAI全产品线的企业，智谱AI在对话（ChatGLM vs ChatGPT）、文生图（CogView vs DALL.E）、代码（CodeGeeX vs Codex）、搜索增强（WebGPT vs WebGLM）和图文理解（ChatGLM3 vs ChatGPT-4V）五个维度全面发力，形成”炫富式”的全模型产品矩阵。从初代GLM到ChatGLM2再到ChatGLM3，智谱AI以不疾不徐的迭代速度，用实际效果赢得了市场认可。在ChatGPT诞生一周年之际，AI行业正经历最激烈的大模型竞赛，智谱AI选择此时发布新一代基座模型，正是对年初各企业”年底要做到xxx”目标的回应。在技术、人才、资金和社会责任等维度全面展示实力的同时，智谱AI率先交出了答卷，为行业树立了新标杆。

试玩地址：https://ChatGLM.cn/main/code