国产大模型领域估值最高的企业究竟为何是智谱AI?短短四个月内,这家公司用惊艳的成绩单证明了自己的实力——自研大模型ChatGLM3不仅底层架构全面升级,功能层面更是实现了全方位革新。性能表现堪称惊艳,在所有50个公开性能测评数据集中,ChatGLM3豪取44个全国第一;产品功能上,率先推出引爆用户关注的代码解释器,不仅能生成代码还能直接运行,这一创新功能现已向公众开放体验,我们亲自测试后发现,用它生成爱心表情包效果相当有趣,而且是国内首创。从智谱AI发布的ChatGLM3中,究竟隐藏着哪些技术突破?行业又将如何从中洞察大模型发展新趋势?让我们深入其发布会现场一探究竟。
ChatGLM3究竟有何过人之处?早在之前,量子位就获悉智谱AI将推出ChatGLM3迭代版本的消息。发布会上,全新升级的ChatGLM第三代正式亮相,在四个关键维度展现出显著提升。首先是性能突破。智谱AI独创多阶段增强训练方法,通过丰富训练数据与优化训练策略,使模型训练更为充分。评测数据显示,相较于ChatGLM2系列,ChatGLM3在同尺寸模型中横扫44个中英文公开数据集测试的国内第一。其次是推理效率提升,官方介绍ChatGLM3系列采用最新高效动态推理和显存优化技术,相同硬件条件下,推理速度比UC伯克利vLLM和Hugging Face TGI最新版本提升2-3倍,成本降低一倍,每千tokens推理成本仅需0.5分。第三大亮点是新增Agent智能体能力。通过自研AgentTuning技术,ChatGLM3原生支持工具调用、代码执行、游戏交互、数据库操作等复杂场景,智能规划执行能力比ChatGLM2系列提升1000%,ChatGLM3-turbo在最新AgentBench上表现接近GPT-3.5且略有优势。值得注意的是,尽管全面升级,智谱AI仍坚持开源理念,此次开源动作覆盖多个细分领域:对话模型ChatGLM3-6B、长文本模型ChatGLM3-6B-32K、多模态模型CogVLM-17B以及智能体AgentLM全部开源,其中60亿参数的ChatGLM3-6B在9个榜单中位列国内第一,32k版本ChatGLM3-6B-32K在LongBench中表现最佳。智谱AICEO张鹏透露,前期开源的ChatGLM-6B下载量已突破千万,这种开放姿态对智谱AI在4个月内推出新一代基座模型功不可没,通过发布领先实用的模型吸引开发者和B端用户,逐步构建自研大模型生态。
智谱AI对ChatGLM3的重视程度从全方位数据中可见一斑。其研发速度和开放态度背后,是长期的技术积累。作为清华KEG实验室成果转化企业,智谱AI兼具市场化大模型公司与学术研究机构的双重属性。作为国内最早投身大模型研究的团队之一,4年多的技术沉淀使其明确持续深耕方向。在百模混战中,智谱AI通过技术为核心竞争力拓展合作网络,践行大模型创企应有之义。
产品实际效果如何?从实用性、应用范围和适配能力三方面来看,ChatGLM3展现出显著优势。功能丰富度上,智谱清言已对标GPT-4V,新增三大核心功能:代码解释器、搜索增强和看图识语义。CEO张鹏强调”不做Demo只推上线”,功能已全面开放。我们实测发现:代码解释器不仅能分析读代码,还能在沙盒中运行代码并生成结果。生成大脑成分饼图时,系统调用Python库生成了幽默表情包;雷达图分析打工人能力时,对摸鱼能力总结精准;数据可视化测试中,系统自动识别财报数据并生成图表,还能直接上传Excel文件分析;函数可视化功能准确生成图像并附上ReLU函数用法说明。搜索增强能力通过WebGLM技术实现,能快速响应热点话题并溯源信息,可用来查找资料并附上链接。看图识语义功能基于CogVLM,识别菜品生成食谱效果良好,对表情包解读能力同样出色,能分析”跳过台阶”表情包中的场景元素,并准确判断其为meme模仿。
落地应用方面,智谱AI率先实现大模型小型化,推出可部署于汽车和手机的端侧模型ChatGLM3-1.5B和3B,支持Vivo、小米、三星等平台,在移动端CPU芯片上实现20tokens/s推理速度,性能接近ChatGLM2-6B模型。硬件适配能力上,全面支持昇腾、神威等10余种国产芯片,在昇腾生态上推理速度提升3倍多,展现出极强的硬件兼容性。
ChatGLM3的产品能力可用三个”更”来概括:更强的实用性、更广的应用范围、更高的硬件适配能力。智谱AI似乎正加速推进大模型落地,从底层技术到产品能力全面发力。这种雷厉风行的速度,既是对前期融资承诺的兑现,也是技术实力的体现。作为国内唯一拥有对标OpenAI全产品线的企业,智谱AI在对话(ChatGLM vs ChatGPT)、文生图(CogView vs DALL.E)、代码(CodeGeeX vs Codex)、搜索增强(WebGPT vs WebGLM)和图文理解(ChatGLM3 vs ChatGPT-4V)五个维度全面发力,形成”炫富式”的全模型产品矩阵。从初代GLM到ChatGLM2再到ChatGLM3,智谱AI以不疾不徐的迭代速度,用实际效果赢得了市场认可。在ChatGPT诞生一周年之际,AI行业正经历最激烈的大模型竞赛,智谱AI选择此时发布新一代基座模型,正是对年初各企业”年底要做到xxx”目标的回应。在技术、人才、资金和社会责任等维度全面展示实力的同时,智谱AI率先交出了答卷,为行业树立了新标杆。
试玩地址:https://ChatGLM.cn/main/code