DeepSeek R2的发布再次遭遇延期,这一消息引发了业界的广泛关注。据《The Information》独家报道,DeepSeek内部原计划于今年5月正式推出下一代大模型DeepSeek-R2,但由于整体表现尚未达到CEO梁文峰的预期标准,发布计划被迫搁置。该报道指出,尽管工程团队在过去数月内持续对R2进行优化,但CEO梁文峰近期评估后认为效果仍未达标,因此未批准模型发布,也未设定新的目标日期。
DeepSeek-R2承载着极高的期望。早在2025年初,其研发路线就已明确,旨在大幅提升多语言推理能力和编码生成能力。作为R1模型的升级版本,R2被视为DeepSeek技术飞跃的关键节点。此次推迟并非偶然,首先从技术层面来看,DeepSeek在R1模型中已展现出”以低成本构建高性能推理模型”的卓越能力,因此对下一代模型提出更高标准实属自然。更关键的是,芯片供应问题成为制约因素。《The Information》指出,DeepSeek正面临与其他中国AI企业类似的困境——高端AI训练芯片短缺。特别是2024年4月以来,美国进一步收紧对华先进芯片出口管制,英伟达H20 GPU停止供货,导致训练与部署算力紧张,严重影响了模型迭代速度。
这一现状在市场层面也有所体现。据悉,DeepSeek已开始与多家中国云服务提供商沟通R2模型的部署事宜,但这些合作方普遍反馈,现阶段他们主要部署的是R1模型,算力环境也主要基于H20 GPU。R2何时上线,仍要取决于模型本身的优化完成度以及硬件资源是否到位。
根据彭博社、路透社和The Information的综合报道,DeepSeek的技术路径和发布策略,代表了一类中国AI企业的典型特征:对标OpenAI,强调多模态、强代码、成本效能比,在研发上追求精益求精,在发布上审慎推进。这一发展路径不仅反映了中国AI产业的快速崛起,也揭示了企业在技术创新与市场应用之间寻求平衡的智慧。