
微新创想
2月11日的消息显示,这个春节全网都在期待DeepSeek发布最新的大模型DeepSeek V4。然而,从目前的情况来看,大版本的发布可能不会在春节期间进行。今天DeepSeek悄然更新了一个新版本,带来了不少亮点。根据DeepSeek官方的介绍,这次更新主要集中在提升模型的上下文处理能力,达到了1M的长度,而此前的DeepSeek V3系列仅支持128K的上下文。这一提升使得DeepSeek能够一次性处理像《三体》三部曲这样体量庞大的超长文本,这一点已经得到了许多网友的实测验证。

其他方面的能力则延续了之前版本的特性,DeepSeek并未提及更多细节。值得注意的是,在回答完相关问题后,DeepSeek特别添加了一段说明,强调这是最新的DeepSeek模型,并没有特定的子名称,既不是V3也不是R1。这种表述方式似乎在刻意区分新模型与旧版本,同时又避免让人误以为这是V4的预览版。
从网友的反馈来看,这次DeepSeek的小更新实际上带来了显著的能力提升。知名大模型测试博主@karminski-牙医已经进行了一次快速测试,主要针对编程领域的一个经典测试项目——大象牙膏实验。测试结果显示,模型在美学、建模、物理模拟以及代码性能等方面都有明显进步,甚至出现了一些令人惊喜的表现。根据测试结果,该模型在多个指标上都达到了当前最优水平,也就是所谓的SOTA(State-of-the-Art)表现,当然主要是针对DeepSeek自身版本而言。

目前还不确定这个新模型是否已经达到了最终的完全体。例如,在一个近期很热门的测试问题中,询问“50米距离上去洗车是走路还是开车去”,DeepSeek新模型给出的回答存在不一致的情况。有的用户认为回答正确,有的则表示无法理解。这种不一致可能意味着模型还在不断优化和调整中,也反映出大模型在实际应用中仍面临一些挑战。
