DeepSeek V4 Lite小参数模型性能强劲逼近美国顶流大模型

微新创想:DeepSeek在2月11日发布了一个名为DeepSeek V4 Lite的新模型,尽管它没有达到春节档发布的DeepSeek V4的规模,但参数量仅有2000亿,相对较小。这个模型的主要亮点在于支持1M的上下文长度,这在处理长文本任务时具有一定的优势。然而,此前网友的测试反馈显示,除了超长上下文之外,其整体表现并没有特别惊艳,因为参数规模与主流大模型相比仍有差距。

然而,自DeepSeek V4 Lite发布以来,其性能一直在持续提升。2月27日,已经有网友测试发现,该模型的表现逐渐增强。昨日再次升级后,Linux Do社区的大佬HCPTangHY进行了测试,并表示非常震惊,认为DeepSeek V4 Lite在此次升级后已经达到了国产模型的最先进水平,甚至在某些方面超越了当前主流的闭源模型。

不仅如此,HCPTangHY还指出,如果DeepSeek V4 Lite能够继续训练下去,未来有可能通过开源的方式对闭源模型形成有力挑战。从他的测试结果来看,0302版本的DeepSeek V4 Lite在各项指标上的得分比0227版本有了明显提升,已经非常接近目前最顶尖的闭源模型Sonnet 4.6。

在测试中,除了常规的文本生成任务外,DeepSeek V4 Lite还通过了多个行业知名的测试项目,包括游戏和前端开发相关的测试。其中,备受关注的天气卡测试表现尤为突出,无论是从视觉设计还是功能实现上,都展现出了在线级的优秀表现。

DeepSeek V4 Lite小参数模型性能强劲逼近美国顶流大模型插图1

回顾过去一年的AI大模型发展,国产大模型在对话聊天方面已经与闭源模型差距不大。但在多模态、编程、数学以及智能体等更复杂的领域,仍然存在一定的不足。最近发布的GLM5、MiniMax 2.5和Qwen 3.5系列在这些方面有所进步,但面对Anthropic、OpenAI和谷歌等国际巨头推出的新模型,差距又有所扩大。

国内公司在追赶顶流闭源模型的过程中,面临诸多挑战。首先是投入资源相对有限,相较于美国的科技巨头,国内企业在研发资金上的支持仍然不足。其次是算力方面的差距,大模型的训练和优化需要强大的计算能力,而国内在这一方面仍处于追赶阶段。此外,数据资料的积累也是一大难题,谷歌和OpenAI凭借多年的技术积累和庞大的用户基数,拥有更丰富的训练数据。

值得一提的是,Anthropic为了获取训练数据,曾从盗版网站下载大量书籍,这一行为引发了广泛争议,并最终导致其被法院判决赔偿15亿美元。这反映出国际大模型公司对数据获取的极端重视,以及在这一过程中可能采取的激进手段。

作为国产大模型的代表之一,DeepSeek在技术探索方面已经树立了良好的标杆。即便是在参数规模较小的情况下,DeepSeek V4 Lite依然展现出强大的潜力,这让人对完整版的DeepSeek V4充满期待。一旦正式发布,它很可能会在国际市场上引发新的竞争格局,对美国AI企业形成有力冲击。

最新快讯

2026年03月03日

14:52
微新创想:3 月 1 日,江苏常州这座古城迎来了一桩喜事——109 岁高龄的张珍保老人迎来了她的生日。这位生于 1917 年的长寿之星,如今已是常州最年长的居民,她的生日不仅让家人欢聚一堂,更成为了邻里间热议的话题。 张珍保老人一生养育了六名子女,三儿三女,如今最大的孩子已经 87 岁高龄,而最小的重外孙女才刚刚 9 岁。这一家子,年龄跨度整整一个世纪,五世...
14:51
微新创想:美团旗下光年之外(GN06)团队近日对其全新AI浏览器产品 Tabbit 陷入的代码纠纷作出官方回应 宣布已从新版本中移除争议翻译项目 并将其完整开源以回馈社区 事件起源于 Tabbit AI 浏览器开启公测后 有开发者指称其部分翻译功能代码涉嫌抄袭开源项目“陪读蛙(read-frog)” 据官方自查通报 技术团队于2025年12月30日进行翻译功...
14:51
微新创想:2026年3月3日,阿里巴巴达摩院宣布与巴基斯坦政府及多家机构达成系列合作,通过签署合作备忘录,正式在该国推广多癌筛查AI技术。这一举措标志着中国医疗科技在国际上的影响力持续扩大。 微新创想:根据协议,巴基斯坦首都医院与卡瓦贾·穆罕默德·萨夫达尔医学院将把该技术整合至影像科室,利用AI辅助识别包括胰腺癌、胃癌、结直肠癌、食管癌在内的多种高发癌症,以...
14:23
微新创想:2026年3月2日至5日,江波龙(Longsys)在西班牙巴塞罗那举办的MWC26展会上发布多项自研存储技术。这些创新成果聚焦于高性能与低功耗的结合,为未来智能设备的发展提供了强有力的技术支撑。 微新创想:该公司展示了HLC UFS(高阶缓存UFS)技术,该技术通过主控与固件的创新设计,以闪存替代部分DRAM缓存功能,有效降低了终端设备的成本。同时...
14:23
微新创想:2026年3月3日 vivo产品经理韩伯啸通过微博详细介绍了X300 Ultra的影像系统升级。此次升级标志着vivo在影像技术领域迈出了重要一步,进一步强化了其在专业摄影领域的竞争力。 该机型被定位为“专业V单”,意味着它将面向追求极致影像体验的用户群体。X300 Ultra主打全焦段4K120fps 10bit Log视频录制功能,支持杜比视界...
14:23
微新创想:3月3日 汽车媒体CarScoops发布路测图 曝光纯电动版路虎揽胜星脉 该车基于捷豹路虎全新电动化模块架构EMA打造 外观更低趴 尾部设计有所重塑 采用隐藏式门把手与鲨鱼鳍天线等创新元素 定位介于揽胜运动版与极光之间 差异化对标现代Ioniq 5等跨界电动车 新车将独家以纯电形式发售 不提供燃油版本 动力参数尚未公布 但预计电池容量将小于大型揽胜...
14:23
微新创想:2026年3月3日,英国皇家铸币厂在伦敦推出面值5英镑的辣妹合唱团官方纪念币,以此庆祝“女孩力量”理念诞生三十周年。这枚纪念币不仅是对辣妹合唱团音乐成就的认可,更是对其在流行文化中深远影响的致敬。 纪念币由知名艺术家Ffion Gwillim精心设计,背面图案生动呈现了五位成员的经典剪影,并附有她们的亲笔签名。正面则采用查尔斯三世国王的官方肖像,彰...
14:23
微新创想:2026年3月3日,房地产投资与资产管理公司Starlight Investments宣布任命Tae Kyoung (TK) Gong为亚太区全球市场副总裁,常驻首尔。同日,该公司在首尔汝矣岛IFC首尔正式启用亚太区总部。Gong将负责领导区域投资者关系、合作伙伴协作及市场拓展。新总部将支持亚太主要市场的关系管理、投资合作及业务开发。此举旨在强化S...
14:23
微新创想:Mozilla在Firefox 149 Beta版中首次默认启用分栏浏览功能 2026年3月2日 Mozilla正式在Firefox 149 Beta版本中引入分栏浏览功能 这一新功能让用户能够通过简单的快捷键操作实现网页并排查看 提升多任务处理效率 用户只需按住Ctrl或Command键多选标签页 然后右键点击选择“Open in Split V...
14:23
微新创想:2026年3月3日,三星面向Galaxy S26/S25系列、Z Fold8、Z TriFold等多款手机推送2026年3月安全补丁 本次更新覆盖月度与季度更新机型,包括S系列、Z折叠系列、A/M/F/C/Tab等数十款设备 共修复67个安全漏洞,其中包含8个关键级漏洞和52个高危级安卓CVE漏洞,以及7个One UI专属SVE漏洞 此次系统更新旨...
14:23
微新创想:2026年3月3日,联想正式推出ThinkBook 14+与16+ 2026锐龙版新品。这两款笔记本电脑是联想面向商务用户推出的全新升级产品,搭载了性能强劲的AMD锐龙处理器。其中,ThinkBook 14+首发搭载代号“Gorgon Point”的锐龙AI 9 H465处理器,售价为8499元;而ThinkBook 16+则采用更高端的HX 47...
14:23
微新创想:近日,中砥半导体宣布完成A轮融资,由无锡云林基金投资。此次融资将进一步推动公司在磷化铟单晶材料领域的技术研发与产业化进程。中砥半导体专注于磷化铟单晶材料的研发与创新,该材料在光通信、集成电路等高端科技领域具有重要应用价值。公司自成立以来,始终致力于国产高端半导体衬底材料的自主化发展,注册地为江苏无锡。本轮融资将用于扩大产能、加强技术研发以及提升团队...