DeepSeek V4 Lite小参数模型性能强劲逼近美国顶流大模型

微新创想:DeepSeek在2月11日发布了一个名为DeepSeek V4 Lite的新模型,尽管它没有达到春节档发布的DeepSeek V4的规模,但参数量仅有2000亿,相对较小。这个模型的主要亮点在于支持1M的上下文长度,这在处理长文本任务时具有一定的优势。然而,此前网友的测试反馈显示,除了超长上下文之外,其整体表现并没有特别惊艳,因为参数规模与主流大模型相比仍有差距。

然而,自DeepSeek V4 Lite发布以来,其性能一直在持续提升。2月27日,已经有网友测试发现,该模型的表现逐渐增强。昨日再次升级后,Linux Do社区的大佬HCPTangHY进行了测试,并表示非常震惊,认为DeepSeek V4 Lite在此次升级后已经达到了国产模型的最先进水平,甚至在某些方面超越了当前主流的闭源模型。

不仅如此,HCPTangHY还指出,如果DeepSeek V4 Lite能够继续训练下去,未来有可能通过开源的方式对闭源模型形成有力挑战。从他的测试结果来看,0302版本的DeepSeek V4 Lite在各项指标上的得分比0227版本有了明显提升,已经非常接近目前最顶尖的闭源模型Sonnet 4.6。

在测试中,除了常规的文本生成任务外,DeepSeek V4 Lite还通过了多个行业知名的测试项目,包括游戏和前端开发相关的测试。其中,备受关注的天气卡测试表现尤为突出,无论是从视觉设计还是功能实现上,都展现出了在线级的优秀表现。

DeepSeek V4 Lite小参数模型性能强劲逼近美国顶流大模型插图1

回顾过去一年的AI大模型发展,国产大模型在对话聊天方面已经与闭源模型差距不大。但在多模态、编程、数学以及智能体等更复杂的领域,仍然存在一定的不足。最近发布的GLM5、MiniMax 2.5和Qwen 3.5系列在这些方面有所进步,但面对Anthropic、OpenAI和谷歌等国际巨头推出的新模型,差距又有所扩大。

国内公司在追赶顶流闭源模型的过程中,面临诸多挑战。首先是投入资源相对有限,相较于美国的科技巨头,国内企业在研发资金上的支持仍然不足。其次是算力方面的差距,大模型的训练和优化需要强大的计算能力,而国内在这一方面仍处于追赶阶段。此外,数据资料的积累也是一大难题,谷歌和OpenAI凭借多年的技术积累和庞大的用户基数,拥有更丰富的训练数据。

值得一提的是,Anthropic为了获取训练数据,曾从盗版网站下载大量书籍,这一行为引发了广泛争议,并最终导致其被法院判决赔偿15亿美元。这反映出国际大模型公司对数据获取的极端重视,以及在这一过程中可能采取的激进手段。

作为国产大模型的代表之一,DeepSeek在技术探索方面已经树立了良好的标杆。即便是在参数规模较小的情况下,DeepSeek V4 Lite依然展现出强大的潜力,这让人对完整版的DeepSeek V4充满期待。一旦正式发布,它很可能会在国际市场上引发新的竞争格局,对美国AI企业形成有力冲击。

最新快讯

2026年03月03日

13:50
微新创想:近日,反无人机雷达系统研发制造商八阵图完成天使轮融资,投资方为福能兴业投资。公司总部位于中国,专注于低空安防领域,主营业务涵盖反无人机雷达系统的研发、生产及低空安全监测整体解决方案。本轮融资将用于加速核心技术迭代、扩大产线建设及市场推广。 当前低空经济快速发展,无人机管控需求持续攀升,八阵图凭借其小型化、高精度雷达技术,已在国内多个重点区域开展试点...
13:50
微新创想:OPPO官方于3月3日宣布ColorOS日历新增课程表导入功能。这一功能的加入,为用户带来了更加便捷的课程管理体验。用户可以通过拍照、相册或手动输入的方式,轻松导入课表内容。不仅支持单张课表的导入,还允许用户管理多张课表,满足不同学习场景的需求。 微新创想:此外,该功能还具备分享与设置提醒的功能,用户可以将课表分享给同学或老师,确保信息同步。同时,...
13:50
微新创想:2026年3月3日(农历正月十五)晚 我国迎来年度唯一一次月全食 也是本世纪罕见的‘元宵节红月亮’天象 本次月全食自17时49分初亏 至21时17分复圆 食甚出现在19时33分 恰逢元宵赏灯黄金时段 因与传统佳节重合 且观测条件优越 不需要熬夜 肉眼即可清晰可见 全境均可观赏 被誉为‘人人可参与的天文盛宴’ 专家建议选择光污染少 视野开阔的地方进行...
13:50
微新创想:最近,杭州城站火车站的一条仅10米长的行李传送带在社交媒体上引发了广泛关注,火了整整好几个月。这条传送带位于到达大厅与地铁站A口连接通道的楼梯两侧,去年5月悄然投入使用。虽然长度不长,但它给旅客带来的便利却非常显著。 旅客们只需把行李箱往传送带上一放,就能“空手”下楼,再也不用提着沉重的行李爬楼梯了。全程还有工作人员贴心引导,确保每一位旅客都能顺利...
13:50
微新创想:近日,浙江杭州发生一起令人震惊的意外事件,42岁的周先生因一时好奇,差点酿成大祸。春节期间,周先生一家满怀喜悦地搬入了装修一新的新房,亲朋好友纷纷前来祝贺并赠送礼物。其中,一盆名为“滴水观音”的大型盆栽尤为引人注目,周先生对它爱不释手。大年三十晚上7点左右,周先生饭后闲来无事,开始围着这盆绿植转悠,不时用手轻触叶片和根茎,感受它的触感。 就在他随意...
13:50
微新创想 OPPO Find N6将于本月正式发布 新机已在OPPO商城、京东等平台上架预约 作为主打卖点之一 OPPO Find N6强调屏幕无折痕” 那么 真实使用一个月后的折痕表现如何 今日 OPPO Find系列产品负责人周意保发布路人盲测挑战的视频 他将一台已使用一个月的OPPO Find N6交给路人 要求参与者蒙眼在10秒内通过手指触摸...
13:50
微新创想:一加15T将于本月发布 虽然发布会时间尚未官宣 但官方已提前开启预热 今日 一加中国区总裁李杰首次晒出一加15T与iPhone 17 Pro的屏幕边框对比图 从图片来看 一加15T边框明显更窄 视觉冲击力十足 李杰表示 一加15T拥有1.xx mm物理极窄四等边 很大可能是目前小屏手机里 甚至是全世界视觉最窄的四等边 他强调之所以能做到这个程度 是...
13:50
微新创想:3月3日消息 据国内媒体报道 2月27日 江西赣州发生了一件令人震惊的事件 一名陌生女子在一家店铺内连接了Wi-Fi后 以店家需负责为由向店主曾女士提出借款100元的要求 该女子在成功连接店铺Wi-Fi后 在店门口玩手机约二十多分钟 随后走进店内 向曾女士提出借款请求 声称自己手机里没有钱 并说出“连了你家Wi-Fi就得对我负责”这样荒谬的理由 面...
13:50
微新创想:3月3日元宵节当天,思念汤圆、五芳斋、三全食品等汤圆品牌纷纷通过官方社交账号发布信息,称“千问请你吃元宵,今天是免单卡最后一天,走过路过别错过。”这条消息迅速引发网友热议,有人调侃道,“汤圆品牌的时间点掐的真好,免单卡最后一天,把销量安排的明明白白。” 此前,千问曾宣布为了让大家吃上一碗免费元宵,将春节期间发放的免单卡有效期延长至3月3日。免单...
13:08
微新创想:3月3日元宵节当天,长三角铁路预计发送旅客205万人次。为应对节日期间的出行需求,中国铁路上海局集团当日计划增开旅客列车164列,其中包括直通列车109列和管内列车55列。同时,还将扩编动车组97列,以提升运力,满足旅客出行需要。 此次增开的列车主要覆盖成都、长沙、西安、郑州等方向的长途客流,以及阜阳、蚌埠、徐州至上海、杭州、合肥等地的短途客流。这...
13:08
微新创想:2026年3月16日起深圳将施行一项新的城市更新政策。根据最新规定,对于尚未完成规划审批的城市更新项目,将取消保障性住房奖励容积的政策,同时原则上不再强制配建保障房。这一调整适用于所有未完成审批流程的项目,旨在优化城市更新的资源配置和审批流程。 已完成规划审批的城市更新项目仍按照原有政策执行。这意味着在新规实施之前已经获得批准的项目,其保障性住房的...
13:08
微新创想:2026年3月3日,新加坡电信与瑞典爱立信在新加坡宣布达成战略合作。双方将联合推动5G Advanced技术发展,重点构建可编程、AI驱动的数字网络平台。这一合作不仅标志着两家公司在通信技术领域的深度协作,也为未来智能网络的演进奠定了坚实基础。 合作涵盖网络架构升级、智能运维试点及用例开发,旨在提升网络灵活性、能效与自动化水平。通过引入先进的AI技...