DeepSeek MODEL1代码曝光：V4架构剑指2月，代码生成能力再进化

2026-01-21 09:28:45 AI动态 2 次阅读

AIbase最新报道揭示，DeepSeek-R1发布一周年之际，备受瞩目的下一代旗舰模型研发进展已初露端倪。据The Information独家爆料，这款被市场高度期待的全新模型（或代号为DeepSeek V4）预计最快将于今年2月中旬（农历新年期间）正式亮相，其最令人期待的突破在于代码生成能力的显著提升。

开发团队在DeepSeek官方GitHub仓库的最新代码库更新中发现了重要线索。通过深入分析FlashMLA代码库的114个文件，研究人员发现其中多达28处引用了名为”MODEL1″的神秘标识符。代码逻辑显示，”MODEL1″代表一种全新架构，与现有”V32″（DeepSeek-V3.2）架构存在显著差异。这种差异主要体现在三个关键领域：键值(KV)缓存布局优化、稀疏性处理机制创新以及FP8数据格式解码支持。这些技术突破表明，新模型在内存管理和计算效率方面进行了针对性的底层架构重构。

值得关注的是，DeepSeek团队此前已陆续发布了一系列重要技术论文。其中关于”优化残差连接（mHC）”的研究，以及受生物学启发的”AI记忆模块(Engram)”技术，均被视为该公司的核心技术突破。业界普遍猜测，这些最新的研究成果极有可能被整合进正在开发的”MODEL1″中，为这款即将发布的新旗舰模型提供强大的技术支撑。随着研发进展的不断推进，我们有理由期待DeepSeek V4将在人工智能领域带来更多突破性创新。

2026年01月21日

10:46

DeepSeek MODEL1代码曝光：V4架构剑指2月，代码生成能力再进化

最新快讯

2026年01月21日

Baseten完成3亿美元融资估值达50亿美元

英望科技完成B+轮战略融资加大研发拓展海外市场

DHL绿色航燃服务在华超半数客户签约使用

全新宝马iX3长轴距版北京车展首发 2026下半年上市

美德乐今日申购发行价41.88元/股

HR Path合并Enforce拓展北美业务

汇通能源1.84亿投资兴华芯7.43%股权加码半导体产业链布局

顺丰京东物流春节加收资源调节费 2026年费用标准及优惠

科顺股份中标顺丰年度防水集采成独家供应商

Zadarma推出AI语音智能体

巴黎法院驳回广告协会暂停苹果ATT功能诉讼请求

菲律宾棉兰老岛附近海域5.1级地震实时监测与最新进展