
AIbase最新报道揭示,DeepSeek-R1发布一周年之际,备受瞩目的下一代旗舰模型研发进展已初露端倪。据The Information独家爆料,这款被市场高度期待的全新模型(或代号为DeepSeek V4)预计最快将于今年2月中旬(农历新年期间)正式亮相,其最令人期待的突破在于代码生成能力的显著提升。
开发团队在DeepSeek官方GitHub仓库的最新代码库更新中发现了重要线索。通过深入分析FlashMLA代码库的114个文件,研究人员发现其中多达28处引用了名为”MODEL1″的神秘标识符。代码逻辑显示,”MODEL1″代表一种全新架构,与现有”V32″(DeepSeek-V3.2)架构存在显著差异。这种差异主要体现在三个关键领域:键值(KV)缓存布局优化、稀疏性处理机制创新以及FP8数据格式解码支持。这些技术突破表明,新模型在内存管理和计算效率方面进行了针对性的底层架构重构。

值得关注的是,DeepSeek团队此前已陆续发布了一系列重要技术论文。其中关于”优化残差连接(mHC)”的研究,以及受生物学启发的”AI记忆模块(Engram)”技术,均被视为该公司的核心技术突破。业界普遍猜测,这些最新的研究成果极有可能被整合进正在开发的”MODEL1″中,为这款即将发布的新旗舰模型提供强大的技术支撑。随着研发进展的不断推进,我们有理由期待DeepSeek V4将在人工智能领域带来更多突破性创新。
