
微新创想:据《科创板日报》消息 DeepSeek 即将于下周发布其最新的大型模型 V4。这款新模型备受期待 具备图像 视频和文本生成功能 标志着 DeepSeek 在多模态技术上的又一次飞跃。据知情人士透露 DeepSeek V4 在硬件适配上将全面支持国产算力 目的是优化与中国制造芯片的兼容性。这不仅有望提升中国市场对其半导体产品的需求 还能加速 AI 模型在推理阶段与本土芯片的融合。
在 V4 发布的同时 DeepSeek 还计划推出一份简短的技术说明 预计一个月后会有更详尽的技术报告。这一系列动作显示了 DeepSeek 在技术透明度和市场反应上的决心。目前 DeepSeek 的 V4 Lite 测试版本也正在进行中。这一版本被称为 sealion-lite 具有 100 万 tokens 的上下文窗口 相较于 V3 系列的 128K 提升了近 8 倍 理论上能够一次性处理《三体》全集的文本量。
值得注意的是 V4 Lite 是原生多模态架构 意味着它在预训练阶段就将文本和视觉理解相结合 而非后期拼接。从参数规模来看 V4 Lite 预计有 2000 亿参数 而完整的 V4 版本参数可能会突破 1 万亿。此外 V4 Lite 在生成 SVG 图像的能力上也表现出色 使用极简代码(仅 54 行)即可生成高质量图像 显示出其在空间推理和结构化输出方面的提升。
回顾 DeepSeek 的发展历程 该公司自 2023 年以来在推理能力和模型效率上不断创新。自 2024 年发布 V2 以来 DeepSeek 不断追求综合性能与推理效率的平衡。到 2025 年 DeepSeek 推出的 V3 系列不仅确立了强大的综合性能基础 更通过持续的小版本更新提升了用户体验。
总的来看 DeepSeek 在等待 V4 发布的同时 始终在技术革新和多模态能力的布局上不遗余力。这无疑将为 AI 领域带来新的活力与可能性。
