DeepSeek V3.2-exp模型创新稀疏注意力机制显著降低API成本

2025-09-30 09:00:37 AI动态 50 次阅读

人工智能公司DeepSeek的研究团队于本周一正式发布了其最新实验模型V3.2-exp，这款模型的核心突破在于创新性地采用了”稀疏注意力”机制，旨在革命性地降低长上下文操作的推理成本。这一具有里程碑意义的成果已在Hugging Face和GitHub平台同步上线，并配有详尽的学术论文作为技术支撑。

V3.2-exp模型最引人注目的特点是其自主研发的DeepSeek稀疏注意力系统。该复杂机制由两个关键模块协同工作：首先，名为”闪电索引器”的模块能够智能识别并优先排序上下文窗口中的关键信息片段；其次，独立的”细粒度标记选择系统”会从这些高优先级摘录中精准筛选出核心标记，仅将这些重要信息加载到有限的注意力窗口中进行处理。这种创新的机制组合使得模型能够在保持高性能的同时显著降低服务器负载，从而高效处理超长上下文片段。

初步测试结果令人瞩目。DeepSeek官方数据显示，在处理长文本任务时，新模型的API调用成本可降低高达50%。虽然目前仍需更多第三方机构进行独立验证，但考虑到该模型采用开放权重设计并在Hugging Face平台完全免费开放，其真实性能将在不久后得到行业广泛检验。

此次突破是DeepSeek近期一系列解决AI推理成本难题的创新举措之一。与此前专注于降低训练成本的R1模型不同，V3.2-exp着重于提升基础Transformer架构的运行效率，为AI应用的规模化普及提供了更具成本效益的解决方案。推理成本特指部署已训练AI模型的服务器运行费用，而非模型训练投入。

在当前AI技术浪潮中，DeepSeek始终备受瞩目。其早前发布的R1模型凭借创新的低成本强化学习方法曾引发广泛关注。此次稀疏注意力技术的突破虽然可能不会像R1那样产生轰动效应，但为全球AI从业者提供了宝贵的实践经验，将有力推动整个行业共同降低AI服务的运营成本，加速AI技术的商业化进程。

2025年11月28日

21:37

DeepSeek V3.2-exp模型创新稀疏注意力机制显著降低API成本

最新快讯

2025年11月28日

长安汽车投资4.5亿成立机器人公司聚焦人形机器人研发

近半美国人用AI备战购物节生成式AI将重塑美国假日购物模式

好上好业绩飙升半导体驱动新领域拓展

龙洲股份控股子公司中汽宏远停产延期至2026年5月

牧原股份更新H股上市申请推进国际化融资布局

理想汽车Q3营收净利双降首现亏损市值蒸发433亿

阿尔宾娜2024年入华销售宝马高端性能车

昀冢科技聚焦智能手机摄像头音圈马达CCM业务稳健发展

滨崎步上海演唱会取消全额退款30日内到账

利君控股签下5760万美元设备出口大单创收超半成业绩将迎增长

东宏股份中标5109万元HDPE管项目提升区域排水能力

霸王茶姬Q3财报：门店7338家GMV79.3亿净利32.08亿

DeepSeek V3.2-exp模型创新稀疏注意力机制 显著降低API成本

最新快讯

2025年11月28日

DeepSeek V3.2-exp模型创新稀疏注意力机制显著降低API成本