DeepSeek-V3.2重磅发布:稀疏注意力架构创新,API成本腰斩性能媲美顶尖模型

12月1日 — 中国领先的人工智能初创公司深度求索(DeepSeek AI)正式发布了备受期待的DeepSeek-V3.2系列模型,凭借其突破性的技术创新和卓越性能,向全球顶级AI模型发起有力挑战。该系列包含标准版DeepSeek-V3.2和高性能增强版DeepSeek-V3.2-Speciale,两者均搭载了革命性的稀疏注意力机制(DSA)和强化型Agent能力,旨在与OpenAI的GPT-5和Google的Gemini3.0Pro等国际顶尖模型展开全面竞争。

DeepSeek-V3.2系列的核心竞争力源于其独创的DeepSeek Sparse Attention(DSA)架构。这一创新机制首次实现了细粒度稀疏注意力处理,在显著降低长文本场景下的计算复杂度和内存占用的同时,依然保持与密集注意力模型相当的性能表现。这一技术突破带来了惊人的效率提升:长文本任务推理速度大幅提升2至3倍,API成本更是降低超过50%,官方已公布新的价格体系。这一成就标志着AI模型在处理长文本时实现了性能与效率的双重飞跃。

DeepSeek-V3.2被深度求索定位为”Agent优先”的旗舰模型,专注于将深度推理能力与实际工具操作流程实现无缝融合。通过采用大规模Agent任务合成流水线进行针对性训练,该模型显著提升了在现实世界复杂场景中的泛化能力。特别值得一提的是,新模型引入了创新的”思考模式”功能,允许模型在执行复杂任务前进行链式逻辑推理,从而大幅提高问题解决的准确性和效率。在多项权威Agent评估测试中,DeepSeek-V3.2已达到开源模型中的顶尖水平,展现出强大的实用价值。

DeepSeek-V3.2重磅发布:稀疏注意力架构创新,API成本腰斩性能媲美顶尖模型插图1

此次发布的DeepSeek-V3.2系列包含两个核心版本,分别满足不同应用需求:

DeepSeek-V3.2标准版:该版本已全面上线深度求索的网页端、移动应用及API服务,是一个兼顾效率与性能的理想选择,特别适用于日常推理助手、智能客服及开发测试等场景。其优化后的性能表现和成本效益,为企业和开发者提供了极具吸引力的解决方案。

DeepSeek-V3.2-Speciale增强版:作为极限推理能力的高性能版本,Speciale专注于提供无与伦比的计算表现,目前通过临时API服务限量开放。根据官方测试报告,Speciale版本在多项高难度推理任务上已超越GPT-5的表现水平,并在2025年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)竞赛模拟测试中取得金牌级别成绩,充分证明其卓越的智能水平。

为促进AI技术生态发展,深度求索已在Hugging Face平台开放V3.2模型的权重文件,并提供完整开源内核及演示代码,支持研究人员和企业进行商业部署。这一举措将加速AI技术的创新应用,为全球开发者创造更多可能性。

DeepSeek-V3.2重磅发布:稀疏注意力架构创新,API成本腰斩性能媲美顶尖模型插图2

分析人士指出,DeepSeek V3.2的发布不仅标志着AI行业在结合深度推理与实际工具操作方面迈出了重要一步,更显著缩小了开源模型与商业巨头之间的技术差距。这一突破性进展将推动AI应用向更智能化、更实用的方向发展。

如需了解更多技术细节和使用指南,开发者可查阅DeepSeek API官方文档。技术资料获取地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

最新快讯

2025年12月02日

10:34
蚂蚁集团(以下简称“蚂蚁”)的通用AI应用“灵光”意外走红,其上线仅6天下载量便突破200万,提前完成年底KPI。这一成绩在ChatGPT用户超8亿、豆包活跃用户超1.72亿、千问上线一周获千万用户的背景下显得尤为亮眼。科技大厂纷纷布局C端AI应用,蚂蚁的“灵光”看似是抢占入口之举,实则更像是其三年AI战略布局的“溢出性”成果。在推出“灵光”前,蚂蚁的AI应...
10:34
微新创想12月2日讯 三星今日正式在海外市场推出其首款三折叠手机Galaxy Z TriFold,标志着折叠屏手机市场迎来新的竞争格局。作为华为Mate XT问世一年多以来的首个全球对手,这款产品有望成为未来几年内三折叠手机的标杆之作。 在折叠技术设计上,三星Galaxy Z TriFold与华为形成了鲜明对比。华为采用Z字型折叠方案,可灵活切换单屏、双屏及...
10:34
爱诗科技重磅宣布,旗下AI视频生成引擎PixVerse V5.5(国内版“拍我AI V5.5”)已完成全面升级并正式向公众开放体验。这一版本的核心突破在于成为国内首款支持“多镜头+音画同步一键直出”功能的AI视频大模型,正式宣告AI生成视频技术从“单镜头素材”时代迈入“完整叙事短片”的新纪元。相较于前代产品仅能输出零散画面的局限,V5.5凭借自研的MVL(多...
10:34
灵光App自上线以来便以惊人的速度走红,其核心功能“30秒生应用”更是引爆了大众对AI应用开发的热情。12月2日,这款由蚂蚁集团打造的通用AI助手正式宣布,仅上线两周,用户已成功创建出高达330万个“闪应用”,这一数字充分展现了普通人利用AI解决碎片化需求的巨大潜力。 这些由用户亲手打造的闪应用覆盖了生活的方方面面。从互动游戏、情绪减压等娱乐类应用,为用户带...
10:34
Runway 隆重推出旗下最新视频生成模型 Gen-4.5,为用户带来革命性的高清视频创作体验。这一突破性技术不仅在视觉准确性上实现了飞跃,更在创意控制层面超越了过往版本,致力于让每个人都能轻松创作出令人惊叹的动态视频。只需输入简短的文本提示,Gen-4.5就能精准生成涵盖复杂场景与生动人物角色的动态影像,彻底颠覆传统视频制作流程。 Gen-4.5采用Nvi...
10:34
2025年12月,中国人民银行湖南省分行携手湖南省发改委、商务厅等多部门联合发布《关于金融支持湖南省提振和扩大消费的指导意见》,推出涵盖11项核心举措的综合性政策方案。该《通知》聚焦消费品以旧换新、新型消费、文体消费、生活服务及商贸流通五大重点领域,明确要求金融机构加大信贷资源倾斜力度,通过精准施策推动消费市场实现规模与质量的双重提升。具体而言,将通过优化信...
10:34
2025年12月1日,西班牙政府紧急召开农业安全会议,就加泰罗尼亚山区发现非洲猪瘟病例发布最新通报。农业、渔业和食品大臣路易斯·普拉纳斯在会上明确指出,当前疫情尚未对人类健康构成威胁,但必须采取最高级别的防控措施,严防病毒传入商业养猪场。此次会议着重强调,相关部门将严格执行各项防疫规定,确保疫情不会进一步扩散,避免对西班牙养猪业及猪肉出口造成重大损失。为稳定...
10:34
2025年12月2日,美国普林斯顿大学的神经科学家在权威期刊《自然》上发表了一项突破性研究,揭示了人类大脑在人工智能面前保持独特优势的核心机制。这项研究通过精密的脑成像技术,首次证实了大脑能够在不同任务中重复利用相同的认知"模块",并通过对这些模块进行灵活的组合与重组,实现新行为模式的快速生成。这一发现不仅为理解人类灵活思维的神经基础提供了全新视角,也为人工...
10:34
2025年12月1日,上海临港迎来酒店业盛事,临港凯悦酒店、临港新辰国际会议中心凯悦嘉轩酒店及上海临港凯悦嘉轩酒店三座地标级酒店同步揭幕,正式组成临港新辰凯悦酒店群这一全新高端住宿综合体。 这三座酒店坐落于上海临港核心区域,彼此相邻,形成无缝衔接的酒店集群。其中,临港凯悦酒店与临港新辰国际会议中心凯悦嘉轩酒店更通过现代化的空中连廊相连,为宾客提供便捷舒适...
10:34
2025年12月1日,DeepSeek重磅发布两款创新模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale,为人工智能领域注入强劲动力。其中,DeepSeek-V3.2凭借其卓越的推理能力与输出长度的完美平衡,成为日常问答和通用Agent任务的理想选择。该模型在保持高效响应的同时,能够生成丰富详尽的内容,满足用户多样化的需求。 与...
10:34
2025年12月2日,备受瞩目的生物医药企业热景生物正式发布重要公告,宣布计划向北京舜景生物医药技术有限公司注入高达3.71亿元人民币的战略投资,增资价格为26.5元/注册资本。此举标志着双方在创新药物研发领域的深度合作迈入新阶段。舜景医药作为国内领先的原创性抗体药物研发机构,其核心业务聚焦于心脑血管疾病、肿瘤及神经退行性疾病三大治疗领域的创新药开发,凭借前...
10:34
截至2025年12月1日,我国科技创新债券市场已蓬勃发展,累计发行债券数量达到3004只,总规模高达3.18万亿元人民币。这一数据不仅彰显了我国科创领域的活力,更揭示了融资需求的持续升温。与去年同期相比,发行数量和规模分别实现了85%和98%的显著增长,这一强劲的增长势头充分表明,科技创新正成为资本市场关注的焦点,越来越多的资金正涌入这一充满潜力的领域。 东...