DeepSeek新专利创新部署大语言模型显著提升AI性能

2025-08-01 16:01:37 AI动态 72 次阅读

近日，DeepSeek关联公司——杭州深度求索人工智能基础技术研究有限公司，正式公开了一项名为“一种大语言模型的部署方法及系统”的专利技术。这一重要成果的公布，不仅彰显了DeepSeek在人工智能领域的持续深耕，更标志着该公司在大语言模型部署技术方面取得了突破性进展。图源备注：图片由AI生成，图片授权服务商Midjourney提供

根据专利摘要内容，该发明聚焦于人工智能领域的核心技术突破。其创新之处在于将大语言模型运行过程中的两个关键阶段——预填充阶段和解码阶段，分别部署在具备高性能计算能力的机器与拥有大内存容量的机器上。这种分布式的部署策略能够有效均衡系统负载，实现硬件资源的最大化利用。通过显著减少计算能力的闲置状态，该方法不仅大幅降低了系统整体运行延迟，还显著提升了系统的吞吐量表现。在当前人工智能技术快速发展的背景下，系统的扩展性与容错性已成为衡量技术先进性的重要指标。DeepSeek的这项专利技术，正是通过科学优化资源配置，显著增强了系统应对不同工作负载的适应能力。这种创新的部署方法，预示着未来人工智能模型将朝着更高效、更智能的方向发展，有望为各行各业的应用场景提供更加强大的技术支持。

值得一提的是，DeepSeek-V3作为该公司自主研发的核心产品之一，其搭载的Mixture-of-Experts（MoE）语言模型技术尤为突出。该模型参数量高达671B个，每个token的激活参数更是达到37B级别，展现出强大的语言理解和生成能力。这一系列技术创新的突破，无疑将加速人工智能技术的普及与应用进程，为各行各业的数字化转型注入强劲动力。划重点：? DeepSeek发布新专利，创新部署大语言模型方法，显著提升系统性能。? 分布式部署实现硬件资源最大化利用，有效降低系统延迟。? 增强系统扩展性与容错性，推动未来人工智能技术发展。