
在刚刚落幕的华为全联接大会上,华为技术有限公司携手浙江大学共同揭幕了国内首款基于昇腾千卡算力平台的基础大模型——DeepSeek-R1-Safe。这一突破性成果旨在破解当前人工智能领域长期困扰的安全与性能难题,为智能科技发展开启了全新篇章。浙江大学计算机科学与技术学院院长任奎在会上深入剖析了该模型的核心创新点。DeepSeek-R1-Safe通过构建全流程安全后训练框架实现突破,该框架整合了高质量安全语料库、均衡优化的安全训练机制以及自主研发的软硬件平台,从底层架构上彻底解决AI模型在安全训练过程中的关键瓶颈。尤为引人注目的是,DeepSeek-R1-Safe在千亿级参数安全训练中取得重大突破,其防御能力表现卓越。测试数据显示,该模型在抵御14类有害信息(包括有毒有害言论、政治敏感内容、违法行为教唆等)时,整体防御成功率高达99%,在多种越狱模式攻击下成功率也超过40%,综合安全防御能力达到83%。与同类模型Qwen-235B和DeepSeek-R1-671B的横向对比显示,其性能优势显著,提升幅度达8%至15%。更令人惊喜的是,在MMLU、GSM8K、CEVAL等通用能力基准测试中,DeepSeek-R1-Safe的性能损耗严格控制在1%以内,充分证明其不仅大幅增强了安全防护能力,更确保了模型的实际可用性,成功实现了安全与性能的完美平衡。华为昇腾计算业务总裁张迪煊在会上强调,华为正积极推动基础软件创新与AI安全能力建设,通过开放协作模式与高校及产业伙伴携手共进。值得注意的是,该模型已全面开源至ModelZoo、GitCode、GitHub、Gitee等社区,为全球开发者和研究人员提供宝贵的研究资源。这一具有里程碑意义的发布不仅为AI安全领域注入强大动力,更为未来AI产业生态的协同发展奠定了坚实基础。
