华为浙大联手推DeepSeek-R1-Safe大模型 AI安全性能双突破

2025-09-22 11:33:59 AI动态 15 次阅读

在刚刚落幕的华为全联接大会上，华为技术有限公司携手浙江大学共同揭幕了国内首款基于昇腾千卡算力平台的基础大模型——DeepSeek-R1-Safe。这一突破性成果旨在破解当前人工智能领域长期困扰的安全与性能难题，为智能科技发展开启了全新篇章。浙江大学计算机科学与技术学院院长任奎在会上深入剖析了该模型的核心创新点。DeepSeek-R1-Safe通过构建全流程安全后训练框架实现突破，该框架整合了高质量安全语料库、均衡优化的安全训练机制以及自主研发的软硬件平台，从底层架构上彻底解决AI模型在安全训练过程中的关键瓶颈。尤为引人注目的是，DeepSeek-R1-Safe在千亿级参数安全训练中取得重大突破，其防御能力表现卓越。测试数据显示，该模型在抵御14类有害信息（包括有毒有害言论、政治敏感内容、违法行为教唆等）时，整体防御成功率高达99%，在多种越狱模式攻击下成功率也超过40%，综合安全防御能力达到83%。与同类模型Qwen-235B和DeepSeek-R1-671B的横向对比显示，其性能优势显著，提升幅度达8%至15%。更令人惊喜的是，在MMLU、GSM8K、CEVAL等通用能力基准测试中，DeepSeek-R1-Safe的性能损耗严格控制在1%以内，充分证明其不仅大幅增强了安全防护能力，更确保了模型的实际可用性，成功实现了安全与性能的完美平衡。华为昇腾计算业务总裁张迪煊在会上强调，华为正积极推动基础软件创新与AI安全能力建设，通过开放协作模式与高校及产业伙伴携手共进。值得注意的是，该模型已全面开源至ModelZoo、GitCode、GitHub、Gitee等社区，为全球开发者和研究人员提供宝贵的研究资源。这一具有里程碑意义的发布不仅为AI安全领域注入强大动力，更为未来AI产业生态的协同发展奠定了坚实基础。

2026年02月13日

07:34

华为浙大联手推DeepSeek-R1-Safe大模型 AI安全性能双突破

最新快讯

2026年02月13日

OpenAI与Cerebras联合发布GPT-5.3-Codex-Spark实时编程模型

谷歌发布Gemini 3 Deep Think推理模式助力科研与工程应用

微软推送Windows 11 Canary Build 28020.1611预览版新功能更新

谷歌Pixel 10a四色新机曝光续航超53小时环保包装引关注

花旗集团CEO简·弗雷泽年薪调至4200万美元彰显领导力与业绩认可

英伟达租赁38亿美元垃圾债数据中心推动AI基础设施扩张

标普下调卡夫亨氏信用展望至负面高杠杆压力影响评级前景

应用材料Q1财报营收与EPS超预期半导体设备需求强劲推动增长

礼来减肥药2026年7月起美国医保受益人享折扣优惠

奔驰美国召回近1.2万辆汽车火灾风险隐患全面排查

Anthropic年化收入突破140亿美元，Claude大模型引领AI商业化浪潮

Anthropic完成300亿美元G轮融资估值达3800亿美元引领AI安全发展