
随着大模型技术加速渗透金融、政务、能源等关键领域,其“越智能,越危险”的安全悖论正成为行业关注的焦点。在2025年世界互联网大会乌镇峰会上,360数字安全集团重磅发布了国内首份《大模型安全白皮书》,系统性地剖析了大模型全生命周期中的五大核心风险,并创新性地提出了“外挂式安全 + 平台原生安全”的双轨治理框架,为高危AI时代构筑起一道坚实的纵深防御屏障。
白皮书深入指出,大模型的安全威胁已形成跨层级、强耦合的复杂矩阵,具体涵盖以下五大维度:基础设施层:算力集群和训练平台若遭受攻击,可能导致模型被恶意投毒或关键数据被窃取;内容层:虚假信息、违规内容或“AI幻觉”等问题可能引发严重的社会风险;数据与知识库层:训练数据的泄露或知识库被污染,将直接动摇模型的可信度基础;智能体层(Agent):自主决策的AI代理若被恶意操控,可能执行危害社会的任务;用户端层:通过提示注入、越权访问等攻击手段,可以直接绕过防护机制操控模型行为。
面对这一多维度的威胁挑战,360提出了双轨并行的安全策略。一方面是通过“外挂式安全”在模型外部部署监测、过滤与审计系统,例如内容合规网关、异常行为检测平台等;另一方面是“平台原生安全”,将安全能力深度内嵌至大模型研发、训练、部署、推理等各个环节,实现“安全即代码”的理念。基于这一理念,360已成功构建覆盖数据脱敏、模型加固、内容过滤、Agent行为审计、API防护、红蓝对抗、安全合规等七大核心能力的全链路解决方案,并在金融、制造、政务等多个行业实现了落地实践。
360强调,仅靠企业自身的防护远远不够。未来将联合学术界、产业界和研究机构,共同推动大模型安全标准的制定、威胁情报的共享以及开源安全工具的共建,致力于打造一个开放、协同、可信的AI安全生态体系。AIbase认为,在大模型从“技术秀场”迈向“生产基础设施”的关键转折点,360发布的白皮书不仅是一份及时的风险预警,更是一份AI安全新基建的全面路线图。当智能逐渐成为生产力的重要组成部分,安全必须成为不可逾越的底线——这场由360发起的防御战,不仅关乎技术本身,更关乎AI能否真正赢得社会的信任与托付,决定着其未来的发展方向。
