OpenAI推出锁定模式与风险标签双重防护应对提示注入攻击

2026-02-14 15:48:37 AI动态 1 次阅读

微新创想：OpenAI 近日发布重要公告，宣布为 ChatGPT 新增两项高级安全防护措施。此举旨在应对 AI 系统在与网页及外部应用场景对接过程中日益严重的提示注入攻击风险。此类攻击可能被恶意第三方利用，以诱导 AI 执行有害指令或泄露敏感信息。新推出的防护措施均建立在平台现有的沙箱机制、URL 数据外泄防护等多层安全体系之上，进一步强化了整体安全性。

第一项新增措施为 Lockdown Mode（锁定模式）。该模式是面向高安全需求用户的可选高级设置，而非面向普通用户。其核心在于通过严格限制 ChatGPT 与外部系统的交互方式，从而有效降低数据外泄的风险。在锁定模式下，系统会确定性地禁用或限制那些容易被滥用的工具能力，例如网页浏览功能仅允许访问缓存内容，而缺乏强安全保证的功能则会被直接禁用。目前，该模式已适用于 ChatGPT Enterprise、Edu、医疗和教师版。管理员可以在工作台设置中创建角色并启用此模式，同时还能对锁定模式下允许使用的外部应用及具体操作进行细粒度管控。OpenAI 表示，未来几个月内将逐步将锁定模式开放给消费者用户，以提升更广泛用户的使用安全。

第二项新增措施是在 ChatGPT、ChatGPT Atlas 与 Codex 中，为存在额外安全风险的功能统一标注 **“Elevated Risk（风险提升）”** 标签。这一做法旨在标准化风险提示方式，让用户在使用相关功能时能够更加清晰地了解潜在的安全隐患。OpenAI 指出，部分与网络相关的功能虽然能提升 AI 的实用性，但目前仍存在尚未被行业防护措施完全解决的风险。通过标注风险标签，用户可以自主判断是否使用这些功能，特别是在处理私密数据的场景中，这一提示尤为重要。

以 Codex 为例，当开发者开启其网络访问权限时，系统会在界面中明确显示该风险标签，并详细说明启用后的功能变化、潜在风险以及适用场景。同时，系统还会提供相应的风险缓解建议，帮助用户更好地理解和应对可能的安全问题。这一措施不仅提升了用户的安全意识，也增强了 AI 工具在实际应用中的可控性与透明度。