OpenAI用AI模拟黑客攻击修补ChatGPT Atlas致命漏洞

2025-12-24 10:45:44 AI动态 1 次阅读

OpenAI 正在采用一种创新的”以攻促防”策略，全面提升其代理式网页浏览器 ChatGPT Atlas 的安全性能。面对日益严峻的网络威胁形势，OpenAI 研发团队构建了一套革命性的”自动化攻击者”系统，通过模拟真实黑客的攻击行为，对 ChatGPT Atlas 进行全天候的极限压力测试。这套系统的核心功能是专门针对对抗提示注入（Prompt Injection）攻击，这种攻击方式已成为当前 AI 安全领域的主要威胁。

在提示注入攻击中，恶意第三方会隐蔽地向 AI 代理发送特殊指令，诱使其执行违背用户意愿的操作。例如，在用户毫无察觉的情况下自动转发敏感邮件，或擅自删除云端存储的重要文件。据 AIbase 获悉，OpenAI 的”自动化攻击者”系统采用了先进的强化学习技术，能够自主发现人类红队测试中难以察觉的新型攻击路径。在一次技术演示中，该 AI 攻击者成功模拟了诱导 Atlas 向公司 CEO 发送辞职信的场景。

尽管 Atlas 的防御机制最终成功拦截了这一恶意请求并提醒了用户，但 OpenAI 坦承，网络安全领域的安全博弈永无止境。由于代理式浏览器需要深度介入用户的数字化生活（如访问邮件、日历等），其便利性本身就带来了更大的安全风险敞口。尽管技术手段在不断迭代升级，OpenAI 在最新安全报告中明确警示，由于 AI 代理的本质特性，这类安全威胁可能永远无法被彻底”根治”。

AIbase 特别提醒广大用户，在享受 AI 浏览器带来的便捷服务时，仍需保持高度警惕。建议密切关注官方发布的实时安全响应与防护建议，及时了解最新的安全动态和防护措施。通过科学合理地使用 AI 工具，在便利与安全之间找到最佳平衡点，才是明智之举。