
Perplexity 最新推出的安全系统 BrowseSafe 为 AI 浏览器代理构建了一道坚固的防线,有效抵御网络内容操控带来的威胁。该系统在检测 Prompt 注入攻击方面展现出卓越性能,成功率高达91%,显著超越了市场上同类解决方案的表现。相比之下,PromptGuard-2 的检测率仅为35%,而大型前沿模型 GPT-5 也仅能达到85% 的检测水平。更值得一提的是,BrowseSafe 的运行速度极快,能够实现无缝的实时监测,确保 AI 浏览器代理在各种网络环境下的安全稳定运行。
AI 浏览器代理的普及虽然为用户带来了便利,但也引发了新的安全挑战。今年早些时候,Perplexity 推出的 Comet 浏览器集成了先进的 AI 代理,使其能够像人类用户一样浏览网站,并完成电子邮件、银行和企业应用等需要认证会话的操作。这种高权限的访问模式为恶意攻击者提供了可乘之机,他们可以将危险指令隐藏在网页中,诱导代理执行不当行为,例如将敏感信息泄露到外部地址。面对日益严峻的安全形势,Perplexity 深入分析了现有评估基准的局限性,发现 AgentDojo 等传统基准过于依赖简单提示,无法有效覆盖现实世界中复杂多变的网络攻击场景,导致攻击者能够轻易隐藏恶意代码。
为解决这一问题,Perplexity 创新性地推出了 BrowseSafe Bench,该基准从三个关键维度全面定义网络攻击的范围:攻击类型、注入策略和语言风格。特别值得关注的是,BrowseSafe Bench 重点针对“难以检测的内容”——那些看似无害却可能被误认为是正常操作的复杂网络元素。通过采用专家混合架构,BrowseSafe 能够在不影响用户体验的前提下高效并行进行安全扫描,实现全方位防护。
然而,评估结果也揭示了部分挑战。例如,在多语言攻击场景下,检测率降至76%,表明跨语言攻击仍存在一定难度。此外,攻击者若将恶意内容藏匿于 HTML 评论中,其被检测到的概率反而高于显性区域(如页面底部)的内容。为应对这些挑战,Perplexity 构建了三层防御策略:快速分类器与基于推理的前沿大语言模型协同工作,形成立体化防护体系。尽管 BrowseSafe 在大多数情况下表现优异,但仍有近10%的攻击能够绕过防御,这充分说明网络环境的复杂性和攻击手法的持续演变。

为推动 AI 代理安全领域的进步,Perplexity 决定公开其基准、模型和研究论文,旨在为整个行业提供更完善的解决方案,提升 AI 代理在网络环境中的安全交互能力。以下是本次发布的核心亮点:
🌐 BrowseSafe 的检测率高达91%,显著领先于当前市场上的大多数安全解决方案。
🔒 AI 浏览器代理的高权限访问特性增加了被攻击的风险,需要更强大的防护机制。
📊 Perplexity 推出的安全策略针对复杂网络攻击手法,通过创新基准和混合架构技术提供全方位防护。
