Perplexity BrowseSafe新安全系统检测率达91%保护AI浏览器代理

2025-12-08 11:14:01 AI动态 4 次阅读

Perplexity 最新推出的安全系统 BrowseSafe 为 AI 浏览器代理构建了一道坚固的防线，有效抵御网络内容操控带来的威胁。该系统在检测 Prompt 注入攻击方面展现出卓越性能，成功率高达91%，显著超越了市场上同类解决方案的表现。相比之下，PromptGuard-2 的检测率仅为35%，而大型前沿模型 GPT-5 也仅能达到85% 的检测水平。更值得一提的是，BrowseSafe 的运行速度极快，能够实现无缝的实时监测，确保 AI 浏览器代理在各种网络环境下的安全稳定运行。

AI 浏览器代理的普及虽然为用户带来了便利，但也引发了新的安全挑战。今年早些时候，Perplexity 推出的 Comet 浏览器集成了先进的 AI 代理，使其能够像人类用户一样浏览网站，并完成电子邮件、银行和企业应用等需要认证会话的操作。这种高权限的访问模式为恶意攻击者提供了可乘之机，他们可以将危险指令隐藏在网页中，诱导代理执行不当行为，例如将敏感信息泄露到外部地址。面对日益严峻的安全形势，Perplexity 深入分析了现有评估基准的局限性，发现 AgentDojo 等传统基准过于依赖简单提示，无法有效覆盖现实世界中复杂多变的网络攻击场景，导致攻击者能够轻易隐藏恶意代码。

为解决这一问题，Perplexity 创新性地推出了 BrowseSafe Bench，该基准从三个关键维度全面定义网络攻击的范围：攻击类型、注入策略和语言风格。特别值得关注的是，BrowseSafe Bench 重点针对“难以检测的内容”——那些看似无害却可能被误认为是正常操作的复杂网络元素。通过采用专家混合架构，BrowseSafe 能够在不影响用户体验的前提下高效并行进行安全扫描，实现全方位防护。

然而，评估结果也揭示了部分挑战。例如，在多语言攻击场景下，检测率降至76%，表明跨语言攻击仍存在一定难度。此外，攻击者若将恶意内容藏匿于 HTML 评论中，其被检测到的概率反而高于显性区域（如页面底部）的内容。为应对这些挑战，Perplexity 构建了三层防御策略：快速分类器与基于推理的前沿大语言模型协同工作，形成立体化防护体系。尽管 BrowseSafe 在大多数情况下表现优异，但仍有近10%的攻击能够绕过防御，这充分说明网络环境的复杂性和攻击手法的持续演变。