声明:本文源自微信公众号 硅星人Pro,作者周一笑,经站长之家授权转载发布。北京时间10月22日凌晨,OpenAI正式发布了首款AI浏览器ChatGPT Atlas,却未如传闻般推出Gemini3模型。这款产品将ChatGPT深度集成于浏览器之中,让用户在任何网页上都能随时唤出ChatGPT侧边栏,实现内容总结、文字编辑,甚至完成购物和预订等任务。其功能类似于在Chrome浏览器中安装了ChatGPT插件,但OpenAI的野心远不止于此。
早在2024年11月,关于OpenAI开发浏览器的传闻就已流传。其目标明确——争夺互联网信息入口的控制权,获取更多用户数据。如今这一计划落地,Google股价应声下跌。有趣的是,OpenAI选择了一个与Chrome高度相似的界面来挑战Chrome,用用户最熟悉的方式发起挑战。
ChatGPT Atlas没有进行激进的界面革新,也没有太多功能创新,而是保留了多标签、地址栏等用户习以为常的元素,将AI置于浏览器的核心位置。那么,ChatGPT Atlas究竟有哪些独特之处?它与其他AI浏览器相比又有哪些不同?
### ChatGPT无处不在的浏览体验
#### 侧边栏:ChatGPT随时待命
ChatGPT Atlas最核心的设计是将ChatGPT深度嵌入浏览器。在任何网页上,用户只需点击Ask ChatGPT按钮,即可唤出一个侧边栏。该侧边栏自动获取当前页面的上下文,用户可以直接要求ChatGPT总结代码差异、比较产品参数、分析文章观点,无需再复制粘贴内容。首席设计师Ryan在发布会上强调,这是“范式转变”,浏览器从“仅仅展示信息”变成“理解信息甚至编辑信息”的工具。
然而,坦白说,Perplexity的Comet、The Browser Company的Dia等AI浏览器早已实现了类似功能。侧边栏+页面上下文,已成为AI浏览器的标配。类似的是Cursor Chat功能,在网页的任何文本框中,用户用光标选中文字后可以直接调用ChatGPT进行内联编辑。例如,在Gmail写邮件时,选中一段话,让ChatGPT“整理我的语言”或“改成更正式的语气”,修改后的文本将直接替换原文。这确实省去了在多个标签页之间来回切换的麻烦。
#### 浏览器记忆:帮你记住更多
ChatGPT Atlas引入了“浏览器记忆”功能,这是它与传统浏览器的重要区别。它不仅记录用户访问过哪些网站,还会记住用户在页面上的操作行为,包括看了什么内容、对比了哪些产品、完成了什么任务。这意味着用户可以用自然语言搜索历史,例如问“找出我上周看过的所有职位招聘,并总结行业趋势”,ChatGPT会调用这些记忆给出个性化分析。CEO Fidji Simo在博客中举例,她经常浏览无麸质食谱,现在可以直接让ChatGPT“根据我最近看的食谱制定本周菜单”,并通过Agent模式在Instacart上自动下单。
当然,这个功能完全可选。用户可以在设置中查看、归档或删除所有记忆,也可以在地址栏控制某个网站是否允许ChatGPT读取。清除浏览历史会同步删除相关记忆。记忆功能本是ChatGPT率先推出的特性,迁移到浏览器是自然的延伸。但问题在于,这需要用户对OpenAI有足够的信任,毕竟,让AI记住用户的所有浏览操作和行为,听起来就像在网上“裸奔”。
### Agent模式:本地版Operator
对于Plus、Pro和Business订阅用户,ChatGPT提供了Agent模式。这是一个可以代表用户执行任务的AI代理,它能打开标签页、点击按钮、填写表单、完成购物流程。可以简单理解为本地版的Operator。它在Atlas的标签页里行动,而不是像Operator那样用一台云端的独立浏览器。发布会上的演示场景包括根据食谱计算八人份配料并在Instacart下单、在Google Doc中添加评论并转换为Linear任务。
又是订票、买菜、订餐厅。这些演示场景从Operator发布时就在用,已经不新鲜了。经过我们的测试,目前的网页AI代理在简单任务上表现尚可,但处理复杂问题时仍不够可靠。OpenAI自己也承认,Agent可能会犯错,甚至可能受到网页中隐藏的恶意指令影响。OpenAI强调Agent是“协作式”的,用户可以随时监控进度或接管控制权。在我们的测试中,ChatGPT Atlas未能完成电商比价任务。
#### 安全方面
Agent仅在用户的标签页内运行,不能在计算机上执行代码或访问文件系统。在金融网站等敏感场景,它会暂停并等待用户确认。用户也可以选择“登出模式”,限制Agent访问已登录的账户数据。
### 与其他AI浏览器的比较
OpenAI发布的AI浏览器赛道已经相当拥挤。Perplexity的Comet主打AI侧边栏和多步骤任务自动化,还有能主动给出洞见的背景助手,同样免费开放。Microsoft Edge的Copilot模式整合了聊天和搜索功能,支持多标签对比和语音控制,与微软生态深度绑定。The Browser Company的Dia则更注重界面美学和工作流优化,强调与标签对话的能力,可以作为写作伙伴和个人助理。
所以单从目前功能层面,ChatGPT Atlas并没有从样貌上彻底重新设计浏览器。侧边栏、页面总结、自动化任务,这些都是很多AI浏览器的标准配置。它也没有推翻浏览器的形态本身,只是把AI放到了浏览的中心位置,让用户在熟悉的界面中获得智能化的体验。此外,首发就面向所有用户开放(Agent模式除外),也体现了OpenAI快速占领市场的决心。
在体验上,接下来它还需要证明自己不只是Chrome加了个ChatGPT插件。毕竟Edge早就引入了Copilot,而Chrome也可以轻易加入Gemini侧边栏,Gemini光标、Agent模式,还有着庞大的用户基数和生态优势。但在此之外,OpenAI的Atlas绝对不只是“又一个浏览器”这么简单。
### OpenAI的野心
在OpenAI的思路里,ChatGPT Atlas的亮点之一在于与ChatGPT账户的深度整合。浏览器可以调用用户在ChatGPT中的历史对话和偏好设置,实现跨设备、跨平台的一致体验。跨会话、跨网站的记忆系统也不只是单次对话的上下文,对于重度ChatGPT用户来说,有了它至少可以少开一个应用,也不用跨窗口复制粘贴了。
OpenAI CEO Fidji Simo在博客中阐述了发布ChatGPT Atlas的意图,“我们希望ChatGPT从一个孤立的、被动的文本聊天界面,演变为一个直觉化的超级助手,连接你需要的所有服务。”她提出了ChatGPT将成为你生活的操作系统。而浏览器是这一战略的关键节点,因为它是大多数人获取信息、完成任务的入口。
也就是说,OpenAI的Atlas最大的“不同”,就是它是由OpenAI发布的。ChatGPT Atlas带来的是ChatGPT整个生态的能力与用户关系。这使得它是第一个可以不只在Chrome设定的规则内进行功能修补,而试图从根本上改变人们对浏览器的使用逻辑的产品——它要在已经被ChatGPT塑造了使用习惯的数亿用户的基础上,把浏览体验的核心从谷歌的搜索引擎,转移到OpenAI的AI模型上。
这本质上还是OpenAI要把ChatGPT打造成未来全知全能的操作系统的路线里,必要的一步。用一个最像Chrome的样子,对用户来说熟悉的界面几乎没有学习成本;而对竞争对手,尤其是谷歌而言,这算是一个真正的警告了。接下来可以预期的是,它会迫使谷歌、微软等巨头更快速地将AI深度整合进自己的浏览器产品。所有人都会卷入OpenAI的AI时代操作系统之争中去。