阿里云通义实验室近日正式宣布开源其自主研发的突破性AI智能体项目WebAgent,其中旗舰组件WebShaper和WebSailor在网络智能体领域引发全球瞩目。这款革命性AI工具凭借端到端的自主信息检索与多步推理能力,实现了接近甚至超越人类专家的网络交互水平,为信息处理领域带来全新突破。

WebAgent:模拟人类搜索行为的智能体

WebAgent是阿里巴巴通义实验室精心打造的开源AI智能体,其核心使命在于模拟人类在网络环境中的感知、决策和行动循环。通过自主搜索和多步推理技术,WebAgent能够高效处理复杂、模糊的网络任务,为用户提供前所未有的智能搜索体验。该智能体包含多个关键组件,其中WebSailor和WebShaper的技术创新尤为引人注目。根据官方介绍,WebAgent能够主动检索学术数据库、新闻网站和专业论坛,精准筛选关键信息并生成结构化报告,广泛应用于学术研究、商业分析和日常查询等场景。

在权威评测集BrowseComp上,WebSailor-72B模型表现惊艳,超越了DeepSeek R1和Grok-3等知名闭源模型,仅次于OpenAI的DeepResearch,荣登开源网络智能体榜首。WebAgent还在GAIA和WebWalkerQA基准测试中分别取得60.19分和52.2分的卓越成绩,充分展现了其在复杂任务中的强大能力。

WebShaper:形式化驱动的数据合成新范式

WebShaper作为WebAgent生态的核心创新,提出了一种基于”形式化驱动”的数据合成方法,有效解决了AI在高不确定性任务中的推理难题。通过集合论构建信息搜索任务的数学化表示框架,WebShaper利用”知识投影”概念,将复杂搜索过程抽象为实体集合的操作。例如在查询”出生于90年代的球员在2004-05赛季为东德足球队效力”时,WebShaper能系统化地生成训练数据,确保AI在多步推理中保持高度准确性。

WebShaper数据集覆盖体育、学术、政治、娱乐等多个领域,其中体育类问题占21%,学术类占17%,确保了知识的广泛适应性。其逐层扩展策略有效避免了推理捷径和信息冗余,使AI必须通过完整推理路径得出答案。实验表明,WebShaper训练的模型在相同数据量下,性能显著优于WebWalkerQA和E2HQA等传统数据集。

WebSailor:复杂任务中的”超级网络侦探”

作为WebAgent的”大脑”,WebSailor是一个大规模语言模型,负责理解用户意图、制定浏览策略并决定操作步骤。其最新版本WebSailor-72B通过阿里云FunctionAI实现一键部署,用户仅需10分钟即可完成配置,极大降低了使用门槛。WebSailor在高不确定性任务中表现出色,尤其擅长处理模糊查询或需要跨平台信息整合的复杂场景。

WebSailor的训练采用了创新的SailorFog-QA数据集,通过子图采样和信息模糊化技术模拟真实网络环境中的复杂知识图谱。这种方法赋予了模型处理”超人类”任务的能力,在BrowseComp测试中,WebSailor-32B和72B版本不仅领先所有开源模型,还超越了部分闭源系统。

阿里开源WebAgent项目WebShaper GAIA评测超越Claude4-Sonnet插图

WebDancer与WebWalker:构建完整生态

WebAgent的成功离不开两大关键模块WebDancer和WebWalker的支持。WebDancer是一个端到端智能体训练框架,通过四阶段训练(数据构建、轨迹采样、监督微调、强化学习)全面提升AI的多步搜索能力。其最新版本WebDancer-QwQ-32B在GAIA Pass@3评测中取得64.1%的优异成绩。

WebWalker则是一个基准测试工具,用于评估语言模型在复杂网页遍历中的表现,为开发者优化算法提供了标准化的评估体系。WebAgent的混合推理模式通过”思维预算机制”动态分配计算资源,实现快速响应简单查询与深度推理复杂任务的完美平衡。

在实际应用中,WebAgent能在10分钟内完成特斯拉与小鹏汽车配置表的爬取与分析,或从PubMed等数据库提取临床试验数据并生成溯源报告,效率远超人工操作。

开源意义:重塑信息处理与社区创新

WebAgent的开源不仅大幅降低了企业和开发者的使用成本,更为全球AI社区提供了工业级训练框架和评估标准。其GitHub仓库(https://github.com/Alibaba-NLP/WebAgent)已获超4000次星标,位列GitHub trending第一,Huggingface月度第三。WebSailor的训练策略——高难度任务合成、小规模冷启动、高效强化学习优化——为开源社区攻克复杂推理任务提供了宝贵思路。

从学术研究到商业决策,WebAgent的应用潜力无限。研究人员可利用其快速检索ACL2025论文主题,商业用户可分析2025年AI芯片市场趋势,普通用户则能获取旅游规划或健康咨询等个性化建议。WebAgent的开源标志着AI智能体从技术演示迈向生产力场景,未来有望推动跨模态信息整合和开放领域推理的进一步突破。

GitHub:https://github.com/Alibaba-NLP/WebAgent
huggingface:https://huggingface.co/datasets/Alibaba-NLP/WebShaper
model scope:https://modelscope.cn/datasets/iic/WebShaper

最新快讯

2025年10月02日

14:24
韩国科技媒体The Bell最新披露的独家消息显示,SK海力士旗下固态存储领军企业Solidigm正全力冲刺下一代NAND闪存技术的研发突破,目标是在明年正式实现商业化落地。作为全球唯一坚持采用浮动栅极架构的NAND闪存巨头,Solidigm的新一代产品将实现革命性突破,成功将堆叠层数提升至约250层,同时继续沿用备受市场认可的QLC单元设计路线。 业内曾长...
13:54
罗技近期在全球范围内正式推出了MX Master 3s Lite无线鼠标,这款新品作为MX Master 3s的精简版本,在保留核心优势的同时进行了针对性优化。MX Master 3s Lite最显著的变化是取消了传统的Bolt 2.4GHz接收器,转而采用蓝牙连接方式,这一设计极大地提升了多设备切换的便捷性,用户可以轻松在不同设备间无缝切换使用。 尽管...
13:54
2025年10月2日,人工智能领域的领军企业OpenAI成功完成了一项具有里程碑意义的二级股票交易,其估值飙升至令人瞩目的5000亿美元。这一重大成就不仅刷新了全球初创企业的估值记录,更标志着OpenAI在全球科技格局中的强势崛起。此次交易为现任及前任员工提供了宝贵的变现机会,允许他们出售约66亿美元的股份,而购入方则包括软银、思睿资本、Dragoneer、...
13:54
10月1日,上海迎来旅游热潮,全市共接待游客358.47万人次,同比增长18.50%,展现出强劲的旅游复苏势头。据上海旅游大数据监测显示,国庆假期首日游客接待量实现显著攀升,市民与游客纷纷选择出行,游览城市地标、文博场馆及商圈街区,共同感受上海的魅力。文旅消费持续升温,全市各大景区和公共场所秩序井然,部分热门景点为保障安全,采取了限流措施。此次增长主要得益于...
13:54
特斯拉近期一项备受争议的举措引发了广泛关注。据《连线》杂志独家报道,该品牌汽车在系统监测到驾驶员出现疲劳状态或车道偏离行为时,会通过中控屏幕主动弹出提示,建议开启FSD(完全自动驾驶辅助功能)。这些提示信息直白而具有引导性,例如"检测到疲劳状态,建议启用FSD助您保持专注"等措辞,迅速成为行业焦点。 尽管特斯拉官方强调FSD系统仍需驾驶员保持全程监控,但多位...
13:23
円星科技(M31)作为全球硅智财(IP)领域的佼佼者,近日传来振奋人心的消息其低功耗IP解决方案在台积电N12e制程上取得突破性进展后,进一步将技术版图拓展至N6e先进制程,成功推出全新存储器编译器系列。该系列IP解决方案专为超低漏电(ULL)、极低漏电(ELL)和低电压操作(Low-VDD)设计,能够完美契合高性能与低功耗并重的应用场景,为物联网、移动设备...
13:23
海口国际机场福朋喜来登酒店盛大启幕,正式宣告这一国际知名酒店品牌首次登陆海口市场。酒店坐落于美兰区海瑜大道,地理位置优越,距离海口美兰国际机场及美兰高铁站仅约5公里,无论是商务出行还是休闲度假,都能实现便捷通达。 作为福朋喜来登品牌在海南的首个落脚点,该酒店精心打造了149间客房与套房,每一间都配备了高品质床品系统,确保宾客享受极致舒适的睡眠体验。55英...
13:23
乐山福朋喜来登酒店盛大启幕,标志着国际知名酒店品牌福朋喜来登正式进驻乐山,为这座千年古城注入全新的住宿体验。酒店坐落于风景秀丽的五通桥区竹根镇岷江道北段,与壮丽的岷江、历史悠久的王爷庙以及静谧的菩提山公园仅咫尺之遥,周边环绕着充满活力的晶硅光伏高新产业区,地理位置得天独厚。 酒店交通极为便利,距离乐山市中心约25公里,乘坐高铁仅需29公里,前往乐山机场只需1...
13:23
今日中午,北京时间传来重磅消息,全球人工智能领域的领军企业OpenAI成功完成了一笔高达约66亿美元的二级市场股份转让交易。这一交易不仅为公司带来了巨额资金,更使其估值实现了飞跃式增长,一跃升至令人瞩目的5000亿美元,从而超越了科技巨头SpaceX,正式加冕为全球估值最高的初创企业。值得注意的是,OpenAI的估值在此前已从3000亿美元的基础上实现了翻倍...
12:50
烟台芝罘福朋喜来登酒店近日盛大开业,为这座海滨城市的旅游市场注入了强劲的新动能。这座现代化酒店坐落于芝罘区海港路黄金地段,紧邻烟台站和烟台港客运站,无论是火车还是轮渡出行都极为便利。值得一提的是,前往烟台蓬莱国际机场仅需45分钟车程,立体交通网络为商务和休闲旅客提供了无与伦比的出行体验。 酒店拥有107间精心设计的现代风格客房,每一间都配备了65寸液晶电视、...
12:50
上海佘山世茂艾美酒店近日以全新面貌焕新登场,正式宣告该奢华品牌再度进驻备受瞩目的佘山旅游度假区。作为佘山国家旅游度假区的核心地标,酒店毗邻月湖雕塑公园与佘山森林公园两大自然人文景观,距离上海南站仅25公里,虹桥国际机场24公里,形成便捷的都会连接枢纽。 此次升级后的酒店共设有330间精致客房与套房,每间客房均配备独立阳台,最小面积达55平方米,为宾客提供私享...
12:50
2025年10月2日,中金公司投资银行部负责人孙雷在行业峰会上发表重要观点,强调并购重组已成为推动中国经济结构调整与高质量发展的核心引擎。他指出,这一趋势不仅优化了资源配置效率,更在深层次上促进了产业升级与经济转型。孙雷基于详尽的市场数据分析,预测2025年中国并购市场全年交易规模将突破历史峰值,有望接近过去十年的最高水平,展现出强劲的增长动能与广阔的发展前...