阿里云通义实验室近日正式宣布开源其自主研发的突破性AI智能体项目WebAgent,其中旗舰组件WebShaper和WebSailor在网络智能体领域引发全球瞩目。这款革命性AI工具凭借端到端的自主信息检索与多步推理能力,实现了接近甚至超越人类专家的网络交互水平,为信息处理领域带来全新突破。

WebAgent:模拟人类搜索行为的智能体

WebAgent是阿里巴巴通义实验室精心打造的开源AI智能体,其核心使命在于模拟人类在网络环境中的感知、决策和行动循环。通过自主搜索和多步推理技术,WebAgent能够高效处理复杂、模糊的网络任务,为用户提供前所未有的智能搜索体验。该智能体包含多个关键组件,其中WebSailor和WebShaper的技术创新尤为引人注目。根据官方介绍,WebAgent能够主动检索学术数据库、新闻网站和专业论坛,精准筛选关键信息并生成结构化报告,广泛应用于学术研究、商业分析和日常查询等场景。

在权威评测集BrowseComp上,WebSailor-72B模型表现惊艳,超越了DeepSeek R1和Grok-3等知名闭源模型,仅次于OpenAI的DeepResearch,荣登开源网络智能体榜首。WebAgent还在GAIA和WebWalkerQA基准测试中分别取得60.19分和52.2分的卓越成绩,充分展现了其在复杂任务中的强大能力。

WebShaper:形式化驱动的数据合成新范式

WebShaper作为WebAgent生态的核心创新,提出了一种基于”形式化驱动”的数据合成方法,有效解决了AI在高不确定性任务中的推理难题。通过集合论构建信息搜索任务的数学化表示框架,WebShaper利用”知识投影”概念,将复杂搜索过程抽象为实体集合的操作。例如在查询”出生于90年代的球员在2004-05赛季为东德足球队效力”时,WebShaper能系统化地生成训练数据,确保AI在多步推理中保持高度准确性。

WebShaper数据集覆盖体育、学术、政治、娱乐等多个领域,其中体育类问题占21%,学术类占17%,确保了知识的广泛适应性。其逐层扩展策略有效避免了推理捷径和信息冗余,使AI必须通过完整推理路径得出答案。实验表明,WebShaper训练的模型在相同数据量下,性能显著优于WebWalkerQA和E2HQA等传统数据集。

WebSailor:复杂任务中的”超级网络侦探”

作为WebAgent的”大脑”,WebSailor是一个大规模语言模型,负责理解用户意图、制定浏览策略并决定操作步骤。其最新版本WebSailor-72B通过阿里云FunctionAI实现一键部署,用户仅需10分钟即可完成配置,极大降低了使用门槛。WebSailor在高不确定性任务中表现出色,尤其擅长处理模糊查询或需要跨平台信息整合的复杂场景。

WebSailor的训练采用了创新的SailorFog-QA数据集,通过子图采样和信息模糊化技术模拟真实网络环境中的复杂知识图谱。这种方法赋予了模型处理”超人类”任务的能力,在BrowseComp测试中,WebSailor-32B和72B版本不仅领先所有开源模型,还超越了部分闭源系统。

阿里开源WebAgent项目WebShaper GAIA评测超越Claude4-Sonnet插图

WebDancer与WebWalker:构建完整生态

WebAgent的成功离不开两大关键模块WebDancer和WebWalker的支持。WebDancer是一个端到端智能体训练框架,通过四阶段训练(数据构建、轨迹采样、监督微调、强化学习)全面提升AI的多步搜索能力。其最新版本WebDancer-QwQ-32B在GAIA Pass@3评测中取得64.1%的优异成绩。

WebWalker则是一个基准测试工具,用于评估语言模型在复杂网页遍历中的表现,为开发者优化算法提供了标准化的评估体系。WebAgent的混合推理模式通过”思维预算机制”动态分配计算资源,实现快速响应简单查询与深度推理复杂任务的完美平衡。

在实际应用中,WebAgent能在10分钟内完成特斯拉与小鹏汽车配置表的爬取与分析,或从PubMed等数据库提取临床试验数据并生成溯源报告,效率远超人工操作。

开源意义:重塑信息处理与社区创新

WebAgent的开源不仅大幅降低了企业和开发者的使用成本,更为全球AI社区提供了工业级训练框架和评估标准。其GitHub仓库(https://github.com/Alibaba-NLP/WebAgent)已获超4000次星标,位列GitHub trending第一,Huggingface月度第三。WebSailor的训练策略——高难度任务合成、小规模冷启动、高效强化学习优化——为开源社区攻克复杂推理任务提供了宝贵思路。

从学术研究到商业决策,WebAgent的应用潜力无限。研究人员可利用其快速检索ACL2025论文主题,商业用户可分析2025年AI芯片市场趋势,普通用户则能获取旅游规划或健康咨询等个性化建议。WebAgent的开源标志着AI智能体从技术演示迈向生产力场景,未来有望推动跨模态信息整合和开放领域推理的进一步突破。

GitHub:https://github.com/Alibaba-NLP/WebAgent
huggingface:https://huggingface.co/datasets/Alibaba-NLP/WebShaper
model scope:https://modelscope.cn/datasets/iic/WebShaper

最新快讯

2025年08月01日

04:02
7月31日收盘时分,ICE美元指数在纽约市场强势收涨,最终报99.960点,单日涨幅达0.15%,展现出稳健的上涨态势。整个7月,该指数累计上涨3.18%,表现远超市场预期。回顾月初至17日,美元指数呈现稳步攀升的态势,从96.377点逐步攀升至98.950点,期间展现出较强的上涨动能。然而,在18日至24日期间,指数出现短暂回调,但并未改变整体向上的趋势。...
04:02
2025年8月1日凌晨3:00,中国外汇市场传来积极信号,在岸人民币兑美元(CNY)汇率收报7.1998元,较前一交易日夜盘收盘上涨2个基点,展现出稳健的升值态势。这一数据不仅反映了市场对人民币的信心增强,也体现了中国外汇市场的深度与活力。当日,人民币兑美元的交易量达到484.56亿美元,较前一日略有增长,显示出市场参与者的活跃度进一步提升。这一表现不仅对稳...
04:02
2025年8月1日,恒指期货夜盘交易落下帷幕,最终收跌0.15%,报收于24708点。相较于前一交易日,指数下跌65点,低水位运行。这一数据反映出市场在夜盘时段的波动情况,投资者需密切关注后续走势变化。
04:02
2025年第一季度全球服务贸易发展呈现新态势,整体增速显著放缓至5%,这一数据较2024年和2023年同期增速大幅回落约一半。世界贸易组织最新发布的权威报告显示,欧洲和北美两大经济板块的服务贸易出口同比增长率仅为3%,明显低于2024年同期的表现。值得注意的是,亚洲地区逆势上扬,服务贸易出口同比增幅高达9%,展现出强劲的增长韧性。 报告特别指出,金融服务出口...
04:02
7月30日,俄罗斯堪察加半岛的阿瓦恰湾海域突发8.7级强震,引发广泛关注。这场强烈地震不仅造成了巨大影响,更在科学界引发了深入探讨。据俄科学院统一地球物理局堪察加分部主任切布罗夫于7月31日透露,地震发生后,该地区已监测到约1000次余震,显示出地震活动的持续性和复杂性。 专家们经过综合分析认为,此次强震可能预示着堪察加半岛地区一年多来地震活动的最终阶段。这...
03:01
2025年8月1日,全球能源市场迎来波动,WTI原油期货合约以1.06%的跌幅收盘,最终报收于69.26美元/桶。这一价格变动背后,是市场对原油需求预期的深刻调整,反映出投资者对全球能源市场动态的高度敏感。随着全球经济形势的变化,原油需求的预期成为影响市场走势的关键因素。投资者正密切关注全球经济复苏进程、主要经济体政策动向以及地缘政治风险等多重因素,这些因素...
03:01
2025年8月1日,大宗商品市场迎来波动性交易,上期所原油期货夜盘价格承压下跌,最终收跌0.71%,报收于528.2元/桶。这一表现反映出国际原油市场在供需预期变化下的调整态势。与此同时,贵金属板块呈现分化走势,沪金主力合约表现稳健,小幅收涨0.12%,报771元/克,显示出较强的抗跌性;而沪银主力合约则受多重因素影响,下跌1.37%,报8935元/千克,市...
03:01
8月1日,行业消息人士向媒体透露,全球领先的企业云服务巨头Salesforce与服务管理软件领导者ServiceNow正在就一项高达数十亿美元的战略合作达成协议进行密集磋商。据悉,双方计划分别投入约7.5亿美元资金,共同入股全球云客服解决方案供应商Genesys。若此次投资交易最终完成,Genesys的估值将有望突破150亿美元大关,创下行业新纪录。 值得注...
03:01
2025年8月1日,中国北京,设计软件巨头Figma的首次公开募股(IPO)迎来惊艳开局。开盘后股价飙升超过172%,最终定格在93.5美元,远超市场预期。这一惊人表现不仅彰显了Figma的强劲发展势头,更凸显了资本市场对其创新能力和未来增长潜力的坚定信心。此次IPO发行价为每股33美元,而开盘价的大幅溢价,充分证明了投资者对Figma的高度认可。作为全球领...
01:56
2025年8月1日,美国科技股市场呈现显著分化态势。在纳斯达克100指数成分股中,Arm控股遭遇重挫,股价暴跌13.3%,德康医疗也大幅下挫8.3%,而高通股价则下跌7.6%。这一表现与科技七巨头的走势形成鲜明对比,其中Meta逆势上涨11.6%,表现最为强劲;微软和亚马逊分别录得4.2%和1.8%的温和涨幅,而英伟达股价保持持平,苹果微跌,谷歌A和特斯拉则...
01:56
8月1日,国际纸业(IP)股价遭遇重挫,跌幅一度扩大至10%,这一剧烈波动主要源于公司最新公布的财务业绩未能达到市场预期。数据显示,该公司的盈利能力显著低于分析师的普遍预期,这一消息迅速引发市场对IP经营状况的深度担忧。投资者开始质疑公司未来的发展潜力,股价的持续下跌正是这种谨慎态度的直观体现。此次事件不仅暴露了公司在当前市场环境下的经营压力,也反映出资本市...
01:56
2025年8月1日,夜盘金属期货市场整体呈现震荡下行态势,多数品种价格遭遇下跌。其中,国际铜主力合约夜盘收跌0.46%,表现相对稳定。国内沪铜、沪铝、沪锌、沪铅、沪镍及沪锡等主要金属期货品种均出现不同程度的下跌,跌幅分别为0.55%、0.58%、0.18%、0.95%、0.40%和0.87%。此外,氧化铝和铝合金期货价格也同步走弱,分别收跌0.83%和0.5...