阿里云通义实验室近日正式宣布开源其自主研发的突破性AI智能体项目WebAgent,其中旗舰组件WebShaper和WebSailor在网络智能体领域引发全球瞩目。这款革命性AI工具凭借端到端的自主信息检索与多步推理能力,实现了接近甚至超越人类专家的网络交互水平,为信息处理领域带来全新突破。

WebAgent:模拟人类搜索行为的智能体

WebAgent是阿里巴巴通义实验室精心打造的开源AI智能体,其核心使命在于模拟人类在网络环境中的感知、决策和行动循环。通过自主搜索和多步推理技术,WebAgent能够高效处理复杂、模糊的网络任务,为用户提供前所未有的智能搜索体验。该智能体包含多个关键组件,其中WebSailor和WebShaper的技术创新尤为引人注目。根据官方介绍,WebAgent能够主动检索学术数据库、新闻网站和专业论坛,精准筛选关键信息并生成结构化报告,广泛应用于学术研究、商业分析和日常查询等场景。

在权威评测集BrowseComp上,WebSailor-72B模型表现惊艳,超越了DeepSeek R1和Grok-3等知名闭源模型,仅次于OpenAI的DeepResearch,荣登开源网络智能体榜首。WebAgent还在GAIA和WebWalkerQA基准测试中分别取得60.19分和52.2分的卓越成绩,充分展现了其在复杂任务中的强大能力。

WebShaper:形式化驱动的数据合成新范式

WebShaper作为WebAgent生态的核心创新,提出了一种基于”形式化驱动”的数据合成方法,有效解决了AI在高不确定性任务中的推理难题。通过集合论构建信息搜索任务的数学化表示框架,WebShaper利用”知识投影”概念,将复杂搜索过程抽象为实体集合的操作。例如在查询”出生于90年代的球员在2004-05赛季为东德足球队效力”时,WebShaper能系统化地生成训练数据,确保AI在多步推理中保持高度准确性。

WebShaper数据集覆盖体育、学术、政治、娱乐等多个领域,其中体育类问题占21%,学术类占17%,确保了知识的广泛适应性。其逐层扩展策略有效避免了推理捷径和信息冗余,使AI必须通过完整推理路径得出答案。实验表明,WebShaper训练的模型在相同数据量下,性能显著优于WebWalkerQA和E2HQA等传统数据集。

WebSailor:复杂任务中的”超级网络侦探”

作为WebAgent的”大脑”,WebSailor是一个大规模语言模型,负责理解用户意图、制定浏览策略并决定操作步骤。其最新版本WebSailor-72B通过阿里云FunctionAI实现一键部署,用户仅需10分钟即可完成配置,极大降低了使用门槛。WebSailor在高不确定性任务中表现出色,尤其擅长处理模糊查询或需要跨平台信息整合的复杂场景。

WebSailor的训练采用了创新的SailorFog-QA数据集,通过子图采样和信息模糊化技术模拟真实网络环境中的复杂知识图谱。这种方法赋予了模型处理”超人类”任务的能力,在BrowseComp测试中,WebSailor-32B和72B版本不仅领先所有开源模型,还超越了部分闭源系统。

阿里开源WebAgent项目WebShaper GAIA评测超越Claude4-Sonnet插图

WebDancer与WebWalker:构建完整生态

WebAgent的成功离不开两大关键模块WebDancer和WebWalker的支持。WebDancer是一个端到端智能体训练框架,通过四阶段训练(数据构建、轨迹采样、监督微调、强化学习)全面提升AI的多步搜索能力。其最新版本WebDancer-QwQ-32B在GAIA Pass@3评测中取得64.1%的优异成绩。

WebWalker则是一个基准测试工具,用于评估语言模型在复杂网页遍历中的表现,为开发者优化算法提供了标准化的评估体系。WebAgent的混合推理模式通过”思维预算机制”动态分配计算资源,实现快速响应简单查询与深度推理复杂任务的完美平衡。

在实际应用中,WebAgent能在10分钟内完成特斯拉与小鹏汽车配置表的爬取与分析,或从PubMed等数据库提取临床试验数据并生成溯源报告,效率远超人工操作。

开源意义:重塑信息处理与社区创新

WebAgent的开源不仅大幅降低了企业和开发者的使用成本,更为全球AI社区提供了工业级训练框架和评估标准。其GitHub仓库(https://github.com/Alibaba-NLP/WebAgent)已获超4000次星标,位列GitHub trending第一,Huggingface月度第三。WebSailor的训练策略——高难度任务合成、小规模冷启动、高效强化学习优化——为开源社区攻克复杂推理任务提供了宝贵思路。

从学术研究到商业决策,WebAgent的应用潜力无限。研究人员可利用其快速检索ACL2025论文主题,商业用户可分析2025年AI芯片市场趋势,普通用户则能获取旅游规划或健康咨询等个性化建议。WebAgent的开源标志着AI智能体从技术演示迈向生产力场景,未来有望推动跨模态信息整合和开放领域推理的进一步突破。

GitHub:https://github.com/Alibaba-NLP/WebAgent
huggingface:https://huggingface.co/datasets/Alibaba-NLP/WebShaper
model scope:https://modelscope.cn/datasets/iic/WebShaper

最新快讯

2025年08月02日

01:10
本周A股市场震荡加剧,Wind数据揭示出两极分化的市场格局。其中,20只个股涨幅突破30%,展现出较强的市场活力,南新制药更是以惊人涨幅78.01%领跑全市场,成为本周最大亮点。紧随其后,东芯股份、南方路机、思泉新材等个股也表现抢眼,涨幅均超过50%,医药生物板块整体强势,占据涨幅榜七席,成为市场关注的焦点。 然而,市场并非全然一片利好。与此同时,50只个股...
01:10
本周,资本市场目光首次聚焦于64只个股,其中3家公司更是获得了专业机构的明确目标价指引。香农芯创凭借其强劲的市场表现,获得华创证券"强推"评级,目标价高达50.83元,相较于最新收盘价33.46元,显示出显著的上涨潜力。盟升电子同样备受关注,华泰证券给予其47.43元的目标价,彰显了该公司的投资价值。此外,思瑞浦、九号公司以及京沪高铁等知名企业也位列此次机构...
01:10
近日,美国疾病控制和预防中心(CDC)通过电子邮件正式宣布,将终止与医生团体、公共卫生专家及传染病学者的合作,不再邀请他们参与疫苗数据审查与建议制定工作。这一决定引发广泛关注,其背后原因直指ACIP工作小组的独立性。CDC在邮件中明确指出,此举旨在确保工作小组的决策过程不受任何特殊利益集团的不当影响,同时强调部分联络组织存在基于所代表群体的潜在偏见,可能对专...
01:10
2025年8月1日,美国弗吉尼亚州里士满的能源巨头Dominion公司正式发布第二季度财务报告,结果显示业绩表现未达市场预期。作为全球领先的综合能源供应商,Dominion凭借其雄厚的发电实力和覆盖广泛的输配电网络,在能源行业占据重要地位。值得注意的是,该公司目前正积极布局多个可再生能源项目,其中位于弗吉尼亚海滩沿岸的大型海上风电场项目备受瞩目,该项目不仅将...
01:10
2025年8月1日,全球领先的工业品分销商W.W. Grainger公司正式发布了其第二季度财务报告,数据显示公司当季销售额高达46亿美元,较去年同期实现了5.6%的稳健增长,这一成绩不仅超越了市场此前45.223亿美元的普遍预期,更彰显了其在工业品领域的强大市场竞争力。然而,在营收亮眼的背后,公司摊薄后的每股收益为9.97美元,略低于分析师预期的10.07...
01:10
2025年8月,水利部正式印发《取用水监测计量能力提升三年行动方案》,全面部署2025年至2027年全国范围内取用水监测计量能力的系统性提升工作。该方案以问题导向、目标导向和效果导向为核心原则,明确提出了五大重点举措,旨在构建科学高效的取用水管理新体系。 方案首先强调要加快取水计量设施建设步伐,通过优化资源配置和强化技术支持,确保计量设施在重点区域和关键环节...
01:10
2025年8月1日,富兰克林资源公司正式发布了其截至6月30日的第三财季财务报告,引发市场广泛关注。报告显示,公司当季实现营收20.64亿美元,这一成绩远超市场预期的15.8亿美元,展现出强劲的业务增长势头。然而,净利润方面却呈现不同面貌,录得9230万美元,每股收益为0.15美元,略低于分析师的普遍预期。尽管如此,公司管理资产规模已达到令人瞩目的1.611...
01:10
2025年8月1日,安徽合肥墨子量子科技基金会正式揭晓本年度“墨子量子奖”获奖名单,该奖项特别授予三位在量子模拟领域取得突破性成就的外国科学家。获奖者分别是马克斯·普朗克量子光学研究所与慕尼黑大学联合研究员伊曼纽尔·布洛赫、苏黎世联邦理工学院教授蒂尔曼·埃斯林格,以及哈佛大学教授马库斯·格雷纳。这三位科学家凭借其基于光晶格超冷原子系统实现的玻色子与费米子哈伯...
01:10
2025年8月1日,备受瞩目的《上海市粮食安全保障条例》在上海市第十六届人大常委会第二十三次会议上获得全票通过,标志着上海在粮食安全领域迈出了具有里程碑意义的一步。该条例将于2025年9月1日正式施行,为这座超大城市构建更为坚实的粮食安全防线提供了坚实的法律支撑。 作为上海市首部专门针对粮食安全保障的地方性法规,该条例全面系统地构建了从生产到储备、从管理到服...
01:10
2025年第二季度,全球能源市场经历剧烈波动,油价断崖式下跌给大型石油公司带来严峻挑战。埃克森美孚和雪佛龙作为行业巨头,其财务表现成为市场焦点。尽管油价暴跌导致利润大幅缩水,两家公司仍凭借精明的财务策略实现了调整后每股收益的逆势增长。埃克森美孚当季净利润录得70.8亿美元,同比下降23%,但超出分析师预期;雪佛龙净利润更是锐减44%至24.9亿美元,同样超出...
00:13
2025年,全球人工智能领域的投资热潮将持续升温,亚马逊、Alphabet、微软和Meta四家科技巨头在此领域的累计投入预计将高达3640亿美元,这一数字已远超市场此前预测的3250亿美元。其中,微软表现尤为激进,2025财年资本支出已达到惊人的887亿美元,展现出对AI技术的坚定支持。紧随其后的是Meta和Alphabet,这两家公司也纷纷上调了各自的支出...
00:13
2025年8月1日,欧洲股市遭遇普遍性下跌,整体市场情绪低迷。德国DAX 30指数表现尤为疲软,初步收跌2.23%,报23527.82点,本周累计跌幅扩大至2.95%。法国CAC 40指数同样承压,下跌2.74%,意大利FTSE MIB指数亦跌2.20%。值得注意的是,银行板块指数重挫3.83%,成为市场拖累的主要力量。英国富时100指数虽相对抗跌,但亦收跌...