阿里云开源通义DeepResearch 轻量级AI代理性能对标OpenAI

2025-09-17 09:03:33 AI动态 32 次阅读

阿里云通义实验室今日正式宣布，将备受瞩目的通义DeepResearch开源项目全面释放给全球开发者。这款具有里程碑意义的Web代理工具，以仅300亿参数（实际激活参数仅30亿）的惊人轻量化设计，在性能表现上实现了对标OpenAI深度研究工具的跨越式突破。通义DeepResearch在多项权威基准测试中展现出卓越实力，包括在Humanity’s Last Exam中取得32.9分的高分，在BrowseComp测试中斩获45.3分的优异成绩，更是在xbench-DeepSearch基准测试中以75.0分的亮眼成绩领跑行业，这标志着开源AI智能体在复杂信息检索与推理领域迎来了重大技术飞跃。

这款专为处理多步、长周期深度信息搜集任务而设计的代理工具，支持高达128K的超长上下文处理能力。它能够将复杂问题智能分解为多个子任务，通过多轮推理链条高效整合海量数据，为用户带来前所未有的信息处理体验。其背后的技术创新包括智能体数据持续预训练和on-policy强化学习算法，这使得通义DeepResearch在处理多轮交互和实时数据处理场景中，如多日行程规划、法律文档分析等复杂任务时，始终保持着强大的稳定性和可靠性。

通义DeepResearch提供两种灵活的推理模式：适用于轻量级任务的单模型ReAct模式，以及通过多Agent并行协作、支持算力弹性扩展的Heavy模式。目前，该技术已在多个实际应用场景中落地生根。例如，已集成到高德地图中，帮助用户轻松规划个性化多日行程；同时，它也为法律助手”通义法睿”提供了强大支持，显著提升了合同风险评估和案件分析的效率。

作为阿里云通义系列大模型生态的重要一环，通义DeepResearch的开源将极大地降低AI代理的开发门槛。该系列此前已开源超过200款不同参数规模的模型，并成功催生了Hugging Face平台上超过10万个二次开发模型。专家认为，此次开源将为广大开发者和小型团队提供强大的技术基础，帮助他们快速构建出特定领域的AI智能体，推动AI应用生态的蓬勃发展。