阿里云通义实验室今日正式宣布,将备受瞩目的通义DeepResearch开源项目全面释放给全球开发者。这款具有里程碑意义的Web代理工具,以仅300亿参数(实际激活参数仅30亿)的惊人轻量化设计,在性能表现上实现了对标OpenAI深度研究工具的跨越式突破。通义DeepResearch在多项权威基准测试中展现出卓越实力,包括在Humanity’s Last Exam中取得32.9分的高分,在BrowseComp测试中斩获45.3分的优异成绩,更是在xbench-DeepSearch基准测试中以75.0分的亮眼成绩领跑行业,这标志着开源AI智能体在复杂信息检索与推理领域迎来了重大技术飞跃。
这款专为处理多步、长周期深度信息搜集任务而设计的代理工具,支持高达128K的超长上下文处理能力。它能够将复杂问题智能分解为多个子任务,通过多轮推理链条高效整合海量数据,为用户带来前所未有的信息处理体验。其背后的技术创新包括智能体数据持续预训练和on-policy强化学习算法,这使得通义DeepResearch在处理多轮交互和实时数据处理场景中,如多日行程规划、法律文档分析等复杂任务时,始终保持着强大的稳定性和可靠性。
通义DeepResearch提供两种灵活的推理模式:适用于轻量级任务的单模型ReAct模式,以及通过多Agent并行协作、支持算力弹性扩展的Heavy模式。目前,该技术已在多个实际应用场景中落地生根。例如,已集成到高德地图中,帮助用户轻松规划个性化多日行程;同时,它也为法律助手”通义法睿”提供了强大支持,显著提升了合同风险评估和案件分析的效率。
作为阿里云通义系列大模型生态的重要一环,通义DeepResearch的开源将极大地降低AI代理的开发门槛。该系列此前已开源超过200款不同参数规模的模型,并成功催生了Hugging Face平台上超过10万个二次开发模型。专家认为,此次开源将为广大开发者和小型团队提供强大的技术基础,帮助他们快速构建出特定领域的AI智能体,推动AI应用生态的蓬勃发展。