京东开源JoyAgent-JDGenie 多智能体系统GAIA准确率75.15%行业领先

近日,京东正式宣布开源其自主研发的端到端通用多智能体系统JoyAgent-JDGenie,这款产品级框架在权威GAIA基准测试中表现卓越,以75.15%的准确率超越了OWL、OpenManus等主流竞品,位列行业前茅。作为一款功能完备的开源框架,JoyAgent-JDGenie凭借其强大的多智能体协作能力和即用性,为开发者提供了高效构建AI应用的强大工具。

GAIA基准领跑,性能卓越

JoyAgent-JDGenie在GAIA基准测试中取得了令人瞩目的成绩,以75.15%的总体准确率刷新了多智能体系统的性能纪录。GAIA基准以其对真实世界任务的全面评估(涵盖多模态处理、工具使用和复杂推理等场景)而被誉为AI智能体能力的”金标准”。JoyAgent-JDGenie在各个难度级别的任务中均表现出色:Level1任务准确率超过85%,Level2任务接近78%,即使在最具挑战性的Level3任务中也实现了55%的优异表现,显著领先于OWL(约65%)和OpenManus(约65%)等其他开源框架。这一成绩充分彰显了JoyAgent-JDGenie在通用场景下的强大潜力。

京东开源JoyAgent-JDGenie 多智能体系统GAIA准确率75.15%行业领先插图1

端到端多智能体框架,开箱即用

JoyAgent-JDGenie是一款完整的端到端多智能体系统,支持用户通过简单的查询或任务输入直接获取答案或解决方案。该框架集成了前端交互界面、后端服务架构、核心智能体引擎以及多个专业子智能体模块,包括报告生成智能体、代码智能体、PPT智能体和文件处理智能体,可覆盖从文档处理到代码生成、演示文稿制作等多样化应用场景。开发者还可以通过挂载自定义子智能体或集成外部工具(如Web搜索API或Python解释器)来扩展系统功能,满足特定业务需求。与传统单一智能体系统不同,JoyAgent-JDGenie采用多层级协作设计,通过任务分解和智能体协同,高效处理复杂任务。例如,当用户输入”生成一份关于2025年AI趋势的PPT”时,系统会自动分配任务给PPT智能体和数据分析智能体,协同生成包含图表和内容的演示文稿。这种即用性特性极大降低了开发门槛,特别适合企业快速部署AI应用。

多模态与记忆优化,智能更进一步

JoyAgent-JDGenie的多模态与记忆设计是其核心亮点。系统支持文本、图像、代码等多种输入和输出形式,能够处理GAIA基准中的多模态任务,如解析PDF文件、分析图像内容或处理音频数据。此外,框架引入了跨任务级别的相似任务记忆机制,允许系统根据历史任务记录优化当前任务的处理效率。例如,在重复生成类似报告时,系统可调用历史数据,减少重复计算,提升响应速度。社区反馈显示,JoyAgent-JDGenie的多模态能力在处理复杂任务时表现出色。例如,在GAIA Level3任务中,系统能够通过链式推理(Chain-of-Thought)结合外部工具,准确回答涉及多源数据整合的问题,如”根据某幅画作和历史记录提取特定信息”。这种能力使其在数据分析、内容创作和自动化工作流中具有广泛应用前景。

京东开源JoyAgent-JDGenie 多智能体系统GAIA准确率75.15%行业领先插图2

开源生态,助力开发者创新

JoyAgent-JDGenie完全开源(Apache2.0许可证),为开发者提供了极大的灵活性。该项目公开了前端、后端、框架、引擎以及核心子智能体的完整代码,开发者可基于此进行二次开发或直接部署。项目还提供了详细的文档和快速入门指南,支持在Windows、Linux等多个平台上运行,兼容主流硬件环境。社区反馈显示,JoyAgent-JDGenie的模块化设计便于扩展。例如,开发者可通过添加新的子智能体(如专用于金融分析或医疗数据处理的智能体)快速定制系统。此外,京东团队表示将持续优化框架,计划引入本地化LLM支持和更高效的推理加速技术,以降低对云端API的依赖,进一步提升性能和成本效益。

多智能体系统的未来风向

JoyAgent-JDGenie的发布标志着多智能体系统在开源领域的重大突破。其在GAIA基准中的领先表现,不仅体现了京东在AI技术领域的深厚积累,也为企业级AI应用的快速落地提供了范例。随着多智能体系统在任务协作、工具整合和多模态处理能力的持续提升,类似JoyAgent-JDGenie的框架将成为推动AI普及化的重要力量。对于希望尝试JoyAgent-JDGenie的开发者,只需访问其GitHub仓库获取源码,按照指引配置环境即可快速部署。无论是构建智能客服、自动化报告生成还是复杂数据分析工具,这款框架都值得一试。项目地址:https://github.com/jd-opensource/joyagent-jdgenie

最新快讯

2025年10月02日

10:45
路透社最新消息,OpenAI 首席执行官萨姆・奥特曼近期对韩国进行了重要访问,并已安排于周三与韩国总统李在明举行会晤。此次访问的核心目标在于积极推动韩国在人工智能领域的投资政策,从而助力这个亚洲第四大经济体在科技浪潮中抢占先机。李在明总统办公室方面透露,这场备受瞩目的会晤将于当地时间周三下午6点,在首尔市中心的总统府正式举行。 韩国政府正积极寻求通过加大对A...
10:45
特斯拉近日发布了2023年第三季度超级充电网络的亮眼数据,展现出其全球范围内的快速扩张和持续增长。报告显示,本季度特斯拉在全球新增了4000个超级充电桩,这一数字较去年同期增长了18%,进一步巩固了其在充电网络领域的领先地位。与此同时,累计输送电能达到惊人的1.8太瓦时,同比增长29%,充分体现了超充网络的高效运行和用户需求的旺盛。 在充电服务方面,第三季度...
10:45
OpenAI近日推出了一款名为Sora的TikTok风格应用,凭借其强大的AI生成视频功能迅速引发关注。然而这款应用上线后却遭遇内部争议,因平台充斥着大量CEO奥尔特曼的深度伪造视频而饱受诟病。多位现任及前任研究员在社交平台上公开表达担忧,质疑此举是否违背了OpenAI"开发惠及人类AI"的核心理念。 预训练研究员霍尔曼在接受采访时坦言,虽然AI信息流存在令...
10:45
亚马逊于当地时间9月30日震撼发布2025款Fire TV产品线,涵盖多项创新升级,为用户带来前所未有的视听盛宴。此次更新不仅提升了硬件性能,更在智能交互和观影体验上实现了突破性进展,旨在满足不同消费者的需求。 新款Fire TV Omni QLED电视成为本次发布的旗舰产品,其亮度提升高达60%,调光分区数量翻倍,处理器性能增强40%,全面支持Dolby ...
10:45
2025年10月2日,江苏连云港田湾核电基地传来喜讯,其累计安全发电量成功突破5000亿千瓦时这一里程碑,为我国核电事业发展再添辉煌篇章。作为长三角地区重要的清洁能源供应基地,田湾核电基地始终致力于为江苏及区域经济社会发展提供稳定可靠的绿色电力支撑。据测算,该基地累计发电量相当于节约标准煤1.5亿吨,有效减少二氧化碳排放约4亿吨,在助力实现碳达峰碳中和目标方...
10:45
2025年9月,零跑汽车以月交付量6.1万辆的亮眼成绩,成功突破历史峰值,标志着这家中国新势力车企迈上了新的发展阶段。这一里程碑的背后,是位于浙江杭州的现代化生产基地持续提升的产能支撑,为满足日益增长的市场需求提供了坚实保障。与此同时,其他造车新势力也展现出强劲的发展势头,理想汽车当月交付量达到5万辆,蔚来汽车和 小鹏汽车 分别交付4万辆和3.8万辆,共同推...
10:12
随着国庆中秋双节假期的第二天,全国铁路客流热度持续攀升,中短途出行高峰正式拉开帷幕。国铁集团最新数据显示,今日预计发送旅客1930万人次,延续了昨日突破2313.2万人次的单日发送量历史新高,展现出假日出行市场的强劲活力。 京津冀地区作为出行热点,今日预计发送旅客160万人次,铁路部门增开列车108.5对,全力保障区域客流需求。长三角地区客流表现同样亮眼...
10:12
微软内部近期曝出关于Copilot产品线混乱的担忧,据《商业内幕》深度报道,公司员工反映消费者版与Microsoft 365集成版等不同Copilot产品在界面设计上高度相似,导致用户难以有效区分,尤其在使用Word、Excel和PowerPoint等集成应用时,混淆现象更为突出。这一潜在问题已引起管理层高度关注,并在近期全员大会上成为焦点议题。 CEO萨提...
10:12
特斯拉正式官宣,新款Model Y高性能版将搭载革命性的车对家(V2H)与车对外放电(V2L)功能,使其成为继Cybertruck之后,特斯拉家族中第二款具备该核心技术的车型。这一创新功能将极大提升用户的用电灵活性与应急保障能力,为家庭用电和户外活动带来全新体验。 通过配备特斯拉充电口转接器或兼容的第三方设备,新款Model Y高性能版能够为各类家用电器、露...
09:40
微软正式宣布Xbox Game Pass订阅计划迎来重大调整,标志其旗舰云游戏服务Xbox Cloud Gaming结束长达五年的Beta测试阶段。即日起,所有订阅用户均可畅享无限次云游戏体验,彻底打破传统游戏平台的限制。其中,Premium会员将享有更优化的等待时间,而Ultimate会员用户更可解锁专属特权,在特定设备上体验高达1440p的超高清画质与极...
09:40
成都莱普科技股份有限公司于9月29日正式启动科创板IPO程序,保荐机构为中信建投证券。作为先进精密激光技术与半导体工艺创新领域的领军企业,公司专注于高端半导体专用设备的研发、生产与销售,其核心产品包括激光热处理设备与专用激光加工设备,这些设备已广泛应用于12英寸集成电路及先进封装产线,为半导体产业的升级提供了关键支撑。 报告期内,公司展现出强劲的增长势头,营...
09:40
近日,一则关于私人显卡收藏的新闻在硬件圈引发巨大震动。这位低调的收藏家历时多年,精心构建了一座跨越近三十年的"硅基档案库",囊括了从1995年英伟达NV1多媒体加速器到最新RTX 5090的完整产品线,同时又将AMD阵营从Radeon DDR系列到RX 9070 XT的历代旗舰悉数纳入其中。这一壮观的收藏不仅展示了硬件技术的演进历程,更成为业界罕见的珍品展示...