近日,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室携手 OpenBMB 及 AI9Stars 联合推出了革命性的 UltraRAG2.0 框架,这是全球首个基于 Model Context Protocol(MCP)架构设计的检索增强生成(RAG)框架。该框架的核心目标在于大幅简化 RAG 系统的构建流程,使科研人员能够在短时间内高效实现复杂的多阶段推理系统。
UltraRAG2.0 的创新之处在于其独特的声明式编程方式。用户只需通过编写 YAML 文件,即可轻松声明复杂的逻辑流程,包括串行处理、循环迭代以及条件分支等,从而显著减少代码量,有效降低实现的门槛。这一设计理念使得原本需要大量代码的手动编码工作变得简单快捷。
在当前的 RAG 发展趋势中,许多系统逐渐融入了自适应知识组织、多轮推理及动态检索等复杂特性,其中 DeepResearch 和 Search-o1 就是典型代表。然而,这些复杂特性的实现给开发者带来了高昂的工程成本,制约了新想法的快速迭代与复现。UltraRAG2.0 的推出正是为了解决这一痛点,它通过将 RAG 的核心组件封装为独立的 MCP 服务器,实现了功能的灵活调用和扩展。
具体而言,与以往的实现方式相比,UltraRAG2.0 在代码量上实现了大幅减少。以经典方法 IRCoT 为例,其官方实现需要近900行代码,而使用 UltraRAG2.0 只需约50行代码就能完成同等功能。其中一半的代码是用于流程编排的 YAML 伪代码,这一设计极大降低了开发门槛,使得复杂的推理逻辑不再需要冗长的手动编码。
UltraRAG2.0 还支持动态检索、条件判断及多轮交互等高级功能,科研人员可以在短时间内搭建出高性能的实验平台,满足复杂多跳问题的需求。其性能较传统的 Vanilla RAG 提升约12%,这一性能优势得益于其高效的系统设计和优化的算法实现。
该系统的设计理念旨在让研究者在工程实现方面节省时间和精力,将更多的注意力放在算法创新和实验设计上。此外,UltraRAG2.0 的 MCP 架构允许不同模块间的无缝复用,并支持模块的灵活扩展和接入,方便科研人员快速适配新的模型和算法。这一设计极大提升了系统开发的效率和可复现性。
UltraRAG2.0 的推出为 RAG 系统的开发带来了新的可能性,其简洁高效的声明式编程方式和强大的功能支持,将极大地促进科研人员在新算法和新模型上的创新。对于需要构建复杂推理系统的科研人员来说,UltraRAG2.0 无疑是一个值得尝试的优秀选择。
GitHub:https://github.com/OpenBMB/UltraRAG项目主页:https://openbmb.github.io/UltraRAG划重点:🌟 UltraRAG2.0由清华与东北大学联合推出,旨在简化复杂的 RAG 系统构建过程。 🛠️ 用户通过编写 YAML 文件即可实现复杂推理逻辑,大幅降低代码量与开发门槛。 📈 相较于传统方法,UltraRAG2.0在性能上提升约12%,适用于多轮推理和动态检索等高级功能。