随着大语言模型(LLM)和视觉-语言模型(VLM)的迅猛发展,智能体在知识发现与问题解决领域的变革正以前所未有的速度推进。然而当前众多开源智能体框架普遍存在过度依赖昂贵付费工具的问题,这极大制约了其可复现性和广泛应用前景。为突破这一瓶颈,腾讯 AI Lab 隆重推出全新开源智能体框架——Cognitive Kernel-Pro,该框架致力于最大限度降低外部依赖,为全球研究人员和开发者构建智能体系统提供更便捷的解决方案。
Cognitive Kernel-Pro 采用创新的多模块、层次化架构设计,整体系统由一个核心主智能体与多个专业子智能体协同工作。主智能体负责全局任务分解与信息整合,而各子智能体则根据预设分工执行特定功能,如网页浏览、文件处理等。这种模块化设计不仅确保了各组件的高度独立性,也为系统扩展提供了强大灵活性。
为提升复杂任务处理效率,Cognitive Kernel-Pro 引入”进度状态”管理机制,智能体能够实时追踪已完成步骤并规划待办任务,显著优化了执行路径。框架通过简洁高效的文本接口实现主智能体与子智能体间的通信协作,既简化了调试流程,又保障了系统运行稳定性。特别值得一提的是,通过引入反思机制与投票系统,框架进一步提升了任务完成质量,尤其针对网页浏览等高随机性任务效果显著。
在性能表现方面,Cognitive Kernel-Pro 在权威 GAIA 基准测试中表现卓越,不仅大幅超越其他开源框架 SmolAgents,其性能指标更接近依赖商业工具的智能体。这一突破性成果主要归功于其创新的训练方法体系,涵盖网页导航、文件处理、多模态推理等多个关键领域。
除了领先的框架设计,腾讯 AI Lab 还配套推出 Agent Foundation Model 训练配方,为社区研究提供完整技术支持。目前所有代码与技术文档均已开源至 GitHub 平台,项目地址:https://github.com/Tencent/CognitiveKernel-Pro,诚邀全球开发者参与探索与共创。这一开放举措将有力推动智能体技术从实验室走向实际应用,加速构建更智能、更普惠的下一代人机协作系统。