香港大学XLANG实验室联合月之暗面、斯坦福大学等顶尖机构,共同宣布开源一款革命性框架——OpenCUA,旨在推动计算机使用智能体(CUA)技术的普及化发展。这一创新项目致力于降低开发门槛,让每个人都能轻松构建和扩展个性化的电脑助手,开启智能办公新纪元。OpenCUA框架的问世,不仅标志着CUA技术迈入全新阶段,更以其卓越的功能设计,为开发者提供了前所未有的便利。
OpenCUA的核心优势在于其无缝的注释基础设施,能够精准捕捉用户在电脑操作过程中的每一个演示动作。该框架特别集成了AgentNet大规模计算机使用任务数据集,涵盖超过200款应用程序和网站,以及三大主流操作系统,为开发者提供海量真实场景数据支持。这些丰富资源极大地降低了开发难度,让技术爱好者也能参与智能助手创作。
更值得关注的是,OpenCUA内置的可扩展工作流程,能够将用户演示高效转换为”状态-动作”对,这一创新设计显著提升了长链推理能力。开发者可根据实际需求灵活调整参数,打造高度个性化的智能助手,帮助用户在办公、学习等场景中实现效率倍增。项目负责人余涛教授强调,OpenCUA通过开放完整的数据集、开发工具和模型,真正实现了”人人皆可打造专属电脑智能体”的愿景。
在性能表现上,OpenCUA在多个关键基准测试中表现惊艳,甚至超越当前最先进的GPT-4o模型,成为开源CUA解决方案中的佼佼者。这一突破性成果不仅彰显了技术的创新力,更为智能助手的应用拓展了无限可能。随着框架的正式发布,计算机智能体的应用场景将更加广泛,用户体验也将得到质的飞跃。
该项目得到了多所知名高校及科技企业的鼎力支持,充分展现了智能体研究领域跨机构合作的巨大价值。OpenCUA的开源举措为未来智能助手开发注入了强大动力,必将推动相关技术持续创新。我们有理由相信,在不久的将来,科技将持续赋能人类工作与生活,创造更多可能。项目地址:https://opencua.xlang.ai/ 论文地址:https://arxiv.org/pdf/2508.09123