Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破

Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破插图1

Salesforce与南加州大学的研究团队联合研发了一项名为CoAct-1的革命性技术,该技术通过巧妙融合编码指令与图形用户界面(GUI)操作的独特优势,显著增强了AI代理在复杂计算机任务中的执行能力。这一创新混合方法旨在突破传统GUI代理的局限性,为构建更强大、更具扩展性的自动化系统开辟新路径。传统AI代理的困境:效率与稳定性的双重挑战当前计算机AI代理普遍依赖视觉语言模型(VLM)来解析屏幕内容并模拟鼠标键盘操作。尽管这类”点击式”代理能够胜任多种任务,但在处理办公生产力套件等具有密集菜单和复杂工作流程的应用时,其表现往往不尽如人意。研究团队发现,在这些场景中,微小的误点击或对UI元素的误解都可能导致整个任务功亏一篑。为了弥补这一缺陷,研究人员曾尝试引入高级规划器来优化GUI代理,但该方法仍无法解决那些通过几行代码就能更直接、更可靠完成的操作。CoAct-1:多智能体协作的混合解决方案为克服上述局限,CoAct-1系统应运而生。其核心设计理念在于”将GUI操作的直观性优势与通过代码进行系统交互的精确性、可靠性和效率有机结合”。该系统由三个功能各异的代理组成的专业团队协作完成复杂任务:编排器(Orchestrator):作为中央指挥中心,负责将用户的总体目标分解为可执行的子任务,并智能分配给最合适的代理成员。程序员(Programmer):精通Python或Bash脚本编写,专注于处理文件管理、数据处理等需要精确系统交互的后端操作。GUI操作员(GUI Operator):基于VLM技术,专门负责需要点击按钮、填写表单等前端界面交互任务。这种动态协作机制使CoAct-1能够智能地选择最合适的执行方式——当GUI操作效率低下时,系统会无缝切换到代码执行模式,同时保留必要的视觉交互能力。整个工作流程采用迭代式设计,每个代理完成子任务后都会向编排器汇报进展,由其决定后续行动方案。性能突破:速度与效率的双重飞跃研究人员在OSWorld基准测试中全面评估了CoAct-1的性能,该基准涵盖了369个跨浏览器、IDE和办公应用程序的实际任务场景。测试结果显示,CoAct-1以60.76%的成功率创下了新的行业最高纪录。特别是在操作系统级任务和多应用程序工作流整合场景中,其性能提升尤为突出。更令人瞩目的是,该系统平均只需10.15步即可完成任务,而其他领先纯GUI代理通常需要15.22步。研究团队强调,更少的操作步骤不仅显著提高了任务完成速度,更大幅降低了出错概率,从而实现了更高效、更可靠的自动化体验。从实验室走向企业:广阔的应用前景与实施挑战这项技术蕴含着巨大的企业应用价值。Salesforce应用AI研究总监Ran Xu指出,客户支持、销售勘探、自动化簿记和营销活动管理等领域都是CoAct-1的理想应用场景。在这些场景中,企业通常需要同时处理有API接口和无API接口的多种工具,而CoAct-1能够灵活整合代码与屏幕交互能力,提供全方位的自动化解决方案。然而,将CoAct-1从实验室环境推向企业实际应用仍面临诸多挑战,包括如何兼容遗留软件系统、确保操作安全性以及建立必要的人工监督机制。徐博士强调,需要通过在沙盒环境中进行充分训练来提升代理的适应能力,并构建完善的访问控制体系和安全防护措施,防止潜在的安全风险。从长远来看,在可预见的未来,”人在环”的协作模式将是确保AI代理安全可靠运行的关键保障。

Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破插图2

Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破插图3

最新快讯

2026年01月14日

08:43
近日,江苏发生的一起家庭事件引发广泛关注并登上热搜。一位妻子因全心照顾孩子请假频繁,导致年终奖被扣除。然而,家人的暖心举动却让这份失落化为满满的感动,同时也引发了社会对于家庭责任分工与职场权益的深度讨论。据悉,这位妻子在育儿过程中投入了大量精力,频繁请假虽属无奈,却还是影响了年终奖的发放。得知此事后,丈夫毫不犹豫地转账8000元...
08:43
近日,贵州施秉的一场婚礼上,一段展示新娘满屋嫁妆的视频在网络上引发广泛关注。画面中,一张床上整齐陈列着数十套精致的衣服和首饰,令人目不暇接。据刘先生介绍,这些嫁妆是新娘母亲自女儿年幼时起,便开始一针一线亲手缝制,历经20年时光积累而成。每一件衣物、每一件首饰,都凝聚着新娘母亲的心血与爱意,同时也得到了新娘父亲的大力支持。这份沉甸...
08:43
近日,一位 23 岁女孩夏夏的抗癌故事在网络上引发广泛关注。据媒体报道, 2021 年 6 月,夏夏被确诊患有骨肉瘤,这是一种成骨间叶细胞产生的原发恶性骨或软组织肿瘤,也是最常见的骨恶性肿瘤之一,约占所有恶性骨肿瘤的34%,好发于 10 至 30 岁的年轻人,且男性患者多于女性。面对突如其来的重病,夏夏展现出了惊人的勇气和乐观。...
08:43
马年贺岁纪念币与纪念钞正式开放预约,这一消息迅速点燃了民众的热情,相关话题瞬间冲上微博热搜前五,其中“马年纪念币预约”与“马年纪念币抢不到”更是强势霸榜前二,足见其受欢迎程度。据悉,此次发行的 2026 年贺岁币发行量达 1 亿枚,每枚面额为 10 元; 2026 年贺岁钞发行量同样为 1 亿张,每张面额 20 元。在预约兑换规...
08:12
2026年1月13日,苹果加拿大发布创意广告SLIDE,宣传iPhone 17系列搭载的第二代超瓷晶面板。广告模拟法律谈判场景,律师将iPhone 17 Pro Max屏幕朝下在桌面反复滑行并撞击,展示其耐用性。最终标语“放轻松,这可是iPhone 17”强调产品可靠性。苹果称,新屏幕抗划痕能力达前代iPhone 16的三倍,得益于Ceramic Shie...
08:12
2026年,宝马M部门将推出首款全面电动化的高性能车型,或将命名为iM3。新车基于新世代技术打造,采用四电机独立驱动、专属电池系统及“Heart of Joy”控制核心,动力响应显著提升。车辆配备模拟换挡模式,增强驾驶参与感,并应用Bcomp天然纤维材料,降低碳排放约40%。此举标志着宝马M正式进军纯电高性能领域。
08:12
2026年1月13日,苹果宣布调整软件生态策略,旗下Pages、Numbers、Keynote和Freeform四款应用将结束完全免费时代,转为“免费增值”模式。用户可继续免费使用基础功能,包括文档创建、编辑与协作;但高级功能如AI智能工具、高级模板及“内容中心”的高品质素材库需订阅“Apple Creator Studio”解锁。此举旨在提升专业用户创作...
08:12
2026年1月29日,备受瞩目的全新奔驰S级将揭开神秘面纱,而豪华旗舰迈巴赫版S级也将在随后登场。本次改款阵容堪称一次全面的革新,工程师们对约2700项部件进行了精心升级,从外观设计到内饰配置,从智能科技到动力系统,无不彰显着梅赛德斯-奔驰对卓越品质的不懈追求。 此次改款最引人注目的莫过于动力系统的全面升级。全新S450和S500车型将搭载先进的M256 E...
08:12
2026年1月13日,苹果在发布新应用的同时透露,iOS版Pixelmator将不再获得更新。该应用原为2014年推出的Mac版Pixelmator Classic配套工具,现被标记为“经典版”,虽仍可使用基础修图功能,但已停止维护。与此同时,同团队开发的Photomator应用则将继续独立销售并获得后续更新支持。此举标志着苹果对图像编辑产品线的一次调整,...
08:12
2026年1月14日,美国科罗拉多斯普林斯市警方正式宣布启用一项创新执法技术——自动车辆识别系统(AVIS),该系统不仅具备移动测速功能,更将大幅提升交通管理效率。据悉,首批配备该系统的警车已选用两辆Jeep大切诺基,将在城市多个重点区域进行流动执法。这些高精尖设备将重点监控学校周边、公园入口、施工现场以及居民生活区等关键路段,确保交通安全与秩序。 根据警方...
08:12
2026年1月12日,德国与英国顶尖科学家团队正式宣布达成一项突破性合作,计划利用欧洲首台E级超级计算机“木星”进行史上规模最大的人脑模拟实验。这一雄心勃勃的项目旨在通过超大规模计算模拟,彻底揭示人脑复杂的运作机制,为神经科学领域带来革命性突破。据项目组介绍,高精度模拟将涵盖人脑从神经元到神经网络的多尺度交互过程,有望填补当前认知科学研究的诸多空白。 该项目...
08:12
2026年1月14日,我国自主研发的首台海底地层空间钻探与监测机器人在南海成功完成试验作业,这一重大突破标志着我国深海勘探技术迈入新纪元。该设备由广州海洋地质调查局精心研制,具备深海立体钻探与原位实时监测的核心功能,为我国深海资源开发提供了强有力的技术支撑。 此次试验作业在南海复杂海底环境中展开,充分验证了机器人的自主作业能力与稳定性。作为我国深海科学钻...