Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破

Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破插图1

Salesforce与南加州大学的研究团队联合研发了一项名为CoAct-1的革命性技术,该技术通过巧妙融合编码指令与图形用户界面(GUI)操作的独特优势,显著增强了AI代理在复杂计算机任务中的执行能力。这一创新混合方法旨在突破传统GUI代理的局限性,为构建更强大、更具扩展性的自动化系统开辟新路径。传统AI代理的困境:效率与稳定性的双重挑战当前计算机AI代理普遍依赖视觉语言模型(VLM)来解析屏幕内容并模拟鼠标键盘操作。尽管这类”点击式”代理能够胜任多种任务,但在处理办公生产力套件等具有密集菜单和复杂工作流程的应用时,其表现往往不尽如人意。研究团队发现,在这些场景中,微小的误点击或对UI元素的误解都可能导致整个任务功亏一篑。为了弥补这一缺陷,研究人员曾尝试引入高级规划器来优化GUI代理,但该方法仍无法解决那些通过几行代码就能更直接、更可靠完成的操作。CoAct-1:多智能体协作的混合解决方案为克服上述局限,CoAct-1系统应运而生。其核心设计理念在于”将GUI操作的直观性优势与通过代码进行系统交互的精确性、可靠性和效率有机结合”。该系统由三个功能各异的代理组成的专业团队协作完成复杂任务:编排器(Orchestrator):作为中央指挥中心,负责将用户的总体目标分解为可执行的子任务,并智能分配给最合适的代理成员。程序员(Programmer):精通Python或Bash脚本编写,专注于处理文件管理、数据处理等需要精确系统交互的后端操作。GUI操作员(GUI Operator):基于VLM技术,专门负责需要点击按钮、填写表单等前端界面交互任务。这种动态协作机制使CoAct-1能够智能地选择最合适的执行方式——当GUI操作效率低下时,系统会无缝切换到代码执行模式,同时保留必要的视觉交互能力。整个工作流程采用迭代式设计,每个代理完成子任务后都会向编排器汇报进展,由其决定后续行动方案。性能突破:速度与效率的双重飞跃研究人员在OSWorld基准测试中全面评估了CoAct-1的性能,该基准涵盖了369个跨浏览器、IDE和办公应用程序的实际任务场景。测试结果显示,CoAct-1以60.76%的成功率创下了新的行业最高纪录。特别是在操作系统级任务和多应用程序工作流整合场景中,其性能提升尤为突出。更令人瞩目的是,该系统平均只需10.15步即可完成任务,而其他领先纯GUI代理通常需要15.22步。研究团队强调,更少的操作步骤不仅显著提高了任务完成速度,更大幅降低了出错概率,从而实现了更高效、更可靠的自动化体验。从实验室走向企业:广阔的应用前景与实施挑战这项技术蕴含着巨大的企业应用价值。Salesforce应用AI研究总监Ran Xu指出,客户支持、销售勘探、自动化簿记和营销活动管理等领域都是CoAct-1的理想应用场景。在这些场景中,企业通常需要同时处理有API接口和无API接口的多种工具,而CoAct-1能够灵活整合代码与屏幕交互能力,提供全方位的自动化解决方案。然而,将CoAct-1从实验室环境推向企业实际应用仍面临诸多挑战,包括如何兼容遗留软件系统、确保操作安全性以及建立必要的人工监督机制。徐博士强调,需要通过在沙盒环境中进行充分训练来提升代理的适应能力,并构建完善的访问控制体系和安全防护措施,防止潜在的安全风险。从长远来看,在可预见的未来,”人在环”的协作模式将是确保AI代理安全可靠运行的关键保障。

Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破插图2

Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破插图3

最新快讯

2025年11月28日

13:39
微新创想11月28日专稿 杭州市中医院耳鼻喉科近日接诊了一位年轻患者小羽(化名),其经历揭示了冬季常见鼻部不适背后可能隐藏的严重健康风险。这位年仅20岁的年轻人长期被鼻痒困扰,近期因症状加剧而频繁用手指抠挖鼻腔,结果导致鼻腔黏膜破损出血并伴有明显肿胀。更令人担忧的是,次日清晨小羽面部肿胀情况急剧恶化,甚至出现眼睑闭合困难、剧烈疼痛等症状,紧急就医后被确诊为面...
13:39
2025年11月26日,香港大埔区宏福苑突发五级烈火,火势迅速蔓延,造成严重财产损失和人员伤亡。面对这场突如其来的灾难,商汤科技第一时间伸出援手,宣布向受灾地区捐赠300万港元善款。这笔资金将专项用于受灾群众的紧急安置、生活物资补给、医疗救助以及灾后重建等关键工作。公司方面在声明中沉痛哀悼遇难者,并向受伤人员及其家属致以深切慰问,同时高度致敬奋战在一线的救援...
13:39
2025年11月28日,备受瞩目的北京燕莎中心凯宾美食廊在万众期待中完成华丽转身,正式入驻位于一层亮马河畔花园的全新址并盛大启幕。这家拥有33年辉煌历史的老牌美食店此次焕新升级,营业面积实现了惊人的两倍增长,新增的109平方米室内用餐区与110平方米户外花园区域,为食客们带来了更加宽敞舒适的用餐环境。 新店精心设计了充满现代感的咖啡师岛台,让顾客可以近距...
13:39
2025年11月28日,中国生态环境部与中国人民银行联合宣布正式启动绿色发展投融资合作伙伴关系指导委员会的筹建工作。这一重要举措标志着我国在绿色金融领域的国际合作迈入新阶段,将有力推动绿色金融创新与可持续发展。该委员会的核心目标聚焦于三大关键领域:一是促进绿色投融资工具的多元化创新,二是积极探索海外碳资产的开发与交易机制,三是大力推进气候韧性基础设施的建设与...
13:38
2025年11月27日,韩国科技界迎来重大合作里程碑。在首尔,韩国科学技术信息通信部第二次官柳济明携手三星电子、现代汽车、SK电讯及Naver四大龙头企业代表,正式宣告成立GPU专项工作组。此举旨在统筹规划并高效推进大规模英伟达GPU的采购计划及其在关键领域的深度应用。 根据公布的合作方案,韩国政府与四大企业将组成史无前例的采购联盟,计划分阶段累计采购26万...
13:08
2025年11月28日,北京时间,行业消息人士遠坂小町在X平台发布惊人爆料,称AMD即将推出两款备受瞩目的新显卡——Radeon AI PRO R9700S与R9600D。尽管AMD官方尚未在官网公布任何产品信息,但细心的用户发现,这两款显卡的支持页面已经悄然上线。更有趣的是,当用户输入错误的型号名称时,系统会显示404页面不存在错误提示,这一细节有力地证实...
13:08
2025年11月27日,谷歌Pixel Watch用户群体中出现了一项令人担忧的普遍问题——步行模式下的距离记录严重失准。多位用户在社交媒体和科技论坛上纷纷发声,指出手表在记录步行数据时存在系统性偏差。Reddit平台上,一位名为almosttan的用户进行了严谨的测试,其结果显示步行模式下记录的距离仅为实际距离的四分之一左右,而切换至骑行或跑步模式后,数据...
12:38
2025年11月28日,国家能源局综合司正式发布通知,宣布全面启动“人工智能+”能源试点工作,标志着我国能源行业智能化转型进入全新阶段。此次试点聚焦于能源领域的八大核心应用场景和37项重点任务,旨在通过系统性布局推动能源产业与人工智能技术的深度融合。通知明确面向全国能源企业公开征集具有高价值的应用场景需求,并创新性地采用“揭榜挂帅”机制,鼓励人工智能技术供给...
12:38
2025年上海国际体育博览会盛大启幕,瑞士高端跑步品牌On昂跑以"空前之轻,未来之履"为核心主题,精心打造了引人注目的品牌展台。这一创新设计不仅完美融合了前沿空间美学与互动体验,更向全球观众全方位展示了On昂跑在跑步科技与时尚设计领域的最新突破与成果。展会期间,品牌特别宣布重新发售备受瞩目的高性能竞速跑鞋Cloudboom Strike LS,现场跑者不仅有...
12:38
2025年11月28日,中国科学院电工研究所传来振奋人心的消息,他们成功研制出一种具有突破性意义的大口径高场通用超导磁体。该磁体中心磁场强度达到了惊人的16.5特斯拉,内孔直径更是达到了150毫米,这一成就不仅刷新了国内同类磁体的最高磁场纪录,更标志着我国在超导技术领域迈出了坚实的一步。 为了实现这一突破,科研团队采用了多项创新技术。他们巧妙地运用了分层分级...
12:38
2026年初,备受期待的M&M'S®全新门店即将在上海迪士尼度假区迪士尼小镇盛大启幕。这家融合购物、餐饮与娱乐演出的复合型门店坐落于迪士尼小镇入口处,将成为游客体验迪士尼奇妙旅程的全新亮点。此次开业计划由玛氏中国正式宣布,不仅标志着品牌在中国市场的进一步扩张,更体现了其致力于为游客打造沉浸式互动体验的创新精神。通过将品牌元素与迪士尼经典场景深度融合,...
12:38
2025年11月28日,科技界传来振奋消息,谷歌推出的“凭据恢复API”已取得突破性进展,显著提升了安卓设备的换机体验。长期以来,安卓用户在更换手机后不得不逐一重新登录各种应用,而iOS用户却能享受无缝迁移登录状态的红利。为解决这一痛点,谷歌于2024年正式推出这项创新API,通过安全迁移旧设备的登录token至新设备,实现一键自动登录。目前,打车平台Ube...