Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破

Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破插图1

Salesforce与南加州大学的研究团队联合研发了一项名为CoAct-1的革命性技术,该技术通过巧妙融合编码指令与图形用户界面(GUI)操作的独特优势,显著增强了AI代理在复杂计算机任务中的执行能力。这一创新混合方法旨在突破传统GUI代理的局限性,为构建更强大、更具扩展性的自动化系统开辟新路径。传统AI代理的困境:效率与稳定性的双重挑战当前计算机AI代理普遍依赖视觉语言模型(VLM)来解析屏幕内容并模拟鼠标键盘操作。尽管这类”点击式”代理能够胜任多种任务,但在处理办公生产力套件等具有密集菜单和复杂工作流程的应用时,其表现往往不尽如人意。研究团队发现,在这些场景中,微小的误点击或对UI元素的误解都可能导致整个任务功亏一篑。为了弥补这一缺陷,研究人员曾尝试引入高级规划器来优化GUI代理,但该方法仍无法解决那些通过几行代码就能更直接、更可靠完成的操作。CoAct-1:多智能体协作的混合解决方案为克服上述局限,CoAct-1系统应运而生。其核心设计理念在于”将GUI操作的直观性优势与通过代码进行系统交互的精确性、可靠性和效率有机结合”。该系统由三个功能各异的代理组成的专业团队协作完成复杂任务:编排器(Orchestrator):作为中央指挥中心,负责将用户的总体目标分解为可执行的子任务,并智能分配给最合适的代理成员。程序员(Programmer):精通Python或Bash脚本编写,专注于处理文件管理、数据处理等需要精确系统交互的后端操作。GUI操作员(GUI Operator):基于VLM技术,专门负责需要点击按钮、填写表单等前端界面交互任务。这种动态协作机制使CoAct-1能够智能地选择最合适的执行方式——当GUI操作效率低下时,系统会无缝切换到代码执行模式,同时保留必要的视觉交互能力。整个工作流程采用迭代式设计,每个代理完成子任务后都会向编排器汇报进展,由其决定后续行动方案。性能突破:速度与效率的双重飞跃研究人员在OSWorld基准测试中全面评估了CoAct-1的性能,该基准涵盖了369个跨浏览器、IDE和办公应用程序的实际任务场景。测试结果显示,CoAct-1以60.76%的成功率创下了新的行业最高纪录。特别是在操作系统级任务和多应用程序工作流整合场景中,其性能提升尤为突出。更令人瞩目的是,该系统平均只需10.15步即可完成任务,而其他领先纯GUI代理通常需要15.22步。研究团队强调,更少的操作步骤不仅显著提高了任务完成速度,更大幅降低了出错概率,从而实现了更高效、更可靠的自动化体验。从实验室走向企业:广阔的应用前景与实施挑战这项技术蕴含着巨大的企业应用价值。Salesforce应用AI研究总监Ran Xu指出,客户支持、销售勘探、自动化簿记和营销活动管理等领域都是CoAct-1的理想应用场景。在这些场景中,企业通常需要同时处理有API接口和无API接口的多种工具,而CoAct-1能够灵活整合代码与屏幕交互能力,提供全方位的自动化解决方案。然而,将CoAct-1从实验室环境推向企业实际应用仍面临诸多挑战,包括如何兼容遗留软件系统、确保操作安全性以及建立必要的人工监督机制。徐博士强调,需要通过在沙盒环境中进行充分训练来提升代理的适应能力,并构建完善的访问控制体系和安全防护措施,防止潜在的安全风险。从长远来看,在可预见的未来,”人在环”的协作模式将是确保AI代理安全可靠运行的关键保障。

Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破插图2

Salesforce南加大联手CoAct-1代码GUI混合AI代理自动化再突破插图3

最新快讯

2025年11月28日

14:45
微新创想11月28日重磅消息,一加手机中国区总裁正式宣布,全新一加Ace 6T将全球首次搭载8300mAh冰川电池与100W超级闪充技术,这一创新成果使其成为当前手机市场中唯一同时拥有超大电池容量与百瓦级快充能力的旗舰机型。长期以来,大电池与快充在手机设计中始终存在难以兼顾的矛盾。追求大电池意味着牺牲快充速度,而选择快充方案又往往导致电池容量被压缩。这种两难...
14:45
微新创想11月28日讯 从山东菏泽单县朱楼村出发,57岁的“大衣哥”朱之文正迎来他人生的新篇章。这位因2011年《星光大道》而走红的农民歌手,至今仍坚守着与土地的深情连接,用歌声传递着质朴的力量。 作为家喻户晓的明星,朱之文始终保持着农民本色。他常穿的那件军绿色大衣,早已成为他鲜明的个人标识。成名后,他选择扎根故土,但随之而来的争议也从未间断。围绕他的“炒作...
14:45
AR眼镜用户刚询问"对面是什么楼",后端MLLM-SC框架便在10毫秒内生成一张语义注意力热图。建筑轮廓被标注为深红色并赋予最高优先级,而其他背景信息则被降低编码率。这种创新的多模态数据处理方式彻底改变了传统信息处理的模式,不再对所有数据"平均用力",而是通过语义引擎精准识别并优先处理与任务相关的像素、语音和坐标数据,让这些关键信息走"快车道",同时自动降档...
14:45
ICLR 2026 学术会议正面临一场前所未有的挑战——AI技术大规模渗透其审稿系统,引发学术界的广泛关注和担忧。根据第三方机构最新检测报告显示,在ICLR 2026收到的7.6万份评审意见中,高达21%的评审完全由大型语言模型一键生成,另有35%的评审意见被AI不同程度地润色修改,真正由人类专家独立撰写的比例已锐减至43%。这一数据揭示了AI技术在学术评审...
14:45
11月27日,备受瞩目的AI社交平台Soul App正式向香港交易所递交招股书,正式宣告进军资本市场,中信证券作为独家保荐人全程保驾护航。Soul App以其独特的基于兴趣与个性的沉浸式社交模式,迅速在年轻用户群体中掀起热潮。截至2025年8月31日,平台累计注册用户已突破3.9亿大关,日均活跃用户达到惊人的1100万,其中高达78.7%的用户属于Z世代这一...
14:45
2025年11月17日夜晚,意大利阿尔卑斯山脉上演了一场罕见的自然奇观——罕见的“ELVE”红色光环现象在雷暴云层之上绚烂绽放。摄影师Valter Binotto凭借其精湛的技艺,利用索尼A7S相机搭配20mm f/1.8超广角镜头,在距离雷暴中心约300公里的山巅成功定格了这一转瞬即逝的发光事件。这一现象由强烈负极闪电产生的电磁脉冲猛烈撞击电离层引发,形成...
14:45
近日,中信证券最新研报发布,明确指出2025年将成为具身智能商业化进程中的关键转折点。报告特别强调,随着多家头部企业成功斩获亿元级大单,具身智能技术正加速从实验室走向实际应用场景。值得注意的是,尽管当前下游制造企业对于大规模订单仍持谨慎态度,整个产业在发展过程中确实面临阶段性瓶颈。然而,在OEM厂商、核心供应链企业以及科技巨头的紧密协同下,机器替代人工的效率...
14:45
2025年11月28日,长安汽车在最新一轮路演活动中重磅发布了其智能汽车机器人技术发展战略,正式官宣将围绕“1+N+X”全新战略框架,全面加速在智能汽车机器人领域的布局。据悉,长安汽车将携手行业领军企业共同研发具有突破性的人形机器人,重点攻克“大脑”智能决策系统、“能源”高效续航技术以及“驱动”精准控制三大核心技术瓶颈,旨在打造具备高度自主性和交互能力的下一...
14:45
2025年11月27日,银轮股份正式宣布完成董事会对外投资议案的审议,并成功获得批准。根据公告内容,公司计划投入约1.33亿元人民币自有资金,通过股权收购与增资扩股相结合的方式,强势控股深圳市深蓝电子股份有限公司,并取得其超过55%的股权。此举标志着银轮股份在数字能源系统领域迈出战略布局的关键一步。 此次投资的核心目标在于整合深蓝电子在控制器、驱动器集成电路...
14:45
天风证券最新研报揭示了中国医美市场的蓬勃发展趋势,指出轻医美项目正成为消费新宠。尽管目前整体渗透率仍落后于成熟市场,但注射类、光电器械、减脂塑形及医美服务等细分领域展现出巨大的增长潜力。在强监管政策持续加码的背景下,行业正经历一场深刻的洗牌,优质企业加速脱颖而出,推动市场迈向健康化、规范化轨道。研报特别强调,规范化管理将成为医美产业实现长期可持续发展的关键驱...
14:45
中信建投最新研报深度剖析了机器人技术领域的最新动态,指出随着技术路线的持续迭代升级,产业链正迎来前所未有的发展机遇。值得注意的是,当前市场参与者日益多元化,投资者更加关注产品性能的突破和客户送样等实质性进展,这些关键指标成为衡量企业竞争力的核心标准。在此背景下,Optimus机器人的正式定型有望引领硬件技术路线走向边际收敛,形成更为清晰的发展方向,而深度配套...
14:45
2025年11月21日,欧洲航天局(ESA)与日本宇宙航空研究开发机构(JAXA)共同宣布了一项重大航天成就——备受瞩目的BepiColombo水星探测器已成功进入抵达水星前的最后一年航程。这一里程碑式的任务自2018年10月发射以来,已经跨越了整整七年的漫长旅程,期间经历了六次精准的水星飞掠,不断调整并优化自身轨道。根据计划,BepiColombo预计将在...