微软UI-Evol组件提升AI智能体操作稳定性与成功率

2025-11-18 10:22:39 快讯 3 次阅读

微软亚洲研究院近期发布了一项创新组件——UI-Evol，专门针对计算机使用AI智能体在图形用户界面操作中存在的”知识-行动鸿沟”难题。这一技术瓶颈导致当前智能体虽然能够获取高准确率的指令，但实际任务成功率却不足50%，且行为表现极不稳定。UI-Evol通过引入独特的”回溯”与”审校”双阶段机制，实现了对智能体实际操作轨迹的精准记录与持续优化，从而动态对齐外部知识库与真实界面环境之间的差异。

在功能设计上，UI-Evol首先通过”回溯”阶段完整捕捉智能体的每一步操作，包括点击、拖拽等交互行为；随后”审校”阶段会对这些操作进行智能分析，识别出与预期目标不符的环节，并自动调整后续行为策略。这种闭环优化机制能够显著减少智能体在复杂界面环境中的试错成本，使其逐渐适应用户习惯与系统特性。

经过严格测试，集成UI-Evol组件的AI智能体在OSWorld基准测试中表现突出。以GPT-4o等前沿模型为基础的实验结果显示，任务成功率提升了近40%，行为标准差大幅降低，整体执行过程展现出更高的可靠性与稳定性。这些数据有力证明了该组件在解决AI智能体界面交互难题方面的有效性。

该研究成果已获得国际学术界的广泛关注，成功入选ICML 2025研讨会的重点议题。微软亚洲研究院表示，UI-Evol不仅为当前AI智能体的发展提供了重要技术突破，更为未来人机交互系统的智能化升级奠定了坚实基础。随着技术的持续迭代，该组件有望在智能客服、远程运维等场景中发挥更大价值。

2025年11月18日

13:05

微软UI-Evol组件提升AI智能体操作稳定性与成功率

最新快讯

2025年11月18日

蓝思智能机器人新基地投产年产百万台AI设备打造全产业链标杆

维业股份子公司联合中标澳门大学20.86亿项目

北京海淀84亿综合用地挂牌上地板块价值高地

三木集团澄清：未投资平潭县项目投资传闻

肥多多签署多项跨境合作意向书推动数字农业国际合作

运满满冷运荣获2025全链价值实践成果数字化冷链平台引领行业新标杆

美团LongCat发布AMO-Bench数学评测基准难度超IMO推动AI推理发展

OceanBase发布AI原生数据库seekdb 开箱即用支持混合搜索

大秦铁路日运煤124.5万吨保障冬季能源供应

英伟达与Riken联手打造AI量子超算助力日本科学2030愿景

2025年Q3全球OLED出货量激增65% 华硕登顶市场冠军

哈佛量子纠错重大突破距离实用量子计算机更近一步