AIbase最新报道 – 苹果研究团队在突破性论文《UICoder:通过自动反馈微调大型语言模型生成用户界面代码》中,揭示了一项令人震撼的技术进展:成功训练开源模型自主学习SwiftUI用户界面开发。尽管大型语言模型在创意写作和编程领域展现出卓越能力,但在生成”语法正确、设计良好的UI代码”方面仍存在明显局限。研究团队指出,即使在精心策划的数据集中,UI代码示例也极为稀缺,在某些代码数据集中占比不足1%,这成为制约模型性能的关键瓶颈。
研究团队以开源编程模型StarChat-Beta为基础,创新性地采用自动反馈循环方法,通过三个核心步骤实现突破:首先进行数据生成,向模型提供详尽的UI描述列表,指示其生成大量SwiftUI程序;接着通过Swift编译器验证代码可执行性,并利用GPT-4V视觉模型对比界面与原始描述,进行迭代优化;最后剔除编译失败、无关或重复的输出,保留高质量训练数据进行模型微调。经过五轮精密迭代,团队成功构建了包含996,000个SwiftUI程序的庞大合成数据集,并由此训练出UICoder模型。
测试结果显示,UICoder在自动化指标和人工评估方面均显著超越基础StarChat-Beta模型,整体质量接近GPT-4水平,编译成功率甚至超越GPT-4。研究中的一个关键发现源于深入的数据分析:StarChat-Beta的原始训练数据几乎不包含SwiftUI内容。在创建TheStack数据集时,Swift代码库被意外排除,OpenAssistant-Guanaco数据集中仅有万分之一的Swift代码示例。这一发现有力证明,UICoder的性能提升并非来自对已有数据的重新整理,而是通过自动反馈循环构建的自生成精选数据集实现的真正学习突破。
研究团队强调,这种方法的成功验证了其在其他编程语言和UI工具包中的广泛应用潜力,为AI辅助软件开发开辟了全新可能。论文地址:https://arxiv.org/html/2406.07739v1