人工智能浪潮席卷全球,大模型竞赛进入白热化阶段
从ChatGPT的横空出世到如今的大模型时代,人工智能仅用不到一年的时间便成为科技圈最炙手可热的赛道。不仅是科技巨头纷纷押注,众多中小企业也在人工智能浪潮中积极寻求突破。据研究机构统计,截至今年9月,国内已发布超过106个大模型,随着备案工作的完成,文心一言、讯飞星火等头部产品陆续向公众开放。这场大模型军备竞赛已进入白热化阶段,值得注意的是,在应用场景上,尽管头部玩家横跨客服、工业、医疗等多个领域,但编程这一曾被寄予厚望的关键场景,如今却鲜有提及。
人工智能编程的探索历程
使用人工智能进行编程的想法由来已久。2019年,Google Brain的突破性论文首次尝试以深度学习辅助程序员开发。随后微软、谷歌等科技巨头纷纷入局,推出GPT-C、PyMT5等专业编程模型。随着ChatGPT的智能涌现现象被证实,OpenAI Codex、GitHub Copilot等更成熟的编程大模型应运而生。一度有人预言人工智能将颠覆程序员行业,让零基础者也能轻松开发。
然而现实与理想之间仍存在差距。数据工程师陈锋指出,当前人工智能大模型在理解能力和准确度上仍存在明显短板,技术尚未达到商业化水平,普及零基础编程的目标仍遥遥无期。
开发者视角下的AI编程体验
互联网公司中层刘航曾指导8岁儿子使用ChatGPT和Claude开发一款平台跳跃游戏。尽管游戏代码由顶级AI生成,但低级错误频出,需要大量修改才能运行。这一经历让刘航对人工智能编程的可靠性产生质疑:”代码写得像’弱智’,低级错误一大堆,稍微复杂就完全不会。”这并非刘航首次接触AI编程,今年3月GPT-4发布时,他曾考虑将其引入公司开发流程,但实际使用后很快放弃了:”AIGC本质上不是理解编程语言,而是从现有案例中生成,需要开发者精确描述需求,重复调试过程并不比直接编写更高效。”
开发者黄一也指出,AI生成的代码质量具有高度不确定性:”让AI写复杂代码,正确与否还得人重新检查,时间可能比直接编写还要多。”代码需要运行验证才能成为有价值的交付物。
技术到商用的鸿沟
编程语言作为人与计算机的沟通桥梁,其精确性要求远超自然语言。刘航认为,程序员”太聪明”,是大模型在编程上显得”笨拙”的主要原因。计算机语言缺乏自然语言的灵活性,人工智能难以理解其深层含义。例如某国内大模型无法理解”青梅竹马”的引申义,只能识别单个字词。在编程中,用户需要用简洁语言描述复杂需求,但往往需要不断调整Prompt(提示词)才能获得理想结果。
更严重的是,大模型缺乏判断能力,无法判断输出结果是否正确。数据工程师陈锋解释道:”人类能判断自己是否解决编程问题,但大模型不行。目前训练模型通过无监督因果推断,无论有没有正确答案都会给出似是而非的结果,验证过程需要大量时间。”自主学习能力同样欠缺,程序员需要不断学习新技术,而大模型学习新知识意味着重新训练,成本高昂。
目前市面上的AI辅助开发工具多针对轻量级场景:代码段自动填充、函数创建、代码注释等。GitHub Copilot等主流产品提供代码建议功能,但黄一认为:”AIGC只能胜任简单测试和代码补全,实际测试不用AI也能完成,只有代码补全略微提高效率,企业目前肯定不会为辅助编程AI付费。”
不止编程受限
大模型在编程领域遇到的问题,以类似逻辑存在于其他应用场景。理解能力不足导致需要更精确的语言输入,催生了新兴技术”提示词工程(Prompt Engineering)”。这项技术要求用户设计和研发提示词,涉及大模型交互和研发技能,门槛较高。对于大多数使用场景,专门学习提示词工程性价比极低,即使出现”提示词工程师”职业,在缺乏行业规范前也难以发挥作用。
在编程之外领域,缺乏判断能力的AI会生成偏离事实的内容,被称为”人工智能幻觉”。这类技术缺陷限制了大模型的商业化潜力,目前基于大模型的产品开发相对谨慎,集中于美颜相机、语音助手等常规领域。国内top厂商提供的大模型服务多为增值服务,独立产品少之又少。
商业化前景分析
2023上半年多家企业财报显示,AIGC相关业务已产生收入。商汤科技生成式AI相关收入同比增长670.4%,对集团业务贡献从10.4%提升至20.3%;360智脑为中小企业提供AI增值服务,收入近2000万元;科大讯飞AI学习机GMV在5月和6月分别大增136%和217%。
增值服务已在不同领域带来收入,但体量难以覆盖大模型训练成本,更无法支撑行业进一步发展。正如丘吉尔所言:”这不是结束,甚至不是结束的开始,可能只是开始的结束。”技术与应用之间的壁垒依然高耸,比起谈概念,行业更需要发现真实需求、解决具体问题。
