大模型编程商业化前景分析及发展瓶颈

2023-09-30 11:14:34 互联网 34 次阅读

人工智能浪潮席卷全球，大模型竞赛进入白热化阶段

从ChatGPT的横空出世到如今的大模型时代，人工智能仅用不到一年的时间便成为科技圈最炙手可热的赛道。不仅是科技巨头纷纷押注，众多中小企业也在人工智能浪潮中积极寻求突破。据研究机构统计，截至今年9月，国内已发布超过106个大模型，随着备案工作的完成，文心一言、讯飞星火等头部产品陆续向公众开放。这场大模型军备竞赛已进入白热化阶段，值得注意的是，在应用场景上，尽管头部玩家横跨客服、工业、医疗等多个领域，但编程这一曾被寄予厚望的关键场景，如今却鲜有提及。

人工智能编程的探索历程

使用人工智能进行编程的想法由来已久。2019年，Google Brain的突破性论文首次尝试以深度学习辅助程序员开发。随后微软、谷歌等科技巨头纷纷入局，推出GPT-C、PyMT5等专业编程模型。随着ChatGPT的智能涌现现象被证实，OpenAI Codex、GitHub Copilot等更成熟的编程大模型应运而生。一度有人预言人工智能将颠覆程序员行业，让零基础者也能轻松开发。

然而现实与理想之间仍存在差距。数据工程师陈锋指出，当前人工智能大模型在理解能力和准确度上仍存在明显短板，技术尚未达到商业化水平，普及零基础编程的目标仍遥遥无期。

开发者视角下的AI编程体验

互联网公司中层刘航曾指导8岁儿子使用ChatGPT和Claude开发一款平台跳跃游戏。尽管游戏代码由顶级AI生成，但低级错误频出，需要大量修改才能运行。这一经历让刘航对人工智能编程的可靠性产生质疑：”代码写得像’弱智’，低级错误一大堆，稍微复杂就完全不会。”这并非刘航首次接触AI编程，今年3月GPT-4发布时，他曾考虑将其引入公司开发流程，但实际使用后很快放弃了：”AIGC本质上不是理解编程语言，而是从现有案例中生成，需要开发者精确描述需求，重复调试过程并不比直接编写更高效。”

开发者黄一也指出，AI生成的代码质量具有高度不确定性：”让AI写复杂代码，正确与否还得人重新检查，时间可能比直接编写还要多。”代码需要运行验证才能成为有价值的交付物。

技术到商用的鸿沟

编程语言作为人与计算机的沟通桥梁，其精确性要求远超自然语言。刘航认为，程序员”太聪明”，是大模型在编程上显得”笨拙”的主要原因。计算机语言缺乏自然语言的灵活性，人工智能难以理解其深层含义。例如某国内大模型无法理解”青梅竹马”的引申义，只能识别单个字词。在编程中，用户需要用简洁语言描述复杂需求，但往往需要不断调整Prompt（提示词）才能获得理想结果。

更严重的是，大模型缺乏判断能力，无法判断输出结果是否正确。数据工程师陈锋解释道：”人类能判断自己是否解决编程问题，但大模型不行。目前训练模型通过无监督因果推断，无论有没有正确答案都会给出似是而非的结果，验证过程需要大量时间。”自主学习能力同样欠缺，程序员需要不断学习新技术，而大模型学习新知识意味着重新训练，成本高昂。

目前市面上的AI辅助开发工具多针对轻量级场景：代码段自动填充、函数创建、代码注释等。GitHub Copilot等主流产品提供代码建议功能，但黄一认为：”AIGC只能胜任简单测试和代码补全，实际测试不用AI也能完成，只有代码补全略微提高效率，企业目前肯定不会为辅助编程AI付费。”

不止编程受限

大模型在编程领域遇到的问题，以类似逻辑存在于其他应用场景。理解能力不足导致需要更精确的语言输入，催生了新兴技术”提示词工程（Prompt Engineering）”。这项技术要求用户设计和研发提示词，涉及大模型交互和研发技能，门槛较高。对于大多数使用场景，专门学习提示词工程性价比极低，即使出现”提示词工程师”职业，在缺乏行业规范前也难以发挥作用。

在编程之外领域，缺乏判断能力的AI会生成偏离事实的内容，被称为”人工智能幻觉”。这类技术缺陷限制了大模型的商业化潜力，目前基于大模型的产品开发相对谨慎，集中于美颜相机、语音助手等常规领域。国内top厂商提供的大模型服务多为增值服务，独立产品少之又少。

商业化前景分析

2023上半年多家企业财报显示，AIGC相关业务已产生收入。商汤科技生成式AI相关收入同比增长670.4%，对集团业务贡献从10.4%提升至20.3%；360智脑为中小企业提供AI增值服务，收入近2000万元；科大讯飞AI学习机GMV在5月和6月分别大增136%和217%。

增值服务已在不同领域带来收入，但体量难以覆盖大模型训练成本，更无法支撑行业进一步发展。正如丘吉尔所言：”这不是结束，甚至不是结束的开始，可能只是开始的结束。”技术与应用之间的壁垒依然高耸，比起谈概念，行业更需要发现真实需求、解决具体问题。