编者按:本文由许四清撰写,作为阿尔法公社创始合伙人兼CEO,本文经微新创想授权转载。上周四,百度文心一言与讯飞星火大模型等一批大型语言模型正式获批提供服务,标志着人工智能范式迎来深刻变革。这一变革不仅重塑了技术格局,更引发了人们对于核心问题的思考——在范式转型中,资本流向何方?谁将成为主导力量?尽管MidJourney凭借其传奇表现(2022年11人收入突破1亿美元)点燃了创业与投资的热情,但探索AIGC(生成式人工智能)商业模式的征程仍在继续。本文将从大模型构成角度,剖析创业与投资机遇,并在结尾分享一个“误入钱眼”的创业故事。
图1:文生图示例——雨中赛博朋克风女杀手(由HiDream Pixeling V1.0生成)
### LLM:大公司生态博弈,创业者需谨慎
观察大型语言模型的应用架构(如图2所示),不难发现其底层构建于坚实的硬件基础之上。以NVIDIA为代表的GPU厂商,以及CoreWeave等算力提供者,构成了这一庞大体系的基石。硬件作为商业化的根本要素,其重要性不言而喻。然而,对于创业者和投资人而言,直接投身硬件领域的机会有限,主要集中于为模型优化算力平台。
图2:大型语言模型的结构及代表企业
大洋彼岸,主流大模型数量有限,OpenAI、Meta、Google等巨头均以自身大模型为基础构建生态体系。此外,transformer模型的原创者创立的LLM公司(如Adept、Cohere、Character.ai)则更倾向于差异化竞争而非同质化模仿。这些现象揭示了大厂之间的生态之战——缺乏自研大模型的企业将面临严峻挑战。人们之所以看好微软胜过Amazon,正是因为其巧妙地占据了OpenAI和Meta Llama 2大模型的先机,将产品全面拥抱AI。得模型者得天下,拥有基础大模型的企业能够构建底层平台,上层应用自然形成对Amazon等竞争对手的釜底抽薪式竞争。基础大模型堪称“吞金兽”,大厂通过其跑马圈地,算大账,尚能承受;而小厂若非专注于垂类模型,几乎无生存空间,创业者需谨慎评估。
图3:AI模型的演进(源自www.lightspeed.com)
OpenAI与大厂模型属于第一波,transformer原创者创立的模型为第二波,后续涌现的各类自研或开源模型则构成第三波。大语言模型的发展趋势是从基础大模型向垂类模型,再进一步演变为面向企业应用的长尾模型。
图4:中国LLM概览(图片源自网络)
值得注意的是,国内LLM市场呈现“铺天盖地”的竞争态势。除少数大厂外,多数模型可能基于开源模型训练而成(缺乏GPU资源的企业难以胜任预训练环节),属于模型再造。这种“多快好省”的方式值得肯定,但多数属于垂类模型或甲方定制模型,并非真正意义上的基础大模型。训练基础大模型耗资耗人,动辄千万美元,堪称“富人游戏”,创业者需谨慎参与。原因在于,国内创业公司融资额约为国外同类企业的1/10,难以支撑预训练所需的高昂成本。若尝试从头进行预训练,GPU价格飙升,企业很快将耗尽融资。
### AI工具:淘金潮中卖镐,技术含量高
生成式人工智能不仅开创了新范式,更催生了大量新工具机会。这些工具涵盖模型评价、运行维护、增强系统及操作工具等,无一不是范式变革带来的新机遇。尤其值得关注的是数据管理、训练工具,以及安全防护体系。安全工具不仅包括传统安全产品,更需关注面向模型的安全与合规解决方案。试想,若训练出的模型被恶意入侵,岂非成为攻击者侵犯隐私的利器?因此,安全不仅是工具,更是不可或缺的基础设施。
林林总总,老工具难以适用,创业者大显身手的机会较多。
### 新AI应用:百花怒放的乐园
应用层是真正的富矿,创业机会遍地开花。无论是toB还是toC应用,新一代人工智能都提供了无限可能。toC应用的特征是革命性地切入新场景,产品经理创新空间广阔,基本无需深入模型技术即可推出受用户喜爱的应用。不难预见,一批优秀的中国产品经理将在范式变革的大潮中成为国际级玩家,新一代“张一鸣”或许正在快速涌现。toB应用则考验从业者对企业需求痛点的理解,利用新手段解决老问题。除少数颠覆性创新外,多数应用仍将沿着降本增效的路径发展。技术变革确实提供了“一招鲜吃遍天”的机会,但革命不易成功,传统玩家早已占据应用场景优势,新手段和工具则扮演革新角色,形成新老共存的格局。私有化部署的甲方大模型,将在很长一段时间内保持强劲增长需求。唯一需留意的是,中国toB市场与美国市场因客户构成、采购行为差异巨大,创业者不可照搬。
### 文生视觉:被证实的富矿;中国版MidJourney——快感与痛感并存
MidJourney直接触达设计师群体,极大地提升了美工设计效率,数秒内生成一张图,彻底改变了生产方式。用户付费意愿强烈,11人年收入突破1亿美元,成为迄今为止AIGC商业化的最亮眼案例。今年年初,笔者与设计师共同研究MidJourney,现场体验了C端付费B端买单的商业模式,深刻感受到其商业逻辑的硬道理。同时,使用门槛之高也令人印象深刻——一位大美工不断修正复杂专业的英文描述,通过“修”prompt以期生成满意创意图,还要忍受模型对中国风格的缺陷——彼时只有MidJourney这类仅懂英文、仅学习西方文化素材的模型,设计师不得不提高英文准确度,还要忍受“Chinese”被表现成东瀛或韩国风的窘境。颠覆性手段带来设计效率革命,设计师却同时承受语言与画风错配的煎熬,强烈的快感与痛感并存,让我们坚信中国需要自己的MidJourney。不仅如此,我们还认为MJ应被超越:第一,市场呼唤更懂人话的工具;第二,中文元素或全球本地元素需得到更好表达。此外,电商、广告对海量图片、小视频的高效生产工具需求巨大,与生产系统对接成为重要市场。天赐良机,与数年来一直图谋共同“搞事情”的科大师弟梅涛院士一拍即合,懂算法、会模型、工业界经验丰富的老兵下场创业,于是有了阿尔法公社与科大校友支持梅涛院士的HiDream。短短数月,HiDream展现出惊人迭代速度与惊艳效果,彻底颠覆了学界对“学者创业”的偏见。
图5-7:MidJourney与HiDream由相同prompt生成的图
MidJourney做出了宝贵的开创性工作,后来者若能更好地应用transformer,打造更强模型能力,不再简单依赖Diffusion Model(MJ基于此模型不断优化),将大有可为。我们坚信MJ会利用先发优势,摆脱对扩散模型的依赖,持续为市场带来惊喜。
无论是工具、浅表层应用,还是深层企业应用,都处于规模生成、暗流涌动的早期。AIGC才刚刚开始,我们期待算法创新与迭代为工业界不断展示更绚丽的篇章。
2023年9月6日凌晨于合肥
本文作者许四清,阿尔法公社创始合伙人兼CEO。