声明:本文源自微信公众号陆玖商业评论(ID:liujiucaijing69),作者胡家铭,经微新创想授权转载发布。在文心一言的强大助力下,众多应用的交互体验得到显著简化,交互方式也从传统的机器指令转变为自然语言对话。用户使用门槛大幅降低,原本被视为“高难度”“存在技术壁垒”的赛道,在大模型的底层技术支撑下,逐渐变得触手可及。当各大大模型厂商纷纷将目光聚焦于应用层开发时,率先发布并面向公众开放的文心一言,其先发优势开始显现。正如百度CEO李彦宏在5月31日“文心杯创业大赛”启动仪式上所言,“在中国,将有更多开发者基于文心大模型构建AI应用。”到了9月5日的云智大会上,李彦宏的愿景进一步升级:“我们期望创业者在文心大模型之上,打造出AI时代的爆款应用。”李彦宏对“爆款应用”的信心源自何处?文心一言面向公众开放后的24小时内,成功解答了超过3342万个用户问题。这一数据来自文心一言正式发布半年后的统计,生成式AI的广阔前景由此可见一斑。除了“文心杯”赛事之外,百度还面向开发者推出了AI Studio星河大模型社区、插件机制以及文心大模型“星河”共创生态计划。目前已有超过500家生态伙伴通过百度智能云千帆大模型平台,接入各类大模型服务。在DemoDay路演现场,陆玖商业评论观察到,最终获奖的创业团队涵盖了AI赋能的社交软件、二次元同人社区,以及面向商家与个人用户的销售决策助理和电商导购买手,精准覆盖了当前互联网行业的热门赛道与成熟赛道。在文心一言的加持下,这些应用的交互体验得到极大优化,交互方式从机械化的机器指令转变为流畅的自然语言对话。用户使用门槛的降低,使得原本被认为“难以企及”“存在技术壁垒”的赛道,在大模型的底层技术支撑下,逐渐变得平易近人。整个过程中,百度的文心一言作为底座,提供生态与算力支持,应用厂商则依托自身专业能力,深耕用户体验,最终实现商业化落地。从某种意义上说,这不仅是生成式AI时代的创业典范,也是百度这家老牌AI企业的新时代机遇。
01 AI原生应用的重要性为何如此突出?李彦宏之所以反复强调应用层的机会,并不仅仅是为了支持“文心杯”。因为与上一个互联网创业时代不同,当前的大模型创业门槛极高。这个门槛不仅涉及资金与算力,更在于数据获取。能力越强的大模型,通常需要更大的数据量作为预训练数据集。然而在移动互联网时代,原本散落在公域的信息数据已被APP分割成一个个孤岛,即便合作,也无法全面获取其他平台的数据。对于初创的大模型团队而言,这一挑战更为严峻。在国内,率先发布大模型的厂商如百度、三六零、阿里,均在各自领域(搜索、安全、电商)积累了丰富的中文语料与行业数据,其生长出的模型几乎等同于移动互联网时代的手机操作系统(安卓、iOS)。对于人才储备、资金储备、算力储备“三不足”的初创团队而言,想在已占优势的模型层实现追赶,显然难上加难。但在强调专业能力的应用层,却是他们的天然主场。例如此次获得“文心杯”一等奖的ChatDOC,是一个基于文档智能的专业知识问答助手及阅读平台。ChatDOC创始人林得苗向陆玖商业评论表示,与通用模型厂商相比,他们会针对特定行业整理好文档库,例如正在推进的金融行业法律法规库,就是行业合规人员的“刚需型”产品。要发挥这种数据库的能力,需要非常细致的分类工作,这主要是为了保证回答问题时限定在文档范围内。但如此细分的“体力活”场景,大厂“亲力亲为”显然不太可能,这正是更专业的AI原生应用“存在意义”所在。更进一步说,生成式AI的模型厂商与应用团队,二者更像是一种共生关系:在初始阶段,大模型厂商需要为创业团队提供算力、API接口、模型能力等支持;应用团队则基于自身专业能力和行业理解,对通用化的模型能力进行更专业的调试,最终实现商业化。但在整个过程中,仍需生态融合、投资方引入等必要环节。“文心杯”正是这样一个场景,通过项目比赛,底层模型厂商、应用项目方和股权投资方齐聚一堂,让真正有前景的AI原生应用更快落地,更快商业化。
02 生态、底座与赋能在集中路演期间,陆玖商业评论集中走访了不同类型的数支团队。从走访结果来看,百度对参赛的所有团队提供的生态扶持一视同仁,但参赛团队在具体应用方式、应用程度上存在较大差异。例如与AI结合的社交类APP“麦小记”,由于主要产品形态以图文呈现,所以对于文心一言整体的应用,在用户端的感受更直接。据“麦小记”产品负责人介绍,在用户个人内容发布的“记录”板块,用户可以用AI辅助生成内容,点击笔记下方的AI按钮后,会直接调用文心一言的大多数功能,用户可以直接生成对应主题的文字和图片。而在类微信朋友圈的“好友”和类豆瓣小组的“频道”板块,文心一言加持的AI机器人则充当了版面管理员的角色,不仅可以自动筛选用户内容进行智能推荐,而且还有一定程度的社区治理权限。麦小记的社群助手,是基于各类社群的具体场景,联手社群主进行数据训练,这使得其能以更贴合个性化需求的方式提供服务,这可以涌现出千群千面的社群助手,或称群主分身,这与上一代社群机器人有着本质的不同。对比国外一些应用,例如Telegram的社群机器人,基于文心一言大模型基础训练的社群助手,其对中文语义的理解与表达,都有显著改善。二次元同人创作社区“Genie AI”,对于文心一言的应用则有所不同。产品负责人告诉陆玖商业评论,目前Genie AI所涉及的“原神、星穹铁道”相关的同人创作,主要是基于其中的人气角色,进行对应单图、视觉小说和漫画的相关二创。爱好者们的创意各有千秋,但在多模态生成领域,并非所有用户都是天生的“提示词专家”。中间的提词优化过程,自然落到了平台头上。产品负责人告诉陆玖商业评论,文心一言在实际表现中,已经与ChatGPT的体感相差无几,通过必要的“微调”,已经能够将用户输入的大多数自然语言,顺利转化为对应的二创内容。自然语言的跨模态转化,用户端感知可能有限,但却是整个项目的灵魂。“Genie AI”目前的团队体量并不算大,纯后台研发只有3人。如果独立承担自然语言的全程优化与图像生成流程,在成本上显然不现实。文心一言的接入,使得整体创业更为轻量化,可以让团队把主要精力放在产品优化和用户增长上——据创始人透露,Genie AI在抖音和小红书公测仅仅4周,整体曝光量90w+。除了图文相关创业领域的直接赋能,文心一言对于一些高精尖领域的研究,也有意想不到的效果。例如新材料发现平台幻量科技,就基于材料信息学,结合AI、计算物理、高通量实验等,融合跨领域数据,进行正向预测与反向设计,成功加速了各行业新材料研发的产业落地。在材料学领域,将结果真正应用到产业领域,为企业带来成本节省、效率提升是关键。CEO刘雨阳告诉陆玖商业评论,在研究者视角来看,原先需要通过代码和命令行驱动的实验进程和变量筛选,在文心一言的参与下,可以完全使用自然语言来进行。让整个过程更加高效。在“实验语言”转变成自然语言之后,各类复合型人才将获益,对于有效实验变量的筛选不仅可以更快、更精准,整体实验的效率也会大大增加。刘雨阳还提到,如果能借助文心一言这样的AI大模型排除无效变量,提高效率,加快实验进程,将产生更多对产业有实际帮助的成果。
03 百度的时代新机遇从前述项目的细节就能发现,文心一言底座对于各个创业团队的“赋能”进程,实际上也是“百度系”AI应用不断跑马圈地的缩影。个中逻辑也不难理解:对于AI原生应用而言,底层模型就是类似“安卓”“iOS”这样的操作系统。各家大模型厂商在扶持自己的开发者群体时,自然会基于自家大模型进行对应扶持。在模型深入应用、改造应用的同时,应用本身也“变成了模型厂商的形状”,团队也成了文心一言的客户。如果应用团队本身没有充分准备,很难贸然转投别家阵营。正因如此,国产大模型竞争到应用层时,已经不再是资金与算力的竞争,而是对于优秀应用团队的竞争。谁对应用团队扶持的力度最大,谁就能在生成式AI时代获得话语权。百度在这方面的需求自然非常迫切。原因不仅来源于移动互联网时代的“被迫缺位”——公司对于AI领域的长期投入固然“理想主义”,但同样也需要产业切实落地,把老赛道“重做一遍”的契机。所以本次创业大赛中,同样也入围了专注电商和本地生活领域的AI原生应用团队。例如专注AI电商导购买手的Buysmart.AI,在用户端输入需求,通过文心一言的模型能力加持,可以智能推荐对应需求的商品。导购助手在用户购物进程中的作用,不仅替代了传统的电商广告和产品评测媒体,对于淘宝、百度等厂商的竞价排名广告体系,同样也是一种颠覆。对于百度而言,这种方式虽然在传统业务“革自己的命”,但通过生成式AI做了一块更大的蛋糕。至于吃不吃,固然取决于公司整体决策,但在生成式AI的巨大产业前景面前,很难有不吃的理由。更重要的意义在于,这些基于生成式AI的应用工具,实质上让已经固化的产业格局,提供了重新洗牌的可能。同一个电商赛道,原生AI应用的体验可能远胜于旧应用。Buysmart.AI联合创始人邱运伟也认为,即便原来的电商巨头,会对此围追堵截、严防死守,但体量较小的原生应用团队可以跟新兴电商平台如百度电商,或者行业次强进行合作,用更好的用户体验和专业能力,为自己谋得一席之地。作为底层模型厂商,百度也可以与应用团队的脚步一道,补全原先移动互联网时代“落下的课程”。真正用生成式AI“把所有行业重做一遍”。只有这些革命性的AI原生应用越来越多,才会真正如百度CEO李彦宏所说,“越来越多的应用会建立在模型之上,整个生态系统将充满活力。”