编者按:本文经微信公众号 阿尔法公社(ID:alphastartups)授权转载。在生成式AI蓬勃发展的今天,哪些应用形态正引领风潮?Copilot、ChatGPT等类人智能服务固然火热,而AI Agent无疑是其中的佼佼者。OpenAI联合创始人Andrej Karpathy曾在Twitter上高瞻远瞩地指出:”提示工程(prompt engineering)的下一个前沿是AutoGPT(Agent)”。在亚马逊云的Amazon Bedrock平台发布会上,明星产品Amazon Bedrock Agents更是成为焦点,它让开发者能够轻松构建各类生成式AI应用,高效完成复杂任务。
AI Agent究竟是什么?简单来说,它是一种能够自主理解、规划、执行复杂任务的人工智能系统。这类系统无需人类持续控制,即可独立运行,通过API接口还能实现浏览网页、操作应用、读写文件甚至信用卡支付等高级功能。在AI Agent领域,Fixie这家初创公司已崭露头角。由连续创业者、前哈佛计算机教授创立的Fixie,在今年早些时候获得了Redpoint领投,Madrona Venture以及来自Google、Amazon和Apple等科技巨头的现任和前任高管参与的1700万美元种子轮融资。
Fixie的创始团队堪称豪华阵容。主要创始人Matt Welsh(现担任首席架构师)不仅是连续创业者,还曾担任哈佛大学计算机教授,并在Google和Apple担任技术主管。其他联合创始人同样星光熠熠:CEO Zach Koch曾是Shopify产品总监,在Google Chrome和Android团队担任过产品负责人;CTO Justin Uberti是Google Stadia、Duo和Hangouts Video团队的负责人,也是WebRTC的发明者之一;首席AI科学家Hessam Bagherinezhad曾是Apple的AI/ML领导者。如此豪华的团队配置,难怪硅谷顶级投资机构纷纷追逐Fixie的投资机会。
Fixie创始团队坚信,大语言模型的价值远不止文本补全,其真正的用武之地在于链接外部API和数据源,融入企业业务流程,实现自动化问题解决。Fixie作为一个基于云的平台,不仅帮助开发者构建能与外部系统、数据和工具互动的Agent,还解决了API接入和数据托管等一系列技术难题。Madrona投资方对Fixie的评价极高,这是Matt Welsh参与创立的第三家公司(前两次是Xnor和OctoML),他们认为Fixie团队兼具乐观主义精神、对客户的深度理解和超高人才密度。Redpoint董事总经理Erica Brescia表示:”现有的大语言模型虽然强大且不断进化,但真正产生价值的地方是与企业内部数据和系统结合,从根本上改善企业运营。Fixie将实现这一目标——自动化手动工作,让员工专注于更高价值的任务。我们相信Fixie将成为构建基于大模型的应用程序的标准,这些应用将优化企业中每个角色的工作流程,最终解锁巨大的生产力增长。”
构建人人可用的Agent平台,GPT-4、开源模型任选AI Agent能够胜任众多复杂任务,对开发者而言,构建单个Agent并不算难,但企业需要更完善的解决方案来定义、构建、测试、部署、共享、保护、管理和监控他们的Agent。Fixie应运而生,旨在帮助企业应用开发者克服这些挑战。Fixie平台是一个基于云的PaaS服务,企业应用开发者可以轻松创建基于各种大模型的Agent,这些Agent能够回答关于私有数据源的问题,从历史客户支持对话中获取信息,并通过传统API与现有企业资源进行交互。Fixie平台开源了SDK和示例代码,开发者可以在Fixie的GitHub Repo上获取。
Agent的内在原理大模型具备通过示例学习新技能的能力,即少示例学习(Few-shot learning)。开发者只需提供一些执行新任务的示例(如发电子邮件、操作商用软件、联网),大模型就能掌握这些技能。一个独立的Agent由基础提示、一组少示例和quote函数组成。基础提示为提示底层大语言模型如何与外部世界互动设定了框架;少示例通过示例教导大语言模型如何处理传入的查询,向quote函数寻求帮助,以及如何将返回值融入其回复。
Fixie平台的价值体现在多个方面。Fixie内置了超过30个Agent,它们可以访问各种系统和工具,包括数据库、复杂的API(如GitHub)、生产力工具(如Google Calendar)以及Web搜索和Twitter等公共数据源。Fixie Agent SDK使构建自己的Agent变得非常简单,Agent构建好后,可以一键部署到云端,开发者也可以构建自己的Agent并提供给别人使用。未来,平台的功能还将进一步扩展。在Fixie平台,每个Agent都可以使用自定义的大模型,除了默认支持的GPT-4外,还可以与商用或开源模型集成,包括AI21的Jurassic-2、GPT-NeoX或Cohere的Command。Agent可以生成和处理任意模态的媒体,比如使用Stable Diffusion生成图像并以各种方式操作它们。Fixie对ChatGPT的插件系统也有良好支持:用户可以构建一个调用ChatGPT插件的Fixie Agent,或构建一个调用Fixi Agent的ChatGPT插件。
Agent的使用示例企业客户可以将Fixie构建的Agent应用于客户支持、业务自动化、业务智能、内容生成、CRM自动化等领域。例如,使用Fixie,企业客户可以构建一个Agent,将客户票据作为输入,并将查找客户的订单历史、发出退货标签和生成票据的草稿回复的过程自动化。Fixie提供了核心平台,企业客户可以非常轻松地构建与平台集成的、私有的高度定制代理。与使用垂直集成的”客户票据AI”产品相比,使用Fixie,企业客户可以自定义大模型与其私有的数据和系统的每个方面的集成。Fixie此前举办的一次黑客马拉松上,涌现出许多创新应用:有团队构建了电子邮件助理Agent,帮助用户的Gmail收件箱进行排序并生成写新电子邮件的提示;另一个参赛者构建了电影场景Agent,可以与Spotify API结合进行搜索,根据电影场景的文本描述找到电影中的特定歌曲;还有一个参赛团队构建了基于YouTube的推荐Agent,为用户推荐特定主题的内容。
OpenAI将Agent视为下一个主要方向,那么创业公司还有机会么?Agent代表了构建软件的基础性转变,它是一种新的软件形态。以前的大型软件,每个功能都需要投入不少研发力量去开发维护,而一个Agent,只要其基础大模型能力升级,或者花较少的成本把模型进行微调,能力就可以迭代升级。开发者可以构建一个Agent解决一个单点问题,也可以用几个Agent组合起来协作解决更复杂的问题。对于创业者,可以构建单个的Agent并不断迭代,例如BabyAGI,也可以像Fixie一样构建一个平台,让企业和开发者可以自由的开发Agent。
在文章开头,我们提到了亚马逊云对Agent的重视和投入,那么,面对科技巨头,创业者在这个方向还有机会么?先说一个”坏消息”,生成式AI的领头羊OpenAI对Agent也十分重视。OpenAI联合创始人Andrej Karpathy在一次OpenAI的黑客马拉松上发表观点:”如果一篇论文提出了某种不同的模型训练方法,OpenAI内部会嗤之以鼻,认为都是我们玩剩下的。但是当新的AI Agents论文出来的时候,我们会十分认真且兴奋地讨论。” OpenAI联合创始人兼CEO Sam Altman也曾在多个场合表示,构建庞大AI模型的时代已经结束,AI Agent才是挑战。外媒《The Information》指出,Sam Altman曾在5月私下告诉部分开发者,OpenAI希望将ChatGPT打造成个人工作助手,并有知情人士指出,OpenAI一直在关注如何使用聊天机器人来创建自主的AI Agent,相关功能很有可能部署在ChatGPT中。
那么好消息是,在同一场黑客马拉松上,Andrej Karpathy还说了这样的话:”普通人、创业者和极客在构建AI Agent方面相比OpenAI这样的公司更有优势。”尽管有业内专家表示,想要实现可用的AI Agent,还需要大幅提高大模型的能力,但是能够找到适合Agent的应用场景,有创新能力的创业者,显然应该行动起来了。
本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。