连续创业者与资深人工智能专家联手,让普通软件工程师也能玩转大模型

编者按:本文来自微信公众号 阿尔法公社(ID:alphastartups),作者:阿尔法公社,微新创想经授权发布。上周,Meta发布了大语言模型Llama 2,其能力相比前作有了显著提升,但更重要的意义在于开源和开放商用。这一举措为有志于在业务中应用生成式AI能力的创业者们节省了高达99%的大语言模型训练算力时长成本。他们只需投入1%的算力时长,就能在开源可商用的大语言模型上进行微调,打造出符合自身行业需求的模型。这一突破从根本上降低了大模型创业的准入门槛。

在生成式AI创业从基础大模型转向垂直应用的趋势下,涌现出许多致力于帮助应用侧客户和用户以低成本使用大语言模型能力的创业公司。Replicate就是这一方向上的典型代表。它打造了一个开源的AI模型托管云平台,助力中小企业实现模型的快速交付。用户不仅可以在平台上部署和微调AI模型,还能根据业务量灵活扩展模型规模。

Replicate在2023年2月和7月分别完成了两轮融资。2月,它获得了由a16z领投的1250万美元A轮融资;7月,又成功筹集了3200万美元的新融资(投资者未披露)。除了a16z,其投资者还包括红杉资本、Y Combinator以及OpenAI科学家Andrej Karpathy、You.com创始人Richard Socher、Docker创始人Solomon Hykes和GitHub CEO Thomas Dohmke等。这些顶级投资机构和企业家们的集体青睐,足以证明Replicate的潜力与价值。

连续创业者与资深人工智能专家联手,让普通软件工程师也能玩转大模型

硅谷顶级VC连投两次 Replicate 降AI模型部署成本创新方案插图

在计算领域,新的基础构件并不多见,应用程序大多是基于网络、存储和计算的组合。然而,像Stable Diffusion和ChatGPT这样的视觉或语言大模型,却真正代表了一个全新的基础构件。将这些大模型整合到软件中,开发者可以实现包括文本、视觉、语音等多模态内容的生成,这在以前是无法想象的。这种转变的级别不仅是从PC转移到移动设备(iPhone带来的转变),更代表了一种全新类型的软件。

尽管大模型的能力毋庸置疑,但普通软件开发者在将AI大规模运行到生产环境中时,仍面临一系列难题:如何托管模型,模型出问题时该怎么办,以及如何随着时间推移构建模型的差异化——针对大模型的清晰抽象和简单工具尚未诞生。

Replicate的两位联合创始人Ben Firshman和Andreas Jansson,从头像就可看出他们的极客范儿。他们致力于解决这些问题,并且拥有丰富的经验和技术基因。Ben Firshman是一位连续创业者,Replicate是他第四次创业。他在Docker担任产品总监时设计了Docker Compose,这个工具被数百万开发者使用,他对开发者体验有着超乎寻常的理解力。Andreas Jansson曾担任Spotify的高级机器学习工程师,他具备大规模部署AI模型的经验,并从零设计过创新的AI工具。

“对于软件工程师,AI目前还太难用,你必须对AI具有非常深刻的认识。整个软件行业都受到了机器学习专家短缺的阻碍(约3000万软件工程师对比约50万机器学习工程师)。我们让软件工程师可以在没有任何经验的情况下,只需几行代码就可以使用AI的能力,这样他们就可以构建带有AI的产品,并将其应用到业务上。”Firshman在谈到创业初衷时这样说。

Replicate的种子轮和A轮投资人,红杉资本合伙人Stephanie Zhan表示:“Replicate提供了一种简单、快速的方式,让任何人都可以在云上运行生成式AI模型。开发者不必为GPU烦恼,也不必为昂贵的AWS付费,他们只需要一行代码就可以在云中部署AI模型,按秒计费。除了在开源生态系统中使用最好的模型,Replicate的平台还允许公司运行自己的定制模型,它会自动打包、优化并部署这些模型——将过程从几周缩短到几分钟,并减少对基础设施团队帮助的需求。我们很高兴能通过这轮A轮融资深化与Ben和Andreas的合作,AI将是下一个十年最重要的主题——由数据规模、生成式AI模型的新技术突破和计算的进步推动——而在这个软件2.0世界的基础设施堆栈被编写的过程中,我们相信Replicate将扮演一个基础的角色。”

硅谷顶级VC连投两次 Replicate 降AI模型部署成本创新方案插图1

一个云平台,让AI模型部署时间从几周降到几分钟

Replicate的核心产品理念是,所有开源AI模型都应该能在一个地方找到,并且易于使用。开发者应该能在没有任何机器学习工作、托管设置的情况下,立即启动并运行大语言模型。将几个模型组合成一个管道应该很容易。并且,当应用程序规模扩大时,开发者应该能够使用简单的工具进行微调并托管自己的模型。

Replicate的产品是一个开源的AI模型托管云平台,其主要功能包括:现有大模型的整合与引入。企业用户可以使用几行代码就在平台上运行机器学习模型,而无需了解任何机器学习的工作原理。针对需求相对简单的用户,Replicate提供了上千个不同的AI模型在线使用或者简便地导入到自己的程序中,包括语言模型、视频创作与编辑、超分辨率、图像修复、图片转文字、文字转图像等六大功能,最火爆的模型已经被在线使用了超过9000万次。针对需求更高的深度用户,他们可以借助Replicate的模型库以及Next.js和Vercel等工具开发自己的项目。截止目前,已经有很多AI工程师使用Replicate来制作自己的项目,例如将开源基础大模型进行特定方向的微调(目前开发者们已经能在Replicate平台上微调 Llama 2大模型),其中优秀项目包括roomGPT、 Scribble Diffusion等。

帮助用户部署人工智能大模型

部署人工智能大模型的传统方法是,开发人员必须先将模型及其支撑组件手动打包到软件容器中,然后再部署。Replicate 开发了一种名为Cog的开源工具,简化了这项任务。Cog目前内嵌在Replicate的云平台中,用户可以通过比以往更少的定制化工作来配置容器。用户在云平台仅通过几行代码就能运行特定的AI模型,整个过程只需要几分钟,与以前的部署方法相比是指数级的下降。Replicate不仅提供了云平台,还给出了非常详细的模型部署教程。目前,cog在GitHub上获得了超过5200颗星。

硅谷顶级VC连投两次 Replicate 降AI模型部署成本创新方案插图2

帮助快速扩展人工智能模型规模

对于中小企业,大规模部署机器学习模型不仅会遇到Cog解决的部署问题,同样关键的问题是如何扩大其规模以达到商用标准。在扩大规模的时候,要处理的问题涵盖API服务器、依赖关系、模型权重、CUDA、GPU、批处理等。当用户在Replicate平台上部署机器学习模型,平台可以从硬件和软件两个层面帮助其扩展规模。软件上,用户既可以使用现成的开源模型,也可以大规模部署自定义私有模型——只要使用Cog定义的模型,Replicate都可以自动为其生成可扩展的API服务器,并部署在大型GPU集群上。当用户部署的模型获得大量流量时,Replicate会自动扩展模型以满足需求。如果部署的模型没有获得任何流量,replicate就会将规模缩减至零,并且不会向用户收取任何费用。硬件上,Replicate目前提供七种不同级别的硬件设施以供用户部署其模型,平台会以秒级别的精度计算用户的部署时间并计费,价格区间在0.0002美元/秒至0.00471美元/秒之间。同时,平台还支持对于合规性、安全性或对SLA(服务等级协议)有特定需求的企业级客户提供定制软硬件解决方案。

更低的进入门槛让AI应用创业迎来春天

我们曾经说过,得人才者得模型,得模型者得天下,现在再加一句,产品致胜。把模型训练、服务产品化,靠产品化实现规模化、低成本,是AIGC创业的王道。此前,Llama 2帮助创业者节省了99%的训练模型算力时长,Replicate这样的创业公司又帮助创业者把模型部署的时间成本降低了99%,再加上99%的企业需要第三方模型服务,这些都是创业的机会。当然,Replicate并不是唯一帮助企业降低AI使用准入门槛的,像Hugging Face(它已经是估值20亿美元的独角兽)和OctoML等公司也在做类似的事。而且不知是巧合还是必然,这三家公司都来自开源社区。这些来自开源社区的创业者,更理解开发者们的痛点,也更具有开源精神,能够打造真正符合开发者需求的产品和平台。随着Llama 2对于开发和商用的开源,利用AI大模型的能力做垂直应用的公司将如雨后春笋般涌现出来,而帮助它们降低使用AI大模型能力门槛的公司,使这些AI应用创业公司们更早迎来春天。

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年02月10日

12:09
微新创想 伸懒腰竟然能把肺给弄破 这可不是危言耸听 而是实打实发生的事 据媒体报道 近日 17岁的小伙小孙(化名)早上起床伸了个懒腰 没想到右侧胸口突然发生一阵尖锐的刺痛 紧接着感到呼吸有些费劲 还忍不住咳嗽 父母将其送到浙江省人民医院就诊后 医生通过胸部CT检查发现 小孙右侧的肺被压缩了70% 诊断为自发性气胸 医生表示 自发性气胸 通俗讲就是...
12:09
微新创想:2月6日,千问正式上线「春节30亿大免单」活动,用户只需将千问更新至最新版本,即可领取一张25元的无门槛免单卡,用于在千问APP内点奶茶、订餐或购买年货。活动上线仅5小时,用户通过千问APP成功下单超过500万单奶茶。此外,老用户每邀请一名新用户,还能再获得一张免单卡,邀请3位新用户则有机会参与抽取价值10000元的千问AI生活卡。活动页面还预告,...
12:09
声明:本文来自于微信公众号 电商在线,作者:唐果,授权站长之家转载发布。春节红包大战刚“燃”到请客喝奶茶,网红茶饮品牌阿嬷手作却早已不想只卖奶茶了。1月底,阿嬷手作参股投资的餐饮品牌“LUOSHI鑼獅”在上海新天地东台里开门迎客,目前的主要餐品为广西主食和手工广西菜,包括招牌螺蛳粉、吊龙炒螺蛳粉、鑼狮红油卷粉、八妹鸽腿、慢炖玉林...
12:09
微新创想 游戏科学创始人冯骥今天突然发布了《黑神话:钟馗》第一支实机视频。虽然目前只是一个拜年短片,但依然引发了广泛关注。视频中并未包含操作、战斗、玩法等内容,主要展示了部分人物和场景的画面。游戏科学在视频结尾特别说明,此视频仅为马年春节特别制作,与游戏实际剧情并无关联。尽管内容有限,但这一举动至少表明《黑神话:钟馗》项目正在快速推进中,或许在不久的将来,比...
12:09
微新创想:2月10日消息,农历腊月二十三在北方被称为小年,南方则错后一天,在二十四迎来小年。这一传统节日的日期差异源于历史演变和地域风俗的不同。 专家指出,古代“小年”曾被称为“交年节”或“小节夜”。在宋朝时期,皇宫中以腊月二十四为小节夜,三十日为大节夜。这种说法在周密所著的《武林旧事岁除》中有详细记载。随着时间推移,“交年节”逐渐演变为“小年夜”,成为人们...
12:09
微新创想 近日有网友分享了一段令人揪心又暖心的视频。视频中,一名男子骑摩托车带妹妹出行时,不幸被后车追尾。事故导致兄妹两人摔倒在地,妹妹率先爬起,发现哥哥躺在地上不动,随即看到地面上流淌的红色液体,误以为是哥哥受伤流的血,顿时情绪崩溃,放声大哭起来。她扑到哥哥身上,撕心裂肺地哭喊,并跪地哀求哥哥醒来。肇事司机在看到这一幕之后也被吓到,以为自己要面临法律的严惩...
12:00
微新创想:继腾讯元宝分现金、阿里千问送免单后,字节跳动旗下的 AI 助手豆包正式官宣加入春节“红海”大战。豆包宣布将以合作伙伴身份亮相2026年中央广播电视总台春晚,并开启名为“豆包过年”的大型新春活动。此次活动不仅延续了传统红包的玩法,更在科技体验上进行了大胆创新。 本次活动的亮点在于其极具科技感的奖池。与传统的纯现金红包不同,豆包此次准备了超过10万份深...
11:52
微新创想:2026年2月,国雁集团成功完成Pre-A轮融资,该轮融资由亿道基金独家投资。此次融资标志着公司在新材料技术研发与制造领域迈出了重要一步,进一步巩固了其在行业内的领先地位。 微新创想:国雁集团总部设立于中国,致力于新材料技术的创新与应用。公司业务范围广泛,涵盖合成材料、工程塑料、塑料制品以及汽车零部件的研发与生产,同时积极拓展储能技术服务和新能源汽...
11:52
微新创想:2026年2月,湖南株洲鸿星科技有限公司成功完成天使轮融资。此次融资由株洲国投创投与定航资本联合投资,标志着公司在航天科技领域迈出了重要一步。鸿星科技是一家专注于脉冲等离子体推力器工程化应用的高科技企业,致力于将先进的推进技术应用于航天器与运载火箭制造。公司业务范围广泛,涵盖微小卫星的研发与生产,以及火箭发动机的研制等多个核心领域。 微新创想:公司...
11:52
微新创想:2月9日,AI.com在超级碗投放价值1500万美元的广告,并耗资7000万美元购得域名。这一举动标志着AI.com在品牌推广和市场拓展上的重大投入。广告内容呼吁观众立即访问网站注册用户名,以获取更多服务信息。 然而,广告发布后不久便遭遇技术故障。由于系统仅支持Google单点登录,导致大量用户在尝试注册时被Google限流,最终引发全站瘫痪。这一...
11:52
微新创想:2026年2月,工信部发布《减免车辆购置税的新能源汽车车型目录(第二十七批)》,新款腾势Z9与Z9GT正式入选。两款车型均提供102.326kWh和122.496kWh电池版本,CLTC纯电续航最高达1068km(Z9)和1036km(Z9GT)。Z9GT新增三电机版本,单电机最大功率370kW,插混版CLTC纯电续航超400km。新车升级激光雷达...
11:52
微新创想:2026年2月9日,宏碁宣布其2026年1月合并营收达到210.77亿新台币,约合46.56亿元人民币。这一成绩相比去年同期实现了39.8%的同比增长,创下多年同期的新高。 此次营收增长主要得益于商用产品业务的强劲表现,同比增长高达63.4%。电竞及游戏相关业务同样展现出强劲势头,同比增长53.4%。笔记本电脑业务也实现了50.6%的同比增长,成为...