掌控表情符号的人正在推动AI重写规则

**前言**:这是一档由【微新创想】与聚焦创业投资市场的品牌咨询公司【赋雅FOYA】联合出品,每周为大家带来有趣、有料的海外独角兽商业故事。作者丨适道编辑丨海腰图源丨Hugging Face官方

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图

Hugging Face是一家估值20亿美元的AI独角兽,拥有24位投资人,包括Lux Capital、红杉资本等。在大模型领域,我们已见证OpenAI获得微软的百亿美元投资,以及InflectionAI获得微软和英伟达的13亿美元融资。然而,Hugging Face这家估值”仅20亿美元”的公司,却是目前AI领域的创造力中心之一。它被称为”AI领域的Github”,不仅汇聚了众多开发者和产品经理在社区中研究和发布AI模型,还拥有超过5000个客户(其中3000个为付费客户)。

Hugging Face的核心是名为Transformers的自然语言处理库。其Transformers库在GitHub上拥有62000颗星和14000个分叉,显示开发者和数据科学社区对其技术的积极应用与改进。Transformers提供API,可轻松下载和训练最先进的预训练模型,降低计算成本、减少碳足迹,并节省大量训练时间。Hugging Face采用免费增值模式:客户可使用免费推理API获得基础AI推理能力,并通过社区支持;付费服务则允许客户轻松训练模型,提升推理API性能。此外,其产品还包括Datasets(多模态模型数据集)、Hub(模型和数据集托管服务)、Tokenizers(高速分词器)等。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图1

这家潜力巨大的AI开源独角兽由法国小镇出身的极客Clem Delangue创立。他在都柏林大学求学时展现的极客精神和开源精神,塑造了Hugging Face独特的社区文化和企业文化。这位非典型创业者对AI有深刻理解,也对创业、开源社区及融资有自己的见解。本文结合红杉资本对Hugging Face的深度报道,以及创投圈著名播客20VC主理人Harry Stebbings对Clem Delangue的访谈,梳理了Hugging Face从0到1的进化道路,以及Clem Delangue的创业故事。

Hugging Face的开源精神源于创始人23岁时的大学经历。当时,Clem Delangue打造了教育平台UniShared,旨在解决全球学习资源分配不公问题,向每个人提供大学教育的机会。这一创举让他登上TEDx讲台。少年时代的Delangue来自法国北部小镇La Bassée,互联网的到来打破了他的世界局限。”当我得到自己的第一台电脑时,它就像一扇窗户,让我看到了更大的世界,那种感觉真是令人震惊。”他回忆道。UniShared虽未改变世界,却种下了开源和分享的种子,并让Google向他递出橄榄枝。Delangue拒绝后,加入巴黎计算机视觉创业公司Moodstocks,接触机器学习。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图2

在巴黎的一次会议上,Delangue向Apple市场营销专家Guy Kawasaki介绍自己的应用。Kawasaki质疑机器学习能否识别所有物体。”他说的大意是,你无法创建规则来识别世界上所有的物体。”Delangue演示后,Kawasaki惊讶于应用正确识别了他的水瓶品牌并提取社交媒体评论。那一刻,Delangue意识到机器学习以新方式连接人与人的潜力。”两个从未见过面的人——一位法国极客工程师和这位美国硅谷的家伙——他们因为机器学习发现他们其实喜欢同一个饮料品牌。”Delangue说。

离开Moodstocks后,Delangue在初创公司负责产品与市场营销。2016年,他与Julien Chaumond(法国经济部门计算机工程师)重逢。两人共同参加斯坦福大学在线工程课程,组建30多人的学习小组,其中Thomas Wolf(科学训练的专利律师)加入。他们决定解决机器学习领域最棘手的问题:构建开放领域、会话式的AI聊天机器人。当时,Siri和Alexa已出现,但”它们极其无聊,只会做生产力相关的事情。我们对建立一个有趣的会话式AI感到兴奋。”Delangue说。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图3

2016年,依赖深度神经网络的NLP领域仍处萌芽阶段,他们的目标近乎科幻。聊天机器人需整合多种模型,理解情感并生成答案,而管理海量训练数据是首要挑战。正是对不可能的挑战,使Hugging Face成为全球最大的开源AI社区。从一开始,Hugging Face团队就展现出开源社区的慷慨与民主精神,Delangue赋予员工权力,让他们自主发布功能。最终,这个聊天机器人活跃在社交网络和移动APP上,用户发送了超过十亿条信息。

Hugging Face转向开源的标志性时刻是发布自定义BERT模型。当时,Google发布的BERT过于复杂,且仅支持TensorFlow。Hugging Face一周内创建PyTorch版本,并免费开源。”那是个分水岭时刻”,红杉资本投资人Pat Grady说。Delangue被问及动机时,回答得简单直接:”我们只是觉得,这是许多人会喜欢使用的东西。”

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图4

Delangue在20VC访谈中强调开源对AI的重要性:”AI的进步基于开放科学和开源。所有人都能用最新算法搭建应用,形成正反馈循环,快速推进AI发展。没有开放科学,AI进度会慢很多年。”BERT模型的成功验证了Delangue早年的信念——分享知识对每个人都有益。

Hugging Face的使命随之改变:开始分享构建聊天机器人过程中积累的机器学习知识。他们逐渐成为工程师、研究人员的首选资源。在BERT适配版开发中,Delangue团队成为Transformer模型的专家。Transformer能从未标记数据中产生优秀结果,节省大量训练时间。Hugging Face建立为开发Transformer的首选开源中心,约20万种公共模型供用户访问。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图5

Delangue意识到,理解这些工具需要社区。随着转向开源,Hugging Face正成为他希望建立的社区。红杉资本合伙人Sonya Huang说:”Delangue理解用户——他就是用户——并且他对草根社区有直觉。他以极其真实的方式培育它。”Delangue没有雇佣专职社区经理,而是亲自参与,在Twitter上发布bug修复信息,与10000多家公司解决功能问题。至今,Hugging Face160名员工都积极参与在线社区。”我们觉得如果我们开始拥有社区经理,那就是将所有成员都应负的责任外包出去。”Delangue说。

Hugging Face的庞大规模推动了其战略地位。视觉大模型Stable Diffusion选择将其模型、数据集和演示发布到Hugging Face,激发了用户引领的活动,如”一个橡皮鸭在讲台上发表演讲”和”被辐射的皮卡丘”等创意作品。2023年3月,Delangue在旧金山与Hugging Face用户举行临时聚会,超过400人使用密码ossftw(开源软件永远胜利)注册,最终约5000人(含三头羊驼)参加,现场充满狂欢派对与机器人竞赛的氛围。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图6

AI原生创业公司将颠覆旧有企业。Delangue认为,AI已从后台技术演变为更奇妙(或可怕)的存在,数百万开发者和产品经理涌入AI领域。他主张任何投资AI的人都应加入Hugging Face社区。”如果用户不理解技术如何构建,会带来很多风险和误解。”Delangue认为,对通用人工智能崛起的担忧是错位的。他同意Andrej Karpathy的观点——AI是Software 2.0,是现代世界的重大进步,但不是万能的。AI是构建所有技术的新范式,但不是新的人类形式,它将为技术创造新能力。”大多数技术公司将编写AI。”

Delangue谈通用大模型与开源小模型的适用性:”有两种AI世界观,一种是通用大模型解决所有问题,另一种是许多开源小模型解决不同问题。选择取决于使用场景。如果你是Facebook,大模型能做任何事;如果你是消费品公司,需要针对场景优化AI模型。如何选择,取决于你如何定位自己。”对于企业是直接使用大模型API还是训练开源模型,Delangue的观点是:”直接使用OpenAI的API在开始阶段更快,但长期看,创业者没有建立核心竞争力。AI公司需要像传统软件公司编写代码一样,在机器学习范式中训练或定制模型。”

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图7

这是新公司颠覆旧有企业的巨大机会:旧企业选择容易的解决方案,而其他公司选择更具颠覆性的方式。AI发展太快,现有盈利方式可能3-5年后就不适用。Hugging Face采用免费增值模式,已有3000家付费客户(包括Bloomberg、Grammarly)。Delangue认为,首要任务是建立网络效应平台,被更多人采纳。”在AI领域,你期望公司愿意为AI付费,所以如果Hugging Face继续成为公司使用的第一AI平台,我们将能获得大量收入。”对于盈利,他强调逐步解锁学习阶段,从六位数收入开始,逐步到七位数、八位数和九位数。”在AI领域,底层技术的发展速度非常快,今天赚钱的方式可能三年后就不适用了。”

**非典型创始人:投资人不该抢创业者的活**
在与20VC的访谈中,Delangue介绍了自己的融资原则:
1. 两轮融资之间,不与外部投资者交谈,专注公司发展;
2. 融资快,获得足够资金后不再接触不熟悉的新投资人;
3. 选定投资人后,共度3天深度了解和尽调,确认目标一致、期望相似,能保持良好关系。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图8

对于风险投资人,Delangue认为部分人遗忘了风险投资首先是财务帮助,却把时间花在别处,甚至像CEO一样干预公司。他主张创业者不应为投资者建立公司,投资者也不该表现得像创业者,否则可能导致公司崩溃。”与创业者相反,投资人同时管理多家公司,时间有限,对技术的理解可能过于简单化。”

他最喜欢的投资人是Richard Socher(NLP领域杰出研究者,You.com创始人)。Richard与Delangue相识很早,在科学、商业和创业方面都给予帮助。

**本文为微新创想原创,未经授权不得转载,否则微新创想将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系http://www.idea2003.com/。**

最新快讯

2025年08月14日

15:44
腾讯近期震撼发布其自主研发的Hunyuan-GameCraft框架,这一突破性开源工具彻底革新了游戏开发模式,能够从单张静态图像和用户操作指令中实时生成可交互的游戏视频。作为腾讯HunyuanVideo技术的最新结晶,该框架的核心创新在于将二维场景转化为具备完整物理引擎的动态游戏体验。开发者只需提供一张场景素材,系统即可自动构建支持键盘、鼠标等操作的完整游戏...
15:44
AIbase最新消息,阿里巴巴旗下核心源头厂货平台1688即将于8月20日举办一场备受瞩目的产品发布会,正式揭开全新商家会员产品——“诚信通AI版”的神秘面纱。这款划时代的产品不仅将重新定义电商商家服务标准,更预示着1688在智能化转型道路上迈出关键一步。据悉,该产品计划于2025年10月全面上线,届时所有新入驻商家将必须开通AI版才能入驻成功,而现有的诚信...
15:44
近年来人工智能在内容生成领域的应用不断深化,其中PPT生成技术正成为AI技术竞争的新焦点。根据权威科技媒体AIbase最新报道,Moonshot AI旗下旗舰模型Kimi即将推出基于强大K2模型驱动的全球版PPT生成功能,这一创新举措迅速引发行业内外的高度关注。得益于Kimi K2在代码生成、数学推理和Agent任务处理方面的卓越能力,这款新功能有望彻底改变...
15:44
字节跳动在人工智能领域的创新步伐再次提速,正式发布了其最新研发的AI模型——M3-Agent-Control。这款尖端模型的推出,不仅彰显了字节跳动在人工智能技术前沿的领先地位,更彰显了其推动智能技术开放共享、赋能各行业发展的坚定决心。M3-Agent-Control的问世,为全球开发者和企业开辟了更广阔的技术应用空间,有望在智能化浪潮中扮演关键角色。 M3...
15:44
近期,一款名为Nano-Banana的图像编辑AI模型在社交媒体上掀起热潮。众多用户反馈显示,这款在lmarena平台发布的新模型在图像处理方面展现出卓越性能,多个关键指标甚至超越了备受推崇的FLUX Kontext模型。Nano-Banana在图像编辑领域的优势主要体现在三个方面 首先是角色还原能力。该模型能够精准捕捉并保留图像中人物角色的细节特征,确保编...
15:34
微新创想8月14日专电 在金庸先生的武侠巨著《神雕侠侣》中,小龙女栖身古墓的奇特生活令人津津乐道,尤其是她以绳为床的绝技,既可安然入睡,又能自由翻滚,尽显灵动身姿。近日,这一看似匪夷所思的场景竟在山东临沂变为现实,一位年仅9岁的女孩练就了令人惊叹的"睡绳功夫",其平衡能力之高超,堪称现代版小龙女。据媒体报道,这位小姑娘不仅能在绳索上稳如泰山般躺卧,更能在上...
15:34
腾讯控股(00700.HK)于8月13日正式发布2025年第二季度财务报告,数据显示QQ移动终端月活跃账户数稳定在5.32亿,与前两个季度基本持平,持续维持在5.3亿的用户规模。这一成绩的取得,离不开QQ从去年底开始推行的系列产品优化策略。其中,主界面移除QQ短视频功能成为显著调整之一,通过精简非核心业务实现自我"瘦身",同时通过优化产品界面、减少消息提醒等...
15:34
2025年8月14日,国家邮政局最新发布的数据揭示了我国邮政行业的蓬勃发展趋势。数据显示,7月份邮政行业整体业务收入高达1449.8亿元,同比增长8.6%,展现出稳健的增长态势。其中,快递业务表现尤为亮眼,收入达到1206.4亿元,同比增长8.9%,成为行业增长的主要驱动力。 在业务量方面,7月份寄递业务总量完成177.9亿件,同比增长12.6%,而快递业务...
15:34
2025年8月14日,国家铁路局最新发布的数据显示,7月份全国铁路客运量再创新高,完成旅客发送量4.55亿人次,同比增长6.6%,展现出铁路运输的强劲复苏势头。同期,旅客周转量达到1770.69亿人公里,同比增长5.7%,进一步印证了铁路运输在国民经济中的重要作用。 从全年数据来看,1至7月全国铁路累计发送旅客26.91亿人次,同比增长6.7%,累计旅客...
15:34
8月14日,备受瞩目的时尚科技品牌Bananain蕉内与国内领先纺织企业华孚时尚股份有限公司正式签署战略合作协议,标志着双方将在棉花产业领域开启深度合作新篇章。此次合作聚焦于棉花原产地溯源、纺纱生产工艺优化以及品质管理体系升级等多个核心环节,通过资源共享与技术创新,共同打造行业领先的供应链解决方案。双方在协议签署仪式上强调,将基于"科技赋能、品质至上"的合作...
15:34
2025年8月13日正午时分,今年第11号台风“杨柳”如猛兽般以强台风级别悍然登陆台湾省台东县沿海,狂风骤雨瞬间席卷这片土地。仅仅一天之后,8月14日凌晨0时30分左右,“杨柳”再度以强热带风暴姿态强势登陆福建省漳浦县沿海,其威力虽有所减弱,但依旧展现出不容小觑的破坏力。值得注意的是,这不仅是今年首个造访福建的台风,更刷新了历史记录,成为有气象记录以来第73...
15:33
截至8月13日,北京口岸今年出入境人员总量已突破1300万人次,同比增长18.7%,展现出强劲的增长势头。其中,入出境外国人数量达到367.7万人次,同比增长近36%,占总量的28.3%,反映出国际交流的活跃度显著提升。数据显示,7月1日至8月13日期间,出入境人员近295万人次,同比增长11%,进一步印证了暑期已成为北京口岸出入境的高峰时段。这一数据不仅体...