掌控表情符号的人正在推动AI重写规则

**前言**:这是一档由【微新创想】与聚焦创业投资市场的品牌咨询公司【赋雅FOYA】联合出品,每周为大家带来有趣、有料的海外独角兽商业故事。作者丨适道编辑丨海腰图源丨Hugging Face官方

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图

Hugging Face是一家估值20亿美元的AI独角兽,拥有24位投资人,包括Lux Capital、红杉资本等。在大模型领域,我们已见证OpenAI获得微软的百亿美元投资,以及InflectionAI获得微软和英伟达的13亿美元融资。然而,Hugging Face这家估值”仅20亿美元”的公司,却是目前AI领域的创造力中心之一。它被称为”AI领域的Github”,不仅汇聚了众多开发者和产品经理在社区中研究和发布AI模型,还拥有超过5000个客户(其中3000个为付费客户)。

Hugging Face的核心是名为Transformers的自然语言处理库。其Transformers库在GitHub上拥有62000颗星和14000个分叉,显示开发者和数据科学社区对其技术的积极应用与改进。Transformers提供API,可轻松下载和训练最先进的预训练模型,降低计算成本、减少碳足迹,并节省大量训练时间。Hugging Face采用免费增值模式:客户可使用免费推理API获得基础AI推理能力,并通过社区支持;付费服务则允许客户轻松训练模型,提升推理API性能。此外,其产品还包括Datasets(多模态模型数据集)、Hub(模型和数据集托管服务)、Tokenizers(高速分词器)等。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图1

这家潜力巨大的AI开源独角兽由法国小镇出身的极客Clem Delangue创立。他在都柏林大学求学时展现的极客精神和开源精神,塑造了Hugging Face独特的社区文化和企业文化。这位非典型创业者对AI有深刻理解,也对创业、开源社区及融资有自己的见解。本文结合红杉资本对Hugging Face的深度报道,以及创投圈著名播客20VC主理人Harry Stebbings对Clem Delangue的访谈,梳理了Hugging Face从0到1的进化道路,以及Clem Delangue的创业故事。

Hugging Face的开源精神源于创始人23岁时的大学经历。当时,Clem Delangue打造了教育平台UniShared,旨在解决全球学习资源分配不公问题,向每个人提供大学教育的机会。这一创举让他登上TEDx讲台。少年时代的Delangue来自法国北部小镇La Bassée,互联网的到来打破了他的世界局限。”当我得到自己的第一台电脑时,它就像一扇窗户,让我看到了更大的世界,那种感觉真是令人震惊。”他回忆道。UniShared虽未改变世界,却种下了开源和分享的种子,并让Google向他递出橄榄枝。Delangue拒绝后,加入巴黎计算机视觉创业公司Moodstocks,接触机器学习。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图2

在巴黎的一次会议上,Delangue向Apple市场营销专家Guy Kawasaki介绍自己的应用。Kawasaki质疑机器学习能否识别所有物体。”他说的大意是,你无法创建规则来识别世界上所有的物体。”Delangue演示后,Kawasaki惊讶于应用正确识别了他的水瓶品牌并提取社交媒体评论。那一刻,Delangue意识到机器学习以新方式连接人与人的潜力。”两个从未见过面的人——一位法国极客工程师和这位美国硅谷的家伙——他们因为机器学习发现他们其实喜欢同一个饮料品牌。”Delangue说。

离开Moodstocks后,Delangue在初创公司负责产品与市场营销。2016年,他与Julien Chaumond(法国经济部门计算机工程师)重逢。两人共同参加斯坦福大学在线工程课程,组建30多人的学习小组,其中Thomas Wolf(科学训练的专利律师)加入。他们决定解决机器学习领域最棘手的问题:构建开放领域、会话式的AI聊天机器人。当时,Siri和Alexa已出现,但”它们极其无聊,只会做生产力相关的事情。我们对建立一个有趣的会话式AI感到兴奋。”Delangue说。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图3

2016年,依赖深度神经网络的NLP领域仍处萌芽阶段,他们的目标近乎科幻。聊天机器人需整合多种模型,理解情感并生成答案,而管理海量训练数据是首要挑战。正是对不可能的挑战,使Hugging Face成为全球最大的开源AI社区。从一开始,Hugging Face团队就展现出开源社区的慷慨与民主精神,Delangue赋予员工权力,让他们自主发布功能。最终,这个聊天机器人活跃在社交网络和移动APP上,用户发送了超过十亿条信息。

Hugging Face转向开源的标志性时刻是发布自定义BERT模型。当时,Google发布的BERT过于复杂,且仅支持TensorFlow。Hugging Face一周内创建PyTorch版本,并免费开源。”那是个分水岭时刻”,红杉资本投资人Pat Grady说。Delangue被问及动机时,回答得简单直接:”我们只是觉得,这是许多人会喜欢使用的东西。”

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图4

Delangue在20VC访谈中强调开源对AI的重要性:”AI的进步基于开放科学和开源。所有人都能用最新算法搭建应用,形成正反馈循环,快速推进AI发展。没有开放科学,AI进度会慢很多年。”BERT模型的成功验证了Delangue早年的信念——分享知识对每个人都有益。

Hugging Face的使命随之改变:开始分享构建聊天机器人过程中积累的机器学习知识。他们逐渐成为工程师、研究人员的首选资源。在BERT适配版开发中,Delangue团队成为Transformer模型的专家。Transformer能从未标记数据中产生优秀结果,节省大量训练时间。Hugging Face建立为开发Transformer的首选开源中心,约20万种公共模型供用户访问。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图5

Delangue意识到,理解这些工具需要社区。随着转向开源,Hugging Face正成为他希望建立的社区。红杉资本合伙人Sonya Huang说:”Delangue理解用户——他就是用户——并且他对草根社区有直觉。他以极其真实的方式培育它。”Delangue没有雇佣专职社区经理,而是亲自参与,在Twitter上发布bug修复信息,与10000多家公司解决功能问题。至今,Hugging Face160名员工都积极参与在线社区。”我们觉得如果我们开始拥有社区经理,那就是将所有成员都应负的责任外包出去。”Delangue说。

Hugging Face的庞大规模推动了其战略地位。视觉大模型Stable Diffusion选择将其模型、数据集和演示发布到Hugging Face,激发了用户引领的活动,如”一个橡皮鸭在讲台上发表演讲”和”被辐射的皮卡丘”等创意作品。2023年3月,Delangue在旧金山与Hugging Face用户举行临时聚会,超过400人使用密码ossftw(开源软件永远胜利)注册,最终约5000人(含三头羊驼)参加,现场充满狂欢派对与机器人竞赛的氛围。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图6

AI原生创业公司将颠覆旧有企业。Delangue认为,AI已从后台技术演变为更奇妙(或可怕)的存在,数百万开发者和产品经理涌入AI领域。他主张任何投资AI的人都应加入Hugging Face社区。”如果用户不理解技术如何构建,会带来很多风险和误解。”Delangue认为,对通用人工智能崛起的担忧是错位的。他同意Andrej Karpathy的观点——AI是Software 2.0,是现代世界的重大进步,但不是万能的。AI是构建所有技术的新范式,但不是新的人类形式,它将为技术创造新能力。”大多数技术公司将编写AI。”

Delangue谈通用大模型与开源小模型的适用性:”有两种AI世界观,一种是通用大模型解决所有问题,另一种是许多开源小模型解决不同问题。选择取决于使用场景。如果你是Facebook,大模型能做任何事;如果你是消费品公司,需要针对场景优化AI模型。如何选择,取决于你如何定位自己。”对于企业是直接使用大模型API还是训练开源模型,Delangue的观点是:”直接使用OpenAI的API在开始阶段更快,但长期看,创业者没有建立核心竞争力。AI公司需要像传统软件公司编写代码一样,在机器学习范式中训练或定制模型。”

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图7

这是新公司颠覆旧有企业的巨大机会:旧企业选择容易的解决方案,而其他公司选择更具颠覆性的方式。AI发展太快,现有盈利方式可能3-5年后就不适用。Hugging Face采用免费增值模式,已有3000家付费客户(包括Bloomberg、Grammarly)。Delangue认为,首要任务是建立网络效应平台,被更多人采纳。”在AI领域,你期望公司愿意为AI付费,所以如果Hugging Face继续成为公司使用的第一AI平台,我们将能获得大量收入。”对于盈利,他强调逐步解锁学习阶段,从六位数收入开始,逐步到七位数、八位数和九位数。”在AI领域,底层技术的发展速度非常快,今天赚钱的方式可能三年后就不适用了。”

**非典型创始人:投资人不该抢创业者的活**
在与20VC的访谈中,Delangue介绍了自己的融资原则:
1. 两轮融资之间,不与外部投资者交谈,专注公司发展;
2. 融资快,获得足够资金后不再接触不熟悉的新投资人;
3. 选定投资人后,共度3天深度了解和尽调,确认目标一致、期望相似,能保持良好关系。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图8

对于风险投资人,Delangue认为部分人遗忘了风险投资首先是财务帮助,却把时间花在别处,甚至像CEO一样干预公司。他主张创业者不应为投资者建立公司,投资者也不该表现得像创业者,否则可能导致公司崩溃。”与创业者相反,投资人同时管理多家公司,时间有限,对技术的理解可能过于简单化。”

他最喜欢的投资人是Richard Socher(NLP领域杰出研究者,You.com创始人)。Richard与Delangue相识很早,在科学、商业和创业方面都给予帮助。

**本文为微新创想原创,未经授权不得转载,否则微新创想将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系http://www.idea2003.com/。**

最新快讯

2025年11月23日

09:02
2025年11月23日,雷神震撼亮相ACL北区总决赛现场,正式发布首款搭载国产核心的电竞主机——黑武士・猎刃 Pro,这一里程碑事件在国产电竞新品启动仪式上隆重揭晓。作为国产化电竞硬件领域的破冰之作,黑武士・猎刃 Pro不仅彰显了雷神的技术实力,更向全球电竞爱好者展示了国产硬件的无限潜力。 黑武士・猎刃 Pro的核心配置堪称顶级,搭载了由海光自主研发的新一代...
09:02
2025年11月23日至24日,一场强劲的冷空气自西向东席卷我国大部地区,北方局部地区降温幅度惊人,超过10℃。甘肃、青海北部、内蒙古及东北地区将迎来降雪天气,为大地披上银装。与此同时,中东部其余地区则以晴朗为主,阳光明媚。然而,这并非冷空气的最后一次造访。25日至27日及29日前后,还将有两股冷空气陆续登场,导致气温频繁波动,给我国天气格局带来更多变数。此...
09:02
2025年11月18日,中国科学院大学正式发布官方通知,宣布将旗下航空宇航学院更名为星际航行学院,标志着中国航天教育体系迈入全新发展阶段。校方此举旨在强化前沿航天科技人才培养,提升国际学术影响力。11月21日,校方相关负责人向媒体明确证实更名决定属实,但出于保密考虑,尚未公布学院正式挂牌的具体时间节点。值得注意的是,截至目前,学院官方网站及相关教学资料尚未同...
08:32
2025年11月21日,中国汽车制造业迎来重大突破,上汽集团正式宣布其与清陶动力合作的全固态电池产线在上海安亭成功贯通。这一里程碑意义的进展预示着新能源汽车技术将迎来革命性变革。据悉,该产线预计在年底前完成首批样件下线,为2026年的样车测试奠定坚实基础,并计划于2027年实现"光启电池"的量产交付,正式推向市场。 该固态电池技术展现出卓越的性能指标:能量密...
07:53
2025年11月22日,峰飞航空科技震撼发布全球首款“海空一体低空经济解决方案”,这一创新举措标志着低空经济进入全新发展阶段。该方案巧妙融合零碳水上机场与eVTOL垂直起降航空器,实现了陆地与水域运输的无缝衔接,具备极强的快速部署能力,可灵活应用于江河湖海等多样化地理环境。 水上机场作为方案核心,采用纯电动驱动技术,全面集成起降平台、光伏供能系统、智能调度平...
07:53
2025年11月23日,中国汽车产业迎来重大突破,广汽集团正式宣布其自主研发的大容量全固态电池产线已成功建成并进入小批量测试生产阶段。这条产线不仅标志着中国在全球固态电池技术领域取得领先地位,更将为中国新能源汽车产业的可持续发展注入强劲动力。 该产线具备60安时以上车规级电池的量产能力,其能量密度较现有电池技术提升近一倍,达到了惊人的水平。面容量最高可达7....
07:53
2025年11月22日,视觉(中国)文化发展股份有限公司联合其他两家公司,在其官方网站联合发布了一份正式声明,就摄影师戴建峰的著作权纠纷案公开致歉。声明中明确指出,其网站平台上展示并销售的《银河下的村庄》图片,系未经授权的第三方盗图行为上传,最终经法院审理认定,该侵权行为严重侵犯了戴建峰的署名权与信息网络传播权。视觉中国方面强调,在问题曝光后已第一时间采取行...
00:09
2025年11月22日,宾利汽车以创新科技重新定义奢华体验,正式推出支持定制动画的迎宾灯光系统。这项前沿技术允许客户自由创作最长11秒的独特动画效果,为每一次出行注入个性化魅力。据悉,该技术首次亮相于在罗马尼亚雅典娜神庙举办的特别活动中,通过车门下方精密投影装置,为宾客呈现令人惊叹的光影艺术。 该系统采用尖端光学设计,集成了三色光源、五个高精度镜头、两个特殊...

2025年11月22日

23:32
微新创想11月22日讯 谷歌近日震撼发布全新Gemini3系列大模型,凭借卓越性能强势超越OpenAI,成为当前AI领域的顶尖力量,其影响力更推动谷歌股价实现历史性飞跃。Gemini 3系列的崛起,离不开谷歌自研TPU生态的强大支撑,这一技术壁垒为谷歌在AI领域的持续领先奠定了坚实基础。展望未来,若想保持Gemini 4的领先地位,谷歌必须进一步强化算力基础...
23:32
近日,航天技术领域传来重大进展,Axiom Space与KBR公司成功联手完成了一项关键性的新型舱外机动单元航天服测试。此次测试的核心目标是为NASA备受瞩目的“阿尔忒弥斯”重返月球计划提供坚实的技术支撑。整个测试过程在模拟真空环境下严谨进行,重点聚焦于航天服在极端环境下的热性能表现以及先进材料的实际应用效果。 据研究员Russell Ralston透露,本...
23:32
2025年11月25日至12月2日,《战地6》将开启为期一周的盛大免费试玩活动,为广大玩家提供深度体验的机会。本次试玩内容丰富多样,涵盖征服、突破、破坏、团队死斗以及一种神秘未公布模式,让玩家可以在“东方木林”“布莱克韦尔农场”“开罗围城”三张精心设计的地图中尽情探索。这三张地图各具特色,从紧张刺激的战场到充满策略的据点争夺,将为玩家带来全方位的游戏体验。 ...
22:58
微新创想11月22日讯 小米集团于当晚隆重举办小米17与澎湃OS3庆功盛典,以"软硬融合 共赴巅峰"为主题,向全球用户展示其创新成果。卢伟冰在社交媒体上分享的菜单细节,堪称一场精心策划的感官盛宴,从"澎湃启航"到"卓越并肩",四个篇章精心呈现了18道精致菜品及各式主食水果,每道菜名均巧妙融入"初心"、"希望"、"开拓"等关键词,将产品理念巧妙地编织在宴席的每...