掌控表情符号的人正在推动AI重写规则

**前言**:这是一档由【微新创想】与聚焦创业投资市场的品牌咨询公司【赋雅FOYA】联合出品,每周为大家带来有趣、有料的海外独角兽商业故事。作者丨适道编辑丨海腰图源丨Hugging Face官方

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图

Hugging Face是一家估值20亿美元的AI独角兽,拥有24位投资人,包括Lux Capital、红杉资本等。在大模型领域,我们已见证OpenAI获得微软的百亿美元投资,以及InflectionAI获得微软和英伟达的13亿美元融资。然而,Hugging Face这家估值”仅20亿美元”的公司,却是目前AI领域的创造力中心之一。它被称为”AI领域的Github”,不仅汇聚了众多开发者和产品经理在社区中研究和发布AI模型,还拥有超过5000个客户(其中3000个为付费客户)。

Hugging Face的核心是名为Transformers的自然语言处理库。其Transformers库在GitHub上拥有62000颗星和14000个分叉,显示开发者和数据科学社区对其技术的积极应用与改进。Transformers提供API,可轻松下载和训练最先进的预训练模型,降低计算成本、减少碳足迹,并节省大量训练时间。Hugging Face采用免费增值模式:客户可使用免费推理API获得基础AI推理能力,并通过社区支持;付费服务则允许客户轻松训练模型,提升推理API性能。此外,其产品还包括Datasets(多模态模型数据集)、Hub(模型和数据集托管服务)、Tokenizers(高速分词器)等。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图1

这家潜力巨大的AI开源独角兽由法国小镇出身的极客Clem Delangue创立。他在都柏林大学求学时展现的极客精神和开源精神,塑造了Hugging Face独特的社区文化和企业文化。这位非典型创业者对AI有深刻理解,也对创业、开源社区及融资有自己的见解。本文结合红杉资本对Hugging Face的深度报道,以及创投圈著名播客20VC主理人Harry Stebbings对Clem Delangue的访谈,梳理了Hugging Face从0到1的进化道路,以及Clem Delangue的创业故事。

Hugging Face的开源精神源于创始人23岁时的大学经历。当时,Clem Delangue打造了教育平台UniShared,旨在解决全球学习资源分配不公问题,向每个人提供大学教育的机会。这一创举让他登上TEDx讲台。少年时代的Delangue来自法国北部小镇La Bassée,互联网的到来打破了他的世界局限。”当我得到自己的第一台电脑时,它就像一扇窗户,让我看到了更大的世界,那种感觉真是令人震惊。”他回忆道。UniShared虽未改变世界,却种下了开源和分享的种子,并让Google向他递出橄榄枝。Delangue拒绝后,加入巴黎计算机视觉创业公司Moodstocks,接触机器学习。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图2

在巴黎的一次会议上,Delangue向Apple市场营销专家Guy Kawasaki介绍自己的应用。Kawasaki质疑机器学习能否识别所有物体。”他说的大意是,你无法创建规则来识别世界上所有的物体。”Delangue演示后,Kawasaki惊讶于应用正确识别了他的水瓶品牌并提取社交媒体评论。那一刻,Delangue意识到机器学习以新方式连接人与人的潜力。”两个从未见过面的人——一位法国极客工程师和这位美国硅谷的家伙——他们因为机器学习发现他们其实喜欢同一个饮料品牌。”Delangue说。

离开Moodstocks后,Delangue在初创公司负责产品与市场营销。2016年,他与Julien Chaumond(法国经济部门计算机工程师)重逢。两人共同参加斯坦福大学在线工程课程,组建30多人的学习小组,其中Thomas Wolf(科学训练的专利律师)加入。他们决定解决机器学习领域最棘手的问题:构建开放领域、会话式的AI聊天机器人。当时,Siri和Alexa已出现,但”它们极其无聊,只会做生产力相关的事情。我们对建立一个有趣的会话式AI感到兴奋。”Delangue说。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图3

2016年,依赖深度神经网络的NLP领域仍处萌芽阶段,他们的目标近乎科幻。聊天机器人需整合多种模型,理解情感并生成答案,而管理海量训练数据是首要挑战。正是对不可能的挑战,使Hugging Face成为全球最大的开源AI社区。从一开始,Hugging Face团队就展现出开源社区的慷慨与民主精神,Delangue赋予员工权力,让他们自主发布功能。最终,这个聊天机器人活跃在社交网络和移动APP上,用户发送了超过十亿条信息。

Hugging Face转向开源的标志性时刻是发布自定义BERT模型。当时,Google发布的BERT过于复杂,且仅支持TensorFlow。Hugging Face一周内创建PyTorch版本,并免费开源。”那是个分水岭时刻”,红杉资本投资人Pat Grady说。Delangue被问及动机时,回答得简单直接:”我们只是觉得,这是许多人会喜欢使用的东西。”

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图4

Delangue在20VC访谈中强调开源对AI的重要性:”AI的进步基于开放科学和开源。所有人都能用最新算法搭建应用,形成正反馈循环,快速推进AI发展。没有开放科学,AI进度会慢很多年。”BERT模型的成功验证了Delangue早年的信念——分享知识对每个人都有益。

Hugging Face的使命随之改变:开始分享构建聊天机器人过程中积累的机器学习知识。他们逐渐成为工程师、研究人员的首选资源。在BERT适配版开发中,Delangue团队成为Transformer模型的专家。Transformer能从未标记数据中产生优秀结果,节省大量训练时间。Hugging Face建立为开发Transformer的首选开源中心,约20万种公共模型供用户访问。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图5

Delangue意识到,理解这些工具需要社区。随着转向开源,Hugging Face正成为他希望建立的社区。红杉资本合伙人Sonya Huang说:”Delangue理解用户——他就是用户——并且他对草根社区有直觉。他以极其真实的方式培育它。”Delangue没有雇佣专职社区经理,而是亲自参与,在Twitter上发布bug修复信息,与10000多家公司解决功能问题。至今,Hugging Face160名员工都积极参与在线社区。”我们觉得如果我们开始拥有社区经理,那就是将所有成员都应负的责任外包出去。”Delangue说。

Hugging Face的庞大规模推动了其战略地位。视觉大模型Stable Diffusion选择将其模型、数据集和演示发布到Hugging Face,激发了用户引领的活动,如”一个橡皮鸭在讲台上发表演讲”和”被辐射的皮卡丘”等创意作品。2023年3月,Delangue在旧金山与Hugging Face用户举行临时聚会,超过400人使用密码ossftw(开源软件永远胜利)注册,最终约5000人(含三头羊驼)参加,现场充满狂欢派对与机器人竞赛的氛围。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图6

AI原生创业公司将颠覆旧有企业。Delangue认为,AI已从后台技术演变为更奇妙(或可怕)的存在,数百万开发者和产品经理涌入AI领域。他主张任何投资AI的人都应加入Hugging Face社区。”如果用户不理解技术如何构建,会带来很多风险和误解。”Delangue认为,对通用人工智能崛起的担忧是错位的。他同意Andrej Karpathy的观点——AI是Software 2.0,是现代世界的重大进步,但不是万能的。AI是构建所有技术的新范式,但不是新的人类形式,它将为技术创造新能力。”大多数技术公司将编写AI。”

Delangue谈通用大模型与开源小模型的适用性:”有两种AI世界观,一种是通用大模型解决所有问题,另一种是许多开源小模型解决不同问题。选择取决于使用场景。如果你是Facebook,大模型能做任何事;如果你是消费品公司,需要针对场景优化AI模型。如何选择,取决于你如何定位自己。”对于企业是直接使用大模型API还是训练开源模型,Delangue的观点是:”直接使用OpenAI的API在开始阶段更快,但长期看,创业者没有建立核心竞争力。AI公司需要像传统软件公司编写代码一样,在机器学习范式中训练或定制模型。”

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图7

这是新公司颠覆旧有企业的巨大机会:旧企业选择容易的解决方案,而其他公司选择更具颠覆性的方式。AI发展太快,现有盈利方式可能3-5年后就不适用。Hugging Face采用免费增值模式,已有3000家付费客户(包括Bloomberg、Grammarly)。Delangue认为,首要任务是建立网络效应平台,被更多人采纳。”在AI领域,你期望公司愿意为AI付费,所以如果Hugging Face继续成为公司使用的第一AI平台,我们将能获得大量收入。”对于盈利,他强调逐步解锁学习阶段,从六位数收入开始,逐步到七位数、八位数和九位数。”在AI领域,底层技术的发展速度非常快,今天赚钱的方式可能三年后就不适用了。”

**非典型创始人:投资人不该抢创业者的活**
在与20VC的访谈中,Delangue介绍了自己的融资原则:
1. 两轮融资之间,不与外部投资者交谈,专注公司发展;
2. 融资快,获得足够资金后不再接触不熟悉的新投资人;
3. 选定投资人后,共度3天深度了解和尽调,确认目标一致、期望相似,能保持良好关系。

红杉资本青睐Hugging Face AI开源社区如何引领创造力浪潮插图8

对于风险投资人,Delangue认为部分人遗忘了风险投资首先是财务帮助,却把时间花在别处,甚至像CEO一样干预公司。他主张创业者不应为投资者建立公司,投资者也不该表现得像创业者,否则可能导致公司崩溃。”与创业者相反,投资人同时管理多家公司,时间有限,对技术的理解可能过于简单化。”

他最喜欢的投资人是Richard Socher(NLP领域杰出研究者,You.com创始人)。Richard与Delangue相识很早,在科学、商业和创业方面都给予帮助。

**本文为微新创想原创,未经授权不得转载,否则微新创想将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系http://www.idea2003.com/。**

最新快讯

2026年02月10日

20:03
微新创想:2026年2月10日,英特尔正式发布Wi-Fi驱动更新包24.20.0 该版本驱动适配Windows 10 64位及Windows 11操作系统 对应驱动版本为24.20.0.4 此次更新标志着英特尔在无线网络技术领域迈出了重要一步 该版本首次支持BE211、BE213等新一代Wi-Fi 7网卡 同时确认Wi-Fi 7完整功能需Windows 11...
20:03
微新创想:2026年2月9日,美国加州北区法院文件显示,OpenAI因商标纠纷决定不在任何AI硬件产品中使用“io”或“IYO”名称。此举源于音频初创公司iyO发起的侵权诉讼。 公司副总裁Peter Welinder确认,首款无屏桌面AI硬件将不早于2027年2月28日面向消费者发货。目前该设备仍处原型阶段,尚未启动包装与营销材料制作。 原计划中,这款AI硬...
20:03
微新创想:2026年1月30日,摩尔线程宣布开源TileLang-MUSA项目,今日再次发布。该项目实现了对高层张量分块编程语言TileLang的完整支持,并已在MTT S5000、S4000等国产GPU平台上完成验证。TileLang采用类似Python的声明式语法,使得开发者能够以更简洁的方式表达复杂的张量操作。 微新创想:TileLang支持自动循环优...
20:03
微新创想:2026年2月3日,韩国媒体报道称Nexon已与暴雪达成合作,正式启动基于《星际争霸》IP的新游戏项目。这一消息引起了业界广泛关注,标志着Nexon在游戏开发领域迈出了重要一步。 该项目由Nexon射击事业本部主导,计划采用第一人称射击(FPS)或第三人称射击(TPS)玩法,而非传统的即时战略(RTS)模式。这一选择表明Nexon希望将《星际争霸》...
20:03
微新创想:2026年2月6日,户外品牌KOLON SPORT可隆在北京华贸购物中心正式启用品牌体验旗舰店“KOLON ATLAS可隆自然典集”。这一全新门店由品牌自主打造,致力于通过沉浸式空间展现自然探索的核心理念。店内不仅展示了可隆最新的产品系列,还融入了丰富的文化互动元素和生活方式体验,为顾客带来全方位的感官享受。 旗舰店选址于北京核心商业区,精准定位都...
20:03
微新创想:2026年2月10日,阿里云宣布通过ICANN全面技术评估,成为中国首家具备顶级域名全链路服务能力的云服务商 阿里云此次通过评估,标志着其在顶级域名服务领域达到了国际领先水平。该认证覆盖了新顶级域名申请、域名资产管理、DNS解析、安全防护以及云部署等多个关键环节,为用户提供了一站式的解决方案 此前,企业在申请地域性顶级域名时往往需要与多个机构进行协...
19:02
微新创想:2026年2月10日,国际DRAM现货市场整体持稳,DDR5部分颗粒结束连续数日小幅下跌,出现温和反弹。市场情绪有所回暖,显示出一定的复苏迹象。 DDR5 16Gb(2Gx8)4800/5600规格颗粒价格上涨0.41%,均价达到38美元。这一涨幅虽然不大,但标志着市场开始对近期的供需变化做出反应。 同容量的eTT版本颗粒也出现了上涨,涨幅为0.5...
19:02
微新创想:2026年2月10日,制造商Musnap在海外正式推出Ocean C彩色墨水屏电纸书。这款设备采用了7英寸的Kaleido 3面板,具备300PPI的黑白显示和150PPI的彩色显示,为用户带来更清晰细腻的阅读体验。其硬件配置也相当扎实,搭载了8核处理器、4GB RAM以及64GB存储空间,能够流畅运行安卓14系统。 微新创想:Ocean C不仅在...
19:02
微新创想:2026年2月10日,四川资阳乐至县太平2号特大桥现场传来喜讯,中铁十九局成功完成最后一孔箱梁的架设工作,标志着成渝中线高铁四川段桥梁工程全面竣工。这一重要节点的达成,不仅为后续的铺轨作业和联调联试提供了坚实基础,也意味着整个项目正式迈入全面冲刺阶段。 此次桥梁工程由长江沿岸铁路集团四川有限公司负责建设管理,覆盖四川境内的全线桥梁结构。作为成渝中线...
19:02
微新创想:2026年2月10日,上海召开年度市重大工程建设工作会议。全市共安排重大工程正式项目184项、预备项目14项,计划新开工16项、基本建成22项,年度投资2550亿元,创历史新高。此次会议标志着上海在推动城市高质量发展方面迈出了坚实一步。 微新创想:项目聚焦“五个中心”建设,涵盖科技创新、产业升级、基础设施完善、文化教育提升、医疗卫生优化、生态环境改...
19:02
微新创想:2026年2月10日 大位科技发布异动公告回应市场误读 大位科技(600589.SH)在2026年2月10日发布公告 明确回应市场对其算力租赁概念的误解 公司股票在2026年2月6日、9日、10日连续三日涨幅偏离值超过20% 引起投资者广泛关注 面对市场对算力租赁业务的猜测 公司在公告中强调其相关业务收入占比并不高 2024年前三季度 大位科技的算...
19:02
微新创想:2026年2月10日,由世茂集团商业地产商娱公司与章丘控股集团联合打造的章丘世茂广场在济南市章丘区东部核心板块正式开业。项目总建筑面积约14万平方米,定位为区域旗舰级城市综合体,涵盖商业零售、休闲娱乐、餐饮及服务等多种业态。选址依托高阶居住人群集聚区,旨在提升东部片区商业能级与消费体验。该项目是目前章丘规模最大的城市综合体,标志着区域商业升级迈出关...