编者按:本文来自微信公众号适道(ID:survivalbiz),作者白石,微新创想经授权转载。导读:1. 20岁少年参与开创生成式AI时代的重要论文2. 喜欢玩技术的华人创业者与天才少年联合创立Cohere3. AI会带来哪些风险,它未来最大的机会是什么?基础大模型领域的全球竞争如火如荼,融资百亿美元的OpenAI无疑是领跑者,其杀手级应用ChatGPT拥有数亿活跃用户,想要与之正面竞争无疑充满挑战。然而,一家估值20亿美元的AI独角兽在基础大模型的竞争中找到了差异化路线,成为大模型创业混战中的一股清流。这家独角兽就是Cohere,它由开创性论文《Attention is All You Need》最年轻的作者Aidan Gomez与他的两位多伦多大学校友Ivan Zhang和Nick Frosst联合创立。Cohere近期获得了2.7亿美元的C轮融资,累计融资额超过4.3亿美元,估值超过21亿美元。投资者名单中包括Salesforce、NVIDIA、Oracle等企业巨头,Tiger Global和Index Ventures等顶级投资机构,以及Geoffrey Hinton(深度学习三巨头,图灵奖获得者)、李飞飞等知名AI大牛。合作者还包括Amazon、麦肯锡等。为何说Cohere是大模型创业混战中的一股清流?在产品上,它专注于服务企业级客户,以强大的大模型Command为基础,提供企业级别的文字处理、知识问答等功能,并且模型可微调、可定制。此外,它还推出了企业级的知识助手Coral。在安全性上,为了打消企业客户的疑虑,它的产品可以多云和本地部署,并且拥有高度的数据隐私性。在融资策略上,它更倾向于拿与自己产业链相关的大企业的钱,借助巨头的力量发展自己,但是却不与巨头绑定(参考OpenAI与微软的关系)。作为知名AI独角兽,Cohere的产品和企业竞争优势已经被研究透彻,我们尝试从创业者角度切入,以Cohere的两位创始人Aidan Gomez与Ivan Zhang的多个访谈为材料,整理出Cohere从0到1的发展历程,以及Aidan与Ivan两位创业者对企业与AI的诸多真知灼见。注:本文材料来源于Cohere的投资人、Madrona合伙人Jon Turow,Weights&Bias的创始人Lukas Biewald,知名媒体人Steven Marsh与Cohere的两位联合创始人Aidan Gomez及Ivan Zhang的对谈。

1、20岁的少年参与了开创生成式AI时代的重要论文
Aidan Gomez是大语言模型领域开创性论文《Attention is All You Need》最年轻的作者。当时他从多伦多大学去Google Brain实习,还是大约19或20岁的本科生,这是他在美国科技界的第一次经历。Aidan Gomez在多伦多大学他在谷歌的实习导师是Lukasz Kaiser,也是《Attention is All You Need》的主要作者之一。当时他们一起打造了一个训练大型神经网络的软件平台Tensor,同时他们也在训练一个AI模型。他们的想法是,训练一个能从数据集中学会做许多事情的巨大AI模型,训练它要用到多种模态的数据集,包括图片、文本、甚至视频。当时Aidan和Noam Shazeer(也是Transformer的论文作者)是“同桌”,Noam也在研究大语言模型,只是他研究的算法是RNN(循环神经网络)。Noam的目标是找到一种比RNN更简单、更精炼、更具可扩展性的新架构。于是Lukasz、Aidan与Noam一拍即合,打算一起做这项研究,这时他们又发现Google Brain的translate组的Niki Parmar, Jakob Uszkoreit, Ashish Vaswani与自己有相近的想法,两个小组合并后,大家齐心协力地研究,最后那篇《Attention is All You Need》就诞生了。论文的投稿是在一个凌晨,当时办公室只有Aidan和Ashish两个人。稿子投出去后,他们就沉浸在了兴奋中。Ashish已经预见到这篇论文可能产生巨大的影响,而年轻的Aidan还是第一次投稿重要论文,还不知道这篇论文的重要性。就像他接受纽约客专栏作家Steven Marsh访谈时说的那样:“我不认为任何人预见到了它在未来会变成什么样。”而他真正对Transformer模型的实际影响感到震撼,是在实习结束回到多伦多大学以后。“当时,我在多伦多大学进行夏季研究,然后收到了Lukasz的邮件,主题是《看看这个》。邮件内容是一个关于日本朋克摇滚乐队的故事,故事记载了他们怎么组队,怎么发专辑,然后又遗憾解散的过程。在邮件的最后,Lukasz写道:‘我输入的唯一的词是transformer,模型自动生成了故事。’看了这篇机器生成的文本,我觉得这会掀起一场产品革命。因为这是第一次,一个非人类的系统以一种像我们人类一样引人入胜的方式使用语言。” Aidan对Steven Marsh说。

大模型的进化树当《Attention is All You Need》和Transformer诞生之后,这个创新的模型迅速被AI社区采纳,成为了新的技术标准。它在AI研究者中间掀起了热潮,不断有基于Transformer的强大模型出现,例如BERT,例如GPT。而在2022年底,ChatGPT正式打开了生成式AI的热潮。

2、喜欢玩技术的华人创业者与天才少年联合创立Cohere
Cohere的联合创始人Ivan Zhang是一个非典型AI研究者,但却是一个典型的创业者。他与Aidan是多伦多大学的校友,后来辍学与Aidan一起创业。“我是一个创造者,我不太喜欢坐在教室里单纯地吸收大量信息,我需要亲自动手,边‘玩技术’边学习,这是我最好的学习方式。” 他这么向Cohere的投资人Jon Turow介绍自己。Cohere的联合创始人Ivan Zhang从研究者到创业者,从ToC转型ToB2017年,从多伦多大学辍学后,Ivan在一家创业公司做后端工程师,他正是在这时认识了Aidan Gomez。当时Aidan想做一个独立的AI研究小组,进行兴趣主导的AI研究,验证自己的创新想法,于是他们一起做了FOR.ai 。现在这个组织仍在运行,叫做Cohere For AI,由多位AI领域的研究科学家组成,主要做AI的基础研究。2019年,Ivan向Aidan提议:“我们为什么不一起做一些新东西?”,于是他们从FOR.ai独立出来,开始进行更正式的创业。在这个阶段,他们已经有了创业经验,懂得一个组织正确的运行方式,也认识了不少AI领域的创始人。在Cohere的创业初期,他们的第一个想法是打造一个AI基础平台,让开发者上传AI模型,然后平台会压缩模型的尺寸,使模型更高效。但是在那个时间点,生成式AI的热潮并没有到来,这个市场还太小。作为论文作者的Aidan观察到Transformer模型在AI社区内的蓬勃发展,看到它解决了各种各样和文本处理相关的问题,看到了开发者们对这个架构的改进。正好那时OpenAI的GPT-2发布,Transformer模型的参数突破10亿,这也让Aidan进一步意识到了模型规模的重要性,以及这个模型架构真正的潜力。于是,几位创始人将Cohere的方向从一个模型压缩平台,往基础大模型及服务转型。“当体验了GPT-2后,我们发现它很酷,但是我们还不确定可以用GPT这类的AI基础模型搭建什么服务。我们先尝试做了Cohere的第一个项目,它是一个文本自动完成工具,形式是Chrome浏览器的扩展。用户只要在文本框中输入一段文字,它可以自动续写完成。我们最初打算利用广告来赚钱。(注:这是一个ToC的商业模式)。但是我们显然低估了打造消费者产品的难度,这个产品的体验并不好,也没有获得很多用户,我们明白自己在这个方向没有竞争优势。于是我们决定拆除前端的界面,只提供后端的模型的能力,从ToC转向ToB,做企业级的API服务。当时,99%的NLP用例需要单词嵌入,也需要对模型进行微调,所以我们在几个月内,打造了一个带有AI生成能力,并可以对模型进行嵌入和微调的API平台。” Ivan向Jon Turow分享Cohere转型背后的思考。对于Cohere为什么转向ToB,以及公司使命的内核,Aidan Gomez进行了清晰的表述:“我们就是想让AI大模型被更多人使用。当时,开发者和企业想要利用AI大模型的能力,无论是技术还是算力上都面临很多阻碍。我们存在的意义就是消除人们使用AI大模型的障碍,让不熟悉AI的开发者,以及普通的企业,都能方便地使用AI的能力。因为生成式AI特有的对话式互动对于终端用户来说是最好的体验。以我自己为例,当我想开一个银行账户时,如果一家银行能有一个24小时与我对话互动、并且高效解决问题的移动App,那会对我吸引力大增。Cohere就是要做到这一点,帮助所有类型的企业和组织用上生成式AI的力量,增强他们的竞争优势。 Cohere允许企业客户用自己的数据微调模型企业在采用AI能力时,还会对两个问题产生疑问,就是模型的托管和数据的隐私。我们是支持多云托管的,企业可以选择适合自己的云服务,也可以在本地的服务器中部署。我们也十分重视数据隐私,当企业用自己的数据进行模型微调时,无论是部署在云中,还是部署在本地服务器,我们都不会看到他们的数据,这是我们的一个核心特性。”

不拘一格的人才策略,塑造了Cohere的高创造力
Cohere能够在早期迅速转向,找到自己正确的位置,离不开Ivan和Aidan从FOR.ai 开始积累的人才观和创业哲学。Ivan在与Jon Turow对谈时分享了他们的人才招聘哲学和创业文化:“我们的招聘方式与众不同。在FOR.ai创业的时候,我们就确立了一个原则:我们寻找的是来自不同背景,但是对AI非常感兴趣并希望产生巨大影响的人。你不需要具有在Meta AI,DeepMind或Google工作过的完美背景,但是一定要对自己专注的领域有非常高的兴趣和热情。而且你不光会写论文,还要有实际动手的能力。我们把这种招聘方式带到了Cohere,构建了非常强大的早期团队。在公司文化上,我们喜欢在技术方面进行很多探索,‘玩技术’,然后获得突破。虽然我们都会写论文,但不是‘书呆子’,我们对自己应该要做什么非常清楚,而且会花很多的时间在工程实践而不仅是算法探索上,这让我们打造的产品能够真正为人们带来价值。”

现在OpenAI占据了生成式AI的C位,那么已经拥有数亿活跃用户的ChatGPT,会不会帮助OpenAI进行垄断,其他的公司是否还有机会?Aidan Gomez有自己的看法:“我绝不认为大模型领域会形成垄断。我认为每个公司都有自己的风格、方向和自己的优势,在市场上都会找到自己的位置。消费者和企业客户会选择他们认为最好的伙伴,最值得信任的公司,以及最能帮他们成功的平台。对于Cohere这样的基础模型公司,我们面对的最终状态,很可能不是赢家通吃,而是一个多元化的市场格局。我们会有凭借自己的优势去赢得自己比赛的胜利。我们会用各种方法帮助客户,让他们用上最好的AI能力。我们的焦点是让AI模型通过提示,微调在内的各种方法,帮助特定客户,获得最大的价值。”

3、AI会带来哪些风险,它未来最大的机会是什么?
生成式AI的爆发,在受到欢迎的同时,也引发了不少担忧。在公众层面,人们担忧AI是否会发展太快,能力太强,从而“抢夺”人类的工作机会;在现实的使用层面,则有不少人担忧AI模型的安全性和可控性。对此话题,Aidan Gomez和Ivan Zhang也发表了自己的看法。

AI可能“污染”社交媒体
Aidan Gomez的观点更偏向社会性,他表示,AI生成的内容对社交媒体的“污染”值得担忧:“与其担忧非人类智慧代替人类这类可能还有很多年才会发生的事,我们更应该关注当前的现实风险。例如,非常有可能有AI生成数百万个机器人,无缝地进入我们的社交媒体和公共对话,然后推动某一个观点(无论这个观点是有益的,还是有害的)。这可能会在一些能对社会产生重大影响的公共议题上产生无法预料的影响。所以我们必须权衡这个事情的风险,最好有具体的政策来减轻这种风险。例如,人们有权知道,我们正在阅读的媒体内容或者营销内容,到底是人类创作的还是机器合成的。”

而Ivan Zhang的观点则相对现实,他认为AI面临两大挑战:“对于AI面临的挑战,我们从客户中获取的信息首先是怎么评估生成式AI模型的能力。要准确地比较两个AI模型的能力并不容易,而且在文本生成方面,这种比较很可能是主观的。这对生成式AI在商业方面的采用会产生一定的阻碍。另一个挑战就是数据隐私问题,在使用开源或闭源的大模型进行商用时,你有时候会使用一些敏感的数据,这又会产生合规的问题。比如用AI辅助你写作一封敏感的电子邮件时,你是不是会担心自己输进模型的敏感数据被滥用?当然,这种担心成为了我们的机会,我们正在与Oracle合作解决这个问题。”

具身智能未来是AI的大机会
Aidan Gomez和Ivan Zhang既是AI专家,也是企业家,对于AI在未来有哪些新的方向和机会,他们的观点也值得关注。首先,他们在不同的场合都提到了同一个技术,那就是具身智能,也就是将生成式AI的能力注入到有形的机器中。Aidan这么对Lukas Biewald表述:“我认为将生成式AI用到机器人技术和实体化方面真的太酷了,而且这个方向有非常强烈的需求。我们都想象过机器人具有高智能和灵活的身体会怎么样——它一定会产生巨大的变革。但是这个方向确实还有很长的路要走,我也希望自己在这个方向产生影响,并试着去做一些相关的事情。”

Ivan也认为具身智能绝对是AI下一阶段的大机会:“我认为最大的机会是能影响实体的‘行动模型’,将AI与工程及实体的产品结合起来,将会非常令人兴奋,也一定会有不少企业对它们感兴趣。但是,这项技术要走向实体化,模型的准确性还需要进一步的提高。”

此外,Aidan也对AI的智能发展和未来应用做了更长远的想象:“现在AI模型的构建依赖于人类,为了让AI更加智能,我们会用人类的各种高阶知识来训练它。打个比方,就像让一个非常聪明的人,去教一个还不那么聪明的AI。那么未来如果AI模型变得非常聪明,人类的知识已经被他全部学会了,就会面临一个临界点——人类已经没什么能教给AI了。我最感兴趣的是,如果AI突破了这个临界点,会发生什么?如果一群已经学完了人类已有知识的AI在一起交谈、探索、学习,会不会产生新的知识?也许当这个时候来临,我们人类会向AI学习新知识,AI会带着人类一起在新的知识海洋里遨游。”

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年02月13日

16:44
微新创想:2月13日,神州租车与华夏金融租赁有限公司在京签署《自动驾驶车辆融资租赁专项合作协议》。此次合作标志着双方在智能出行领域的深入探索迈出了重要一步。 双方将在北京启动自动驾驶车队的商业化租赁与运营合作。这一举措不仅为自动驾驶技术的应用提供了新的商业模式,也为未来智能交通的发展奠定了坚实基础。 此次合作是华夏金租在自动驾驶领域的首单业务投放。通过这一项...
16:44
微新创想:2026年2月,深圳墨思维尔科技有限公司宣布完成天使轮融资,投资方为深创投与力合科创。此次融资标志着公司在AR光波导显示技术领域迈出了重要一步。 该公司专注于AR光波导显示技术的研发,致力于解决传统技术中存在的色散严重、视场角窄及多层堆叠等问题。通过持续的技术攻关,墨思维尔成功研发出全球首款单层全彩消色差超表面光波导系统,实现了在显示效果和用户体验...
16:44
微新创想:2026年2月,北京爱沃新能源科技有限公司宣布获得物美通达战略投资。此次投资标志着公司在新能源材料领域迈出了重要一步,也为其未来的发展提供了强有力的支持。 该公司专注新一代锂离子电池正极材料的研发与产业化,致力于解决当前电池技术中的关键问题。其研究方向主要集中在高容量、高电压、高安全性和长寿命等核心性能提升上,力求为市场提供更优质的电池材料解决方案...
16:44
微新创想:2024年9月,京东健康启动“过期药回收”公益项目,搭建线上回收平台,解决家庭过期药品处置难题。该项目旨在帮助消费者妥善处理家中过期药品,避免其对环境和人体健康造成潜在危害。通过便捷的线上预约服务,用户可以轻松提交过期药品回收申请,平台随后安排专业人员上门取件,确保药品回收过程的安全与高效。 微新创想:截至2025年,项目已覆盖全国315个城市,吸...
16:44
微新创想:2026年2月12日 联想ThinkBook产品经理在社交平台晒出三星电子新款LPCAMM2内存条实物 这款内存条容量达到96GB 传输速率为9600MT/s 是目前消费级市场中规格最高的产品之一 然而目前该产品尚未进入量产阶段 业内人士分析其主要原因在于配套技术尚未完全成熟 英特尔官方目前仅支持LPCAMM2最高7467MT/s 与三星的9600...
16:44
微新创想:2026年2月13日北京时间0时45分,欧洲阿丽亚娜空间公司在法属圭亚那库鲁航天中心,使用新型阿丽亚娜64火箭成功将32颗亚马逊Leo卫星送入预定轨道 本次发射标志着该型号火箭首次执行任务,总载荷约20吨,接近其21.6吨的最大运力。火箭配备四枚P120C固体助推器,整体高度达到62米,整流罩长度为20米,展现出强大的运载能力和技术实力 升空后11...
16:44
微新创想:2026年2月13日 中信证券发布研报 给予美国光通信企业Lumentum“买入”评级 目标股价620美元 该评级基于公司在高速光模块 激光器及3D传感领域的技术领先性 AI驱动的光通信需求增长 以及其在北美云服务商供应链中的核心地位 研报指出 Lumentum受益于800G/1.6T光模块升级周期及CPO(共封装光学)技术演进 预计未来两年营收与...
16:44
微新创想:2026年2月13日,瑞银发布报告指出,AI正对各行业构成颠覆性变革,但市场尚未充分评估其系统性风险 报告分析称,近期‘软件末日论’引发的信贷抛售,凸显投资者对AI加速渗透非软件领域(如金融、制造、服务等)的担忧 尤其在美国低质量信贷市场,AI驱动的效率提升与岗位替代可能加剧信用风险 相比之下,投资级债券因发行人资产负债表稳健、评级稳定,预计表现相...
16:44
微新创想:2026年2月13日,市场监管总局发布《互联网平台反垄断合规指引》。该指引面向平台经营者,旨在防范垄断风险、促进平台经济健康发展。 文件明确平台须遵循针对性、全面性、穿透性和持续性原则,落实反垄断主体责任。重点划出四类违法类型及八大高风险场景,包括算法共谋、“二选一”、封禁屏蔽、不公平高价等。 其中“二选一”被明确认定存在排除限制竞争风险。指引将《...
16:44
微新创想:科乐美在索尼State of Play发布会上宣布《合金装备:大师合集 Vol.2》将于2026年8月27日登陆PS5、Xbox Series X|S、Switch及Switch 2平台,同时还将支持PC端。这一消息引起了众多玩家的广泛关注,尤其是对于《合金装备》系列的忠实粉丝而言,无疑是一个重磅的发布。 此次合集包含《合金装备4:爱国者之枪》《和...
16:44
微新创想:2026年2月12日,Embracer Group公布2025/26财年第三季度财报,确认《天国:拯救2》自2025年2月4日发售以来首年销量突破500万份。这款游戏以历史题材为背景,是一款第一人称开放世界动作角色扮演游戏,由Warhorse Studios开发。游戏自发布以来受到了玩家的广泛关注,凭借其独特的叙事风格和丰富的游戏内容,迅速在市场中...
16:44
微新创想:2026年2月,海南自贸港高新技术企业域尊国际完成A轮融资,金额达2.8亿元人民币。此次融资由多家知名投资机构联合领投,标志着公司在生物科技领域获得了重要认可。 公司成立于近年来,总部设立于海南,专注于生物医药、基因编辑及细胞治疗等前沿科技领域。凭借对行业趋势的精准把握,域尊国际迅速在生物科技服务市场中占据了一席之地。 域尊国际致力于为客户提供从研...