编者按:本文来自微信公众号适道(ID:survivalbiz),作者白石,微新创想经授权转载。导读:1. 20岁少年参与开创生成式AI时代的重要论文2. 喜欢玩技术的华人创业者与天才少年联合创立Cohere3. AI会带来哪些风险,它未来最大的机会是什么?基础大模型领域的全球竞争如火如荼,融资百亿美元的OpenAI无疑是领跑者,其杀手级应用ChatGPT拥有数亿活跃用户,想要与之正面竞争无疑充满挑战。然而,一家估值20亿美元的AI独角兽在基础大模型的竞争中找到了差异化路线,成为大模型创业混战中的一股清流。这家独角兽就是Cohere,它由开创性论文《Attention is All You Need》最年轻的作者Aidan Gomez与他的两位多伦多大学校友Ivan Zhang和Nick Frosst联合创立。Cohere近期获得了2.7亿美元的C轮融资,累计融资额超过4.3亿美元,估值超过21亿美元。投资者名单中包括Salesforce、NVIDIA、Oracle等企业巨头,Tiger Global和Index Ventures等顶级投资机构,以及Geoffrey Hinton(深度学习三巨头,图灵奖获得者)、李飞飞等知名AI大牛。合作者还包括Amazon、麦肯锡等。为何说Cohere是大模型创业混战中的一股清流?在产品上,它专注于服务企业级客户,以强大的大模型Command为基础,提供企业级别的文字处理、知识问答等功能,并且模型可微调、可定制。此外,它还推出了企业级的知识助手Coral。在安全性上,为了打消企业客户的疑虑,它的产品可以多云和本地部署,并且拥有高度的数据隐私性。在融资策略上,它更倾向于拿与自己产业链相关的大企业的钱,借助巨头的力量发展自己,但是却不与巨头绑定(参考OpenAI与微软的关系)。作为知名AI独角兽,Cohere的产品和企业竞争优势已经被研究透彻,我们尝试从创业者角度切入,以Cohere的两位创始人Aidan Gomez与Ivan Zhang的多个访谈为材料,整理出Cohere从0到1的发展历程,以及Aidan与Ivan两位创业者对企业与AI的诸多真知灼见。注:本文材料来源于Cohere的投资人、Madrona合伙人Jon Turow,Weights&Bias的创始人Lukas Biewald,知名媒体人Steven Marsh与Cohere的两位联合创始人Aidan Gomez及Ivan Zhang的对谈。

1、20岁的少年参与了开创生成式AI时代的重要论文
Aidan Gomez是大语言模型领域开创性论文《Attention is All You Need》最年轻的作者。当时他从多伦多大学去Google Brain实习,还是大约19或20岁的本科生,这是他在美国科技界的第一次经历。Aidan Gomez在多伦多大学他在谷歌的实习导师是Lukasz Kaiser,也是《Attention is All You Need》的主要作者之一。当时他们一起打造了一个训练大型神经网络的软件平台Tensor,同时他们也在训练一个AI模型。他们的想法是,训练一个能从数据集中学会做许多事情的巨大AI模型,训练它要用到多种模态的数据集,包括图片、文本、甚至视频。当时Aidan和Noam Shazeer(也是Transformer的论文作者)是“同桌”,Noam也在研究大语言模型,只是他研究的算法是RNN(循环神经网络)。Noam的目标是找到一种比RNN更简单、更精炼、更具可扩展性的新架构。于是Lukasz、Aidan与Noam一拍即合,打算一起做这项研究,这时他们又发现Google Brain的translate组的Niki Parmar, Jakob Uszkoreit, Ashish Vaswani与自己有相近的想法,两个小组合并后,大家齐心协力地研究,最后那篇《Attention is All You Need》就诞生了。论文的投稿是在一个凌晨,当时办公室只有Aidan和Ashish两个人。稿子投出去后,他们就沉浸在了兴奋中。Ashish已经预见到这篇论文可能产生巨大的影响,而年轻的Aidan还是第一次投稿重要论文,还不知道这篇论文的重要性。就像他接受纽约客专栏作家Steven Marsh访谈时说的那样:“我不认为任何人预见到了它在未来会变成什么样。”而他真正对Transformer模型的实际影响感到震撼,是在实习结束回到多伦多大学以后。“当时,我在多伦多大学进行夏季研究,然后收到了Lukasz的邮件,主题是《看看这个》。邮件内容是一个关于日本朋克摇滚乐队的故事,故事记载了他们怎么组队,怎么发专辑,然后又遗憾解散的过程。在邮件的最后,Lukasz写道:‘我输入的唯一的词是transformer,模型自动生成了故事。’看了这篇机器生成的文本,我觉得这会掀起一场产品革命。因为这是第一次,一个非人类的系统以一种像我们人类一样引人入胜的方式使用语言。” Aidan对Steven Marsh说。

大模型的进化树当《Attention is All You Need》和Transformer诞生之后,这个创新的模型迅速被AI社区采纳,成为了新的技术标准。它在AI研究者中间掀起了热潮,不断有基于Transformer的强大模型出现,例如BERT,例如GPT。而在2022年底,ChatGPT正式打开了生成式AI的热潮。

2、喜欢玩技术的华人创业者与天才少年联合创立Cohere
Cohere的联合创始人Ivan Zhang是一个非典型AI研究者,但却是一个典型的创业者。他与Aidan是多伦多大学的校友,后来辍学与Aidan一起创业。“我是一个创造者,我不太喜欢坐在教室里单纯地吸收大量信息,我需要亲自动手,边‘玩技术’边学习,这是我最好的学习方式。” 他这么向Cohere的投资人Jon Turow介绍自己。Cohere的联合创始人Ivan Zhang从研究者到创业者,从ToC转型ToB2017年,从多伦多大学辍学后,Ivan在一家创业公司做后端工程师,他正是在这时认识了Aidan Gomez。当时Aidan想做一个独立的AI研究小组,进行兴趣主导的AI研究,验证自己的创新想法,于是他们一起做了FOR.ai 。现在这个组织仍在运行,叫做Cohere For AI,由多位AI领域的研究科学家组成,主要做AI的基础研究。2019年,Ivan向Aidan提议:“我们为什么不一起做一些新东西?”,于是他们从FOR.ai独立出来,开始进行更正式的创业。在这个阶段,他们已经有了创业经验,懂得一个组织正确的运行方式,也认识了不少AI领域的创始人。在Cohere的创业初期,他们的第一个想法是打造一个AI基础平台,让开发者上传AI模型,然后平台会压缩模型的尺寸,使模型更高效。但是在那个时间点,生成式AI的热潮并没有到来,这个市场还太小。作为论文作者的Aidan观察到Transformer模型在AI社区内的蓬勃发展,看到它解决了各种各样和文本处理相关的问题,看到了开发者们对这个架构的改进。正好那时OpenAI的GPT-2发布,Transformer模型的参数突破10亿,这也让Aidan进一步意识到了模型规模的重要性,以及这个模型架构真正的潜力。于是,几位创始人将Cohere的方向从一个模型压缩平台,往基础大模型及服务转型。“当体验了GPT-2后,我们发现它很酷,但是我们还不确定可以用GPT这类的AI基础模型搭建什么服务。我们先尝试做了Cohere的第一个项目,它是一个文本自动完成工具,形式是Chrome浏览器的扩展。用户只要在文本框中输入一段文字,它可以自动续写完成。我们最初打算利用广告来赚钱。(注:这是一个ToC的商业模式)。但是我们显然低估了打造消费者产品的难度,这个产品的体验并不好,也没有获得很多用户,我们明白自己在这个方向没有竞争优势。于是我们决定拆除前端的界面,只提供后端的模型的能力,从ToC转向ToB,做企业级的API服务。当时,99%的NLP用例需要单词嵌入,也需要对模型进行微调,所以我们在几个月内,打造了一个带有AI生成能力,并可以对模型进行嵌入和微调的API平台。” Ivan向Jon Turow分享Cohere转型背后的思考。对于Cohere为什么转向ToB,以及公司使命的内核,Aidan Gomez进行了清晰的表述:“我们就是想让AI大模型被更多人使用。当时,开发者和企业想要利用AI大模型的能力,无论是技术还是算力上都面临很多阻碍。我们存在的意义就是消除人们使用AI大模型的障碍,让不熟悉AI的开发者,以及普通的企业,都能方便地使用AI的能力。因为生成式AI特有的对话式互动对于终端用户来说是最好的体验。以我自己为例,当我想开一个银行账户时,如果一家银行能有一个24小时与我对话互动、并且高效解决问题的移动App,那会对我吸引力大增。Cohere就是要做到这一点,帮助所有类型的企业和组织用上生成式AI的力量,增强他们的竞争优势。 Cohere允许企业客户用自己的数据微调模型企业在采用AI能力时,还会对两个问题产生疑问,就是模型的托管和数据的隐私。我们是支持多云托管的,企业可以选择适合自己的云服务,也可以在本地的服务器中部署。我们也十分重视数据隐私,当企业用自己的数据进行模型微调时,无论是部署在云中,还是部署在本地服务器,我们都不会看到他们的数据,这是我们的一个核心特性。”

不拘一格的人才策略,塑造了Cohere的高创造力
Cohere能够在早期迅速转向,找到自己正确的位置,离不开Ivan和Aidan从FOR.ai 开始积累的人才观和创业哲学。Ivan在与Jon Turow对谈时分享了他们的人才招聘哲学和创业文化:“我们的招聘方式与众不同。在FOR.ai创业的时候,我们就确立了一个原则:我们寻找的是来自不同背景,但是对AI非常感兴趣并希望产生巨大影响的人。你不需要具有在Meta AI,DeepMind或Google工作过的完美背景,但是一定要对自己专注的领域有非常高的兴趣和热情。而且你不光会写论文,还要有实际动手的能力。我们把这种招聘方式带到了Cohere,构建了非常强大的早期团队。在公司文化上,我们喜欢在技术方面进行很多探索,‘玩技术’,然后获得突破。虽然我们都会写论文,但不是‘书呆子’,我们对自己应该要做什么非常清楚,而且会花很多的时间在工程实践而不仅是算法探索上,这让我们打造的产品能够真正为人们带来价值。”

现在OpenAI占据了生成式AI的C位,那么已经拥有数亿活跃用户的ChatGPT,会不会帮助OpenAI进行垄断,其他的公司是否还有机会?Aidan Gomez有自己的看法:“我绝不认为大模型领域会形成垄断。我认为每个公司都有自己的风格、方向和自己的优势,在市场上都会找到自己的位置。消费者和企业客户会选择他们认为最好的伙伴,最值得信任的公司,以及最能帮他们成功的平台。对于Cohere这样的基础模型公司,我们面对的最终状态,很可能不是赢家通吃,而是一个多元化的市场格局。我们会有凭借自己的优势去赢得自己比赛的胜利。我们会用各种方法帮助客户,让他们用上最好的AI能力。我们的焦点是让AI模型通过提示,微调在内的各种方法,帮助特定客户,获得最大的价值。”

3、AI会带来哪些风险,它未来最大的机会是什么?
生成式AI的爆发,在受到欢迎的同时,也引发了不少担忧。在公众层面,人们担忧AI是否会发展太快,能力太强,从而“抢夺”人类的工作机会;在现实的使用层面,则有不少人担忧AI模型的安全性和可控性。对此话题,Aidan Gomez和Ivan Zhang也发表了自己的看法。

AI可能“污染”社交媒体
Aidan Gomez的观点更偏向社会性,他表示,AI生成的内容对社交媒体的“污染”值得担忧:“与其担忧非人类智慧代替人类这类可能还有很多年才会发生的事,我们更应该关注当前的现实风险。例如,非常有可能有AI生成数百万个机器人,无缝地进入我们的社交媒体和公共对话,然后推动某一个观点(无论这个观点是有益的,还是有害的)。这可能会在一些能对社会产生重大影响的公共议题上产生无法预料的影响。所以我们必须权衡这个事情的风险,最好有具体的政策来减轻这种风险。例如,人们有权知道,我们正在阅读的媒体内容或者营销内容,到底是人类创作的还是机器合成的。”

而Ivan Zhang的观点则相对现实,他认为AI面临两大挑战:“对于AI面临的挑战,我们从客户中获取的信息首先是怎么评估生成式AI模型的能力。要准确地比较两个AI模型的能力并不容易,而且在文本生成方面,这种比较很可能是主观的。这对生成式AI在商业方面的采用会产生一定的阻碍。另一个挑战就是数据隐私问题,在使用开源或闭源的大模型进行商用时,你有时候会使用一些敏感的数据,这又会产生合规的问题。比如用AI辅助你写作一封敏感的电子邮件时,你是不是会担心自己输进模型的敏感数据被滥用?当然,这种担心成为了我们的机会,我们正在与Oracle合作解决这个问题。”

具身智能未来是AI的大机会
Aidan Gomez和Ivan Zhang既是AI专家,也是企业家,对于AI在未来有哪些新的方向和机会,他们的观点也值得关注。首先,他们在不同的场合都提到了同一个技术,那就是具身智能,也就是将生成式AI的能力注入到有形的机器中。Aidan这么对Lukas Biewald表述:“我认为将生成式AI用到机器人技术和实体化方面真的太酷了,而且这个方向有非常强烈的需求。我们都想象过机器人具有高智能和灵活的身体会怎么样——它一定会产生巨大的变革。但是这个方向确实还有很长的路要走,我也希望自己在这个方向产生影响,并试着去做一些相关的事情。”

Ivan也认为具身智能绝对是AI下一阶段的大机会:“我认为最大的机会是能影响实体的‘行动模型’,将AI与工程及实体的产品结合起来,将会非常令人兴奋,也一定会有不少企业对它们感兴趣。但是,这项技术要走向实体化,模型的准确性还需要进一步的提高。”

此外,Aidan也对AI的智能发展和未来应用做了更长远的想象:“现在AI模型的构建依赖于人类,为了让AI更加智能,我们会用人类的各种高阶知识来训练它。打个比方,就像让一个非常聪明的人,去教一个还不那么聪明的AI。那么未来如果AI模型变得非常聪明,人类的知识已经被他全部学会了,就会面临一个临界点——人类已经没什么能教给AI了。我最感兴趣的是,如果AI突破了这个临界点,会发生什么?如果一群已经学完了人类已有知识的AI在一起交谈、探索、学习,会不会产生新的知识?也许当这个时候来临,我们人类会向AI学习新知识,AI会带着人类一起在新的知识海洋里遨游。”

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年02月13日

18:27
微新创想:2026年2月,韩国知名外设品牌Pulsar正式发布了CrazyLight系列的新款游戏鼠标,主题为WildScapes。此次推出的系列共有五款产品,分别以火山、沙漠、海洋、森林和岩石为设计灵感,充分展现了自然景观的多样魅力。每款鼠标都融入了独特的视觉元素,使其在外观上极具辨识度和吸引力。 微新创想:该系列涵盖的型号包括X2H、X3、X2N、X2以...
18:27
微新创想:2026年2月26日至29日,美科将在日本横滨举办的CP+ 2026国际摄影展上发布新品。此次展会是全球知名的摄影器材盛会,吸引了众多专业摄影师与行业爱好者前来交流与采购。美科作为光学技术领域的领先品牌,将携全新镜头系列亮相,展现其在镜头研发与制造方面的深厚实力。 全画幅镜头AF85mm f/1.4 II(MIX系列)将作为重点产品之一在展会上首次...
18:27
微新创想:2月12日,海圣医疗(920166.BJ)在北交所正式挂牌上市,保荐机构为中信证券,开盘涨幅达125.47%,总市值21.46亿元。公司为全球麻醉与监护类医疗器械综合供应商,产品覆盖麻醉科、ICU及急诊科等临床场景。 海圣医疗近年来业绩稳步增长,2022至2024年营收分别为2.68亿、3.06亿、3.04亿元,2025年上半年营收1.56亿元。公...
18:27
微新创想:2月13日 美团闪购宣布“1对1急送”服务已覆盖全国近200个城市 该服务面向所有闪购用户开放 下单时可自主勾选 平均加价3-4元 较常规配送提速5-20分钟 服务主要应用于冰品 母婴 日用百货等时效敏感品类 以及数码 白酒等高价值礼赠场景 此举旨在提升紧急需求响应能力 优化即时配送体验
18:27
微新创想:2月13日,智谱股价报475港元,涨18.16%,总市值达2117.75亿港元,创上市新高。这一成绩标志着公司在资本市场获得高度认可,也体现了市场对其技术实力和未来发展潜力的信心。 同日,公司A股上市进程提速。2月9日,国泰海通与智谱签署科创板上市辅导协议,将与中金公司共同开展辅导工作。此举表明智谱正积极拓展融资渠道,加速其在A股市场的布局。 智谱...
18:27
微新创想:2026年2月13日,加拿大国际车展期间,加拿大汽车零部件制造商协会(APMA)发布了两款全本土研发的电动概念车Vector和Borealis。这两款车型均属于Project Arrow计划的第二阶段成果,由安大略理工大学牵头,联合80余家加拿大企业共同打造。 Vector车型搭载了AI设计的3D打印底盘,展现出先进的制造技术。该车最大输出功率达到...
18:27
微新创想:2026年2月,美国精神卫生保健提供商Talkiatry宣布完成2.1亿美元D轮融资 此次融资由Perceptive Advisors领投,Left Lane Capital、blisce、Andreessen Horowitz(a16z)及Sofina共同参与投资 Talkiatry是一家总部位于美国的精神健康服务公司,专注于通过远程医疗与线下门...
18:27
微新创想:2026年2月10日,上海银行与上海海港足球俱乐部在上海浦东足球场正式签署战略合作协议。此次合作标志着双方将在多个领域展开深入联动,共同探索体育与金融融合发展的新路径。 此次战略合作涵盖赛事支持、品牌共建、球迷互动及场景创新等多个方面。通过资源整合与优势互补,双方将打造更加丰富多元的体育金融服务生态,进一步提升用户体验与品牌影响力。 上海银行副行长...
18:27
微新创想:1月30日,山东滨州举行战略性新兴产业项目签约仪式,滨城区政府与上海开普勒机器人有限公司签署合作协议。此次合作标志着滨州在高端装备制造领域迈出重要一步,为区域经济发展注入新动能。 项目分两期建设:一期建设省级具身智能数据采集与训练中心,支撑百台特种机器人真实场景应用。该中心将作为技术研发和数据积累的重要平台,提升滨州在智能机器人领域的技术水平和应用...
18:27
微新创想:2025年特斯拉Model Y在欧洲市场以149,805辆的注册量稳居纯电车型销量榜首,领先第二名斯柯达Elroq超过5.5万辆。尽管整体销量同比出现28%的下滑,但这一成绩仍显示出Model Y在欧洲市场的强大影响力。分析认为,销量下滑的主要原因是新款Model Y发布期间的生产过渡期导致交付延迟。 特斯拉在欧洲的整体纯电车型销量达到236,35...
18:27
微新创想:2026年2月13日盘前,美股太空概念股普遍上涨。火箭实验室(Rocket Lab)股价上涨0.5%,AST SpaceMobile则录得1.5%的涨幅,追踪SpaceX相关企业的DXYZ基金也上涨了1.4%。此次反弹出现在美国东部时间早盘前的交易时段,显示出市场对商业航天发射领域近期进展的积极反应。市场分析人士指出,这一上涨可能受到行业政策预期改...
17:52
微新创想:2026年2月13日,瑞银发布研报称,网易云音乐(09899.HK)线上音乐业务收入同比增长8%,盈利符合预期。订阅用户数同比增16%,虽结构转向低价88VIP及学生会员,但瑞银预计2026年该业务收入将增长14%,ARPPU有望重拾升势。 报告认为新竞争者对用户转化影响有限,公司将持续聚焦优质差异化内容以扩大用户与付费规模。瑞银维持“买入”评级。...