编者按:本文来自微信公众号适道(ID:survivalbiz),作者白石,微新创想经授权转载。导读:1. 20岁少年参与开创生成式AI时代的重要论文2. 喜欢玩技术的华人创业者与天才少年联合创立Cohere3. AI会带来哪些风险,它未来最大的机会是什么?基础大模型领域的全球竞争如火如荼,融资百亿美元的OpenAI无疑是领跑者,其杀手级应用ChatGPT拥有数亿活跃用户,想要与之正面竞争无疑充满挑战。然而,一家估值20亿美元的AI独角兽在基础大模型的竞争中找到了差异化路线,成为大模型创业混战中的一股清流。这家独角兽就是Cohere,它由开创性论文《Attention is All You Need》最年轻的作者Aidan Gomez与他的两位多伦多大学校友Ivan Zhang和Nick Frosst联合创立。Cohere近期获得了2.7亿美元的C轮融资,累计融资额超过4.3亿美元,估值超过21亿美元。投资者名单中包括Salesforce、NVIDIA、Oracle等企业巨头,Tiger Global和Index Ventures等顶级投资机构,以及Geoffrey Hinton(深度学习三巨头,图灵奖获得者)、李飞飞等知名AI大牛。合作者还包括Amazon、麦肯锡等。为何说Cohere是大模型创业混战中的一股清流?在产品上,它专注于服务企业级客户,以强大的大模型Command为基础,提供企业级别的文字处理、知识问答等功能,并且模型可微调、可定制。此外,它还推出了企业级的知识助手Coral。在安全性上,为了打消企业客户的疑虑,它的产品可以多云和本地部署,并且拥有高度的数据隐私性。在融资策略上,它更倾向于拿与自己产业链相关的大企业的钱,借助巨头的力量发展自己,但是却不与巨头绑定(参考OpenAI与微软的关系)。作为知名AI独角兽,Cohere的产品和企业竞争优势已经被研究透彻,我们尝试从创业者角度切入,以Cohere的两位创始人Aidan Gomez与Ivan Zhang的多个访谈为材料,整理出Cohere从0到1的发展历程,以及Aidan与Ivan两位创业者对企业与AI的诸多真知灼见。注:本文材料来源于Cohere的投资人、Madrona合伙人Jon Turow,Weights&Bias的创始人Lukas Biewald,知名媒体人Steven Marsh与Cohere的两位联合创始人Aidan Gomez及Ivan Zhang的对谈。

1、20岁的少年参与了开创生成式AI时代的重要论文
Aidan Gomez是大语言模型领域开创性论文《Attention is All You Need》最年轻的作者。当时他从多伦多大学去Google Brain实习,还是大约19或20岁的本科生,这是他在美国科技界的第一次经历。Aidan Gomez在多伦多大学他在谷歌的实习导师是Lukasz Kaiser,也是《Attention is All You Need》的主要作者之一。当时他们一起打造了一个训练大型神经网络的软件平台Tensor,同时他们也在训练一个AI模型。他们的想法是,训练一个能从数据集中学会做许多事情的巨大AI模型,训练它要用到多种模态的数据集,包括图片、文本、甚至视频。当时Aidan和Noam Shazeer(也是Transformer的论文作者)是“同桌”,Noam也在研究大语言模型,只是他研究的算法是RNN(循环神经网络)。Noam的目标是找到一种比RNN更简单、更精炼、更具可扩展性的新架构。于是Lukasz、Aidan与Noam一拍即合,打算一起做这项研究,这时他们又发现Google Brain的translate组的Niki Parmar, Jakob Uszkoreit, Ashish Vaswani与自己有相近的想法,两个小组合并后,大家齐心协力地研究,最后那篇《Attention is All You Need》就诞生了。论文的投稿是在一个凌晨,当时办公室只有Aidan和Ashish两个人。稿子投出去后,他们就沉浸在了兴奋中。Ashish已经预见到这篇论文可能产生巨大的影响,而年轻的Aidan还是第一次投稿重要论文,还不知道这篇论文的重要性。就像他接受纽约客专栏作家Steven Marsh访谈时说的那样:“我不认为任何人预见到了它在未来会变成什么样。”而他真正对Transformer模型的实际影响感到震撼,是在实习结束回到多伦多大学以后。“当时,我在多伦多大学进行夏季研究,然后收到了Lukasz的邮件,主题是《看看这个》。邮件内容是一个关于日本朋克摇滚乐队的故事,故事记载了他们怎么组队,怎么发专辑,然后又遗憾解散的过程。在邮件的最后,Lukasz写道:‘我输入的唯一的词是transformer,模型自动生成了故事。’看了这篇机器生成的文本,我觉得这会掀起一场产品革命。因为这是第一次,一个非人类的系统以一种像我们人类一样引人入胜的方式使用语言。” Aidan对Steven Marsh说。

大模型的进化树当《Attention is All You Need》和Transformer诞生之后,这个创新的模型迅速被AI社区采纳,成为了新的技术标准。它在AI研究者中间掀起了热潮,不断有基于Transformer的强大模型出现,例如BERT,例如GPT。而在2022年底,ChatGPT正式打开了生成式AI的热潮。

2、喜欢玩技术的华人创业者与天才少年联合创立Cohere
Cohere的联合创始人Ivan Zhang是一个非典型AI研究者,但却是一个典型的创业者。他与Aidan是多伦多大学的校友,后来辍学与Aidan一起创业。“我是一个创造者,我不太喜欢坐在教室里单纯地吸收大量信息,我需要亲自动手,边‘玩技术’边学习,这是我最好的学习方式。” 他这么向Cohere的投资人Jon Turow介绍自己。Cohere的联合创始人Ivan Zhang从研究者到创业者,从ToC转型ToB2017年,从多伦多大学辍学后,Ivan在一家创业公司做后端工程师,他正是在这时认识了Aidan Gomez。当时Aidan想做一个独立的AI研究小组,进行兴趣主导的AI研究,验证自己的创新想法,于是他们一起做了FOR.ai 。现在这个组织仍在运行,叫做Cohere For AI,由多位AI领域的研究科学家组成,主要做AI的基础研究。2019年,Ivan向Aidan提议:“我们为什么不一起做一些新东西?”,于是他们从FOR.ai独立出来,开始进行更正式的创业。在这个阶段,他们已经有了创业经验,懂得一个组织正确的运行方式,也认识了不少AI领域的创始人。在Cohere的创业初期,他们的第一个想法是打造一个AI基础平台,让开发者上传AI模型,然后平台会压缩模型的尺寸,使模型更高效。但是在那个时间点,生成式AI的热潮并没有到来,这个市场还太小。作为论文作者的Aidan观察到Transformer模型在AI社区内的蓬勃发展,看到它解决了各种各样和文本处理相关的问题,看到了开发者们对这个架构的改进。正好那时OpenAI的GPT-2发布,Transformer模型的参数突破10亿,这也让Aidan进一步意识到了模型规模的重要性,以及这个模型架构真正的潜力。于是,几位创始人将Cohere的方向从一个模型压缩平台,往基础大模型及服务转型。“当体验了GPT-2后,我们发现它很酷,但是我们还不确定可以用GPT这类的AI基础模型搭建什么服务。我们先尝试做了Cohere的第一个项目,它是一个文本自动完成工具,形式是Chrome浏览器的扩展。用户只要在文本框中输入一段文字,它可以自动续写完成。我们最初打算利用广告来赚钱。(注:这是一个ToC的商业模式)。但是我们显然低估了打造消费者产品的难度,这个产品的体验并不好,也没有获得很多用户,我们明白自己在这个方向没有竞争优势。于是我们决定拆除前端的界面,只提供后端的模型的能力,从ToC转向ToB,做企业级的API服务。当时,99%的NLP用例需要单词嵌入,也需要对模型进行微调,所以我们在几个月内,打造了一个带有AI生成能力,并可以对模型进行嵌入和微调的API平台。” Ivan向Jon Turow分享Cohere转型背后的思考。对于Cohere为什么转向ToB,以及公司使命的内核,Aidan Gomez进行了清晰的表述:“我们就是想让AI大模型被更多人使用。当时,开发者和企业想要利用AI大模型的能力,无论是技术还是算力上都面临很多阻碍。我们存在的意义就是消除人们使用AI大模型的障碍,让不熟悉AI的开发者,以及普通的企业,都能方便地使用AI的能力。因为生成式AI特有的对话式互动对于终端用户来说是最好的体验。以我自己为例,当我想开一个银行账户时,如果一家银行能有一个24小时与我对话互动、并且高效解决问题的移动App,那会对我吸引力大增。Cohere就是要做到这一点,帮助所有类型的企业和组织用上生成式AI的力量,增强他们的竞争优势。 Cohere允许企业客户用自己的数据微调模型企业在采用AI能力时,还会对两个问题产生疑问,就是模型的托管和数据的隐私。我们是支持多云托管的,企业可以选择适合自己的云服务,也可以在本地的服务器中部署。我们也十分重视数据隐私,当企业用自己的数据进行模型微调时,无论是部署在云中,还是部署在本地服务器,我们都不会看到他们的数据,这是我们的一个核心特性。”

不拘一格的人才策略,塑造了Cohere的高创造力
Cohere能够在早期迅速转向,找到自己正确的位置,离不开Ivan和Aidan从FOR.ai 开始积累的人才观和创业哲学。Ivan在与Jon Turow对谈时分享了他们的人才招聘哲学和创业文化:“我们的招聘方式与众不同。在FOR.ai创业的时候,我们就确立了一个原则:我们寻找的是来自不同背景,但是对AI非常感兴趣并希望产生巨大影响的人。你不需要具有在Meta AI,DeepMind或Google工作过的完美背景,但是一定要对自己专注的领域有非常高的兴趣和热情。而且你不光会写论文,还要有实际动手的能力。我们把这种招聘方式带到了Cohere,构建了非常强大的早期团队。在公司文化上,我们喜欢在技术方面进行很多探索,‘玩技术’,然后获得突破。虽然我们都会写论文,但不是‘书呆子’,我们对自己应该要做什么非常清楚,而且会花很多的时间在工程实践而不仅是算法探索上,这让我们打造的产品能够真正为人们带来价值。”

现在OpenAI占据了生成式AI的C位,那么已经拥有数亿活跃用户的ChatGPT,会不会帮助OpenAI进行垄断,其他的公司是否还有机会?Aidan Gomez有自己的看法:“我绝不认为大模型领域会形成垄断。我认为每个公司都有自己的风格、方向和自己的优势,在市场上都会找到自己的位置。消费者和企业客户会选择他们认为最好的伙伴,最值得信任的公司,以及最能帮他们成功的平台。对于Cohere这样的基础模型公司,我们面对的最终状态,很可能不是赢家通吃,而是一个多元化的市场格局。我们会有凭借自己的优势去赢得自己比赛的胜利。我们会用各种方法帮助客户,让他们用上最好的AI能力。我们的焦点是让AI模型通过提示,微调在内的各种方法,帮助特定客户,获得最大的价值。”

3、AI会带来哪些风险,它未来最大的机会是什么?
生成式AI的爆发,在受到欢迎的同时,也引发了不少担忧。在公众层面,人们担忧AI是否会发展太快,能力太强,从而“抢夺”人类的工作机会;在现实的使用层面,则有不少人担忧AI模型的安全性和可控性。对此话题,Aidan Gomez和Ivan Zhang也发表了自己的看法。

AI可能“污染”社交媒体
Aidan Gomez的观点更偏向社会性,他表示,AI生成的内容对社交媒体的“污染”值得担忧:“与其担忧非人类智慧代替人类这类可能还有很多年才会发生的事,我们更应该关注当前的现实风险。例如,非常有可能有AI生成数百万个机器人,无缝地进入我们的社交媒体和公共对话,然后推动某一个观点(无论这个观点是有益的,还是有害的)。这可能会在一些能对社会产生重大影响的公共议题上产生无法预料的影响。所以我们必须权衡这个事情的风险,最好有具体的政策来减轻这种风险。例如,人们有权知道,我们正在阅读的媒体内容或者营销内容,到底是人类创作的还是机器合成的。”

而Ivan Zhang的观点则相对现实,他认为AI面临两大挑战:“对于AI面临的挑战,我们从客户中获取的信息首先是怎么评估生成式AI模型的能力。要准确地比较两个AI模型的能力并不容易,而且在文本生成方面,这种比较很可能是主观的。这对生成式AI在商业方面的采用会产生一定的阻碍。另一个挑战就是数据隐私问题,在使用开源或闭源的大模型进行商用时,你有时候会使用一些敏感的数据,这又会产生合规的问题。比如用AI辅助你写作一封敏感的电子邮件时,你是不是会担心自己输进模型的敏感数据被滥用?当然,这种担心成为了我们的机会,我们正在与Oracle合作解决这个问题。”

具身智能未来是AI的大机会
Aidan Gomez和Ivan Zhang既是AI专家,也是企业家,对于AI在未来有哪些新的方向和机会,他们的观点也值得关注。首先,他们在不同的场合都提到了同一个技术,那就是具身智能,也就是将生成式AI的能力注入到有形的机器中。Aidan这么对Lukas Biewald表述:“我认为将生成式AI用到机器人技术和实体化方面真的太酷了,而且这个方向有非常强烈的需求。我们都想象过机器人具有高智能和灵活的身体会怎么样——它一定会产生巨大的变革。但是这个方向确实还有很长的路要走,我也希望自己在这个方向产生影响,并试着去做一些相关的事情。”

Ivan也认为具身智能绝对是AI下一阶段的大机会:“我认为最大的机会是能影响实体的‘行动模型’,将AI与工程及实体的产品结合起来,将会非常令人兴奋,也一定会有不少企业对它们感兴趣。但是,这项技术要走向实体化,模型的准确性还需要进一步的提高。”

此外,Aidan也对AI的智能发展和未来应用做了更长远的想象:“现在AI模型的构建依赖于人类,为了让AI更加智能,我们会用人类的各种高阶知识来训练它。打个比方,就像让一个非常聪明的人,去教一个还不那么聪明的AI。那么未来如果AI模型变得非常聪明,人类的知识已经被他全部学会了,就会面临一个临界点——人类已经没什么能教给AI了。我最感兴趣的是,如果AI突破了这个临界点,会发生什么?如果一群已经学完了人类已有知识的AI在一起交谈、探索、学习,会不会产生新的知识?也许当这个时候来临,我们人类会向AI学习新知识,AI会带着人类一起在新的知识海洋里遨游。”

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年03月15日

10:21
微新创想:3月11日,美国外设厂商Turtle Beach宣布推出与卡普空合作的《街头霸王II:冠军版》联名款Victrix Pro KO Leverless Fight Stick。这款街机控制器以像素风设计呈现,完美还原了经典街机的视觉风格,深受怀旧玩家喜爱。 这款控制器印有12名可选角色,1P和2P分别对应隆与春丽,让玩家能够直接体验到游戏中最具代表性...
10:21
微新创想:2026年3月,特斯拉在海外市场为焕新款Model 3和Model Y上线了4合1 USB-C集线器,售价85美元(约587.3元人民币)。这款产品能够将中控储物箱原本单个的USB-C接口扩展为四个,极大提升了用户的充电和数据传输效率。 微新创想:该集线器支持多种功率分配模式,包括单口最高60W、双口各30W、三口共享54W以及四口共享48W。用户...
10:21
微新创想:2026年中国家电及消费电子博览会于3月15日在上海盛大开幕。此次展会吸引了众多智能机器人参展,充分展现了中国在人工智能与机器人技术方面的强大制造能力和广泛应用前景。 展会现场,各类智能机器人纷纷亮相,涵盖人形、四足以及外骨骼机器人等多个领域。这些创新产品不仅体现了技术的突破,也预示着未来智能生活的无限可能。 根据最新数据显示,2025年全球人形机...
09:49
微新创想:2026年3月13日,亚马逊在美国正式推出Prime Video Ultra订阅层级。这项新服务专为Prime会员打造,提供更高级别的视频观看体验。用户可以选择月费4.99美元或年费45.99美元的方式订阅,价格约合34.5元人民币和317.8元人民币。 升级后的Prime Video Ultra支持UHD/4K画质,带来更清晰细腻的视觉享受。同时...
09:49
微新创想:2026年3月15日,三星电子在中国香港等地区正式上线Galaxy Tab S11 Ultra专用Pro Keyboard。这款键盘专为Galaxy Tab S11 Ultra设计,旨在为用户提供更高效的办公体验。 该键盘采用铝合金机身,不仅提升了整体质感,还保证了良好的耐用性。其轻薄便携的设计让用户在移动办公时更加自如,无需额外携带沉重设备。 P...
09:49
微新创想:3月13日,Hugging Face首席执行官Clément Delangue在X平台发文称,开源AI智能体项目OpenClaw(“小龙虾”)的热潮将在六周后消退。他以陪产假为例,指出AI热点周期短暂。 近期OpenClaw因轻量、自托管、多云适配等特点迅速走红。该项目凭借其灵活的架构和低门槛的部署方式,吸引了大量开发者和企业用户的关注。许多用户认...
09:17
微新创想:2026年3月15日,韩国高端音频品牌Astell&Kern正式推出其旗舰级混动有线Hi-Fi耳机STELLA。这款耳机以30999元的售价亮相市场,成为音频爱好者关注的焦点。STELLA的诞生不仅代表着Astell&Kern在音频技术上的又一突破,也彰显了品牌对极致音质的追求。 STELLA的声学校准由五次格莱美奖得主母带工程师M...
08:37
微新创想:Epic Games宣布将于2026年3月19日起对《堡垒之夜》游戏内货币V币进行价格调整 主要原因是运营成本的上升 这次调整适用于所有平台包括PC iOS 安卓和网页端 其中38元档的V币数量将由原来的1000减少至800 精确充值的价格也有所变化 从每2元兑换50V币调整为每4元兑换50V币 Epic Games同时宣布将战斗通行证的价格下调至...
08:02
微新创想:2026年3月15日 微软悄然在官网下载中心发布“Windows 11 Installation Assistant 25H2”升级工具 该工具面向Windows 10及旧版Windows 11用户 可就地升级至25H2版本 并自动检测设备兼容性 尽管25H2已推送近半年 但此前未见官方宣传 工具亦支持已安装25H2的设备执行系统修复 升级需满足基...
08:02
微新创想:2026年铁路春运于3月13日圆满结束 全程持续40天 全国铁路在春运期间累计发送旅客5.38亿人次 比去年同期增长4.8% 货物运输总量达到4.24亿吨 增长幅度为2.1% 日均开行旅客列车数量为12861列 单日最高开行量达到14037列 运力增长8.3% 广深港高铁跨境旅客数量达到404.5万人次 中老铁路旅客运输量同比增长34% 12306...
07:25
微新创想:2026年3月,日本物质材料研究机构(NIMS)联合东京大学等高校在RuO₂(101)外延薄膜中首次观测到交替磁性机制。这一发现为磁性材料研究带来了新的突破。该薄膜是在Al₂O₃(1̅02)衬底上制备的,呈现出单取向结构。研究人员通过实验手段成功验证了这一材料的特殊磁性特性。 微新创想:研究团队进一步发现,这种RuO₂(101)外延薄膜不仅具备铁磁...
07:25
微新创想:山东花物堂化妆品股份有限公司(半亩花田)于2026年3月15日前正式向港交所递交上市申请中信证券担任其独家保荐人。公司专注于花植研究领域产品涵盖身体发部及面部洗护三大方向共计拥有509个主要SKU。2025年前九个月公司实现营收18.95亿元同比增长76.7%其中身体洗护业务收入占比超过40%成为主要收入来源而发部洗护业务则迅速崛起成为公司的第二大...