编者按:本文来自微信公众号适道(ID:survivalbiz),作者白石,微新创想经授权转载。导读:1. 20岁少年参与开创生成式AI时代的重要论文2. 喜欢玩技术的华人创业者与天才少年联合创立Cohere3. AI会带来哪些风险,它未来最大的机会是什么?基础大模型领域的全球竞争如火如荼,融资百亿美元的OpenAI无疑是领跑者,其杀手级应用ChatGPT拥有数亿活跃用户,想要与之正面竞争无疑充满挑战。然而,一家估值20亿美元的AI独角兽在基础大模型的竞争中找到了差异化路线,成为大模型创业混战中的一股清流。这家独角兽就是Cohere,它由开创性论文《Attention is All You Need》最年轻的作者Aidan Gomez与他的两位多伦多大学校友Ivan Zhang和Nick Frosst联合创立。Cohere近期获得了2.7亿美元的C轮融资,累计融资额超过4.3亿美元,估值超过21亿美元。投资者名单中包括Salesforce、NVIDIA、Oracle等企业巨头,Tiger Global和Index Ventures等顶级投资机构,以及Geoffrey Hinton(深度学习三巨头,图灵奖获得者)、李飞飞等知名AI大牛。合作者还包括Amazon、麦肯锡等。为何说Cohere是大模型创业混战中的一股清流?在产品上,它专注于服务企业级客户,以强大的大模型Command为基础,提供企业级别的文字处理、知识问答等功能,并且模型可微调、可定制。此外,它还推出了企业级的知识助手Coral。在安全性上,为了打消企业客户的疑虑,它的产品可以多云和本地部署,并且拥有高度的数据隐私性。在融资策略上,它更倾向于拿与自己产业链相关的大企业的钱,借助巨头的力量发展自己,但是却不与巨头绑定(参考OpenAI与微软的关系)。作为知名AI独角兽,Cohere的产品和企业竞争优势已经被研究透彻,我们尝试从创业者角度切入,以Cohere的两位创始人Aidan Gomez与Ivan Zhang的多个访谈为材料,整理出Cohere从0到1的发展历程,以及Aidan与Ivan两位创业者对企业与AI的诸多真知灼见。注:本文材料来源于Cohere的投资人、Madrona合伙人Jon Turow,Weights&Bias的创始人Lukas Biewald,知名媒体人Steven Marsh与Cohere的两位联合创始人Aidan Gomez及Ivan Zhang的对谈。

1、20岁的少年参与了开创生成式AI时代的重要论文
Aidan Gomez是大语言模型领域开创性论文《Attention is All You Need》最年轻的作者。当时他从多伦多大学去Google Brain实习,还是大约19或20岁的本科生,这是他在美国科技界的第一次经历。Aidan Gomez在多伦多大学他在谷歌的实习导师是Lukasz Kaiser,也是《Attention is All You Need》的主要作者之一。当时他们一起打造了一个训练大型神经网络的软件平台Tensor,同时他们也在训练一个AI模型。他们的想法是,训练一个能从数据集中学会做许多事情的巨大AI模型,训练它要用到多种模态的数据集,包括图片、文本、甚至视频。当时Aidan和Noam Shazeer(也是Transformer的论文作者)是“同桌”,Noam也在研究大语言模型,只是他研究的算法是RNN(循环神经网络)。Noam的目标是找到一种比RNN更简单、更精炼、更具可扩展性的新架构。于是Lukasz、Aidan与Noam一拍即合,打算一起做这项研究,这时他们又发现Google Brain的translate组的Niki Parmar, Jakob Uszkoreit, Ashish Vaswani与自己有相近的想法,两个小组合并后,大家齐心协力地研究,最后那篇《Attention is All You Need》就诞生了。论文的投稿是在一个凌晨,当时办公室只有Aidan和Ashish两个人。稿子投出去后,他们就沉浸在了兴奋中。Ashish已经预见到这篇论文可能产生巨大的影响,而年轻的Aidan还是第一次投稿重要论文,还不知道这篇论文的重要性。就像他接受纽约客专栏作家Steven Marsh访谈时说的那样:“我不认为任何人预见到了它在未来会变成什么样。”而他真正对Transformer模型的实际影响感到震撼,是在实习结束回到多伦多大学以后。“当时,我在多伦多大学进行夏季研究,然后收到了Lukasz的邮件,主题是《看看这个》。邮件内容是一个关于日本朋克摇滚乐队的故事,故事记载了他们怎么组队,怎么发专辑,然后又遗憾解散的过程。在邮件的最后,Lukasz写道:‘我输入的唯一的词是transformer,模型自动生成了故事。’看了这篇机器生成的文本,我觉得这会掀起一场产品革命。因为这是第一次,一个非人类的系统以一种像我们人类一样引人入胜的方式使用语言。” Aidan对Steven Marsh说。

大模型的进化树当《Attention is All You Need》和Transformer诞生之后,这个创新的模型迅速被AI社区采纳,成为了新的技术标准。它在AI研究者中间掀起了热潮,不断有基于Transformer的强大模型出现,例如BERT,例如GPT。而在2022年底,ChatGPT正式打开了生成式AI的热潮。

2、喜欢玩技术的华人创业者与天才少年联合创立Cohere
Cohere的联合创始人Ivan Zhang是一个非典型AI研究者,但却是一个典型的创业者。他与Aidan是多伦多大学的校友,后来辍学与Aidan一起创业。“我是一个创造者,我不太喜欢坐在教室里单纯地吸收大量信息,我需要亲自动手,边‘玩技术’边学习,这是我最好的学习方式。” 他这么向Cohere的投资人Jon Turow介绍自己。Cohere的联合创始人Ivan Zhang从研究者到创业者,从ToC转型ToB2017年,从多伦多大学辍学后,Ivan在一家创业公司做后端工程师,他正是在这时认识了Aidan Gomez。当时Aidan想做一个独立的AI研究小组,进行兴趣主导的AI研究,验证自己的创新想法,于是他们一起做了FOR.ai 。现在这个组织仍在运行,叫做Cohere For AI,由多位AI领域的研究科学家组成,主要做AI的基础研究。2019年,Ivan向Aidan提议:“我们为什么不一起做一些新东西?”,于是他们从FOR.ai独立出来,开始进行更正式的创业。在这个阶段,他们已经有了创业经验,懂得一个组织正确的运行方式,也认识了不少AI领域的创始人。在Cohere的创业初期,他们的第一个想法是打造一个AI基础平台,让开发者上传AI模型,然后平台会压缩模型的尺寸,使模型更高效。但是在那个时间点,生成式AI的热潮并没有到来,这个市场还太小。作为论文作者的Aidan观察到Transformer模型在AI社区内的蓬勃发展,看到它解决了各种各样和文本处理相关的问题,看到了开发者们对这个架构的改进。正好那时OpenAI的GPT-2发布,Transformer模型的参数突破10亿,这也让Aidan进一步意识到了模型规模的重要性,以及这个模型架构真正的潜力。于是,几位创始人将Cohere的方向从一个模型压缩平台,往基础大模型及服务转型。“当体验了GPT-2后,我们发现它很酷,但是我们还不确定可以用GPT这类的AI基础模型搭建什么服务。我们先尝试做了Cohere的第一个项目,它是一个文本自动完成工具,形式是Chrome浏览器的扩展。用户只要在文本框中输入一段文字,它可以自动续写完成。我们最初打算利用广告来赚钱。(注:这是一个ToC的商业模式)。但是我们显然低估了打造消费者产品的难度,这个产品的体验并不好,也没有获得很多用户,我们明白自己在这个方向没有竞争优势。于是我们决定拆除前端的界面,只提供后端的模型的能力,从ToC转向ToB,做企业级的API服务。当时,99%的NLP用例需要单词嵌入,也需要对模型进行微调,所以我们在几个月内,打造了一个带有AI生成能力,并可以对模型进行嵌入和微调的API平台。” Ivan向Jon Turow分享Cohere转型背后的思考。对于Cohere为什么转向ToB,以及公司使命的内核,Aidan Gomez进行了清晰的表述:“我们就是想让AI大模型被更多人使用。当时,开发者和企业想要利用AI大模型的能力,无论是技术还是算力上都面临很多阻碍。我们存在的意义就是消除人们使用AI大模型的障碍,让不熟悉AI的开发者,以及普通的企业,都能方便地使用AI的能力。因为生成式AI特有的对话式互动对于终端用户来说是最好的体验。以我自己为例,当我想开一个银行账户时,如果一家银行能有一个24小时与我对话互动、并且高效解决问题的移动App,那会对我吸引力大增。Cohere就是要做到这一点,帮助所有类型的企业和组织用上生成式AI的力量,增强他们的竞争优势。 Cohere允许企业客户用自己的数据微调模型企业在采用AI能力时,还会对两个问题产生疑问,就是模型的托管和数据的隐私。我们是支持多云托管的,企业可以选择适合自己的云服务,也可以在本地的服务器中部署。我们也十分重视数据隐私,当企业用自己的数据进行模型微调时,无论是部署在云中,还是部署在本地服务器,我们都不会看到他们的数据,这是我们的一个核心特性。”

不拘一格的人才策略,塑造了Cohere的高创造力
Cohere能够在早期迅速转向,找到自己正确的位置,离不开Ivan和Aidan从FOR.ai 开始积累的人才观和创业哲学。Ivan在与Jon Turow对谈时分享了他们的人才招聘哲学和创业文化:“我们的招聘方式与众不同。在FOR.ai创业的时候,我们就确立了一个原则:我们寻找的是来自不同背景,但是对AI非常感兴趣并希望产生巨大影响的人。你不需要具有在Meta AI,DeepMind或Google工作过的完美背景,但是一定要对自己专注的领域有非常高的兴趣和热情。而且你不光会写论文,还要有实际动手的能力。我们把这种招聘方式带到了Cohere,构建了非常强大的早期团队。在公司文化上,我们喜欢在技术方面进行很多探索,‘玩技术’,然后获得突破。虽然我们都会写论文,但不是‘书呆子’,我们对自己应该要做什么非常清楚,而且会花很多的时间在工程实践而不仅是算法探索上,这让我们打造的产品能够真正为人们带来价值。”

现在OpenAI占据了生成式AI的C位,那么已经拥有数亿活跃用户的ChatGPT,会不会帮助OpenAI进行垄断,其他的公司是否还有机会?Aidan Gomez有自己的看法:“我绝不认为大模型领域会形成垄断。我认为每个公司都有自己的风格、方向和自己的优势,在市场上都会找到自己的位置。消费者和企业客户会选择他们认为最好的伙伴,最值得信任的公司,以及最能帮他们成功的平台。对于Cohere这样的基础模型公司,我们面对的最终状态,很可能不是赢家通吃,而是一个多元化的市场格局。我们会有凭借自己的优势去赢得自己比赛的胜利。我们会用各种方法帮助客户,让他们用上最好的AI能力。我们的焦点是让AI模型通过提示,微调在内的各种方法,帮助特定客户,获得最大的价值。”

3、AI会带来哪些风险,它未来最大的机会是什么?
生成式AI的爆发,在受到欢迎的同时,也引发了不少担忧。在公众层面,人们担忧AI是否会发展太快,能力太强,从而“抢夺”人类的工作机会;在现实的使用层面,则有不少人担忧AI模型的安全性和可控性。对此话题,Aidan Gomez和Ivan Zhang也发表了自己的看法。

AI可能“污染”社交媒体
Aidan Gomez的观点更偏向社会性,他表示,AI生成的内容对社交媒体的“污染”值得担忧:“与其担忧非人类智慧代替人类这类可能还有很多年才会发生的事,我们更应该关注当前的现实风险。例如,非常有可能有AI生成数百万个机器人,无缝地进入我们的社交媒体和公共对话,然后推动某一个观点(无论这个观点是有益的,还是有害的)。这可能会在一些能对社会产生重大影响的公共议题上产生无法预料的影响。所以我们必须权衡这个事情的风险,最好有具体的政策来减轻这种风险。例如,人们有权知道,我们正在阅读的媒体内容或者营销内容,到底是人类创作的还是机器合成的。”

而Ivan Zhang的观点则相对现实,他认为AI面临两大挑战:“对于AI面临的挑战,我们从客户中获取的信息首先是怎么评估生成式AI模型的能力。要准确地比较两个AI模型的能力并不容易,而且在文本生成方面,这种比较很可能是主观的。这对生成式AI在商业方面的采用会产生一定的阻碍。另一个挑战就是数据隐私问题,在使用开源或闭源的大模型进行商用时,你有时候会使用一些敏感的数据,这又会产生合规的问题。比如用AI辅助你写作一封敏感的电子邮件时,你是不是会担心自己输进模型的敏感数据被滥用?当然,这种担心成为了我们的机会,我们正在与Oracle合作解决这个问题。”

具身智能未来是AI的大机会
Aidan Gomez和Ivan Zhang既是AI专家,也是企业家,对于AI在未来有哪些新的方向和机会,他们的观点也值得关注。首先,他们在不同的场合都提到了同一个技术,那就是具身智能,也就是将生成式AI的能力注入到有形的机器中。Aidan这么对Lukas Biewald表述:“我认为将生成式AI用到机器人技术和实体化方面真的太酷了,而且这个方向有非常强烈的需求。我们都想象过机器人具有高智能和灵活的身体会怎么样——它一定会产生巨大的变革。但是这个方向确实还有很长的路要走,我也希望自己在这个方向产生影响,并试着去做一些相关的事情。”

Ivan也认为具身智能绝对是AI下一阶段的大机会:“我认为最大的机会是能影响实体的‘行动模型’,将AI与工程及实体的产品结合起来,将会非常令人兴奋,也一定会有不少企业对它们感兴趣。但是,这项技术要走向实体化,模型的准确性还需要进一步的提高。”

此外,Aidan也对AI的智能发展和未来应用做了更长远的想象:“现在AI模型的构建依赖于人类,为了让AI更加智能,我们会用人类的各种高阶知识来训练它。打个比方,就像让一个非常聪明的人,去教一个还不那么聪明的AI。那么未来如果AI模型变得非常聪明,人类的知识已经被他全部学会了,就会面临一个临界点——人类已经没什么能教给AI了。我最感兴趣的是,如果AI突破了这个临界点,会发生什么?如果一群已经学完了人类已有知识的AI在一起交谈、探索、学习,会不会产生新的知识?也许当这个时候来临,我们人类会向AI学习新知识,AI会带着人类一起在新的知识海洋里遨游。”

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年11月21日

11:59
斗鱼集团最新财务报告彰显强劲增长动力 2025年Q3盈利能力显著提升 微新创想11月21日讯 斗鱼集团近日正式发布2025年第三季度未经审计财务报告,数据显示公司整体盈利能力持续向好,各项关键指标均呈现显著增长态势。报告显示,斗鱼第三季度总收入高达8.99亿元,毛利润达到1.16亿元,同比增长率高达90.9%,毛利率提升至12.9%。尤为亮眼的是净利润表现...
11:59
微新创想11月21日讯,一加Ace 6T的神秘面纱即将揭晓!今日,安兔兔官方账号在后台监测到一款型号为PLR110的新机信息,其搭载的高通骁龙8 Gen 5芯片,正是这款备受期待的旗舰机型。根据安兔兔V11版跑分结果显示,这款16GB 1TB版本的一加Ace 6T,在性能测试中取得了3561559的惊人总分,这一成绩甚至超越了骁龙8至尊版,展现了其卓越的性能...
11:59
微新创想11月21日讯 小鹏汽车迎来历史性时刻——第100万台整车正式下线,标志着这家新势力车企在短短几年内实现了惊人的产能飞跃。何小鹏董事长在广州车展期间分享了一组令人瞩目的数据:从首台车下线到突破50万台,小鹏汽车耗时82个月;而仅仅14个月后,产量便翻倍达到100万台。这一速度体现了小鹏汽车在智能制造和供应链管理上的卓越能力。 数据显示,小鹏汽车正迎来...
11:59
最新消息显示,华为常务董事余承东于11月21日通过视频展示了华为Mate 80 Pro Max的强大性能。在烈日暴晒环境下,该机屏幕显示内容依然清晰可见,充分彰显了其出色的抗光能力。余承东特别强调,Mate 80 Pro Max不仅拥有卓越的屏幕素质,更具备出色的护眼功能,为用户带来极致的视觉体验。他预告称,11月25日将在直播间揭晓更多产品细节,引发广泛关...
11:59
谷歌旗下AI研究助手NotebookLM迎来颠覆性升级,全新"Slide Decks"(幻灯片生成)功能震撼上线!这一革命性工具能将用户上传的任何资料——无论是PDF文档、网页链接还是视频内容——一键转化为专业级演示文稿(PPT),生成效果远超Gemini App的内置工具,迅速引发AI领域热议,被业界誉为"PowerPoint和Canva的终结者"。全新S...
11:59
OpenAI 近期震撼发布其尖端 GPT-5模型,这一突破性技术预示着数学与科研领域即将迎来革命性变革。在人工智能浪潮席卷全球的今天,各大科技巨头纷纷将目光聚焦于AI在药物研发和新材料发现中的无限可能。GPT-5的问世正是顺应时代脉搏,它将作为科研人员的得力助手,显著提升复杂问题的解决效率。 据OpenAI官方权威介绍,GPT-5在计算能力和语言理解层面实现...
11:59
语音AI创新企业Wispr近日宣布成功完成2500万美元B+轮融资,由知名投资机构Notable Capital独家领投,Steven Bartlett旗下飞行基金Flight Fund强势参投。此次融资完成后,Wispr累计融资金额已攀升至8100万美元,彰显了资本市场对其技术实力与市场前景的高度认可。 作为公司核心产品的Flow Dictation自上线...
11:42
2025年11月21日,中国邮政储蓄银行正式揭晓了其2025年度AI服务器(鲲鹏)及配件采购项目(第二次)的最终中标名单,烽火通信旗下长江计算凭借卓越实力斩获亚军席位,中标金额突破3000万元大关。此次采购项目作为邮储银行强化人工智能算力基础设施的关键举措,将为其金融业务的智能化转型注入强劲动力。长江计算能够成功入围,主要得益于其在国产化算力技术领域的深厚积...
11:42
2025年11月21日,广州国际车展盛大启幕,广汽丰田执行副总经理文大力在展会期间公开了公司未来三年的战略蓝图。文大力透露,广汽丰田计划于2026年实现年产销突破80万台,这一目标的达成将主要得益于新能源汽车销量的显著提升。据公司内部预测,随着电动化转型的深入推进,到2027年,广汽丰田的销量预计将同比增长超过10%,进一步巩固其在新能源汽车市场的领先地位。...
11:42
2025年11月21日,国内领先的视频制作Agent平台Nemo Video正式宣布成功完成近千万美元Pre-A轮及天使轮融资。此次Pre-A轮由知名风险投资机构IDG资本独家领投,而天使轮则获得了锦秋资本、钛动科技、微光创投等多家投资机构的联合支持,同时前零一万物创始人联创谷雪梅个人也参与了投资。棕榈资本作为独家财务顾问全程参与本轮融资。Nemo Vide...
11:42
2025年11月21日,国内领先的AI生成硬件解决方案提供商指数科技正式宣布成功完成Pre-A轮战略融资,投资方阵容强大,包括知名风险投资机构誉尊基金、云启资本以及尚势资本联合领投。作为生成式AI技术在电子产品设计与制造领域的先行者,指数科技凭借其创新性的技术平台,实现了从产品需求分析到PCBA电路板图纸及嵌入式代码的全流程自动化生成,为传统硬件研发模式带来...
11:42
2025年11月20日,微软正式公布一项重要战略布局,宣布将于2026年2月推出Microsoft 365 Copilot官方浏览器扩展,并优先登陆全球领先的Chrome浏览器平台。这一创新举措标志着微软在AI办公生态建设上的又一重要里程碑,其核心功能将深度整合Copilot Chat与Search两大核心能力,为企业用户提供前所未有的智能办公体验。 该扩展...