编者按:本文来自微信公众号适道(ID:survivalbiz),作者白石,微新创想经授权转载。导读:1. 20岁少年参与开创生成式AI时代的重要论文2. 喜欢玩技术的华人创业者与天才少年联合创立Cohere3. AI会带来哪些风险,它未来最大的机会是什么?基础大模型领域的全球竞争如火如荼,融资百亿美元的OpenAI无疑是领跑者,其杀手级应用ChatGPT拥有数亿活跃用户,想要与之正面竞争无疑充满挑战。然而,一家估值20亿美元的AI独角兽在基础大模型的竞争中找到了差异化路线,成为大模型创业混战中的一股清流。这家独角兽就是Cohere,它由开创性论文《Attention is All You Need》最年轻的作者Aidan Gomez与他的两位多伦多大学校友Ivan Zhang和Nick Frosst联合创立。Cohere近期获得了2.7亿美元的C轮融资,累计融资额超过4.3亿美元,估值超过21亿美元。投资者名单中包括Salesforce、NVIDIA、Oracle等企业巨头,Tiger Global和Index Ventures等顶级投资机构,以及Geoffrey Hinton(深度学习三巨头,图灵奖获得者)、李飞飞等知名AI大牛。合作者还包括Amazon、麦肯锡等。为何说Cohere是大模型创业混战中的一股清流?在产品上,它专注于服务企业级客户,以强大的大模型Command为基础,提供企业级别的文字处理、知识问答等功能,并且模型可微调、可定制。此外,它还推出了企业级的知识助手Coral。在安全性上,为了打消企业客户的疑虑,它的产品可以多云和本地部署,并且拥有高度的数据隐私性。在融资策略上,它更倾向于拿与自己产业链相关的大企业的钱,借助巨头的力量发展自己,但是却不与巨头绑定(参考OpenAI与微软的关系)。作为知名AI独角兽,Cohere的产品和企业竞争优势已经被研究透彻,我们尝试从创业者角度切入,以Cohere的两位创始人Aidan Gomez与Ivan Zhang的多个访谈为材料,整理出Cohere从0到1的发展历程,以及Aidan与Ivan两位创业者对企业与AI的诸多真知灼见。注:本文材料来源于Cohere的投资人、Madrona合伙人Jon Turow,Weights&Bias的创始人Lukas Biewald,知名媒体人Steven Marsh与Cohere的两位联合创始人Aidan Gomez及Ivan Zhang的对谈。

1、20岁的少年参与了开创生成式AI时代的重要论文
Aidan Gomez是大语言模型领域开创性论文《Attention is All You Need》最年轻的作者。当时他从多伦多大学去Google Brain实习,还是大约19或20岁的本科生,这是他在美国科技界的第一次经历。Aidan Gomez在多伦多大学他在谷歌的实习导师是Lukasz Kaiser,也是《Attention is All You Need》的主要作者之一。当时他们一起打造了一个训练大型神经网络的软件平台Tensor,同时他们也在训练一个AI模型。他们的想法是,训练一个能从数据集中学会做许多事情的巨大AI模型,训练它要用到多种模态的数据集,包括图片、文本、甚至视频。当时Aidan和Noam Shazeer(也是Transformer的论文作者)是“同桌”,Noam也在研究大语言模型,只是他研究的算法是RNN(循环神经网络)。Noam的目标是找到一种比RNN更简单、更精炼、更具可扩展性的新架构。于是Lukasz、Aidan与Noam一拍即合,打算一起做这项研究,这时他们又发现Google Brain的translate组的Niki Parmar, Jakob Uszkoreit, Ashish Vaswani与自己有相近的想法,两个小组合并后,大家齐心协力地研究,最后那篇《Attention is All You Need》就诞生了。论文的投稿是在一个凌晨,当时办公室只有Aidan和Ashish两个人。稿子投出去后,他们就沉浸在了兴奋中。Ashish已经预见到这篇论文可能产生巨大的影响,而年轻的Aidan还是第一次投稿重要论文,还不知道这篇论文的重要性。就像他接受纽约客专栏作家Steven Marsh访谈时说的那样:“我不认为任何人预见到了它在未来会变成什么样。”而他真正对Transformer模型的实际影响感到震撼,是在实习结束回到多伦多大学以后。“当时,我在多伦多大学进行夏季研究,然后收到了Lukasz的邮件,主题是《看看这个》。邮件内容是一个关于日本朋克摇滚乐队的故事,故事记载了他们怎么组队,怎么发专辑,然后又遗憾解散的过程。在邮件的最后,Lukasz写道:‘我输入的唯一的词是transformer,模型自动生成了故事。’看了这篇机器生成的文本,我觉得这会掀起一场产品革命。因为这是第一次,一个非人类的系统以一种像我们人类一样引人入胜的方式使用语言。” Aidan对Steven Marsh说。

大模型的进化树当《Attention is All You Need》和Transformer诞生之后,这个创新的模型迅速被AI社区采纳,成为了新的技术标准。它在AI研究者中间掀起了热潮,不断有基于Transformer的强大模型出现,例如BERT,例如GPT。而在2022年底,ChatGPT正式打开了生成式AI的热潮。

2、喜欢玩技术的华人创业者与天才少年联合创立Cohere
Cohere的联合创始人Ivan Zhang是一个非典型AI研究者,但却是一个典型的创业者。他与Aidan是多伦多大学的校友,后来辍学与Aidan一起创业。“我是一个创造者,我不太喜欢坐在教室里单纯地吸收大量信息,我需要亲自动手,边‘玩技术’边学习,这是我最好的学习方式。” 他这么向Cohere的投资人Jon Turow介绍自己。Cohere的联合创始人Ivan Zhang从研究者到创业者,从ToC转型ToB2017年,从多伦多大学辍学后,Ivan在一家创业公司做后端工程师,他正是在这时认识了Aidan Gomez。当时Aidan想做一个独立的AI研究小组,进行兴趣主导的AI研究,验证自己的创新想法,于是他们一起做了FOR.ai 。现在这个组织仍在运行,叫做Cohere For AI,由多位AI领域的研究科学家组成,主要做AI的基础研究。2019年,Ivan向Aidan提议:“我们为什么不一起做一些新东西?”,于是他们从FOR.ai独立出来,开始进行更正式的创业。在这个阶段,他们已经有了创业经验,懂得一个组织正确的运行方式,也认识了不少AI领域的创始人。在Cohere的创业初期,他们的第一个想法是打造一个AI基础平台,让开发者上传AI模型,然后平台会压缩模型的尺寸,使模型更高效。但是在那个时间点,生成式AI的热潮并没有到来,这个市场还太小。作为论文作者的Aidan观察到Transformer模型在AI社区内的蓬勃发展,看到它解决了各种各样和文本处理相关的问题,看到了开发者们对这个架构的改进。正好那时OpenAI的GPT-2发布,Transformer模型的参数突破10亿,这也让Aidan进一步意识到了模型规模的重要性,以及这个模型架构真正的潜力。于是,几位创始人将Cohere的方向从一个模型压缩平台,往基础大模型及服务转型。“当体验了GPT-2后,我们发现它很酷,但是我们还不确定可以用GPT这类的AI基础模型搭建什么服务。我们先尝试做了Cohere的第一个项目,它是一个文本自动完成工具,形式是Chrome浏览器的扩展。用户只要在文本框中输入一段文字,它可以自动续写完成。我们最初打算利用广告来赚钱。(注:这是一个ToC的商业模式)。但是我们显然低估了打造消费者产品的难度,这个产品的体验并不好,也没有获得很多用户,我们明白自己在这个方向没有竞争优势。于是我们决定拆除前端的界面,只提供后端的模型的能力,从ToC转向ToB,做企业级的API服务。当时,99%的NLP用例需要单词嵌入,也需要对模型进行微调,所以我们在几个月内,打造了一个带有AI生成能力,并可以对模型进行嵌入和微调的API平台。” Ivan向Jon Turow分享Cohere转型背后的思考。对于Cohere为什么转向ToB,以及公司使命的内核,Aidan Gomez进行了清晰的表述:“我们就是想让AI大模型被更多人使用。当时,开发者和企业想要利用AI大模型的能力,无论是技术还是算力上都面临很多阻碍。我们存在的意义就是消除人们使用AI大模型的障碍,让不熟悉AI的开发者,以及普通的企业,都能方便地使用AI的能力。因为生成式AI特有的对话式互动对于终端用户来说是最好的体验。以我自己为例,当我想开一个银行账户时,如果一家银行能有一个24小时与我对话互动、并且高效解决问题的移动App,那会对我吸引力大增。Cohere就是要做到这一点,帮助所有类型的企业和组织用上生成式AI的力量,增强他们的竞争优势。 Cohere允许企业客户用自己的数据微调模型企业在采用AI能力时,还会对两个问题产生疑问,就是模型的托管和数据的隐私。我们是支持多云托管的,企业可以选择适合自己的云服务,也可以在本地的服务器中部署。我们也十分重视数据隐私,当企业用自己的数据进行模型微调时,无论是部署在云中,还是部署在本地服务器,我们都不会看到他们的数据,这是我们的一个核心特性。”

不拘一格的人才策略,塑造了Cohere的高创造力
Cohere能够在早期迅速转向,找到自己正确的位置,离不开Ivan和Aidan从FOR.ai 开始积累的人才观和创业哲学。Ivan在与Jon Turow对谈时分享了他们的人才招聘哲学和创业文化:“我们的招聘方式与众不同。在FOR.ai创业的时候,我们就确立了一个原则:我们寻找的是来自不同背景,但是对AI非常感兴趣并希望产生巨大影响的人。你不需要具有在Meta AI,DeepMind或Google工作过的完美背景,但是一定要对自己专注的领域有非常高的兴趣和热情。而且你不光会写论文,还要有实际动手的能力。我们把这种招聘方式带到了Cohere,构建了非常强大的早期团队。在公司文化上,我们喜欢在技术方面进行很多探索,‘玩技术’,然后获得突破。虽然我们都会写论文,但不是‘书呆子’,我们对自己应该要做什么非常清楚,而且会花很多的时间在工程实践而不仅是算法探索上,这让我们打造的产品能够真正为人们带来价值。”

现在OpenAI占据了生成式AI的C位,那么已经拥有数亿活跃用户的ChatGPT,会不会帮助OpenAI进行垄断,其他的公司是否还有机会?Aidan Gomez有自己的看法:“我绝不认为大模型领域会形成垄断。我认为每个公司都有自己的风格、方向和自己的优势,在市场上都会找到自己的位置。消费者和企业客户会选择他们认为最好的伙伴,最值得信任的公司,以及最能帮他们成功的平台。对于Cohere这样的基础模型公司,我们面对的最终状态,很可能不是赢家通吃,而是一个多元化的市场格局。我们会有凭借自己的优势去赢得自己比赛的胜利。我们会用各种方法帮助客户,让他们用上最好的AI能力。我们的焦点是让AI模型通过提示,微调在内的各种方法,帮助特定客户,获得最大的价值。”

3、AI会带来哪些风险,它未来最大的机会是什么?
生成式AI的爆发,在受到欢迎的同时,也引发了不少担忧。在公众层面,人们担忧AI是否会发展太快,能力太强,从而“抢夺”人类的工作机会;在现实的使用层面,则有不少人担忧AI模型的安全性和可控性。对此话题,Aidan Gomez和Ivan Zhang也发表了自己的看法。

AI可能“污染”社交媒体
Aidan Gomez的观点更偏向社会性,他表示,AI生成的内容对社交媒体的“污染”值得担忧:“与其担忧非人类智慧代替人类这类可能还有很多年才会发生的事,我们更应该关注当前的现实风险。例如,非常有可能有AI生成数百万个机器人,无缝地进入我们的社交媒体和公共对话,然后推动某一个观点(无论这个观点是有益的,还是有害的)。这可能会在一些能对社会产生重大影响的公共议题上产生无法预料的影响。所以我们必须权衡这个事情的风险,最好有具体的政策来减轻这种风险。例如,人们有权知道,我们正在阅读的媒体内容或者营销内容,到底是人类创作的还是机器合成的。”

而Ivan Zhang的观点则相对现实,他认为AI面临两大挑战:“对于AI面临的挑战,我们从客户中获取的信息首先是怎么评估生成式AI模型的能力。要准确地比较两个AI模型的能力并不容易,而且在文本生成方面,这种比较很可能是主观的。这对生成式AI在商业方面的采用会产生一定的阻碍。另一个挑战就是数据隐私问题,在使用开源或闭源的大模型进行商用时,你有时候会使用一些敏感的数据,这又会产生合规的问题。比如用AI辅助你写作一封敏感的电子邮件时,你是不是会担心自己输进模型的敏感数据被滥用?当然,这种担心成为了我们的机会,我们正在与Oracle合作解决这个问题。”

具身智能未来是AI的大机会
Aidan Gomez和Ivan Zhang既是AI专家,也是企业家,对于AI在未来有哪些新的方向和机会,他们的观点也值得关注。首先,他们在不同的场合都提到了同一个技术,那就是具身智能,也就是将生成式AI的能力注入到有形的机器中。Aidan这么对Lukas Biewald表述:“我认为将生成式AI用到机器人技术和实体化方面真的太酷了,而且这个方向有非常强烈的需求。我们都想象过机器人具有高智能和灵活的身体会怎么样——它一定会产生巨大的变革。但是这个方向确实还有很长的路要走,我也希望自己在这个方向产生影响,并试着去做一些相关的事情。”

Ivan也认为具身智能绝对是AI下一阶段的大机会:“我认为最大的机会是能影响实体的‘行动模型’,将AI与工程及实体的产品结合起来,将会非常令人兴奋,也一定会有不少企业对它们感兴趣。但是,这项技术要走向实体化,模型的准确性还需要进一步的提高。”

此外,Aidan也对AI的智能发展和未来应用做了更长远的想象:“现在AI模型的构建依赖于人类,为了让AI更加智能,我们会用人类的各种高阶知识来训练它。打个比方,就像让一个非常聪明的人,去教一个还不那么聪明的AI。那么未来如果AI模型变得非常聪明,人类的知识已经被他全部学会了,就会面临一个临界点——人类已经没什么能教给AI了。我最感兴趣的是,如果AI突破了这个临界点,会发生什么?如果一群已经学完了人类已有知识的AI在一起交谈、探索、学习,会不会产生新的知识?也许当这个时候来临,我们人类会向AI学习新知识,AI会带着人类一起在新的知识海洋里遨游。”

本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年08月13日

22:21
佳力图公司于8月13日正式发布公告,宣布其控股股东南京楷得投资有限公司将启动股份减持计划。根据公告内容,南京楷得投资将通过集中竞价交易方式逐步减持公司股份,减持总规模预计不超过541.8万股,占佳力图总股本的比重将严格控制在1%以内。此次减持行动的核心目标在于优化公司股权结构,提升资本运作效率,为企业的长期稳健发展奠定更坚实的基础。目前,具体的减持时间表尚未...
22:21
8月13日,三友医疗正式发布重要公告,披露了公司实控人之一、董事兼总裁徐农的减持计划。据悉,徐农将通过大宗交易途径,减持其通过混沌天成18号间接持有的公司股份,减持总规模不超过666.92万股,占公司总股本比例不超过2%。值得注意的是,此次减持采用了大宗交易这一特殊方式,而非常规的公开市场交易,这被视为徐农基于对公司未来发展进行战略调整的深思熟虑之举。从市场...
22:21
2025年8月13日,中国神华集团正式公布其最新经营数据,数据显示7月份煤炭销售量显著下滑,具体为3780万吨,较去年同期减少了5.5%。这一数据反映出国内煤炭市场在当前经济环境下的微妙变化。值得注意的是,从年初至今的累计销售数据更为严峻,1月至7月间,公司累计销售煤炭总量达到2.43亿吨,与去年同期相比大幅下降10.1%。这一持续性的销售下滑趋势,不仅揭示...
22:21
8月13日,豫光金铅正式发布重要公告,宣布一项资本运作计划——拟向控股股东河南豫光金铅集团定向发行股票。此次发行的股票定价为每股6.74元,整体募资规模预计不超过4亿元人民币。这一举措旨在为公司注入新鲜血液,有效补充流动资金,同时积极偿还银行贷款,从而进一步优化公司的财务结构,增强资本运作能力。对于豫光金铅而言,此举不仅有助于缓解当前的资金压力,更将为其未来...
22:21
长沙一家企业在参与司法拍卖过程中遭遇意外风波,引发社会广泛关注。该公司原本计划竞拍三套挂牌价均为8万元的房产,然而最终拍卖结果却以流拍收场。更令人意外的是,尽管拍卖失败,该公司仍被法院要求支付共计9000元的“辅拍费”。这一收费决定依据的是湖南高级人民法院2020年颁布的《关于人民法院网络司法拍卖辅助工作的管理办法》。 面对这一情况,该公司表示强烈不满,...
22:21
2025年8月13日,香港金融管理局总裁余伟文在最新撰文中透露了香港银行业信贷风险的最新动态。数据显示,截至第二季末,香港银行特定分类贷款比率维持在1.97%,与3月底的1.98%基本持平,但这一比率仍面临持续上升的压力。余伟文特别指出,商业房地产信贷风险是导致这一压力的主要因素。尽管如此,余伟文强调金管局始终保持高度警惕,持续密切监控银行业的发展状况,并认...
22:21
近日,广州金控基金管理有限公司发布紧急公告,揭露有不法分子利用伪造公司材料进行非法活动的恶劣行为。该公司在公告中郑重声明,所谓"启盈优配"并非其或任何下属机构运营的官方网站,更从未以该名称提供任何形式的融资服务。广州金控强调,该虚假平台系不法分子精心策划的诈骗陷阱,旨在欺骗投资者获取非法利益。 随着金融科技的发展,网络诈骗手段日益多样化,广州金控基金管理有限...
22:21
2025年8月13日,腾讯公司正式宣布其在人工智能领域的硬件布局已取得重大进展。据官方消息透露,腾讯目前已成功储备了充足的自研芯片资源,这些芯片能够高效支持大规模人工智能模型的训练与迭代升级需求。在核心技术层面,腾讯不仅拥有自主研发的训练芯片,更在AI推理芯片领域构建了多元化的解决方案矩阵,这意味着公司在面对不同场景的AI应用需求时,具备了丰富的技术选择空间...
22:21
2026款深蓝L07于2025年8月13日正式面向市场,推出包括增程版与纯电版在内的6个丰富版本车型,为消费者提供多样化的选择。其中,增程车型具备高达240km的CLTC纯电续航里程,而纯电车型则拥有令人瞩目的660km CLTC续航表现,确保了不同场景下的出行需求。新车定价区间设定在13.59万元至15.59万元之间,凭借极具竞争力的价格,进一步扩大了其市...
22:21
2025年8月13日,中国东方航空在上海虹桥国际机场T2航站楼正式开启新版登机牌的试运行。这一创新举措旨在通过优化登机口、航班时间、座位号等关键信息的呈现方式,显著提升旅客的出行体验。新版登机牌采用加粗放大字体设计,并强化色彩对比度,使核心信息一目了然,特别照顾到老年旅客的阅读需求。这一人性化的改进不仅有助于旅客快速准确地获取重要信息,更能有效降低误机风险,...
22:21
麦格理今日发布最新市场分析报告,正式将CoreWeave的目标股价从65美元大幅上调至115美元,涨幅高达76%。这一显著调整不仅彰显了分析师对CoreWeave未来增长潜力的强烈信心,更体现了该公司在当前市场环境下的卓越发展态势。报告指出,CoreWeave凭借其创新业务模式与稳健的财务表现,已成功在行业竞争中脱颖而出,未来发展空间广阔。此次目标价上调,预...
21:17
2025年8月13日,资本市场迎来一系列重磅消息,多家上市公司纷纷发布重大公告,引发市场广泛关注。芯碁微装宣布正式启动H股发行计划,并正式向香港联交所递交上市申请,此举标志着该公司加速国际化布局,有望进一步提升品牌影响力。与此同时,长城军工发布紧急公告,表示若股价持续快速上涨,将可能申请停牌接受监管核查,以维护市场公平交易秩序。 在退市机制方面,*ST天茂成...