编者按:本文源自微信公众号腾讯科技(ID:qqtech),作者纪振宇,出品腾讯新闻《潜望》,经微新创想授权发布。ChatGPT的横空出世,让人们首次见证了人工智能大语言模型的惊人能力,通过自然语言交互,人与机器之间似乎建立起了一种微妙的理解关系,新一轮人工智能热潮由此掀起。ChatGPT所展现出的卓越“理解力”,是否标志着机器意识的觉醒?在通往通用人工智能的道路上,目前还存在哪些挑战?人工智能威胁论是否言过其实?未来人工智能将如何发展?带着这些疑问,腾讯新闻《潜望》近日独家专访了卡耐基梅隆大学人工智能教授、前苹果AI首席科学家Ruslan Salakhutdinov。Salakhutdinov师从图灵奖得主、“深度学习之父”杰弗里·辛顿(Geoffrey Hinton),是剪枝、深度编码等著名学习方法的提出者。2016年,Salakhutdinov加入卡耐基梅隆大学,同年获得英伟达人工智能先驱奖,并加入苹果公司担任首任AI研究总监。作为一名人工智能领域的资深学者,Salakhutdinov在对话中表达了乐观态度。他表示,对这一轮AI所展现出的能力感到兴奋,且不认为当前的人工智能发展会对人类生存构成威胁;同时,他认为大语言模型虽不一定是通用人工智能的唯一路径,但却是关键基础,这方面的进展为学术界探索通用人工智能提供了更多启发和信心。作为辛顿的弟子,他也理解辛顿的担忧,但坚持自己对AI更为乐观的判断。以下为此次对话的文字实录,内容有所删减:大模型将革新教育等领域腾讯新闻《潜望》:Salakhutdinov教授,感谢您接受我们的采访。当前世界复杂多变,许多事物以日新月异的速度发展,我们深感幸运能在此探讨这些重要议题。首先让我们聚焦近期最热门的话题——ChatGPT。去年底ChatGPT一经发布,您的第一反应是什么?Russ Salakhutdinov:此前已有GPT-2、GPT-3,我们期待这些模型会持续增强,但去年11月ChatGPT上线时,许多人惊讶于其惊人的表现。在海量数据上构建的大型语言模型,不仅能提问、回答特定问题,还能进行总结。我的许多朋友都在使用ChatGPT进行编程。若在几年前问我,如今能否拥有这项技术,我可能会说不可能,因此我认为这是一项了不起的成就,为不同领域开辟了全新机遇。腾讯新闻《潜望》:编程方面确实令人惊叹,我虽无编程经验,但通过ChatGPT用自然语言描述目标,它就能生成可执行的代码,这让我受益匪浅。Russ Salakhutdinov:是的,这是许多人实际应用大型语言模型的领域之一。这些大模型背后,微软和OpenAI整合了整个GitHub存储库的代码,因此用户在询问代码相关问题时,语言模型表现优异。未来几乎每个编程工具都会配备大型语言模型助手,这一领域将涌现众多应用。腾讯新闻《潜望》:尽管我们能直观感受ChatGPT的强大能力,但许多人仍对人工智能行业的发展感到困惑。ChatGPT或其他大语言模型对普通人意味着什么?Russ Salakhutdinov:这些模型基于过去20年深度学习技术的积累,ChatGPT和Bard等模型的底层架构源自谷歌的Transformer。这对普通人意味着,未来将看到更多人通过自然语言与数据交互。例如,教育领域将迎来变革,未来学生可使用ChatGPT或Bard完成作业、撰写论文,甚至获得个性化辅导。人工智能导师将针对每位学生提供定制化指导,解答问题、教授知识、解释代码或数学概念。此外,当前我们与计算机的交互方式主要是通过搜索引擎获取信息,未来将转变为通过聊天机器人或语言模型进行,用户只需提问,系统便会提供所需信息,无需在网站上逐一查找。腾讯新闻《潜望》:这或许就是谷歌感到焦虑的原因?Russ Salakhutdinov:是的,但这些大型语言模型目前仍不完美,会“产生幻觉”,我们能否解决这一问题?有人认为我们无法解决,或许需要更多时间,但无论如何,人机交互方式将发生改变。“我不认为我们处于需要担忧AI风险的阶段”腾讯新闻《潜望》:当前围绕AI发展的辩论和担忧不绝于耳,您如何看待这些问题?从人类未来发展的角度,您更倾向乐观还是悲观?Russ Salakhutdinov:这是一个重要问题。目前人工智能研究领域存在两大阵营:一派认为AI将带来危害,甚至威胁人类生存;另一派则认为AI充满机遇,将推动医疗系统变革、药物研发进步等。我属于乐观派,不认为当前AI发展构成生存威胁,即使我的导师辛顿对此表示担忧。他是极具智慧的人,但我认为我们尚未到达需要担忧的阶段。目前最大的担忧之一是错误信息的传播,例如通过提示轻易伪造他人声音或视频,未来大规模生成此类内容将极为廉价,使信息真伪难辨。我们需要思考如何通过法规防止这种情况发生。此外,信息偏差也是问题,模型训练数据若存在缺陷,模型将学习错误信息。腾讯新闻《潜望》:您曾转发一幅描绘机器人奴役人类的《纽约客》漫画,并评论“这基本反映了我们当前的情况”。您认为这就是未来吗?Russ Salakhutdinov:这是一个幽默的比喻,但ChatGPT等模型本质上是通过训练预测或自动完成句子,从人类反馈中微调。这些模型属于自回归模型,一次预测一个单词,虽在自然语言理解方面表现出色,但从未接触过视频,缺乏对物理世界的感知。这就是这些模型的局限性,它们在文本处理上达到一定水平,但距离超越人类还很遥远。尽管如此,它们在多个领域仍将发挥重要作用,但至少目前还无法做到比人类更聪明。作为辛顿的学生,我能理解他的担忧。因为人类需要约20年学习才能在领域内变得精通,而数字智能通过大规模分布式训练,几天内就能“阅读”整个互联网。若超级智能出现,相关风险也不容忽视,这是辛顿的担忧所在。我理解这一观点,但不认为当前模型会通过文本规律形成决策对抗人类,因为它们缺乏对物理世界的感知。真正的智能需要与世界互动。腾讯新闻《潜望》:您提到AI需要感知真实物理世界,这需要多长时间?Russ Salakhutdinov:我无法确定具体时间。目前工业界在多模态模型方面做了大量工作,模型不仅处理文本,还能处理视频图像、语音等。但问题是这些基础模型能否从环境中学习并变得聪明。目前大语言模型缺乏主动学习者,即能主动探索物理世界的机器人,例如做饭或自动驾驶的机器人。我们距离这一目标还很远。建立真正的智能需要与世界互动,而不仅仅是被动观察文本视频。现在有许多相关研究正在进行,包括我自己的团队,我们开发了可在房屋内移动的机器人,能理解环境并与之互动。但从技术上讲,我们距离目标仍很遥远,这被称为物理人工智能,与ChatGPT这类大语言模型不同。腾讯新闻《潜望》:许多人认为大语言模型是通往通用人工智能(AGI)的正确途径,您同意吗?Russ Salakhutdinov:通用人工智能意味着系统不仅能解决特定任务,还能应对多种任务。语言模型无疑是关键,它们将在构建AGI中发挥重要作用,但我们距离目标仍很远。若能整合图像视觉等其他模态,或许能构建更智能的系统。目前波士顿动力的机器人主要基于控制理论,未结合大语言模型。卡耐基梅隆大学的研究正在尝试将ChatGPT等模型与机器人技术结合,ChatGPT可提供高级指令,指导机器人系统完成任务。未来大型语言模型、不同模态、机器人技术的融合将是发展方向,尽管目前仍非常困难。波士顿动力研发机器人已20年,但让机器人拿起水杯仍很困难,因此还有大量工作要做。许多大型科技公司如谷歌、微软、苹果等都在探索构建可移动的机器人或老年人辅助系统。我们正在与这些公司合作。腾讯新闻《潜望》:大语言模型展现出惊人功能,但模型开发者却不知其原理,似乎存在许多未知。您认为这种趋势会持续,还是未来未知将逐渐被揭示?Russ Salakhutdinov:人们对模型能完成的任务感到惊讶,这得益于数据规模。但模型能力可能触及天花板,因为数据有限。OpenAI已抓取网络大部分内容,谷歌也可能接近极限。未来我们需要开发更好的系统。目前模型难以调试,例如产生“幻觉”时,我们很难知道原因,因为它们是复杂系统。下一代模型可能会纳入规则集或约束,确保输出正确答案。但当前模型大多是“黑匣子”,难以理解内部机制。未来AI的演变将是可在物理世界中交互的代理,如移动机器人或虚拟/物理世界模拟器。主动学习将成为AI的下一阶段。未来十年将是AI的黄金时代,更多功能将涌现,更智能的模型将出现,这令人兴奋。因此辛顿有理由担忧,但我认为当前AI系统仍处于有用阶段,未来将发展为主动采取行动的模型,例如机器人根据指令预约医生。苹果在研发大模型,且更重视数据隐私苹果在研发自己的大模型,且更重视数据隐私。腾讯新闻《潜望》:您曾在苹果工作,领导AI研究,此前苹果宣布Vision Pro,似乎对未来愿景有独特规划。您能结合苹果经历谈谈理解吗?Russ Salakhutdinov:苹果是行业领导者,我也曾参与其中。Vision Pro等项目苹果早已布局,ChatGPT出现前就已探索相关技术。苹果也在研究大型语言模型,我确信他们正在开发类似ChatGPT的系统。Siri和个人助理是苹果产品的重要组成部分,但巨大的虚拟现实设备仍存在挑战,例如必须佩戴在头上,这与Meta的Oculus类似。苹果显然非常重视可穿戴设备,手表、手机、耳机、平板等都是其产品线。我在苹果时听说过这个项目,但担心的是佩戴舒适度问题。苹果的优势在于软件硬件结合,能真正交付给用户。他们正在研究大语言模型,并考虑如何应用于产品。我认为苹果是唯一能如此完美结合软件硬件的公司,能顺利交付给消费者。腾讯新闻《潜望》:Siri推出10年来,功能仍较简单,为何苹果未大幅更新?Russ Salakhutdinov:我在2020年离开苹果,当时已认为谷歌在语音识别方面表现更好。但苹果的独特之处在于重视隐私和数据保护。例如,询问Siri信息时,数据保留在手机上处理;而使用谷歌服务时,信息会发送到云端,利用更多计算能力。这体现了两种不同理念,这也是Siri落后于谷歌的原因。苹果试图在手机上完成所有任务,未来人们可能更信任苹果设备,因为数据不会被用于训练其他模型。现在苹果也在构建大型语言模型,希望在手机上实现,这是正确的方向。他们必须创新硬件、芯片和设计,以便在个人设备上处理信息。ChatGPT需要云端和大量GPU,目前手机无法实现,因此苹果在探索新的硬件和架构。腾讯新闻《潜望》:从这个角度看,苹果在研发大模型时给自己设了限制。Russ Salakhutdinov:是的,但客户确实信任苹果,他们重视隐私数据。未来人们可能更信任苹果。OpenAI为何决定不开源?腾讯新闻《潜望》:OpenAI备受关注,为何在Transformer架构提出后,将大语言模型作为重点,并取得惊人成就?Russ Salakhutdinov:OpenAI首席科学家之一是我的实验室伙伴,他是联合创始人之一。OpenAI早期探索过游戏、机器人技术等,但意识到语言应用潜力巨大,最初使用Transformer取得回报。OpenAI要么创造惊人产品,要么破产,因此专注于此。尽管底层架构由谷歌开发,谷歌内部也有类似ChatGPT的Bard模型,但表现可能不如ChatGPT。腾讯新闻《潜望》:OpenAI现在决定不开源,您认为他们做对了吗?Russ Salakhutdinov:这是一个复杂问题。OpenAI最初是公益组织,计划开源,但在开发GPT-3时决定不开源,担心被滥用生成虚假文本或新闻。OpenAI与微软合作,所有技术将用于微软产品,微软非常支持他们,提供大量计算资源、GPU和工程标记。微软显然不会开源,因为这将成为其产品的一部分。因此OpenAI不会开源,他们必须盈利生存。但同时许多项目已开源,如Meta发布的LLama模型。许多公司正在构建自己的模型。腾讯新闻《潜望》:OpenAI CEO Sam Altman近期呼吁AI安全和监管,许多人说他更像政客。您认为他这样做的意图是什么?Russ Salakhutdinov:我认为Altman非常理性,他在OpenAI没有任何股权,商业成功不会给他带来利益,我尊重这一点。他们正在做公共关系,为OpenAI建立品牌,希望成为人们首选的AI系统。人工智能社区分裂,是否应要求监管?当前社区存在两大派别:一派主张严格监管,甚至暂停开发;另一派主张继续研发测试。这是一个有趣的时刻,因为没人清楚AI是否会接管世界,只是存在许多不确定性。有人提出担忧,我认为提高关注度是好事,因为技术将被普通人使用,更多关注将了解系统功能。就像隐私问题,我分享数据给ChatGPT,不知是好是坏,但至少提高了人们对系统的认识。我认为总体而言是好事,我个人不主张严格规定,未来许多公司会开发专用模型。未来很多公司都有自己的专门模型腾讯新闻《潜望》:美国和中国AI研发令人兴奋,但初创公司存在显著差异。硅谷多在应用层创新,而中国许多公司声称在研发大模型。为何存在这种差异?Russ Salakhutdinov:未来许多公司需要建立自己的大语言模型,因为客户最重视自己的数据。建立基于数据的模型,才能让消费者更便捷地与数据交互。例如,彭博已建立基于金融数据的GPT模型。美国将成为关键参与者,微软、谷歌、亚马逊等将建立自己的模型,他们拥有计算资源。或许在他们的帮助下,也会出现行业专用模型,如金融模型、制药模型等。若我是金融公司,不会将数据发送给OpenAI,因为数据是私有的。许多大公司会拥有自己的专用模型。当然,像微软、谷歌、亚马逊这样的大玩家会提供通用模型,但未来肯定会有更多专用模型。腾讯新闻《潜望》:初创公司缺乏计算资源,是否应专注应用层面?Russ Salakhutdinov:大公司与其他人主要区别在于计算资源,这很昂贵。构建模型需5万个GPU,花费5000万美元。初创公司应考虑开源模型,如Meta的LLama,采用自己的数据微调。许多初创公司正在尝试降低计算量,构建计算量只有大模型十分之一的模型。未来可能会出现更多类似LLama的开源模型,初创公司可以采用并微调,以适应特定领域。行业除大语言模型外,还有其他探索方向吗?大型语言模型是基础模型的一部分,如Transformer架构,建立在大量数据基础上。现在人们可以为机器人技术建立基础模型,例如我的学生与英伟达合作,试图建立类似GPT的操纵模型,构建能操纵任何物体的机器人。这是一个有趣领域。我们与英伟达合作,他们提供计算能力,但构建机器人仍很困难,例如抓住iPhone并放置。除了大型语言模型,人们还在探索不同领域的基础模型,如视频基础模型能否取得巨大成功。若想在抖音上创建视频,只需执行提示,系统便会生成。世界上最聪明的人都在研究AI腾讯新闻《潜望》:您认为现在是否是职业生涯中最激动人心的时刻?Russ Salakhutdinov:到目前为止是的,但也有些应接不暇。现在AI领域博士生竞争激烈,若在今天,我可能都无法申请到博士,因为当时没有重要论文发表。现在甚至收到高中生的邮件,他们已做了出色项目。腾讯新闻《潜望》:这个地球上最聪明的人都在AI领域从事研究。Russ Salakhutdinov:是的,这太神奇了。我以前的学生杨植麟现在是清华大学教授,他是我最聪明的学生之一,建立了GPT模型前身。这太棒了。腾讯新闻《潜望》:未来这种情况会如何演变?会越来越激动人心,还是有所冷却?Russ Salakhutdinov:当然希望未来更令人兴奋。想起2016年自动驾驶领域,当时我开始为苹果工作,负责相关工作。2016年埃隆·马斯克在特斯拉表示两年内将推出自动驾驶汽车,我们从无到有迅速达到80%、90%,但随后陷入瓶颈。自动驾驶汽车进展很快,但永远无法达到100%正确。现在许多人用ChatGPT做许多事情,例如一位律师用ChatGPT起草起诉书,其中引用的案例完全是编造的。人们尚未完全信任AI,因此必须谨慎。但技术具有巨大潜力。腾讯新闻《潜望》:即使我们非常谨慎,是否有一天AI发展会变得不可控?Russ Salakhutdinov:作为科学家,必须为事件分配概率,不能说永远不会发生,一定有概率。但我不认为现在会发生。目前有许多AI子社区致力于AI安全研究,他们的工作是避免AI研发犯错误。我不相信AI会突然变得非常糟糕,但也许我错了。因此社区中发出各种声音是好事,就像辛顿和约书亚的警告。大多数AI研究人员目前不这么认为,但AI安全领域的研究是好事,以防万一。腾讯新闻《潜望》:辛顿教授宣布离开谷歌时,您是否感到惊讶?Russ Salakhutdinov:近几年他一直在谷歌兼职,现在决定离开,大概是想发声。他应该是在考虑我所说的内容如何影响我工作的公司。我认为谷歌是少数正确做事的公司,对AI采取谨慎态度,没有做疯狂的事。我很幸运,他是我的导师,可能是我最好的导师,给了我很多自由和探索空间,他非常聪明,思考超出了框架。我很幸运,是他让我进入深度学习领域,也是他让我读博士,当时我考虑其他职业,但他有一天早上带我去办公室,展示深度学习算法,我说“哇,这非常有趣”,于是决定读博士。这是一个有趣的故事,谢谢你分享。通过今天的采访,我能感受到你作为AI研究者的兴奋。感谢接受采访!本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2026年02月10日

10:28
微新创想:在全球人工智能芯片市场竞争日益激烈的背景下,Cerebras Systems 正在以惊人的速度崭露头角。这家位于加州的芯片公司近日宣布完成了一轮10亿美元的融资,其估值在短短一年内实现了近三倍的飞跃,达到了230亿美元的里程碑。此次融资由硅谷知名风投Benchmark Capital领投,标志着资本市场对非传统GPU架构算力方案的高度认可。 微新创...
10:28
微新创想:人工智能领军企业 OpenAI 近期再次展现出惊人的扩张速度。首席执行官山姆·奥尔特曼在公司内部消息中透露,旗舰产品 ChatGPT 已重回高速增长轨道,目前月增长率已突破 10%。这一数据表明 ChatGPT 在全球范围内的用户基础正在持续扩大,显示出强大的市场接受度和用户黏性。 微新创想:除了用户规模的飞跃,OpenAI 的产品迭代也在加速。奥...
10:28
微新创想:谷歌正通过其核心产品 Chrome 浏览器加速推动搜索体验从“信息查找”向“智能代理”的进化 本周谷歌正式发布了一系列深度集成 AI 的 Chrome 新功能 这些更新旨在将这款全球市场占有率最高的浏览器转型为个人 AI 助手 此次更新的核心亮点是全新的侧边栏体验 Gemini 用户现在可以直接在侧边栏中调动 AI 能力 实时对比购物选项 总结复杂...
10:28
微新创想:面对日益白热化的全球AI竞争,谷歌母公司Alphabet再次展现了惊人的融资能力。据第一财经消息,Alphabet于周一正式启动了一项高评级美元债券发行计划,预计募资金额约为200亿美元。这笔巨额资金将投向何处?根据发行计划,这笔资金将主要用于支撑公司在2026年高达1850亿美元的资本开支预算。 微新创想:Alphabet明确表示,投入的重点将聚...
10:28
微新创想:继2月1日开启“上元宝,分10亿”新春活动后,腾讯 AI 应用“元宝”于今日凌晨宣布福利升级。用户只需在微信聊天中发送“元宝”二字,即可触发福袋掉落,现金红包将直接存入微信零钱。多重玩法叠加,最高可领万元现金本次活动将持续至2月17日。 除微信聊天彩蛋外,用户登录元宝 App 进入主会场,每天可获得多次抽奖机会。奖池涵盖现金红包、最高5倍的“红包膨...
10:27
微新创想:2月9日 扬州人工智能产业园迎来重要里程碑——钉钉(扬州)AI应用服务中心正式挂牌成立。作为扬州引进的首个AI产业服务应用项目 该中心旨在深度赋能本地企业 推动AI技术从单纯的“辅助工具”进化为企业内部的“流程执行者” 聚焦核心产业 打造数字新优势:钉钉作为阿里巴巴集团旗下的核心办公平台 此次落户扬州具有极强的针对性。深耕集群 重点面向扬州的高...
10:27
微新创想:近日字节跳动发布了新一代多模态视频生成大模型 Seedance2.0 其强大的性能迅速横扫社交媒体。然而伴随“地表最强”美誉而来的是一场关于 AI 伦理与肖像隐私的激烈讨论。 微新创想:这场讨论的导火索来自知名科技博主“影视飓风”创始人 Tim(潘天鸿)的深度评测。Tim 指出他在未授权未提供音频甚至未给任何文字提示的情况下仅上传了一张自己的照片 ...
09:50
微新创想:2026年2月10日,印度Piramal Pharma旗下子公司Piramal Critical Care(美国)与英国Blue-Zone Technologies宣布达成战略合作。双方将在全球范围内联合开发覆盖全生命周期的废弃麻醉气体捕集与回收技术解决方案。此举旨在应对手术室中挥发性麻醉剂排放导致的环境影响,提升医疗低碳实践水平。合作涵盖技术研发...
09:50
微新创想:2026年2月8日,LineageOS团队正式发布23.2版本 该版本全面采用Android最新Material 3 Expressive设计语言 同步Pixel系列与AOSP视觉规范 更新涵盖重制快捷设置面板 扩展深色模式覆盖范围 并完成Twelve音乐播放器等内置应用的UI适配 为响应AOSP发布周期延长至六个月 LineageOS将大版本更新...
09:50
微新创想:2026年2月,机械电子及电子产品批发商阁润世界完成1.57亿元人民币A轮融资 此次融资标志着阁润世界在行业发展中的重要一步 本轮融资将重点用于技术升级、网络拓展和品牌建设 公司计划投入研发GreenPlus+节能系统与GreenCare智能运维平台 加速商业厨房绿色化、智能化转型 业务涵盖厨房设备制造、厨房设计、室内装饰工程及通风管道施工等领域 ...
09:50
微新创想:2026年2月10日,信达生物制药集团与礼来制药宣布达成新一轮战略合作。双方将在全球范围内共同推进肿瘤及自身免疫领域创新药物的研发。此次合作是两家企业自2015年以来的第七次携手,标志着双方长期伙伴关系持续深化。 合作旨在加速临床前至临床阶段项目的转化,提升全球患者对突破性疗法的可及性。具体项目细节未予披露。此次战略联盟不仅加强了双方在生物医药领域...
09:50
微新创想:2026年春运于2月2日正式启动 首周导航里程达340亿公里 2026年春运于2月2日正式启动 这是中国一年一度的交通运输高峰期 也是全国民众返乡探亲的重要时段 高德地图数据显示 在春运首周即2月2日至8日期间 平台导航总里程达到了惊人的340亿公里 这一数字充分体现了春运期间民众出行的密集程度和交通需求的旺盛 与此同时 高德地图的北斗定位调用量也...