编者按:本文源自微信公众号腾讯科技(ID:qqtech),作者纪振宇,出品腾讯新闻《潜望》,经微新创想授权发布。ChatGPT的横空出世,让人们首次见证了人工智能大语言模型的惊人能力,通过自然语言交互,人与机器之间似乎建立起了一种微妙的理解关系,新一轮人工智能热潮由此掀起。ChatGPT所展现出的卓越“理解力”,是否标志着机器意识的觉醒?在通往通用人工智能的道路上,目前还存在哪些挑战?人工智能威胁论是否言过其实?未来人工智能将如何发展?带着这些疑问,腾讯新闻《潜望》近日独家专访了卡耐基梅隆大学人工智能教授、前苹果AI首席科学家Ruslan Salakhutdinov。Salakhutdinov师从图灵奖得主、“深度学习之父”杰弗里·辛顿(Geoffrey Hinton),是剪枝、深度编码等著名学习方法的提出者。2016年,Salakhutdinov加入卡耐基梅隆大学,同年获得英伟达人工智能先驱奖,并加入苹果公司担任首任AI研究总监。作为一名人工智能领域的资深学者,Salakhutdinov在对话中表达了乐观态度。他表示,对这一轮AI所展现出的能力感到兴奋,且不认为当前的人工智能发展会对人类生存构成威胁;同时,他认为大语言模型虽不一定是通用人工智能的唯一路径,但却是关键基础,这方面的进展为学术界探索通用人工智能提供了更多启发和信心。作为辛顿的弟子,他也理解辛顿的担忧,但坚持自己对AI更为乐观的判断。以下为此次对话的文字实录,内容有所删减:大模型将革新教育等领域腾讯新闻《潜望》:Salakhutdinov教授,感谢您接受我们的采访。当前世界复杂多变,许多事物以日新月异的速度发展,我们深感幸运能在此探讨这些重要议题。首先让我们聚焦近期最热门的话题——ChatGPT。去年底ChatGPT一经发布,您的第一反应是什么?Russ Salakhutdinov:此前已有GPT-2、GPT-3,我们期待这些模型会持续增强,但去年11月ChatGPT上线时,许多人惊讶于其惊人的表现。在海量数据上构建的大型语言模型,不仅能提问、回答特定问题,还能进行总结。我的许多朋友都在使用ChatGPT进行编程。若在几年前问我,如今能否拥有这项技术,我可能会说不可能,因此我认为这是一项了不起的成就,为不同领域开辟了全新机遇。腾讯新闻《潜望》:编程方面确实令人惊叹,我虽无编程经验,但通过ChatGPT用自然语言描述目标,它就能生成可执行的代码,这让我受益匪浅。Russ Salakhutdinov:是的,这是许多人实际应用大型语言模型的领域之一。这些大模型背后,微软和OpenAI整合了整个GitHub存储库的代码,因此用户在询问代码相关问题时,语言模型表现优异。未来几乎每个编程工具都会配备大型语言模型助手,这一领域将涌现众多应用。腾讯新闻《潜望》:尽管我们能直观感受ChatGPT的强大能力,但许多人仍对人工智能行业的发展感到困惑。ChatGPT或其他大语言模型对普通人意味着什么?Russ Salakhutdinov:这些模型基于过去20年深度学习技术的积累,ChatGPT和Bard等模型的底层架构源自谷歌的Transformer。这对普通人意味着,未来将看到更多人通过自然语言与数据交互。例如,教育领域将迎来变革,未来学生可使用ChatGPT或Bard完成作业、撰写论文,甚至获得个性化辅导。人工智能导师将针对每位学生提供定制化指导,解答问题、教授知识、解释代码或数学概念。此外,当前我们与计算机的交互方式主要是通过搜索引擎获取信息,未来将转变为通过聊天机器人或语言模型进行,用户只需提问,系统便会提供所需信息,无需在网站上逐一查找。腾讯新闻《潜望》:这或许就是谷歌感到焦虑的原因?Russ Salakhutdinov:是的,但这些大型语言模型目前仍不完美,会“产生幻觉”,我们能否解决这一问题?有人认为我们无法解决,或许需要更多时间,但无论如何,人机交互方式将发生改变。“我不认为我们处于需要担忧AI风险的阶段”腾讯新闻《潜望》:当前围绕AI发展的辩论和担忧不绝于耳,您如何看待这些问题?从人类未来发展的角度,您更倾向乐观还是悲观?Russ Salakhutdinov:这是一个重要问题。目前人工智能研究领域存在两大阵营:一派认为AI将带来危害,甚至威胁人类生存;另一派则认为AI充满机遇,将推动医疗系统变革、药物研发进步等。我属于乐观派,不认为当前AI发展构成生存威胁,即使我的导师辛顿对此表示担忧。他是极具智慧的人,但我认为我们尚未到达需要担忧的阶段。目前最大的担忧之一是错误信息的传播,例如通过提示轻易伪造他人声音或视频,未来大规模生成此类内容将极为廉价,使信息真伪难辨。我们需要思考如何通过法规防止这种情况发生。此外,信息偏差也是问题,模型训练数据若存在缺陷,模型将学习错误信息。腾讯新闻《潜望》:您曾转发一幅描绘机器人奴役人类的《纽约客》漫画,并评论“这基本反映了我们当前的情况”。您认为这就是未来吗?Russ Salakhutdinov:这是一个幽默的比喻,但ChatGPT等模型本质上是通过训练预测或自动完成句子,从人类反馈中微调。这些模型属于自回归模型,一次预测一个单词,虽在自然语言理解方面表现出色,但从未接触过视频,缺乏对物理世界的感知。这就是这些模型的局限性,它们在文本处理上达到一定水平,但距离超越人类还很遥远。尽管如此,它们在多个领域仍将发挥重要作用,但至少目前还无法做到比人类更聪明。作为辛顿的学生,我能理解他的担忧。因为人类需要约20年学习才能在领域内变得精通,而数字智能通过大规模分布式训练,几天内就能“阅读”整个互联网。若超级智能出现,相关风险也不容忽视,这是辛顿的担忧所在。我理解这一观点,但不认为当前模型会通过文本规律形成决策对抗人类,因为它们缺乏对物理世界的感知。真正的智能需要与世界互动。腾讯新闻《潜望》:您提到AI需要感知真实物理世界,这需要多长时间?Russ Salakhutdinov:我无法确定具体时间。目前工业界在多模态模型方面做了大量工作,模型不仅处理文本,还能处理视频图像、语音等。但问题是这些基础模型能否从环境中学习并变得聪明。目前大语言模型缺乏主动学习者,即能主动探索物理世界的机器人,例如做饭或自动驾驶的机器人。我们距离这一目标还很远。建立真正的智能需要与世界互动,而不仅仅是被动观察文本视频。现在有许多相关研究正在进行,包括我自己的团队,我们开发了可在房屋内移动的机器人,能理解环境并与之互动。但从技术上讲,我们距离目标仍很遥远,这被称为物理人工智能,与ChatGPT这类大语言模型不同。腾讯新闻《潜望》:许多人认为大语言模型是通往通用人工智能(AGI)的正确途径,您同意吗?Russ Salakhutdinov:通用人工智能意味着系统不仅能解决特定任务,还能应对多种任务。语言模型无疑是关键,它们将在构建AGI中发挥重要作用,但我们距离目标仍很远。若能整合图像视觉等其他模态,或许能构建更智能的系统。目前波士顿动力的机器人主要基于控制理论,未结合大语言模型。卡耐基梅隆大学的研究正在尝试将ChatGPT等模型与机器人技术结合,ChatGPT可提供高级指令,指导机器人系统完成任务。未来大型语言模型、不同模态、机器人技术的融合将是发展方向,尽管目前仍非常困难。波士顿动力研发机器人已20年,但让机器人拿起水杯仍很困难,因此还有大量工作要做。许多大型科技公司如谷歌、微软、苹果等都在探索构建可移动的机器人或老年人辅助系统。我们正在与这些公司合作。腾讯新闻《潜望》:大语言模型展现出惊人功能,但模型开发者却不知其原理,似乎存在许多未知。您认为这种趋势会持续,还是未来未知将逐渐被揭示?Russ Salakhutdinov:人们对模型能完成的任务感到惊讶,这得益于数据规模。但模型能力可能触及天花板,因为数据有限。OpenAI已抓取网络大部分内容,谷歌也可能接近极限。未来我们需要开发更好的系统。目前模型难以调试,例如产生“幻觉”时,我们很难知道原因,因为它们是复杂系统。下一代模型可能会纳入规则集或约束,确保输出正确答案。但当前模型大多是“黑匣子”,难以理解内部机制。未来AI的演变将是可在物理世界中交互的代理,如移动机器人或虚拟/物理世界模拟器。主动学习将成为AI的下一阶段。未来十年将是AI的黄金时代,更多功能将涌现,更智能的模型将出现,这令人兴奋。因此辛顿有理由担忧,但我认为当前AI系统仍处于有用阶段,未来将发展为主动采取行动的模型,例如机器人根据指令预约医生。苹果在研发大模型,且更重视数据隐私苹果在研发自己的大模型,且更重视数据隐私。腾讯新闻《潜望》:您曾在苹果工作,领导AI研究,此前苹果宣布Vision Pro,似乎对未来愿景有独特规划。您能结合苹果经历谈谈理解吗?Russ Salakhutdinov:苹果是行业领导者,我也曾参与其中。Vision Pro等项目苹果早已布局,ChatGPT出现前就已探索相关技术。苹果也在研究大型语言模型,我确信他们正在开发类似ChatGPT的系统。Siri和个人助理是苹果产品的重要组成部分,但巨大的虚拟现实设备仍存在挑战,例如必须佩戴在头上,这与Meta的Oculus类似。苹果显然非常重视可穿戴设备,手表、手机、耳机、平板等都是其产品线。我在苹果时听说过这个项目,但担心的是佩戴舒适度问题。苹果的优势在于软件硬件结合,能真正交付给用户。他们正在研究大语言模型,并考虑如何应用于产品。我认为苹果是唯一能如此完美结合软件硬件的公司,能顺利交付给消费者。腾讯新闻《潜望》:Siri推出10年来,功能仍较简单,为何苹果未大幅更新?Russ Salakhutdinov:我在2020年离开苹果,当时已认为谷歌在语音识别方面表现更好。但苹果的独特之处在于重视隐私和数据保护。例如,询问Siri信息时,数据保留在手机上处理;而使用谷歌服务时,信息会发送到云端,利用更多计算能力。这体现了两种不同理念,这也是Siri落后于谷歌的原因。苹果试图在手机上完成所有任务,未来人们可能更信任苹果设备,因为数据不会被用于训练其他模型。现在苹果也在构建大型语言模型,希望在手机上实现,这是正确的方向。他们必须创新硬件、芯片和设计,以便在个人设备上处理信息。ChatGPT需要云端和大量GPU,目前手机无法实现,因此苹果在探索新的硬件和架构。腾讯新闻《潜望》:从这个角度看,苹果在研发大模型时给自己设了限制。Russ Salakhutdinov:是的,但客户确实信任苹果,他们重视隐私数据。未来人们可能更信任苹果。OpenAI为何决定不开源?腾讯新闻《潜望》:OpenAI备受关注,为何在Transformer架构提出后,将大语言模型作为重点,并取得惊人成就?Russ Salakhutdinov:OpenAI首席科学家之一是我的实验室伙伴,他是联合创始人之一。OpenAI早期探索过游戏、机器人技术等,但意识到语言应用潜力巨大,最初使用Transformer取得回报。OpenAI要么创造惊人产品,要么破产,因此专注于此。尽管底层架构由谷歌开发,谷歌内部也有类似ChatGPT的Bard模型,但表现可能不如ChatGPT。腾讯新闻《潜望》:OpenAI现在决定不开源,您认为他们做对了吗?Russ Salakhutdinov:这是一个复杂问题。OpenAI最初是公益组织,计划开源,但在开发GPT-3时决定不开源,担心被滥用生成虚假文本或新闻。OpenAI与微软合作,所有技术将用于微软产品,微软非常支持他们,提供大量计算资源、GPU和工程标记。微软显然不会开源,因为这将成为其产品的一部分。因此OpenAI不会开源,他们必须盈利生存。但同时许多项目已开源,如Meta发布的LLama模型。许多公司正在构建自己的模型。腾讯新闻《潜望》:OpenAI CEO Sam Altman近期呼吁AI安全和监管,许多人说他更像政客。您认为他这样做的意图是什么?Russ Salakhutdinov:我认为Altman非常理性,他在OpenAI没有任何股权,商业成功不会给他带来利益,我尊重这一点。他们正在做公共关系,为OpenAI建立品牌,希望成为人们首选的AI系统。人工智能社区分裂,是否应要求监管?当前社区存在两大派别:一派主张严格监管,甚至暂停开发;另一派主张继续研发测试。这是一个有趣的时刻,因为没人清楚AI是否会接管世界,只是存在许多不确定性。有人提出担忧,我认为提高关注度是好事,因为技术将被普通人使用,更多关注将了解系统功能。就像隐私问题,我分享数据给ChatGPT,不知是好是坏,但至少提高了人们对系统的认识。我认为总体而言是好事,我个人不主张严格规定,未来许多公司会开发专用模型。未来很多公司都有自己的专门模型腾讯新闻《潜望》:美国和中国AI研发令人兴奋,但初创公司存在显著差异。硅谷多在应用层创新,而中国许多公司声称在研发大模型。为何存在这种差异?Russ Salakhutdinov:未来许多公司需要建立自己的大语言模型,因为客户最重视自己的数据。建立基于数据的模型,才能让消费者更便捷地与数据交互。例如,彭博已建立基于金融数据的GPT模型。美国将成为关键参与者,微软、谷歌、亚马逊等将建立自己的模型,他们拥有计算资源。或许在他们的帮助下,也会出现行业专用模型,如金融模型、制药模型等。若我是金融公司,不会将数据发送给OpenAI,因为数据是私有的。许多大公司会拥有自己的专用模型。当然,像微软、谷歌、亚马逊这样的大玩家会提供通用模型,但未来肯定会有更多专用模型。腾讯新闻《潜望》:初创公司缺乏计算资源,是否应专注应用层面?Russ Salakhutdinov:大公司与其他人主要区别在于计算资源,这很昂贵。构建模型需5万个GPU,花费5000万美元。初创公司应考虑开源模型,如Meta的LLama,采用自己的数据微调。许多初创公司正在尝试降低计算量,构建计算量只有大模型十分之一的模型。未来可能会出现更多类似LLama的开源模型,初创公司可以采用并微调,以适应特定领域。行业除大语言模型外,还有其他探索方向吗?大型语言模型是基础模型的一部分,如Transformer架构,建立在大量数据基础上。现在人们可以为机器人技术建立基础模型,例如我的学生与英伟达合作,试图建立类似GPT的操纵模型,构建能操纵任何物体的机器人。这是一个有趣领域。我们与英伟达合作,他们提供计算能力,但构建机器人仍很困难,例如抓住iPhone并放置。除了大型语言模型,人们还在探索不同领域的基础模型,如视频基础模型能否取得巨大成功。若想在抖音上创建视频,只需执行提示,系统便会生成。世界上最聪明的人都在研究AI腾讯新闻《潜望》:您认为现在是否是职业生涯中最激动人心的时刻?Russ Salakhutdinov:到目前为止是的,但也有些应接不暇。现在AI领域博士生竞争激烈,若在今天,我可能都无法申请到博士,因为当时没有重要论文发表。现在甚至收到高中生的邮件,他们已做了出色项目。腾讯新闻《潜望》:这个地球上最聪明的人都在AI领域从事研究。Russ Salakhutdinov:是的,这太神奇了。我以前的学生杨植麟现在是清华大学教授,他是我最聪明的学生之一,建立了GPT模型前身。这太棒了。腾讯新闻《潜望》:未来这种情况会如何演变?会越来越激动人心,还是有所冷却?Russ Salakhutdinov:当然希望未来更令人兴奋。想起2016年自动驾驶领域,当时我开始为苹果工作,负责相关工作。2016年埃隆·马斯克在特斯拉表示两年内将推出自动驾驶汽车,我们从无到有迅速达到80%、90%,但随后陷入瓶颈。自动驾驶汽车进展很快,但永远无法达到100%正确。现在许多人用ChatGPT做许多事情,例如一位律师用ChatGPT起草起诉书,其中引用的案例完全是编造的。人们尚未完全信任AI,因此必须谨慎。但技术具有巨大潜力。腾讯新闻《潜望》:即使我们非常谨慎,是否有一天AI发展会变得不可控?Russ Salakhutdinov:作为科学家,必须为事件分配概率,不能说永远不会发生,一定有概率。但我不认为现在会发生。目前有许多AI子社区致力于AI安全研究,他们的工作是避免AI研发犯错误。我不相信AI会突然变得非常糟糕,但也许我错了。因此社区中发出各种声音是好事,就像辛顿和约书亚的警告。大多数AI研究人员目前不这么认为,但AI安全领域的研究是好事,以防万一。腾讯新闻《潜望》:辛顿教授宣布离开谷歌时,您是否感到惊讶?Russ Salakhutdinov:近几年他一直在谷歌兼职,现在决定离开,大概是想发声。他应该是在考虑我所说的内容如何影响我工作的公司。我认为谷歌是少数正确做事的公司,对AI采取谨慎态度,没有做疯狂的事。我很幸运,他是我的导师,可能是我最好的导师,给了我很多自由和探索空间,他非常聪明,思考超出了框架。我很幸运,是他让我进入深度学习领域,也是他让我读博士,当时我考虑其他职业,但他有一天早上带我去办公室,展示深度学习算法,我说“哇,这非常有趣”,于是决定读博士。这是一个有趣的故事,谢谢你分享。通过今天的采访,我能感受到你作为AI研究者的兴奋。感谢接受采访!本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。
最新快讯
2025年08月05日
浙江大学脑机智能全国重点实验室近日震撼发布全球规模最大的类脑计算机——Darwin Monkey(悟空),这一划时代的突破标志着类脑计算技术正式迈入全新纪元。该计算机拥有超过20亿个脉冲神经元和1000亿突触连接,首次在工程系统中实现了接近猕猴大脑的神经元规模,为人工智能和神经科学研究开辟了前所未有的崭新路径。
技术架构:Darwin3芯片驱动的计算革命
悟...
硅谷创新企业OpenMind正引领一场机器人行业的软件革命。与众多聚焦硬件研发的同行不同,OpenMind将目光锁定在机器人的"大脑"上——他们正在开发名为OM1的机器人操作系统,立志成为机器人领域的"安卓系统"。这一战略转型标志着机器人行业正从硬件竞赛转向软件生态建设的新纪元。
当前机器人行业的竞争格局主要集中在硬件层面,包括运动控制、物体抓取、环境交互等...
麦当劳(MCD)近日正式宣布一项雄心勃勃的战略计划,目标是在2027年前将其人工智能(AI)应用规模扩大一倍,而印度将在这场全球布局中扮演核心角色。作为这一战略的关键落子,麦当劳已将印度海得拉巴选定为美国以外的全球最大办公中心,该中心将全面聚焦于数据治理、工程开发以及平台架构建设等前沿技术领域。图源备注:图片由AI生成,图片授权服务商Midjourney
麦...
2025年8月5日,一则重磅商业交易消息在业界引发广泛关注。据资深行业分析师透露,全球顶级投资银行高盛正计划斥资150亿欧元,从法国私募巨头PAI手中收购全球第二大冰激凌生产商Froneri的控股权。这一潜在交易若最终落成,不仅将深刻改变欧洲食品行业的竞争格局,更可能对全球冰激凌市场的版图产生深远影响。
Froneri作为欧洲冰激凌市场的领军企业,其独特之处...
2025年8月5日,北京时间,金融市场迎来剧烈波动。受美国就业数据意外大幅下调的冲击,市场对美联储9月降息的预期急剧升温,直接推动贵金属价格全线上涨。黄金、白银和铂金等避险资产在避险情绪的推动下表现强劲,投资者纷纷涌入这些传统避险市场寻求保护。
然而,贺利氏最新发布的市场分析报告却揭示了另一面:黄金、白银和铂金的需求正显现短期疲软的迹象。数据显示,今年上半年...
2025年8月5日午间收盘,日本股市呈现稳健上涨态势。日经225指数以40544.99点报收,涨幅达到0.63%,显示出市场投资者的积极情绪。与此同时,日本东证指数表现更为强劲,收于2938.27点,涨幅高达0.8%,进一步印证了市场整体的良好表现。此次午间收盘数据不仅反映了日本经济的复苏迹象,也为全球投资者提供了重要的市场参考。随着全球经济形势的不断变化,...
中航材华顺航空资源服务(北京)有限公司近日正式宣告成立,注册资本高达20亿元人民币,彰显了其在航空领域的雄厚实力与战略布局。该公司由中国航空器材集团有限公司全资控股,法定代表人伍德海先生亲自挂帅,预示着将依托集团强大的资源优势,开启航空资源服务的新篇章。
公司业务范围广泛多元,全面覆盖航空运输设备销售、航空运营支持服务、民用航空材料销售以及保税仓库经营等多个...
今日,创新药概念板块经历了一波强劲的冲高后,出现了明显的回落走势,这一波动迅速吸引了市场的广泛关注。在板块整体调整的过程中,多只处于高位的股票出现了大幅下挫,其中昂利康的股价更是逼近跌停线,而南新制药、华森制药、悦康药业、辰欣药业、贵州百灵、舒泰神等公司的股价跌幅均超过了6%。市场分析人士指出,此次板块的调整很可能与前期涨幅过大有关,随着获利盘的集中涌出,投...
2025年8月5日,日本信州大学传来一项突破性研究成果,一种名为LAHB的新型环保塑料成功在深海环境中实现微生物降解,最终分解为无害的二氧化碳和水。这一发现不仅为海洋塑料污染治理提供了全新解决方案,更标志着生物可降解材料研发领域迈出了重要一步。该塑料由经过基因改造的大肠杆菌工程菌合成,此前已在河水和浅海环境中展现出优异的降解性能。通过引入深海微生物群落进行实...
8月4日,全球知名慈善机构比尔及梅琳达·盖茨基金会正式宣布一项雄心勃勃的计划,将在未来十年内投入高达25亿美元的资金,全面加速女性健康领域的创新研发进程。这笔巨额投资将聚焦于五大关键领域,分别是产科护理、孕产妇健康、妇科与经期健康、避孕技术以及性传播感染防治,旨在通过科技创新为全球女性提供更安全、更有效的健康解决方案。
作为该基金会性别平等部门的负责人,扎伊...
《科创板日报》8月5日讯 米哈游联合创始人蔡浩宇倾力打造的二次创业力作《Whispers from the Star》将于8月15日正式登陆Steam平台,首发售价定为9.99美元,初期仅提供英文版本。这款备受瞩目的游戏以"AI实时交互"为核心创新玩法,开创性地让玩家能够通过深度对话与虚拟角色Stella建立真挚的情感纽带。Stella不仅拥有强大的记忆存储...
2025年8月5日,中欣氟材通过官方互动平台发布重要动态,宣布公司正全力推进轻量化相关材料的市场拓展与认证工作。这一战略举措旨在积极应对当前快速增长的轻量化材料市场需求,通过加速产品布局和技术创新,进一步提升公司在该领域的核心竞争力与行业影响力。随着汽车、航空航天等行业的轻量化趋势日益显著,中欣氟材此举不仅彰显了其敏锐的市场洞察力,更体现了公司致力于推动绿色...