编者按:本文源自微信公众号腾讯科技(ID:qqtech),作者纪振宇,出品腾讯新闻《潜望》,经微新创想授权发布。ChatGPT的横空出世,让人们首次见证了人工智能大语言模型的惊人能力,通过自然语言交互,人与机器之间似乎建立起了一种微妙的理解关系,新一轮人工智能热潮由此掀起。ChatGPT所展现出的卓越“理解力”,是否标志着机器意识的觉醒?在通往通用人工智能的道路上,目前还存在哪些挑战?人工智能威胁论是否言过其实?未来人工智能将如何发展?带着这些疑问,腾讯新闻《潜望》近日独家专访了卡耐基梅隆大学人工智能教授、前苹果AI首席科学家Ruslan Salakhutdinov。Salakhutdinov师从图灵奖得主、“深度学习之父”杰弗里·辛顿(Geoffrey Hinton),是剪枝、深度编码等著名学习方法的提出者。2016年,Salakhutdinov加入卡耐基梅隆大学,同年获得英伟达人工智能先驱奖,并加入苹果公司担任首任AI研究总监。作为一名人工智能领域的资深学者,Salakhutdinov在对话中表达了乐观态度。他表示,对这一轮AI所展现出的能力感到兴奋,且不认为当前的人工智能发展会对人类生存构成威胁;同时,他认为大语言模型虽不一定是通用人工智能的唯一路径,但却是关键基础,这方面的进展为学术界探索通用人工智能提供了更多启发和信心。作为辛顿的弟子,他也理解辛顿的担忧,但坚持自己对AI更为乐观的判断。以下为此次对话的文字实录,内容有所删减:大模型将革新教育等领域腾讯新闻《潜望》:Salakhutdinov教授,感谢您接受我们的采访。当前世界复杂多变,许多事物以日新月异的速度发展,我们深感幸运能在此探讨这些重要议题。首先让我们聚焦近期最热门的话题——ChatGPT。去年底ChatGPT一经发布,您的第一反应是什么?Russ Salakhutdinov:此前已有GPT-2、GPT-3,我们期待这些模型会持续增强,但去年11月ChatGPT上线时,许多人惊讶于其惊人的表现。在海量数据上构建的大型语言模型,不仅能提问、回答特定问题,还能进行总结。我的许多朋友都在使用ChatGPT进行编程。若在几年前问我,如今能否拥有这项技术,我可能会说不可能,因此我认为这是一项了不起的成就,为不同领域开辟了全新机遇。腾讯新闻《潜望》:编程方面确实令人惊叹,我虽无编程经验,但通过ChatGPT用自然语言描述目标,它就能生成可执行的代码,这让我受益匪浅。Russ Salakhutdinov:是的,这是许多人实际应用大型语言模型的领域之一。这些大模型背后,微软和OpenAI整合了整个GitHub存储库的代码,因此用户在询问代码相关问题时,语言模型表现优异。未来几乎每个编程工具都会配备大型语言模型助手,这一领域将涌现众多应用。腾讯新闻《潜望》:尽管我们能直观感受ChatGPT的强大能力,但许多人仍对人工智能行业的发展感到困惑。ChatGPT或其他大语言模型对普通人意味着什么?Russ Salakhutdinov:这些模型基于过去20年深度学习技术的积累,ChatGPT和Bard等模型的底层架构源自谷歌的Transformer。这对普通人意味着,未来将看到更多人通过自然语言与数据交互。例如,教育领域将迎来变革,未来学生可使用ChatGPT或Bard完成作业、撰写论文,甚至获得个性化辅导。人工智能导师将针对每位学生提供定制化指导,解答问题、教授知识、解释代码或数学概念。此外,当前我们与计算机的交互方式主要是通过搜索引擎获取信息,未来将转变为通过聊天机器人或语言模型进行,用户只需提问,系统便会提供所需信息,无需在网站上逐一查找。腾讯新闻《潜望》:这或许就是谷歌感到焦虑的原因?Russ Salakhutdinov:是的,但这些大型语言模型目前仍不完美,会“产生幻觉”,我们能否解决这一问题?有人认为我们无法解决,或许需要更多时间,但无论如何,人机交互方式将发生改变。“我不认为我们处于需要担忧AI风险的阶段”腾讯新闻《潜望》:当前围绕AI发展的辩论和担忧不绝于耳,您如何看待这些问题?从人类未来发展的角度,您更倾向乐观还是悲观?Russ Salakhutdinov:这是一个重要问题。目前人工智能研究领域存在两大阵营:一派认为AI将带来危害,甚至威胁人类生存;另一派则认为AI充满机遇,将推动医疗系统变革、药物研发进步等。我属于乐观派,不认为当前AI发展构成生存威胁,即使我的导师辛顿对此表示担忧。他是极具智慧的人,但我认为我们尚未到达需要担忧的阶段。目前最大的担忧之一是错误信息的传播,例如通过提示轻易伪造他人声音或视频,未来大规模生成此类内容将极为廉价,使信息真伪难辨。我们需要思考如何通过法规防止这种情况发生。此外,信息偏差也是问题,模型训练数据若存在缺陷,模型将学习错误信息。腾讯新闻《潜望》:您曾转发一幅描绘机器人奴役人类的《纽约客》漫画,并评论“这基本反映了我们当前的情况”。您认为这就是未来吗?Russ Salakhutdinov:这是一个幽默的比喻,但ChatGPT等模型本质上是通过训练预测或自动完成句子,从人类反馈中微调。这些模型属于自回归模型,一次预测一个单词,虽在自然语言理解方面表现出色,但从未接触过视频,缺乏对物理世界的感知。这就是这些模型的局限性,它们在文本处理上达到一定水平,但距离超越人类还很遥远。尽管如此,它们在多个领域仍将发挥重要作用,但至少目前还无法做到比人类更聪明。作为辛顿的学生,我能理解他的担忧。因为人类需要约20年学习才能在领域内变得精通,而数字智能通过大规模分布式训练,几天内就能“阅读”整个互联网。若超级智能出现,相关风险也不容忽视,这是辛顿的担忧所在。我理解这一观点,但不认为当前模型会通过文本规律形成决策对抗人类,因为它们缺乏对物理世界的感知。真正的智能需要与世界互动。腾讯新闻《潜望》:您提到AI需要感知真实物理世界,这需要多长时间?Russ Salakhutdinov:我无法确定具体时间。目前工业界在多模态模型方面做了大量工作,模型不仅处理文本,还能处理视频图像、语音等。但问题是这些基础模型能否从环境中学习并变得聪明。目前大语言模型缺乏主动学习者,即能主动探索物理世界的机器人,例如做饭或自动驾驶的机器人。我们距离这一目标还很远。建立真正的智能需要与世界互动,而不仅仅是被动观察文本视频。现在有许多相关研究正在进行,包括我自己的团队,我们开发了可在房屋内移动的机器人,能理解环境并与之互动。但从技术上讲,我们距离目标仍很遥远,这被称为物理人工智能,与ChatGPT这类大语言模型不同。腾讯新闻《潜望》:许多人认为大语言模型是通往通用人工智能(AGI)的正确途径,您同意吗?Russ Salakhutdinov:通用人工智能意味着系统不仅能解决特定任务,还能应对多种任务。语言模型无疑是关键,它们将在构建AGI中发挥重要作用,但我们距离目标仍很远。若能整合图像视觉等其他模态,或许能构建更智能的系统。目前波士顿动力的机器人主要基于控制理论,未结合大语言模型。卡耐基梅隆大学的研究正在尝试将ChatGPT等模型与机器人技术结合,ChatGPT可提供高级指令,指导机器人系统完成任务。未来大型语言模型、不同模态、机器人技术的融合将是发展方向,尽管目前仍非常困难。波士顿动力研发机器人已20年,但让机器人拿起水杯仍很困难,因此还有大量工作要做。许多大型科技公司如谷歌、微软、苹果等都在探索构建可移动的机器人或老年人辅助系统。我们正在与这些公司合作。腾讯新闻《潜望》:大语言模型展现出惊人功能,但模型开发者却不知其原理,似乎存在许多未知。您认为这种趋势会持续,还是未来未知将逐渐被揭示?Russ Salakhutdinov:人们对模型能完成的任务感到惊讶,这得益于数据规模。但模型能力可能触及天花板,因为数据有限。OpenAI已抓取网络大部分内容,谷歌也可能接近极限。未来我们需要开发更好的系统。目前模型难以调试,例如产生“幻觉”时,我们很难知道原因,因为它们是复杂系统。下一代模型可能会纳入规则集或约束,确保输出正确答案。但当前模型大多是“黑匣子”,难以理解内部机制。未来AI的演变将是可在物理世界中交互的代理,如移动机器人或虚拟/物理世界模拟器。主动学习将成为AI的下一阶段。未来十年将是AI的黄金时代,更多功能将涌现,更智能的模型将出现,这令人兴奋。因此辛顿有理由担忧,但我认为当前AI系统仍处于有用阶段,未来将发展为主动采取行动的模型,例如机器人根据指令预约医生。苹果在研发大模型,且更重视数据隐私苹果在研发自己的大模型,且更重视数据隐私。腾讯新闻《潜望》:您曾在苹果工作,领导AI研究,此前苹果宣布Vision Pro,似乎对未来愿景有独特规划。您能结合苹果经历谈谈理解吗?Russ Salakhutdinov:苹果是行业领导者,我也曾参与其中。Vision Pro等项目苹果早已布局,ChatGPT出现前就已探索相关技术。苹果也在研究大型语言模型,我确信他们正在开发类似ChatGPT的系统。Siri和个人助理是苹果产品的重要组成部分,但巨大的虚拟现实设备仍存在挑战,例如必须佩戴在头上,这与Meta的Oculus类似。苹果显然非常重视可穿戴设备,手表、手机、耳机、平板等都是其产品线。我在苹果时听说过这个项目,但担心的是佩戴舒适度问题。苹果的优势在于软件硬件结合,能真正交付给用户。他们正在研究大语言模型,并考虑如何应用于产品。我认为苹果是唯一能如此完美结合软件硬件的公司,能顺利交付给消费者。腾讯新闻《潜望》:Siri推出10年来,功能仍较简单,为何苹果未大幅更新?Russ Salakhutdinov:我在2020年离开苹果,当时已认为谷歌在语音识别方面表现更好。但苹果的独特之处在于重视隐私和数据保护。例如,询问Siri信息时,数据保留在手机上处理;而使用谷歌服务时,信息会发送到云端,利用更多计算能力。这体现了两种不同理念,这也是Siri落后于谷歌的原因。苹果试图在手机上完成所有任务,未来人们可能更信任苹果设备,因为数据不会被用于训练其他模型。现在苹果也在构建大型语言模型,希望在手机上实现,这是正确的方向。他们必须创新硬件、芯片和设计,以便在个人设备上处理信息。ChatGPT需要云端和大量GPU,目前手机无法实现,因此苹果在探索新的硬件和架构。腾讯新闻《潜望》:从这个角度看,苹果在研发大模型时给自己设了限制。Russ Salakhutdinov:是的,但客户确实信任苹果,他们重视隐私数据。未来人们可能更信任苹果。OpenAI为何决定不开源?腾讯新闻《潜望》:OpenAI备受关注,为何在Transformer架构提出后,将大语言模型作为重点,并取得惊人成就?Russ Salakhutdinov:OpenAI首席科学家之一是我的实验室伙伴,他是联合创始人之一。OpenAI早期探索过游戏、机器人技术等,但意识到语言应用潜力巨大,最初使用Transformer取得回报。OpenAI要么创造惊人产品,要么破产,因此专注于此。尽管底层架构由谷歌开发,谷歌内部也有类似ChatGPT的Bard模型,但表现可能不如ChatGPT。腾讯新闻《潜望》:OpenAI现在决定不开源,您认为他们做对了吗?Russ Salakhutdinov:这是一个复杂问题。OpenAI最初是公益组织,计划开源,但在开发GPT-3时决定不开源,担心被滥用生成虚假文本或新闻。OpenAI与微软合作,所有技术将用于微软产品,微软非常支持他们,提供大量计算资源、GPU和工程标记。微软显然不会开源,因为这将成为其产品的一部分。因此OpenAI不会开源,他们必须盈利生存。但同时许多项目已开源,如Meta发布的LLama模型。许多公司正在构建自己的模型。腾讯新闻《潜望》:OpenAI CEO Sam Altman近期呼吁AI安全和监管,许多人说他更像政客。您认为他这样做的意图是什么?Russ Salakhutdinov:我认为Altman非常理性,他在OpenAI没有任何股权,商业成功不会给他带来利益,我尊重这一点。他们正在做公共关系,为OpenAI建立品牌,希望成为人们首选的AI系统。人工智能社区分裂,是否应要求监管?当前社区存在两大派别:一派主张严格监管,甚至暂停开发;另一派主张继续研发测试。这是一个有趣的时刻,因为没人清楚AI是否会接管世界,只是存在许多不确定性。有人提出担忧,我认为提高关注度是好事,因为技术将被普通人使用,更多关注将了解系统功能。就像隐私问题,我分享数据给ChatGPT,不知是好是坏,但至少提高了人们对系统的认识。我认为总体而言是好事,我个人不主张严格规定,未来许多公司会开发专用模型。未来很多公司都有自己的专门模型腾讯新闻《潜望》:美国和中国AI研发令人兴奋,但初创公司存在显著差异。硅谷多在应用层创新,而中国许多公司声称在研发大模型。为何存在这种差异?Russ Salakhutdinov:未来许多公司需要建立自己的大语言模型,因为客户最重视自己的数据。建立基于数据的模型,才能让消费者更便捷地与数据交互。例如,彭博已建立基于金融数据的GPT模型。美国将成为关键参与者,微软、谷歌、亚马逊等将建立自己的模型,他们拥有计算资源。或许在他们的帮助下,也会出现行业专用模型,如金融模型、制药模型等。若我是金融公司,不会将数据发送给OpenAI,因为数据是私有的。许多大公司会拥有自己的专用模型。当然,像微软、谷歌、亚马逊这样的大玩家会提供通用模型,但未来肯定会有更多专用模型。腾讯新闻《潜望》:初创公司缺乏计算资源,是否应专注应用层面?Russ Salakhutdinov:大公司与其他人主要区别在于计算资源,这很昂贵。构建模型需5万个GPU,花费5000万美元。初创公司应考虑开源模型,如Meta的LLama,采用自己的数据微调。许多初创公司正在尝试降低计算量,构建计算量只有大模型十分之一的模型。未来可能会出现更多类似LLama的开源模型,初创公司可以采用并微调,以适应特定领域。行业除大语言模型外,还有其他探索方向吗?大型语言模型是基础模型的一部分,如Transformer架构,建立在大量数据基础上。现在人们可以为机器人技术建立基础模型,例如我的学生与英伟达合作,试图建立类似GPT的操纵模型,构建能操纵任何物体的机器人。这是一个有趣领域。我们与英伟达合作,他们提供计算能力,但构建机器人仍很困难,例如抓住iPhone并放置。除了大型语言模型,人们还在探索不同领域的基础模型,如视频基础模型能否取得巨大成功。若想在抖音上创建视频,只需执行提示,系统便会生成。世界上最聪明的人都在研究AI腾讯新闻《潜望》:您认为现在是否是职业生涯中最激动人心的时刻?Russ Salakhutdinov:到目前为止是的,但也有些应接不暇。现在AI领域博士生竞争激烈,若在今天,我可能都无法申请到博士,因为当时没有重要论文发表。现在甚至收到高中生的邮件,他们已做了出色项目。腾讯新闻《潜望》:这个地球上最聪明的人都在AI领域从事研究。Russ Salakhutdinov:是的,这太神奇了。我以前的学生杨植麟现在是清华大学教授,他是我最聪明的学生之一,建立了GPT模型前身。这太棒了。腾讯新闻《潜望》:未来这种情况会如何演变?会越来越激动人心,还是有所冷却?Russ Salakhutdinov:当然希望未来更令人兴奋。想起2016年自动驾驶领域,当时我开始为苹果工作,负责相关工作。2016年埃隆·马斯克在特斯拉表示两年内将推出自动驾驶汽车,我们从无到有迅速达到80%、90%,但随后陷入瓶颈。自动驾驶汽车进展很快,但永远无法达到100%正确。现在许多人用ChatGPT做许多事情,例如一位律师用ChatGPT起草起诉书,其中引用的案例完全是编造的。人们尚未完全信任AI,因此必须谨慎。但技术具有巨大潜力。腾讯新闻《潜望》:即使我们非常谨慎,是否有一天AI发展会变得不可控?Russ Salakhutdinov:作为科学家,必须为事件分配概率,不能说永远不会发生,一定有概率。但我不认为现在会发生。目前有许多AI子社区致力于AI安全研究,他们的工作是避免AI研发犯错误。我不相信AI会突然变得非常糟糕,但也许我错了。因此社区中发出各种声音是好事,就像辛顿和约书亚的警告。大多数AI研究人员目前不这么认为,但AI安全领域的研究是好事,以防万一。腾讯新闻《潜望》:辛顿教授宣布离开谷歌时,您是否感到惊讶?Russ Salakhutdinov:近几年他一直在谷歌兼职,现在决定离开,大概是想发声。他应该是在考虑我所说的内容如何影响我工作的公司。我认为谷歌是少数正确做事的公司,对AI采取谨慎态度,没有做疯狂的事。我很幸运,他是我的导师,可能是我最好的导师,给了我很多自由和探索空间,他非常聪明,思考超出了框架。我很幸运,是他让我进入深度学习领域,也是他让我读博士,当时我考虑其他职业,但他有一天早上带我去办公室,展示深度学习算法,我说“哇,这非常有趣”,于是决定读博士。这是一个有趣的故事,谢谢你分享。通过今天的采访,我能感受到你作为AI研究者的兴奋。感谢接受采访!本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年10月25日

23:22
2025年10月25日,宁德时代电船科技有限公司自主研发的“6006纯电动多用途运输船”凭借其卓越的创新性和环保性能,成功入选中国交通运输协会评选的“2025年全国交通运输与能源融合创新发展优秀典型案例”。这一成就不仅彰显了该项目的领先地位,更标志着内河航运绿色转型进程中的重大突破。 该项目作为全国首个实现船站整体交付并独立运营的货船换电示范项目,其可复制、...
23:22
10月28日,备受瞩目的第二十一届中国国际煤炭采矿技术交流及设备展览会即将在北京中国国际展览中心(顺义馆)盛大启幕。作为行业权威盛事,本次展会由中国煤炭工业协会主办,中国中煤能源集团鼎力协办,以"科技创新引领未来,绿色发展共筑辉煌"为主题,全面聚焦煤炭采矿领域的最新技术突破与高端装备发展。展会将汇聚全球顶尖企业,集中展示智能化开采、绿色矿山建设等前沿成果,为...
23:22
网络安全公司NCC Group最新研究揭示,人工智能技术正推动语音深度伪造技术实现“实时化”突破,攻击者现能在通话过程中即时模仿目标声音,欺骗成功率高达近100%。这种被称为“深度伪造语音钓鱼”的技术已具备实战能力,仅需中等算力即可运行,在配备RTX A1000显卡的高性能设备上,语音模仿的延迟可控制在0.5秒以内,且模仿出的声音自然度极高,几乎难以分辨真假...
22:37
微新创想10月25日讯,今年9月苹果发布的四款iPhone中,有三款均搭载了12GB内存配置,唯独iPhone 17标准版维持了8GB内存。根据韩国最新市场报告,预计即将推出的iPhone 18标准版将升级至12GB内存,但消费者可能需要等到2027年上半年才能体验这款新机。 据悉,苹果已开始从三星电子采购LPDDR5X内存芯片,此举旨在确保iPhone 1...
22:37
微新创想10月25日讯,苹果近期密集发布了一系列搭载新一代M5芯片的旗舰产品,包括全新MacBook Pro、iPad Pro以及Vision Pro,引发市场广泛关注。在备受瞩目的新品之外,业界普遍猜测苹果正筹备推出一款更具市场竞争力的新MacBook,不少消费者期待其能在节日销售季前正式亮相。 行业资深分析师郭明錤近日释放重要消息,透露苹果正在研发一款定...
22:37
2025年10月25日,备受瞩目的川投泸州天然气发电项目传来捷报,其2号机组成功完成168小时试运行,这一里程碑事件标志着项目双机组已全面竣工并正式投入运营。该项目坐落于四川省泸州市江阳区江北镇,由中能建西南电力设计院承担总承包建设任务,整体规划总装机容量高达1400兆瓦,通过建设两套700兆瓦级燃气—蒸汽联合循环机组,打造区域能源供应的新引擎。 项目引进国...
22:37
2025年10月26日,上海两大机场——浦东国际机场与虹桥国际机场将正式迎来新冬春航季的航班计划调整,这一新安排将持续至2026年3月28日。在全新的航季周期中,上海两场每日计划航班总量将高达2419架次,展现出惊人的航空运输能力。其中,浦东机场作为国际航空枢纽,日均计划航班量达到1643架次,而虹桥机场则承担着重要的国内航线任务,日均计划航班量为776架次...
22:37
Xbox游戏内容与工作室总裁Matt Booty近日在接受《纽约时报》采访时,向外界传递了微软游戏业务战略的重大调整信号。他明确指出,微软正积极重新定义其游戏业务方向,将竞争重心从传统主机游戏逐渐转向短视频、流媒体等多元化的娱乐形式。这一转变背后,是市场趋势的深刻洞察——玩家对特定平台的依赖正在显著减弱,他们更加追求无缝的跨平台体验。为此,微软正致力于在用户...
22:37
2025年英雄联盟全球总决赛四分之一决赛抽签结果正式揭晓,LPL赛区两支顶尖战队将面临前所未有的挑战。TES战队将于10月30日迎战欧洲劲旅G2,展开一场激烈的BO5对决;而AL战队则将在次日挑战三冠王T1,争夺晋级半决赛的资格。此前,TES在LPL内战中以2-1的比分力克BLG强势晋级八强,AL战队更是以全胜战绩早早锁定淘汰赛席位,展现了强大的实力和稳定性...
22:00
据博板堂渠道独家消息,英伟达近期对GeForce RTX 5060 Ti系列显卡实施了一项显著的差异化供货策略,其中16GB显存版本获得了前所未有的资源倾斜。这一决策并非源于传统意义上的产能瓶颈,而是基于对市场需求的精准洞察和前瞻性布局。 随着游戏市场对高画质体验的要求日益严苛,3A大作在纹理细节和场景复杂度上不断突破,显存容量已成为决定游戏流畅度的关键因素...
22:00
2025年10月25日,存储芯片市场迎来重大变化。据产业链深度消息透露,多家存储原厂已紧急暂停DRAM和Flash产品的报价,或采取短期限价策略。这一系列调整主要源于上游供应链持续紧张,价格波动异常剧烈,给整个行业带来巨大挑战。 国内相关企业纷纷表态,各自面临不同局面。江波龙方面表示,当前存货因价格上涨而获益匪浅,预计毛利率将迎来显著提升。而普冉股份则透露,...
22:00
2025年10月25日,备受瞩目的江西医药发展大会在赣州市隆重举行,现场气氛热烈,共达成16个医药重点项目的集中签约。这些项目涵盖了创新药研发、传统中药现代化、高端宠物药品、先进医疗器械制造以及医药科创平台建设等多个前沿领域,全面布局江西省医药产业的未来发展。此次签约不仅标志着江西省在医药领域迈出了重要步伐,更彰显了其推动产业转型升级、实现高质量发展的坚定决...