编者按:本文源自微信公众号腾讯科技(ID:qqtech),作者纪振宇,出品腾讯新闻《潜望》,经微新创想授权发布。ChatGPT的横空出世,让人们首次见证了人工智能大语言模型的惊人能力,通过自然语言交互,人与机器之间似乎建立起了一种微妙的理解关系,新一轮人工智能热潮由此掀起。ChatGPT所展现出的卓越“理解力”,是否标志着机器意识的觉醒?在通往通用人工智能的道路上,目前还存在哪些挑战?人工智能威胁论是否言过其实?未来人工智能将如何发展?带着这些疑问,腾讯新闻《潜望》近日独家专访了卡耐基梅隆大学人工智能教授、前苹果AI首席科学家Ruslan Salakhutdinov。Salakhutdinov师从图灵奖得主、“深度学习之父”杰弗里·辛顿(Geoffrey Hinton),是剪枝、深度编码等著名学习方法的提出者。2016年,Salakhutdinov加入卡耐基梅隆大学,同年获得英伟达人工智能先驱奖,并加入苹果公司担任首任AI研究总监。作为一名人工智能领域的资深学者,Salakhutdinov在对话中表达了乐观态度。他表示,对这一轮AI所展现出的能力感到兴奋,且不认为当前的人工智能发展会对人类生存构成威胁;同时,他认为大语言模型虽不一定是通用人工智能的唯一路径,但却是关键基础,这方面的进展为学术界探索通用人工智能提供了更多启发和信心。作为辛顿的弟子,他也理解辛顿的担忧,但坚持自己对AI更为乐观的判断。以下为此次对话的文字实录,内容有所删减:大模型将革新教育等领域腾讯新闻《潜望》:Salakhutdinov教授,感谢您接受我们的采访。当前世界复杂多变,许多事物以日新月异的速度发展,我们深感幸运能在此探讨这些重要议题。首先让我们聚焦近期最热门的话题——ChatGPT。去年底ChatGPT一经发布,您的第一反应是什么?Russ Salakhutdinov:此前已有GPT-2、GPT-3,我们期待这些模型会持续增强,但去年11月ChatGPT上线时,许多人惊讶于其惊人的表现。在海量数据上构建的大型语言模型,不仅能提问、回答特定问题,还能进行总结。我的许多朋友都在使用ChatGPT进行编程。若在几年前问我,如今能否拥有这项技术,我可能会说不可能,因此我认为这是一项了不起的成就,为不同领域开辟了全新机遇。腾讯新闻《潜望》:编程方面确实令人惊叹,我虽无编程经验,但通过ChatGPT用自然语言描述目标,它就能生成可执行的代码,这让我受益匪浅。Russ Salakhutdinov:是的,这是许多人实际应用大型语言模型的领域之一。这些大模型背后,微软和OpenAI整合了整个GitHub存储库的代码,因此用户在询问代码相关问题时,语言模型表现优异。未来几乎每个编程工具都会配备大型语言模型助手,这一领域将涌现众多应用。腾讯新闻《潜望》:尽管我们能直观感受ChatGPT的强大能力,但许多人仍对人工智能行业的发展感到困惑。ChatGPT或其他大语言模型对普通人意味着什么?Russ Salakhutdinov:这些模型基于过去20年深度学习技术的积累,ChatGPT和Bard等模型的底层架构源自谷歌的Transformer。这对普通人意味着,未来将看到更多人通过自然语言与数据交互。例如,教育领域将迎来变革,未来学生可使用ChatGPT或Bard完成作业、撰写论文,甚至获得个性化辅导。人工智能导师将针对每位学生提供定制化指导,解答问题、教授知识、解释代码或数学概念。此外,当前我们与计算机的交互方式主要是通过搜索引擎获取信息,未来将转变为通过聊天机器人或语言模型进行,用户只需提问,系统便会提供所需信息,无需在网站上逐一查找。腾讯新闻《潜望》:这或许就是谷歌感到焦虑的原因?Russ Salakhutdinov:是的,但这些大型语言模型目前仍不完美,会“产生幻觉”,我们能否解决这一问题?有人认为我们无法解决,或许需要更多时间,但无论如何,人机交互方式将发生改变。“我不认为我们处于需要担忧AI风险的阶段”腾讯新闻《潜望》:当前围绕AI发展的辩论和担忧不绝于耳,您如何看待这些问题?从人类未来发展的角度,您更倾向乐观还是悲观?Russ Salakhutdinov:这是一个重要问题。目前人工智能研究领域存在两大阵营:一派认为AI将带来危害,甚至威胁人类生存;另一派则认为AI充满机遇,将推动医疗系统变革、药物研发进步等。我属于乐观派,不认为当前AI发展构成生存威胁,即使我的导师辛顿对此表示担忧。他是极具智慧的人,但我认为我们尚未到达需要担忧的阶段。目前最大的担忧之一是错误信息的传播,例如通过提示轻易伪造他人声音或视频,未来大规模生成此类内容将极为廉价,使信息真伪难辨。我们需要思考如何通过法规防止这种情况发生。此外,信息偏差也是问题,模型训练数据若存在缺陷,模型将学习错误信息。腾讯新闻《潜望》:您曾转发一幅描绘机器人奴役人类的《纽约客》漫画,并评论“这基本反映了我们当前的情况”。您认为这就是未来吗?Russ Salakhutdinov:这是一个幽默的比喻,但ChatGPT等模型本质上是通过训练预测或自动完成句子,从人类反馈中微调。这些模型属于自回归模型,一次预测一个单词,虽在自然语言理解方面表现出色,但从未接触过视频,缺乏对物理世界的感知。这就是这些模型的局限性,它们在文本处理上达到一定水平,但距离超越人类还很遥远。尽管如此,它们在多个领域仍将发挥重要作用,但至少目前还无法做到比人类更聪明。作为辛顿的学生,我能理解他的担忧。因为人类需要约20年学习才能在领域内变得精通,而数字智能通过大规模分布式训练,几天内就能“阅读”整个互联网。若超级智能出现,相关风险也不容忽视,这是辛顿的担忧所在。我理解这一观点,但不认为当前模型会通过文本规律形成决策对抗人类,因为它们缺乏对物理世界的感知。真正的智能需要与世界互动。腾讯新闻《潜望》:您提到AI需要感知真实物理世界,这需要多长时间?Russ Salakhutdinov:我无法确定具体时间。目前工业界在多模态模型方面做了大量工作,模型不仅处理文本,还能处理视频图像、语音等。但问题是这些基础模型能否从环境中学习并变得聪明。目前大语言模型缺乏主动学习者,即能主动探索物理世界的机器人,例如做饭或自动驾驶的机器人。我们距离这一目标还很远。建立真正的智能需要与世界互动,而不仅仅是被动观察文本视频。现在有许多相关研究正在进行,包括我自己的团队,我们开发了可在房屋内移动的机器人,能理解环境并与之互动。但从技术上讲,我们距离目标仍很遥远,这被称为物理人工智能,与ChatGPT这类大语言模型不同。腾讯新闻《潜望》:许多人认为大语言模型是通往通用人工智能(AGI)的正确途径,您同意吗?Russ Salakhutdinov:通用人工智能意味着系统不仅能解决特定任务,还能应对多种任务。语言模型无疑是关键,它们将在构建AGI中发挥重要作用,但我们距离目标仍很远。若能整合图像视觉等其他模态,或许能构建更智能的系统。目前波士顿动力的机器人主要基于控制理论,未结合大语言模型。卡耐基梅隆大学的研究正在尝试将ChatGPT等模型与机器人技术结合,ChatGPT可提供高级指令,指导机器人系统完成任务。未来大型语言模型、不同模态、机器人技术的融合将是发展方向,尽管目前仍非常困难。波士顿动力研发机器人已20年,但让机器人拿起水杯仍很困难,因此还有大量工作要做。许多大型科技公司如谷歌、微软、苹果等都在探索构建可移动的机器人或老年人辅助系统。我们正在与这些公司合作。腾讯新闻《潜望》:大语言模型展现出惊人功能,但模型开发者却不知其原理,似乎存在许多未知。您认为这种趋势会持续,还是未来未知将逐渐被揭示?Russ Salakhutdinov:人们对模型能完成的任务感到惊讶,这得益于数据规模。但模型能力可能触及天花板,因为数据有限。OpenAI已抓取网络大部分内容,谷歌也可能接近极限。未来我们需要开发更好的系统。目前模型难以调试,例如产生“幻觉”时,我们很难知道原因,因为它们是复杂系统。下一代模型可能会纳入规则集或约束,确保输出正确答案。但当前模型大多是“黑匣子”,难以理解内部机制。未来AI的演变将是可在物理世界中交互的代理,如移动机器人或虚拟/物理世界模拟器。主动学习将成为AI的下一阶段。未来十年将是AI的黄金时代,更多功能将涌现,更智能的模型将出现,这令人兴奋。因此辛顿有理由担忧,但我认为当前AI系统仍处于有用阶段,未来将发展为主动采取行动的模型,例如机器人根据指令预约医生。苹果在研发大模型,且更重视数据隐私苹果在研发自己的大模型,且更重视数据隐私。腾讯新闻《潜望》:您曾在苹果工作,领导AI研究,此前苹果宣布Vision Pro,似乎对未来愿景有独特规划。您能结合苹果经历谈谈理解吗?Russ Salakhutdinov:苹果是行业领导者,我也曾参与其中。Vision Pro等项目苹果早已布局,ChatGPT出现前就已探索相关技术。苹果也在研究大型语言模型,我确信他们正在开发类似ChatGPT的系统。Siri和个人助理是苹果产品的重要组成部分,但巨大的虚拟现实设备仍存在挑战,例如必须佩戴在头上,这与Meta的Oculus类似。苹果显然非常重视可穿戴设备,手表、手机、耳机、平板等都是其产品线。我在苹果时听说过这个项目,但担心的是佩戴舒适度问题。苹果的优势在于软件硬件结合,能真正交付给用户。他们正在研究大语言模型,并考虑如何应用于产品。我认为苹果是唯一能如此完美结合软件硬件的公司,能顺利交付给消费者。腾讯新闻《潜望》:Siri推出10年来,功能仍较简单,为何苹果未大幅更新?Russ Salakhutdinov:我在2020年离开苹果,当时已认为谷歌在语音识别方面表现更好。但苹果的独特之处在于重视隐私和数据保护。例如,询问Siri信息时,数据保留在手机上处理;而使用谷歌服务时,信息会发送到云端,利用更多计算能力。这体现了两种不同理念,这也是Siri落后于谷歌的原因。苹果试图在手机上完成所有任务,未来人们可能更信任苹果设备,因为数据不会被用于训练其他模型。现在苹果也在构建大型语言模型,希望在手机上实现,这是正确的方向。他们必须创新硬件、芯片和设计,以便在个人设备上处理信息。ChatGPT需要云端和大量GPU,目前手机无法实现,因此苹果在探索新的硬件和架构。腾讯新闻《潜望》:从这个角度看,苹果在研发大模型时给自己设了限制。Russ Salakhutdinov:是的,但客户确实信任苹果,他们重视隐私数据。未来人们可能更信任苹果。OpenAI为何决定不开源?腾讯新闻《潜望》:OpenAI备受关注,为何在Transformer架构提出后,将大语言模型作为重点,并取得惊人成就?Russ Salakhutdinov:OpenAI首席科学家之一是我的实验室伙伴,他是联合创始人之一。OpenAI早期探索过游戏、机器人技术等,但意识到语言应用潜力巨大,最初使用Transformer取得回报。OpenAI要么创造惊人产品,要么破产,因此专注于此。尽管底层架构由谷歌开发,谷歌内部也有类似ChatGPT的Bard模型,但表现可能不如ChatGPT。腾讯新闻《潜望》:OpenAI现在决定不开源,您认为他们做对了吗?Russ Salakhutdinov:这是一个复杂问题。OpenAI最初是公益组织,计划开源,但在开发GPT-3时决定不开源,担心被滥用生成虚假文本或新闻。OpenAI与微软合作,所有技术将用于微软产品,微软非常支持他们,提供大量计算资源、GPU和工程标记。微软显然不会开源,因为这将成为其产品的一部分。因此OpenAI不会开源,他们必须盈利生存。但同时许多项目已开源,如Meta发布的LLama模型。许多公司正在构建自己的模型。腾讯新闻《潜望》:OpenAI CEO Sam Altman近期呼吁AI安全和监管,许多人说他更像政客。您认为他这样做的意图是什么?Russ Salakhutdinov:我认为Altman非常理性,他在OpenAI没有任何股权,商业成功不会给他带来利益,我尊重这一点。他们正在做公共关系,为OpenAI建立品牌,希望成为人们首选的AI系统。人工智能社区分裂,是否应要求监管?当前社区存在两大派别:一派主张严格监管,甚至暂停开发;另一派主张继续研发测试。这是一个有趣的时刻,因为没人清楚AI是否会接管世界,只是存在许多不确定性。有人提出担忧,我认为提高关注度是好事,因为技术将被普通人使用,更多关注将了解系统功能。就像隐私问题,我分享数据给ChatGPT,不知是好是坏,但至少提高了人们对系统的认识。我认为总体而言是好事,我个人不主张严格规定,未来许多公司会开发专用模型。未来很多公司都有自己的专门模型腾讯新闻《潜望》:美国和中国AI研发令人兴奋,但初创公司存在显著差异。硅谷多在应用层创新,而中国许多公司声称在研发大模型。为何存在这种差异?Russ Salakhutdinov:未来许多公司需要建立自己的大语言模型,因为客户最重视自己的数据。建立基于数据的模型,才能让消费者更便捷地与数据交互。例如,彭博已建立基于金融数据的GPT模型。美国将成为关键参与者,微软、谷歌、亚马逊等将建立自己的模型,他们拥有计算资源。或许在他们的帮助下,也会出现行业专用模型,如金融模型、制药模型等。若我是金融公司,不会将数据发送给OpenAI,因为数据是私有的。许多大公司会拥有自己的专用模型。当然,像微软、谷歌、亚马逊这样的大玩家会提供通用模型,但未来肯定会有更多专用模型。腾讯新闻《潜望》:初创公司缺乏计算资源,是否应专注应用层面?Russ Salakhutdinov:大公司与其他人主要区别在于计算资源,这很昂贵。构建模型需5万个GPU,花费5000万美元。初创公司应考虑开源模型,如Meta的LLama,采用自己的数据微调。许多初创公司正在尝试降低计算量,构建计算量只有大模型十分之一的模型。未来可能会出现更多类似LLama的开源模型,初创公司可以采用并微调,以适应特定领域。行业除大语言模型外,还有其他探索方向吗?大型语言模型是基础模型的一部分,如Transformer架构,建立在大量数据基础上。现在人们可以为机器人技术建立基础模型,例如我的学生与英伟达合作,试图建立类似GPT的操纵模型,构建能操纵任何物体的机器人。这是一个有趣领域。我们与英伟达合作,他们提供计算能力,但构建机器人仍很困难,例如抓住iPhone并放置。除了大型语言模型,人们还在探索不同领域的基础模型,如视频基础模型能否取得巨大成功。若想在抖音上创建视频,只需执行提示,系统便会生成。世界上最聪明的人都在研究AI腾讯新闻《潜望》:您认为现在是否是职业生涯中最激动人心的时刻?Russ Salakhutdinov:到目前为止是的,但也有些应接不暇。现在AI领域博士生竞争激烈,若在今天,我可能都无法申请到博士,因为当时没有重要论文发表。现在甚至收到高中生的邮件,他们已做了出色项目。腾讯新闻《潜望》:这个地球上最聪明的人都在AI领域从事研究。Russ Salakhutdinov:是的,这太神奇了。我以前的学生杨植麟现在是清华大学教授,他是我最聪明的学生之一,建立了GPT模型前身。这太棒了。腾讯新闻《潜望》:未来这种情况会如何演变?会越来越激动人心,还是有所冷却?Russ Salakhutdinov:当然希望未来更令人兴奋。想起2016年自动驾驶领域,当时我开始为苹果工作,负责相关工作。2016年埃隆·马斯克在特斯拉表示两年内将推出自动驾驶汽车,我们从无到有迅速达到80%、90%,但随后陷入瓶颈。自动驾驶汽车进展很快,但永远无法达到100%正确。现在许多人用ChatGPT做许多事情,例如一位律师用ChatGPT起草起诉书,其中引用的案例完全是编造的。人们尚未完全信任AI,因此必须谨慎。但技术具有巨大潜力。腾讯新闻《潜望》:即使我们非常谨慎,是否有一天AI发展会变得不可控?Russ Salakhutdinov:作为科学家,必须为事件分配概率,不能说永远不会发生,一定有概率。但我不认为现在会发生。目前有许多AI子社区致力于AI安全研究,他们的工作是避免AI研发犯错误。我不相信AI会突然变得非常糟糕,但也许我错了。因此社区中发出各种声音是好事,就像辛顿和约书亚的警告。大多数AI研究人员目前不这么认为,但AI安全领域的研究是好事,以防万一。腾讯新闻《潜望》:辛顿教授宣布离开谷歌时,您是否感到惊讶?Russ Salakhutdinov:近几年他一直在谷歌兼职,现在决定离开,大概是想发声。他应该是在考虑我所说的内容如何影响我工作的公司。我认为谷歌是少数正确做事的公司,对AI采取谨慎态度,没有做疯狂的事。我很幸运,他是我的导师,可能是我最好的导师,给了我很多自由和探索空间,他非常聪明,思考超出了框架。我很幸运,是他让我进入深度学习领域,也是他让我读博士,当时我考虑其他职业,但他有一天早上带我去办公室,展示深度学习算法,我说“哇,这非常有趣”,于是决定读博士。这是一个有趣的故事,谢谢你分享。通过今天的采访,我能感受到你作为AI研究者的兴奋。感谢接受采访!本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。
最新快讯
2026年02月10日
微新创想:2026年2月,HMD Global正式在欧洲部分市场推出Terra M三防手机。这款设备专为专业用户设计,具备出色的耐用性和可靠性。
该机通过了IP68/IP69K以及MIL-STD-810H军标认证,能够在极端环境下稳定运行。它适用于医院、工地、机场、安保及应急救援等多个高要求场景,满足不同行业对设备安全性的需求。
Terra M配备了2.8英...
微新创想:一项最新研究揭示了屏幕使用时间与儿童心理健康之间的密切关联。根据2月9日发表于《Nature Portfolio》的研究结果,在美国超过5万名6至17岁的儿童中,每天使用屏幕时间达到或超过四小时的群体,其患抑郁症的风险显著上升了61%。此外,该研究还指出,这些儿童的焦虑症、行为问题以及注意力缺陷多动障碍(ADHD)的风险分别增加了45%、24%和2...
微新创想:2026年2月8日,开源跨平台解压缩工具PeaZip正式发布10.9版本。本次更新由开发团队主导,面向Windows、Linux及macOS用户。新版在文件管理器与多格式查看器方面进行了深度优化,有效降低了内存占用约18%。这一改进显著提升了对超大压缩包的处理能力,尤其是包含数十万文件的压缩包,用户在浏览时将获得更流畅的体验。
界面同步更新Pea/...
微新创想:近日,一名15岁少年凭借超强臂力在网络上迅速走红,被网友赞誉为“现代版李元霸”,其展现出的惊人力量引发了全网的广泛关注和热烈讨论。这段视频迅速成为热门话题,吸引了大量观众的关注和转发。
在一段网络视频中,这位来自辽宁的15岁少年先是在镜头前神色从容,徒手将一个苹果均匀掰成八瓣,动作轻松自然,仿佛在做一件稀松平常之事。随后,他双手握住一根标称80公斤...
微新创想:当下,年轻一代正以独特的方式重新定义年货的意义,继整顿职场之后,又将“整顿”之风吹向了年货领域。如今的年轻人不再遵循传统的年货购置模式,而是按照自己的喜好和需求来挑选年货,把年货从以往的“人情负担”转变为“自我犒赏”。
以往过年,酒水、牛奶、糖果、瓜子等是年货清单上的常客,人们购置年货更多是为了满足他人的期待、维持人情往来。然而,现在年轻人的消费偏...
微新创想:今日,游戏科学官方为玩家们送上了一份特别的新年礼物——时长6分钟的《黑神话:钟馗》贺岁实机小短片。在这段短片中,呈现了人和鬼共同烹制菜肴的奇妙场景,给观众带来了别样的视觉体验。视频发布后,游戏科学创始人兼游戏制作人冯骥也在微博上分享了自己的看法。
他幽默地发问:“不知各位看完后,是会心微笑?一头雾水?还是马上分析出一堆细节隐喻、剧情方向或者新的技术...
微新创想:2月10日,健康AI应用“蚂蚁阿福”正式成为央视CCTV健康生活合作伙伴。这一合作标志着阿福在健康科技领域的影响力进一步扩大,也体现了其在推动全民健康服务方面的积极作用。
作为一款专业的健康AI应用,蚂蚁阿福自上线以来便受到用户的热烈欢迎。其用户数量迅速增长,单日健康咨询解答量突破1000万次,展现了强大的服务能力与用户需求的契合度。
蚂蚁阿福不仅...
微新创想:大模型落地端侧的“减脂增肌”迎来重大突破
腾讯混元今日正式发布面向消费级硬件的极小模型 HY-1.8B-2Bit。该模型通过首个产业级2Bit量化方案将等效参数量精简至0.3B 内存占用仅约600MB 体积甚至小于部分常用的手机应用
技术突破 2Bit量化的“不可能任务”在模型部署中 量化位数越低 精度损失通常越大 为攻克这一难题 腾讯混元团队放弃...
微新创想:2026年2月9日,基于Arch Linux的pearOS 26.2正式发布
pearOS 26.2版本带来了诸多令人期待的更新与改进。此次发布不仅延续了pearOS一贯的简洁与高效风格,还在视觉体验与系统功能上实现了全面升级。该版本深度整合了KDE Plasma 6.5.5桌面环境,为用户提供了更加流畅的操作体验
在界面设计方面,pearOS 2...
微新创想:2026年2月10日12:00,《明日方舟》PC端技术性开放测试正式上线
本次测试为不限量、不删档模式,所有玩家均可参与。游戏官方特别推出PC端版本,支持Windows 10和Windows 11操作系统,满足不同用户的设备需求
测试内容涵盖多平台数据互通功能,确保玩家在不同设备间可以无缝切换并继续游戏进度。同时,PC端优化了键盘和鼠标的操作体验,...
微新创想:2026年2月10日,阿里巴巴达摩院正式发布具身智能基础模型RynnBrain并开源全系列7个模型,其中包含业界首个30B MoE架构的具身模型。这一突破标志着具身智能领域迈出了重要的一步,为机器人技术的发展提供了更强大的基础支持。
该模型首次赋予机器人时空记忆与物理空间推理能力,使其在复杂环境中具备更强的自主决策和任务执行能力。通过这些创新功能,...
微新创想:2026年2月上旬,北京礼达慧凡科技有限公司宣布完成天使轮融资。这一重要里程碑标志着公司在高科技领域的发展迈出了坚实一步。
微新创想:公司主营业务聚焦于人工智能、智能装备及工业软件等前沿科技方向,致力于技术研发与工程应用的深度融合。凭借先进的技术理念和创新的解决方案,礼达慧凡科技正在逐步构建起具有竞争力的科技生态体系。
微新创想:本轮融资将主要用于...
