前苹果AI首任总监独家解读：AI威胁为时尚早大模型将变革教育领域

2023-08-04 18:17:36 互联网 52 次阅读

编者按：本文源自微信公众号腾讯科技（ID：qqtech），作者纪振宇，出品腾讯新闻《潜望》，经微新创想授权发布。ChatGPT的横空出世，让人们首次见证了人工智能大语言模型的惊人能力，通过自然语言交互，人与机器之间似乎建立起了一种微妙的理解关系，新一轮人工智能热潮由此掀起。ChatGPT所展现出的卓越“理解力”，是否标志着机器意识的觉醒？在通往通用人工智能的道路上，目前还存在哪些挑战？人工智能威胁论是否言过其实？未来人工智能将如何发展？带着这些疑问，腾讯新闻《潜望》近日独家专访了卡耐基梅隆大学人工智能教授、前苹果AI首席科学家Ruslan Salakhutdinov。Salakhutdinov师从图灵奖得主、“深度学习之父”杰弗里·辛顿（Geoffrey Hinton），是剪枝、深度编码等著名学习方法的提出者。2016年，Salakhutdinov加入卡耐基梅隆大学，同年获得英伟达人工智能先驱奖，并加入苹果公司担任首任AI研究总监。作为一名人工智能领域的资深学者，Salakhutdinov在对话中表达了乐观态度。他表示，对这一轮AI所展现出的能力感到兴奋，且不认为当前的人工智能发展会对人类生存构成威胁；同时，他认为大语言模型虽不一定是通用人工智能的唯一路径，但却是关键基础，这方面的进展为学术界探索通用人工智能提供了更多启发和信心。作为辛顿的弟子，他也理解辛顿的担忧，但坚持自己对AI更为乐观的判断。以下为此次对话的文字实录，内容有所删减：大模型将革新教育等领域腾讯新闻《潜望》：Salakhutdinov教授，感谢您接受我们的采访。当前世界复杂多变，许多事物以日新月异的速度发展，我们深感幸运能在此探讨这些重要议题。首先让我们聚焦近期最热门的话题——ChatGPT。去年底ChatGPT一经发布，您的第一反应是什么？Russ Salakhutdinov：此前已有GPT-2、GPT-3，我们期待这些模型会持续增强，但去年11月ChatGPT上线时，许多人惊讶于其惊人的表现。在海量数据上构建的大型语言模型，不仅能提问、回答特定问题，还能进行总结。我的许多朋友都在使用ChatGPT进行编程。若在几年前问我，如今能否拥有这项技术，我可能会说不可能，因此我认为这是一项了不起的成就，为不同领域开辟了全新机遇。腾讯新闻《潜望》：编程方面确实令人惊叹，我虽无编程经验，但通过ChatGPT用自然语言描述目标，它就能生成可执行的代码，这让我受益匪浅。Russ Salakhutdinov：是的，这是许多人实际应用大型语言模型的领域之一。这些大模型背后，微软和OpenAI整合了整个GitHub存储库的代码，因此用户在询问代码相关问题时，语言模型表现优异。未来几乎每个编程工具都会配备大型语言模型助手，这一领域将涌现众多应用。腾讯新闻《潜望》：尽管我们能直观感受ChatGPT的强大能力，但许多人仍对人工智能行业的发展感到困惑。ChatGPT或其他大语言模型对普通人意味着什么？Russ Salakhutdinov：这些模型基于过去20年深度学习技术的积累，ChatGPT和Bard等模型的底层架构源自谷歌的Transformer。这对普通人意味着，未来将看到更多人通过自然语言与数据交互。例如，教育领域将迎来变革，未来学生可使用ChatGPT或Bard完成作业、撰写论文，甚至获得个性化辅导。人工智能导师将针对每位学生提供定制化指导，解答问题、教授知识、解释代码或数学概念。此外，当前我们与计算机的交互方式主要是通过搜索引擎获取信息，未来将转变为通过聊天机器人或语言模型进行，用户只需提问，系统便会提供所需信息，无需在网站上逐一查找。腾讯新闻《潜望》：这或许就是谷歌感到焦虑的原因？Russ Salakhutdinov：是的，但这些大型语言模型目前仍不完美，会“产生幻觉”，我们能否解决这一问题？有人认为我们无法解决，或许需要更多时间，但无论如何，人机交互方式将发生改变。“我不认为我们处于需要担忧AI风险的阶段”腾讯新闻《潜望》：当前围绕AI发展的辩论和担忧不绝于耳，您如何看待这些问题？从人类未来发展的角度，您更倾向乐观还是悲观？Russ Salakhutdinov：这是一个重要问题。目前人工智能研究领域存在两大阵营：一派认为AI将带来危害，甚至威胁人类生存；另一派则认为AI充满机遇，将推动医疗系统变革、药物研发进步等。我属于乐观派，不认为当前AI发展构成生存威胁，即使我的导师辛顿对此表示担忧。他是极具智慧的人，但我认为我们尚未到达需要担忧的阶段。目前最大的担忧之一是错误信息的传播，例如通过提示轻易伪造他人声音或视频，未来大规模生成此类内容将极为廉价，使信息真伪难辨。我们需要思考如何通过法规防止这种情况发生。此外，信息偏差也是问题，模型训练数据若存在缺陷，模型将学习错误信息。腾讯新闻《潜望》：您曾转发一幅描绘机器人奴役人类的《纽约客》漫画，并评论“这基本反映了我们当前的情况”。您认为这就是未来吗？Russ Salakhutdinov：这是一个幽默的比喻，但ChatGPT等模型本质上是通过训练预测或自动完成句子，从人类反馈中微调。这些模型属于自回归模型，一次预测一个单词，虽在自然语言理解方面表现出色，但从未接触过视频，缺乏对物理世界的感知。这就是这些模型的局限性，它们在文本处理上达到一定水平，但距离超越人类还很遥远。尽管如此，它们在多个领域仍将发挥重要作用，但至少目前还无法做到比人类更聪明。作为辛顿的学生，我能理解他的担忧。因为人类需要约20年学习才能在领域内变得精通，而数字智能通过大规模分布式训练，几天内就能“阅读”整个互联网。若超级智能出现，相关风险也不容忽视，这是辛顿的担忧所在。我理解这一观点，但不认为当前模型会通过文本规律形成决策对抗人类，因为它们缺乏对物理世界的感知。真正的智能需要与世界互动。腾讯新闻《潜望》：您提到AI需要感知真实物理世界，这需要多长时间？Russ Salakhutdinov：我无法确定具体时间。目前工业界在多模态模型方面做了大量工作，模型不仅处理文本，还能处理视频图像、语音等。但问题是这些基础模型能否从环境中学习并变得聪明。目前大语言模型缺乏主动学习者，即能主动探索物理世界的机器人，例如做饭或自动驾驶的机器人。我们距离这一目标还很远。建立真正的智能需要与世界互动，而不仅仅是被动观察文本视频。现在有许多相关研究正在进行，包括我自己的团队，我们开发了可在房屋内移动的机器人，能理解环境并与之互动。但从技术上讲，我们距离目标仍很遥远，这被称为物理人工智能，与ChatGPT这类大语言模型不同。腾讯新闻《潜望》：许多人认为大语言模型是通往通用人工智能（AGI）的正确途径，您同意吗？Russ Salakhutdinov：通用人工智能意味着系统不仅能解决特定任务，还能应对多种任务。语言模型无疑是关键，它们将在构建AGI中发挥重要作用，但我们距离目标仍很远。若能整合图像视觉等其他模态，或许能构建更智能的系统。目前波士顿动力的机器人主要基于控制理论，未结合大语言模型。卡耐基梅隆大学的研究正在尝试将ChatGPT等模型与机器人技术结合，ChatGPT可提供高级指令，指导机器人系统完成任务。未来大型语言模型、不同模态、机器人技术的融合将是发展方向，尽管目前仍非常困难。波士顿动力研发机器人已20年，但让机器人拿起水杯仍很困难，因此还有大量工作要做。许多大型科技公司如谷歌、微软、苹果等都在探索构建可移动的机器人或老年人辅助系统。我们正在与这些公司合作。腾讯新闻《潜望》：大语言模型展现出惊人功能，但模型开发者却不知其原理，似乎存在许多未知。您认为这种趋势会持续，还是未来未知将逐渐被揭示？Russ Salakhutdinov：人们对模型能完成的任务感到惊讶，这得益于数据规模。但模型能力可能触及天花板，因为数据有限。OpenAI已抓取网络大部分内容，谷歌也可能接近极限。未来我们需要开发更好的系统。目前模型难以调试，例如产生“幻觉”时，我们很难知道原因，因为它们是复杂系统。下一代模型可能会纳入规则集或约束，确保输出正确答案。但当前模型大多是“黑匣子”，难以理解内部机制。未来AI的演变将是可在物理世界中交互的代理，如移动机器人或虚拟/物理世界模拟器。主动学习将成为AI的下一阶段。未来十年将是AI的黄金时代，更多功能将涌现，更智能的模型将出现，这令人兴奋。因此辛顿有理由担忧，但我认为当前AI系统仍处于有用阶段，未来将发展为主动采取行动的模型，例如机器人根据指令预约医生。苹果在研发大模型，且更重视数据隐私苹果在研发自己的大模型，且更重视数据隐私。腾讯新闻《潜望》：您曾在苹果工作，领导AI研究，此前苹果宣布Vision Pro，似乎对未来愿景有独特规划。您能结合苹果经历谈谈理解吗？Russ Salakhutdinov：苹果是行业领导者，我也曾参与其中。Vision Pro等项目苹果早已布局，ChatGPT出现前就已探索相关技术。苹果也在研究大型语言模型，我确信他们正在开发类似ChatGPT的系统。Siri和个人助理是苹果产品的重要组成部分，但巨大的虚拟现实设备仍存在挑战，例如必须佩戴在头上，这与Meta的Oculus类似。苹果显然非常重视可穿戴设备，手表、手机、耳机、平板等都是其产品线。我在苹果时听说过这个项目，但担心的是佩戴舒适度问题。苹果的优势在于软件硬件结合，能真正交付给用户。他们正在研究大语言模型，并考虑如何应用于产品。我认为苹果是唯一能如此完美结合软件硬件的公司，能顺利交付给消费者。腾讯新闻《潜望》：Siri推出10年来，功能仍较简单，为何苹果未大幅更新？Russ Salakhutdinov：我在2020年离开苹果，当时已认为谷歌在语音识别方面表现更好。但苹果的独特之处在于重视隐私和数据保护。例如，询问Siri信息时，数据保留在手机上处理；而使用谷歌服务时，信息会发送到云端，利用更多计算能力。这体现了两种不同理念，这也是Siri落后于谷歌的原因。苹果试图在手机上完成所有任务，未来人们可能更信任苹果设备，因为数据不会被用于训练其他模型。现在苹果也在构建大型语言模型，希望在手机上实现，这是正确的方向。他们必须创新硬件、芯片和设计，以便在个人设备上处理信息。ChatGPT需要云端和大量GPU，目前手机无法实现，因此苹果在探索新的硬件和架构。腾讯新闻《潜望》：从这个角度看，苹果在研发大模型时给自己设了限制。Russ Salakhutdinov：是的，但客户确实信任苹果，他们重视隐私数据。未来人们可能更信任苹果。OpenAI为何决定不开源？腾讯新闻《潜望》：OpenAI备受关注，为何在Transformer架构提出后，将大语言模型作为重点，并取得惊人成就？Russ Salakhutdinov：OpenAI首席科学家之一是我的实验室伙伴，他是联合创始人之一。OpenAI早期探索过游戏、机器人技术等，但意识到语言应用潜力巨大，最初使用Transformer取得回报。OpenAI要么创造惊人产品，要么破产，因此专注于此。尽管底层架构由谷歌开发，谷歌内部也有类似ChatGPT的Bard模型，但表现可能不如ChatGPT。腾讯新闻《潜望》：OpenAI现在决定不开源，您认为他们做对了吗？Russ Salakhutdinov：这是一个复杂问题。OpenAI最初是公益组织，计划开源，但在开发GPT-3时决定不开源，担心被滥用生成虚假文本或新闻。OpenAI与微软合作，所有技术将用于微软产品，微软非常支持他们，提供大量计算资源、GPU和工程标记。微软显然不会开源，因为这将成为其产品的一部分。因此OpenAI不会开源，他们必须盈利生存。但同时许多项目已开源，如Meta发布的LLama模型。许多公司正在构建自己的模型。腾讯新闻《潜望》：OpenAI CEO Sam Altman近期呼吁AI安全和监管，许多人说他更像政客。您认为他这样做的意图是什么？Russ Salakhutdinov：我认为Altman非常理性，他在OpenAI没有任何股权，商业成功不会给他带来利益，我尊重这一点。他们正在做公共关系，为OpenAI建立品牌，希望成为人们首选的AI系统。人工智能社区分裂，是否应要求监管？当前社区存在两大派别：一派主张严格监管，甚至暂停开发；另一派主张继续研发测试。这是一个有趣的时刻，因为没人清楚AI是否会接管世界，只是存在许多不确定性。有人提出担忧，我认为提高关注度是好事，因为技术将被普通人使用，更多关注将了解系统功能。就像隐私问题，我分享数据给ChatGPT，不知是好是坏，但至少提高了人们对系统的认识。我认为总体而言是好事，我个人不主张严格规定，未来许多公司会开发专用模型。未来很多公司都有自己的专门模型腾讯新闻《潜望》：美国和中国AI研发令人兴奋，但初创公司存在显著差异。硅谷多在应用层创新，而中国许多公司声称在研发大模型。为何存在这种差异？Russ Salakhutdinov：未来许多公司需要建立自己的大语言模型，因为客户最重视自己的数据。建立基于数据的模型，才能让消费者更便捷地与数据交互。例如，彭博已建立基于金融数据的GPT模型。美国将成为关键参与者，微软、谷歌、亚马逊等将建立自己的模型，他们拥有计算资源。或许在他们的帮助下，也会出现行业专用模型，如金融模型、制药模型等。若我是金融公司，不会将数据发送给OpenAI，因为数据是私有的。许多大公司会拥有自己的专用模型。当然，像微软、谷歌、亚马逊这样的大玩家会提供通用模型，但未来肯定会有更多专用模型。腾讯新闻《潜望》：初创公司缺乏计算资源，是否应专注应用层面？Russ Salakhutdinov：大公司与其他人主要区别在于计算资源，这很昂贵。构建模型需5万个GPU，花费5000万美元。初创公司应考虑开源模型，如Meta的LLama，采用自己的数据微调。许多初创公司正在尝试降低计算量，构建计算量只有大模型十分之一的模型。未来可能会出现更多类似LLama的开源模型，初创公司可以采用并微调，以适应特定领域。行业除大语言模型外，还有其他探索方向吗？大型语言模型是基础模型的一部分，如Transformer架构，建立在大量数据基础上。现在人们可以为机器人技术建立基础模型，例如我的学生与英伟达合作，试图建立类似GPT的操纵模型，构建能操纵任何物体的机器人。这是一个有趣领域。我们与英伟达合作，他们提供计算能力，但构建机器人仍很困难，例如抓住iPhone并放置。除了大型语言模型，人们还在探索不同领域的基础模型，如视频基础模型能否取得巨大成功。若想在抖音上创建视频，只需执行提示，系统便会生成。世界上最聪明的人都在研究AI腾讯新闻《潜望》：您认为现在是否是职业生涯中最激动人心的时刻？Russ Salakhutdinov：到目前为止是的，但也有些应接不暇。现在AI领域博士生竞争激烈，若在今天，我可能都无法申请到博士，因为当时没有重要论文发表。现在甚至收到高中生的邮件，他们已做了出色项目。腾讯新闻《潜望》：这个地球上最聪明的人都在AI领域从事研究。Russ Salakhutdinov：是的，这太神奇了。我以前的学生杨植麟现在是清华大学教授，他是我最聪明的学生之一，建立了GPT模型前身。这太棒了。腾讯新闻《潜望》：未来这种情况会如何演变？会越来越激动人心，还是有所冷却？Russ Salakhutdinov：当然希望未来更令人兴奋。想起2016年自动驾驶领域，当时我开始为苹果工作，负责相关工作。2016年埃隆·马斯克在特斯拉表示两年内将推出自动驾驶汽车，我们从无到有迅速达到80%、90%，但随后陷入瓶颈。自动驾驶汽车进展很快，但永远无法达到100%正确。现在许多人用ChatGPT做许多事情，例如一位律师用ChatGPT起草起诉书，其中引用的案例完全是编造的。人们尚未完全信任AI，因此必须谨慎。但技术具有巨大潜力。腾讯新闻《潜望》：即使我们非常谨慎，是否有一天AI发展会变得不可控？Russ Salakhutdinov：作为科学家，必须为事件分配概率，不能说永远不会发生，一定有概率。但我不认为现在会发生。目前有许多AI子社区致力于AI安全研究，他们的工作是避免AI研发犯错误。我不相信AI会突然变得非常糟糕，但也许我错了。因此社区中发出各种声音是好事，就像辛顿和约书亚的警告。大多数AI研究人员目前不这么认为，但AI安全领域的研究是好事，以防万一。腾讯新闻《潜望》：辛顿教授宣布离开谷歌时，您是否感到惊讶？Russ Salakhutdinov：近几年他一直在谷歌兼职，现在决定离开，大概是想发声。他应该是在考虑我所说的内容如何影响我工作的公司。我认为谷歌是少数正确做事的公司，对AI采取谨慎态度，没有做疯狂的事。我很幸运，他是我的导师，可能是我最好的导师，给了我很多自由和探索空间，他非常聪明，思考超出了框架。我很幸运，是他让我进入深度学习领域，也是他让我读博士，当时我考虑其他职业，但他有一天早上带我去办公室，展示深度学习算法，我说“哇，这非常有趣”，于是决定读博士。这是一个有趣的故事，谢谢你分享。通过今天的采访，我能感受到你作为AI研究者的兴奋。感谢接受采访！本文为专栏作者授权微新创想发表，版权归原作者所有。文章系作者个人观点，不代表微新创想立场，转载请联系原作者。如有任何疑问，请联系http://www.idea2003.com/。

前苹果AI首任总监独家解读：AI威胁为时尚早大模型将变革教育领域

最新快讯

2025年10月26日

2025年秋粮收获过八成进展顺利覆盖多地

协创数据港交所递表服务器采购破122亿彰显增长信心

三星Galaxy XR支持APK直装解锁Bootloader自制系统更自由

日本H3火箭7号机成功发射HTV-X1货运飞船顺利入轨为国际空间站补给

埃及开罗多车相撞致2死42伤事故现场紧急救援

寒潮来袭电火锅订单暴涨14倍保暖热销

2025年10月25日热带风暴梅丽莎升级为一级飓风影响伊斯帕尼奥拉岛牙买加

中国同辐启动科创板上市辅导市值近60亿港元核技术应用龙头企业加速布局

日本H3火箭7号机成功发射HTV-X1货运飞船验证新技术

VRChat移动版上线iOS安卓 2D模式畅玩但体验受限

2025年10月26日北方强冷空气来袭降温10℃多地气温创新低

TOI-2267双星系统首现两恒星共拥凌星行星创纪录

前苹果AI首任总监独家解读：AI威胁为时尚早 大模型将变革教育领域

最新快讯

2025年10月26日

前苹果AI首任总监独家解读：AI威胁为时尚早大模型将变革教育领域