编者按:本文源自微信公众号腾讯科技(ID:qqtech),作者纪振宇,出品腾讯新闻《潜望》,经微新创想授权发布。ChatGPT的横空出世,让人们首次见证了人工智能大语言模型的惊人能力,通过自然语言交互,人与机器之间似乎建立起了一种微妙的理解关系,新一轮人工智能热潮由此掀起。ChatGPT所展现出的卓越“理解力”,是否标志着机器意识的觉醒?在通往通用人工智能的道路上,目前还存在哪些挑战?人工智能威胁论是否言过其实?未来人工智能将如何发展?带着这些疑问,腾讯新闻《潜望》近日独家专访了卡耐基梅隆大学人工智能教授、前苹果AI首席科学家Ruslan Salakhutdinov。Salakhutdinov师从图灵奖得主、“深度学习之父”杰弗里·辛顿(Geoffrey Hinton),是剪枝、深度编码等著名学习方法的提出者。2016年,Salakhutdinov加入卡耐基梅隆大学,同年获得英伟达人工智能先驱奖,并加入苹果公司担任首任AI研究总监。作为一名人工智能领域的资深学者,Salakhutdinov在对话中表达了乐观态度。他表示,对这一轮AI所展现出的能力感到兴奋,且不认为当前的人工智能发展会对人类生存构成威胁;同时,他认为大语言模型虽不一定是通用人工智能的唯一路径,但却是关键基础,这方面的进展为学术界探索通用人工智能提供了更多启发和信心。作为辛顿的弟子,他也理解辛顿的担忧,但坚持自己对AI更为乐观的判断。以下为此次对话的文字实录,内容有所删减:大模型将革新教育等领域腾讯新闻《潜望》:Salakhutdinov教授,感谢您接受我们的采访。当前世界复杂多变,许多事物以日新月异的速度发展,我们深感幸运能在此探讨这些重要议题。首先让我们聚焦近期最热门的话题——ChatGPT。去年底ChatGPT一经发布,您的第一反应是什么?Russ Salakhutdinov:此前已有GPT-2、GPT-3,我们期待这些模型会持续增强,但去年11月ChatGPT上线时,许多人惊讶于其惊人的表现。在海量数据上构建的大型语言模型,不仅能提问、回答特定问题,还能进行总结。我的许多朋友都在使用ChatGPT进行编程。若在几年前问我,如今能否拥有这项技术,我可能会说不可能,因此我认为这是一项了不起的成就,为不同领域开辟了全新机遇。腾讯新闻《潜望》:编程方面确实令人惊叹,我虽无编程经验,但通过ChatGPT用自然语言描述目标,它就能生成可执行的代码,这让我受益匪浅。Russ Salakhutdinov:是的,这是许多人实际应用大型语言模型的领域之一。这些大模型背后,微软和OpenAI整合了整个GitHub存储库的代码,因此用户在询问代码相关问题时,语言模型表现优异。未来几乎每个编程工具都会配备大型语言模型助手,这一领域将涌现众多应用。腾讯新闻《潜望》:尽管我们能直观感受ChatGPT的强大能力,但许多人仍对人工智能行业的发展感到困惑。ChatGPT或其他大语言模型对普通人意味着什么?Russ Salakhutdinov:这些模型基于过去20年深度学习技术的积累,ChatGPT和Bard等模型的底层架构源自谷歌的Transformer。这对普通人意味着,未来将看到更多人通过自然语言与数据交互。例如,教育领域将迎来变革,未来学生可使用ChatGPT或Bard完成作业、撰写论文,甚至获得个性化辅导。人工智能导师将针对每位学生提供定制化指导,解答问题、教授知识、解释代码或数学概念。此外,当前我们与计算机的交互方式主要是通过搜索引擎获取信息,未来将转变为通过聊天机器人或语言模型进行,用户只需提问,系统便会提供所需信息,无需在网站上逐一查找。腾讯新闻《潜望》:这或许就是谷歌感到焦虑的原因?Russ Salakhutdinov:是的,但这些大型语言模型目前仍不完美,会“产生幻觉”,我们能否解决这一问题?有人认为我们无法解决,或许需要更多时间,但无论如何,人机交互方式将发生改变。“我不认为我们处于需要担忧AI风险的阶段”腾讯新闻《潜望》:当前围绕AI发展的辩论和担忧不绝于耳,您如何看待这些问题?从人类未来发展的角度,您更倾向乐观还是悲观?Russ Salakhutdinov:这是一个重要问题。目前人工智能研究领域存在两大阵营:一派认为AI将带来危害,甚至威胁人类生存;另一派则认为AI充满机遇,将推动医疗系统变革、药物研发进步等。我属于乐观派,不认为当前AI发展构成生存威胁,即使我的导师辛顿对此表示担忧。他是极具智慧的人,但我认为我们尚未到达需要担忧的阶段。目前最大的担忧之一是错误信息的传播,例如通过提示轻易伪造他人声音或视频,未来大规模生成此类内容将极为廉价,使信息真伪难辨。我们需要思考如何通过法规防止这种情况发生。此外,信息偏差也是问题,模型训练数据若存在缺陷,模型将学习错误信息。腾讯新闻《潜望》:您曾转发一幅描绘机器人奴役人类的《纽约客》漫画,并评论“这基本反映了我们当前的情况”。您认为这就是未来吗?Russ Salakhutdinov:这是一个幽默的比喻,但ChatGPT等模型本质上是通过训练预测或自动完成句子,从人类反馈中微调。这些模型属于自回归模型,一次预测一个单词,虽在自然语言理解方面表现出色,但从未接触过视频,缺乏对物理世界的感知。这就是这些模型的局限性,它们在文本处理上达到一定水平,但距离超越人类还很遥远。尽管如此,它们在多个领域仍将发挥重要作用,但至少目前还无法做到比人类更聪明。作为辛顿的学生,我能理解他的担忧。因为人类需要约20年学习才能在领域内变得精通,而数字智能通过大规模分布式训练,几天内就能“阅读”整个互联网。若超级智能出现,相关风险也不容忽视,这是辛顿的担忧所在。我理解这一观点,但不认为当前模型会通过文本规律形成决策对抗人类,因为它们缺乏对物理世界的感知。真正的智能需要与世界互动。腾讯新闻《潜望》:您提到AI需要感知真实物理世界,这需要多长时间?Russ Salakhutdinov:我无法确定具体时间。目前工业界在多模态模型方面做了大量工作,模型不仅处理文本,还能处理视频图像、语音等。但问题是这些基础模型能否从环境中学习并变得聪明。目前大语言模型缺乏主动学习者,即能主动探索物理世界的机器人,例如做饭或自动驾驶的机器人。我们距离这一目标还很远。建立真正的智能需要与世界互动,而不仅仅是被动观察文本视频。现在有许多相关研究正在进行,包括我自己的团队,我们开发了可在房屋内移动的机器人,能理解环境并与之互动。但从技术上讲,我们距离目标仍很遥远,这被称为物理人工智能,与ChatGPT这类大语言模型不同。腾讯新闻《潜望》:许多人认为大语言模型是通往通用人工智能(AGI)的正确途径,您同意吗?Russ Salakhutdinov:通用人工智能意味着系统不仅能解决特定任务,还能应对多种任务。语言模型无疑是关键,它们将在构建AGI中发挥重要作用,但我们距离目标仍很远。若能整合图像视觉等其他模态,或许能构建更智能的系统。目前波士顿动力的机器人主要基于控制理论,未结合大语言模型。卡耐基梅隆大学的研究正在尝试将ChatGPT等模型与机器人技术结合,ChatGPT可提供高级指令,指导机器人系统完成任务。未来大型语言模型、不同模态、机器人技术的融合将是发展方向,尽管目前仍非常困难。波士顿动力研发机器人已20年,但让机器人拿起水杯仍很困难,因此还有大量工作要做。许多大型科技公司如谷歌、微软、苹果等都在探索构建可移动的机器人或老年人辅助系统。我们正在与这些公司合作。腾讯新闻《潜望》:大语言模型展现出惊人功能,但模型开发者却不知其原理,似乎存在许多未知。您认为这种趋势会持续,还是未来未知将逐渐被揭示?Russ Salakhutdinov:人们对模型能完成的任务感到惊讶,这得益于数据规模。但模型能力可能触及天花板,因为数据有限。OpenAI已抓取网络大部分内容,谷歌也可能接近极限。未来我们需要开发更好的系统。目前模型难以调试,例如产生“幻觉”时,我们很难知道原因,因为它们是复杂系统。下一代模型可能会纳入规则集或约束,确保输出正确答案。但当前模型大多是“黑匣子”,难以理解内部机制。未来AI的演变将是可在物理世界中交互的代理,如移动机器人或虚拟/物理世界模拟器。主动学习将成为AI的下一阶段。未来十年将是AI的黄金时代,更多功能将涌现,更智能的模型将出现,这令人兴奋。因此辛顿有理由担忧,但我认为当前AI系统仍处于有用阶段,未来将发展为主动采取行动的模型,例如机器人根据指令预约医生。苹果在研发大模型,且更重视数据隐私苹果在研发自己的大模型,且更重视数据隐私。腾讯新闻《潜望》:您曾在苹果工作,领导AI研究,此前苹果宣布Vision Pro,似乎对未来愿景有独特规划。您能结合苹果经历谈谈理解吗?Russ Salakhutdinov:苹果是行业领导者,我也曾参与其中。Vision Pro等项目苹果早已布局,ChatGPT出现前就已探索相关技术。苹果也在研究大型语言模型,我确信他们正在开发类似ChatGPT的系统。Siri和个人助理是苹果产品的重要组成部分,但巨大的虚拟现实设备仍存在挑战,例如必须佩戴在头上,这与Meta的Oculus类似。苹果显然非常重视可穿戴设备,手表、手机、耳机、平板等都是其产品线。我在苹果时听说过这个项目,但担心的是佩戴舒适度问题。苹果的优势在于软件硬件结合,能真正交付给用户。他们正在研究大语言模型,并考虑如何应用于产品。我认为苹果是唯一能如此完美结合软件硬件的公司,能顺利交付给消费者。腾讯新闻《潜望》:Siri推出10年来,功能仍较简单,为何苹果未大幅更新?Russ Salakhutdinov:我在2020年离开苹果,当时已认为谷歌在语音识别方面表现更好。但苹果的独特之处在于重视隐私和数据保护。例如,询问Siri信息时,数据保留在手机上处理;而使用谷歌服务时,信息会发送到云端,利用更多计算能力。这体现了两种不同理念,这也是Siri落后于谷歌的原因。苹果试图在手机上完成所有任务,未来人们可能更信任苹果设备,因为数据不会被用于训练其他模型。现在苹果也在构建大型语言模型,希望在手机上实现,这是正确的方向。他们必须创新硬件、芯片和设计,以便在个人设备上处理信息。ChatGPT需要云端和大量GPU,目前手机无法实现,因此苹果在探索新的硬件和架构。腾讯新闻《潜望》:从这个角度看,苹果在研发大模型时给自己设了限制。Russ Salakhutdinov:是的,但客户确实信任苹果,他们重视隐私数据。未来人们可能更信任苹果。OpenAI为何决定不开源?腾讯新闻《潜望》:OpenAI备受关注,为何在Transformer架构提出后,将大语言模型作为重点,并取得惊人成就?Russ Salakhutdinov:OpenAI首席科学家之一是我的实验室伙伴,他是联合创始人之一。OpenAI早期探索过游戏、机器人技术等,但意识到语言应用潜力巨大,最初使用Transformer取得回报。OpenAI要么创造惊人产品,要么破产,因此专注于此。尽管底层架构由谷歌开发,谷歌内部也有类似ChatGPT的Bard模型,但表现可能不如ChatGPT。腾讯新闻《潜望》:OpenAI现在决定不开源,您认为他们做对了吗?Russ Salakhutdinov:这是一个复杂问题。OpenAI最初是公益组织,计划开源,但在开发GPT-3时决定不开源,担心被滥用生成虚假文本或新闻。OpenAI与微软合作,所有技术将用于微软产品,微软非常支持他们,提供大量计算资源、GPU和工程标记。微软显然不会开源,因为这将成为其产品的一部分。因此OpenAI不会开源,他们必须盈利生存。但同时许多项目已开源,如Meta发布的LLama模型。许多公司正在构建自己的模型。腾讯新闻《潜望》:OpenAI CEO Sam Altman近期呼吁AI安全和监管,许多人说他更像政客。您认为他这样做的意图是什么?Russ Salakhutdinov:我认为Altman非常理性,他在OpenAI没有任何股权,商业成功不会给他带来利益,我尊重这一点。他们正在做公共关系,为OpenAI建立品牌,希望成为人们首选的AI系统。人工智能社区分裂,是否应要求监管?当前社区存在两大派别:一派主张严格监管,甚至暂停开发;另一派主张继续研发测试。这是一个有趣的时刻,因为没人清楚AI是否会接管世界,只是存在许多不确定性。有人提出担忧,我认为提高关注度是好事,因为技术将被普通人使用,更多关注将了解系统功能。就像隐私问题,我分享数据给ChatGPT,不知是好是坏,但至少提高了人们对系统的认识。我认为总体而言是好事,我个人不主张严格规定,未来许多公司会开发专用模型。未来很多公司都有自己的专门模型腾讯新闻《潜望》:美国和中国AI研发令人兴奋,但初创公司存在显著差异。硅谷多在应用层创新,而中国许多公司声称在研发大模型。为何存在这种差异?Russ Salakhutdinov:未来许多公司需要建立自己的大语言模型,因为客户最重视自己的数据。建立基于数据的模型,才能让消费者更便捷地与数据交互。例如,彭博已建立基于金融数据的GPT模型。美国将成为关键参与者,微软、谷歌、亚马逊等将建立自己的模型,他们拥有计算资源。或许在他们的帮助下,也会出现行业专用模型,如金融模型、制药模型等。若我是金融公司,不会将数据发送给OpenAI,因为数据是私有的。许多大公司会拥有自己的专用模型。当然,像微软、谷歌、亚马逊这样的大玩家会提供通用模型,但未来肯定会有更多专用模型。腾讯新闻《潜望》:初创公司缺乏计算资源,是否应专注应用层面?Russ Salakhutdinov:大公司与其他人主要区别在于计算资源,这很昂贵。构建模型需5万个GPU,花费5000万美元。初创公司应考虑开源模型,如Meta的LLama,采用自己的数据微调。许多初创公司正在尝试降低计算量,构建计算量只有大模型十分之一的模型。未来可能会出现更多类似LLama的开源模型,初创公司可以采用并微调,以适应特定领域。行业除大语言模型外,还有其他探索方向吗?大型语言模型是基础模型的一部分,如Transformer架构,建立在大量数据基础上。现在人们可以为机器人技术建立基础模型,例如我的学生与英伟达合作,试图建立类似GPT的操纵模型,构建能操纵任何物体的机器人。这是一个有趣领域。我们与英伟达合作,他们提供计算能力,但构建机器人仍很困难,例如抓住iPhone并放置。除了大型语言模型,人们还在探索不同领域的基础模型,如视频基础模型能否取得巨大成功。若想在抖音上创建视频,只需执行提示,系统便会生成。世界上最聪明的人都在研究AI腾讯新闻《潜望》:您认为现在是否是职业生涯中最激动人心的时刻?Russ Salakhutdinov:到目前为止是的,但也有些应接不暇。现在AI领域博士生竞争激烈,若在今天,我可能都无法申请到博士,因为当时没有重要论文发表。现在甚至收到高中生的邮件,他们已做了出色项目。腾讯新闻《潜望》:这个地球上最聪明的人都在AI领域从事研究。Russ Salakhutdinov:是的,这太神奇了。我以前的学生杨植麟现在是清华大学教授,他是我最聪明的学生之一,建立了GPT模型前身。这太棒了。腾讯新闻《潜望》:未来这种情况会如何演变?会越来越激动人心,还是有所冷却?Russ Salakhutdinov:当然希望未来更令人兴奋。想起2016年自动驾驶领域,当时我开始为苹果工作,负责相关工作。2016年埃隆·马斯克在特斯拉表示两年内将推出自动驾驶汽车,我们从无到有迅速达到80%、90%,但随后陷入瓶颈。自动驾驶汽车进展很快,但永远无法达到100%正确。现在许多人用ChatGPT做许多事情,例如一位律师用ChatGPT起草起诉书,其中引用的案例完全是编造的。人们尚未完全信任AI,因此必须谨慎。但技术具有巨大潜力。腾讯新闻《潜望》:即使我们非常谨慎,是否有一天AI发展会变得不可控?Russ Salakhutdinov:作为科学家,必须为事件分配概率,不能说永远不会发生,一定有概率。但我不认为现在会发生。目前有许多AI子社区致力于AI安全研究,他们的工作是避免AI研发犯错误。我不相信AI会突然变得非常糟糕,但也许我错了。因此社区中发出各种声音是好事,就像辛顿和约书亚的警告。大多数AI研究人员目前不这么认为,但AI安全领域的研究是好事,以防万一。腾讯新闻《潜望》:辛顿教授宣布离开谷歌时,您是否感到惊讶?Russ Salakhutdinov:近几年他一直在谷歌兼职,现在决定离开,大概是想发声。他应该是在考虑我所说的内容如何影响我工作的公司。我认为谷歌是少数正确做事的公司,对AI采取谨慎态度,没有做疯狂的事。我很幸运,他是我的导师,可能是我最好的导师,给了我很多自由和探索空间,他非常聪明,思考超出了框架。我很幸运,是他让我进入深度学习领域,也是他让我读博士,当时我考虑其他职业,但他有一天早上带我去办公室,展示深度学习算法,我说“哇,这非常有趣”,于是决定读博士。这是一个有趣的故事,谢谢你分享。通过今天的采访,我能感受到你作为AI研究者的兴奋。感谢接受采访!本文为专栏作者授权微新创想发表,版权归原作者所有。文章系作者个人观点,不代表微新创想立场,转载请联系原作者。如有任何疑问,请联系http://www.idea2003.com/。

最新快讯

2025年08月05日

08:56
微新创想8月4日电 8月4日,陕西汉中市宁强县一快递站内发生惊险一幕,一名约10岁的小女孩在玩耍时不慎被传送带卷入,导致身体悬空,情况十分危急。这一事件不仅令人揪心,更敲响了公共场所安全防范的警钟。 据陕西汉中消防部门通报,事发时小女孩在快递站内嬉戏,被正在运转的传送带吸引,出于好奇伸手触碰。然而,传送带突然加速,瞬间将她的手臂卷入,导致身体被悬空拖拽。事发...
08:56
微新创想8月4日重磅报道,小米汽车近期推送的OTA升级中,一项备受关注的创新功能悄然上线,引发了广大车主的热烈讨论。据悉,此次升级不仅优化了系统性能,更在遥控钥匙功能上实现了突破性改进,让用户能够更便捷地掌控爱车。升级后的小米汽车APP新增了自定义按键设置选项,车主们惊喜地发现,原本的遥控钥匙第四按键迎来了功能定制化的全新体验。 这项便捷功能操作极为简单,只...
08:56
2025年7月,中国香港地区制造业采购经理人指数(PMI)表现显著回暖,从上月的47.8回升至49.2。这一数据清晰地反映出香港制造业景气度正逐步复苏,展现出积极的经济复苏态势。PMI指数作为衡量制造业活动水平的关键指标,由权威机构标普全球市场财智发布,其波动直接反映了制造业的整体运行状况。此次指数的回升,标志着香港制造业在经历了一段时期的收缩阶段后,正迎来...
08:56
国金证券最新研究报告揭示,随着人工智能算力需求的爆发式增长,数据中心供电效率正迎来深刻变革。第三代高压直流HVDC架构凭借其显著优势,正逐步成为行业标配。该架构不仅大幅提升能源传输效率,更有效降低系统损耗,为超大规模数据中心提供稳定可靠的电力支持。 分析指出,以海外科技巨头为代表的行业领导者正积极推动高压直流技术的商业化进程,其领先的技术积累和资本优势将...
08:56
2025年8月4日,中国人工智能领域的领军企业第四范式与北京海博思创科技股份有限公司正式达成战略合作,双方签署合资协议,共同成立能量晶体(北京)科技有限公司。作为国内AI技术应用的创新先锋,第四范式将持有合资公司19%的股份,彰显其在此次合作中的核心地位。 能量晶体(北京)科技有限公司将聚焦于电力交易领域的AI技术服务,致力于打造智能化解决方案。依托第四...
08:56
2025年8月5日,A股市场迎来多份重磅公告,行业动态与资本流向备受关注。瑞可达发布最新业绩预告,预计2025年人形机器人业务销售收入将突破千万大关,达到约1000万元,彰显其在新兴领域的战略布局成效。与此同时,西菱动力明确将机器人零部件列为核心战略方向,相关业务规划正稳步推进中,未来有望成为公司新的增长引擎。 在资本市场操作方面,宁德时代展现出强劲的护城河...
08:56
8月4日最新数据显示,共有27只个股获得券商买入评级,其中九号公司-WD、正裕工业、中国神华的预期涨幅最为亮眼,分别高达31.19%、30.84%和21.14%,成为市场关注的焦点。与此同时,19只个股的评级维持稳定,7只个股迎来首次评级,另有1只个股评级得到调高。在券商评级覆盖方面,中国神华和九号公司-WD分别获得4家和3家券商的推荐,显示出市场对这两只股...
08:56
2025年8月4日,同源康医药-B(02410)成功完成配售923万股股票,配售价定为每股17.01港元,此次配售活动最终为公司募集到约1.55亿港元净额资金。这一重要融资举措将有力支持公司未来的发展战略,为推动现有药物管线的研发与商业化进程提供坚实资金保障。 此次配售所得的净资金将按照明确的战略规划进行分配:其中60%将专项用于现有药物管线的研发投入与商业...
08:56
2025年8月4日,德林控股旗下私募基金宣布与新加坡领先科技公司Pangu Software Pte Ltd达成战略合作协议,斥资100万美元精准投资1041股普通股,并同步获得同等价值的认购期权。作为亚洲Web3游戏领域的创新先锋,Pangu Software专注于去中心化Web3游戏平台的研发,其旗下备受瞩目的产品包括突破性Web3游戏《Cyber Cr...
08:56
2025年8月5日,极智嘉-W(02590)正式发布最新业绩预告,透露出公司上半年营收的强劲增长态势。公告显示,极智嘉-W预计2025年上半年总收入将在9.95亿至10.3亿元人民币之间,较去年同期实现27%至32%的显著增长。这一亮眼表现主要归功于仓储移动机器人解决方案的大规模交付,彰显了公司在智能制造领域的核心竞争力持续增强。 在盈利能力方面,极智嘉-W...
08:56
2025年8月,中国白酒巨头金沙酒业正面临前所未有的经营困境。其核心产品摘要珍品遭遇大面积库存积压,经销商普遍陷入价格倒挂的恶性循环。多位业内人士透露,摘要珍品批价在短时间内出现断崖式下跌,部分产品单瓶价格四个月内骤降近20%,市场反应之剧烈令人咋舌。 山东、河南等主要销售区域的经销商们更是苦不堪言。他们反映销售压力空前巨大,许多库存积压严重,回本周期被无限...
08:56
2025年8月5日,备受市场关注的东阳光长江药业(股票代码01558)正式宣布其H股从香港联合交易所(联交所)撤销上市。这一重要举措标志着公司退市计划的顺利执行,同时也开启了股东权益转换的新篇章。根据公司此前公布的退市方案,所有H股股东将有机会按既定比例,以1股H股换取0.263614股东阳光药业股份有限公司(以下简称“要约人”)的H股股份。此次换股操作旨在...