我们离「机械姬」中的AI意识还有多远?前OpenAI研究员让AI克隆思想,模仿人类思维,边思考边行动。

编者按:本文来自微信公众号 新智元(ID:AI_era),作者:新智元,微想智云经授权转载。当AI有了自主意识会如何?「机械姬」中,艾娃利用人类的同情心,以欺骗的方式诱导人类获得自由,最终杀了自己的「造物主」Nathan。近来,在众多网友的力荐下,Sam Altman终于看了这部电影。并表示,「很好的电影,但我不明白为什么每个人都让我看它。」许多人或许想警示,这就是让人工智能有了意识,通过图灵测试的结果。但我们离「机械姬」上映的那一幕还很遥远,GPT-5可能在秘密研发中,让AI有智慧仍是科学家集洪荒之力最想做的事。

AI思想克隆技术突破 模仿人类思维行动插图

这不,来自不列颠哥伦比亚大学的2位研究人员发现,智能体能够像人类一样思考有很多的优势。最新论文中,他们研究了智能体的「思想克隆」(TC)。论文地址:https://arxiv.org/pdf/2306.00323.pdf

这里,人工智能通过模仿人类,学会像人类一样「思考」和「行动」。当AI有了思想,语言是区分人类和其他生物的关键。因此,研究人员设想,如果智能体能够理解语言,便会有很多的好处。比如,帮助人类概括、推断、适应新的情况、将新的方式结合已有的知识,探索、计划、并在必要时重新计划。尽管有这些益处,但AI智能体却很少思考,至少不是用人类语言去思考。虽然神经网络可以被认为是思考的内部向量激活,但许多人假设,以离散的、符号的语言进行思考具有特定的好处。这意味着能够用语言思考的智能体,可能比不用语言的智能体学习得更快,表现、概括得更好。基于所有这些原因,增强AI智能体用语言思考的能力可以产生许多显著的优势。

AI思想克隆技术突破 模仿人类思维行动插图1

Jeff Clune和Shengran Hu认为实现这一目标的最有效的方法是「让AI模仿人类思考」。他们发现,人类不会孤立地获得思维技能,相反,他们一部分技能的获得是通过他人示范和教师提供的反馈来学习的。因此,一个有效的方法是,让智能体从人类在行动时把想法说出的演示中进行学习。这一方法不同于现有的用预训练LLMs进行规划的工作,因为这些LLMs没有受过人类在行动时说出想法的数据进行训练,即「思想数据」。至于「思想数据」的来源,研究者选取了YouTube视频和文字录音,有大约数百万小时,包含了人们行动、计划、决定和重新规划背后的思想。

论文中,研究人员提出了一个新颖的模仿学习框架「思想克隆」。其中,智能体不仅学习人类的示范行为,如行为克隆,而且学习人类行动同时的思考方式。在思想克隆训练框架中,智能体学习在每个时间步中产生思想,并随后根据这些思想调整行动。整体框架如图所示,TC智能体是一个双层架构:上层和下层组件。在每个时间步中,智能体接收一个观察、一个任务和一段思维历史作为输入。上层组件负责思想生成,下层组件产生以这些思想为条件执行操作。然后,将生成的想法和行动与演示数据集中的基本事实进行比较,以计算损失。虽然对于上层和下层组件的条件可能有不同的选择,但在这项工作中,对于思维数据集中长度t的特定轨迹,研究人员将其最小化:对于更复杂或大规模的场景,上层组件可以使用预训练视觉语言模型(VLM)来实现,或者零样本、微调。而下层组件可以从头开始训练,或者从目标域中现有的语言条件控制器中改编。

AI思想克隆技术突破 模仿人类思维行动插图2

论文中,研究人员基于BabyAI 1.1模型体系结构的两个组件进行了研究。该模型利用内存增强架构LSTM来解决部分可观测性的挑战。此外,它还采用FiLM进行模态融合,有效地结合了视觉和文本输入。这里,作者特别强调,本文中的所有模型都是从头开始训练的,但在复杂领域中还是使用预训练模型更强。如下图,是BabyAI环境示例,左图中包含了各种颜色的物品(球、钥匙、盒子、门)。智能体可以拿起、放下、移动物体或者开门和关门,而锁住的门只能用颜色匹配的钥匙打开。智能体可以看到它前面的7×7的网格单元,这些网格单元是被墙壁和关闭的门阻挡。「思想克隆」智能体的任务是,到达紫色的盒子(高亮显示) ,并开始规划了路线。但是当它打开蓝色的门时,准备完成任务,却发现一个紫色的球挡住了去路。于是,思想克隆智能体再重新规划。由此可以看出,智能体的想法和行动表明,当遇到障碍时,先将其移除,并在继续之前的目标前,重新计划路线。这一过程,就特别像艾娃如何一步一步策划,让人类最终相信并帮助自己,逃出囚禁已久的玻璃牢笼。

实验结果研究结果表明,「思想克隆」优于行为克隆。此外,在零样本和微调设置中,思想克隆在分布外的任务中比行为克隆优势更大。有趣的是,研究人员还开发了「预犯罪干预」,允许用户在模型训练后仍能定义不安全行为。当检测到危险的想法时,就能终止智能体。测试中,「预犯罪干预」的效果近乎完美,显示了它在人工智能安全方面的潜力。「思想克隆」不仅使人工智能更聪明,而且更安全,更容易理解。就是说,当AI犯罪前,一切还有得救。

AI思想克隆技术突破 模仿人类思维行动插图3

在Jeff Clune看来,「思想克隆」有助于人工智能的安全。因为我们可以观察到智能体的思想:(1)可以更容易地诊断出事情出错的原因,(2)通过纠正智能体的思想来引导它,(3)或者阻止它做所计划的不安全的事情。

作者介绍Jeff Clune目前,Jeff Clune是不列颠哥伦比亚大学计算机科学副教授。他主要研究深度学习,包括深度强化学习。此前,他还是OpenAI研究团队负责人,Uber人工智能实验室的高级研究经理和创始成员。此前,他和OpenAI团队发布了视频预训练模型——VPT,让AI在我的世界中从视频数据中学习造石镐。Shengran Hu目前是不列颠哥伦比亚大学的博士生,对深度学习,人工智能生成算法感兴趣。

AI思想克隆技术突破 模仿人类思维行动插图4

参考资料:https://twitter.com/ericjang11/status/1665453341789536256本文为专栏作者授权微想智云发表,版权归原作者所有。文章系作者个人观点,不代表微想智云立场,转载请联系原作者。如有任何疑问,请联系http://gpt.idea2003.com/。

最新快讯

2025年12月31日

13:07
2025年12月31日,峰飞航空自主研发的eVTOL电动垂直起降飞行器凯瑞鸥,从海南海口明珠岛成功起飞,以惊人的速度横跨23公里琼州海峡,最终平稳降落在广东省湛江徐闻港。这场历时9分钟的壮丽飞行,不仅创造了全国首例吨级无人驾驶eVTOL在跨海运输场景中的成功验证,更开启了我国低空物流运输的新纪元。 此次历史性的飞行任务,是由海南控股、海南机场集团、海南翼航通...
13:07
2025年12月31日,一架编号为B-658N的C919国产大飞机平稳降落在长沙黄花国际机场,正式加入中国南方航空湖南分公司的机队。这一历史性时刻不仅标志着长沙成为全国第四个具备执管C919资质的城市,更象征着C919国产大飞机首次实现广州与长沙的双基地运行模式。这一战略部署为中国大飞机产业规模化运营进程注入强劲动力,开启了国产机型商业化飞行的新篇章。 此次...
13:07
2025年12月31日,通用人工智能领域的领军企业Minimax(稀宇科技)正式宣布成功斩获27亿港元巨额基石投资。此次融资活动吸引了全球顶尖投资机构的目光,包括阿布扎比投资局、阿里巴巴集团、Aspex Master Fund、Boyu Capital(博裕投资)以及易方达基金等14家知名机构联合参与。这一历史性融资不仅彰显了资本市场对Minimax技术实力...
13:07
2026年1月1日起,全国范围内将全面启动新一轮家电以旧换新和数码智能产品购新补贴政策,为消费者带来实实在在的优惠。此次政策升级,旨在通过刺激消费需求,进一步提振市场活力,同时有力支持实体零售业发展,并特别关注农村市场的消费升级需求。 个人消费者在购买一级能效标准的冰箱、洗衣机、空调、电视机等6类核心家电产品时,以及选择单价不超过6000元的智能手机、平板电...
13:07
2025年12月31日,备受瞩目的新锐品牌MOAIPLAY正式发布了其首款ORA PRO G1系列电源,为玩家市场带来了一款极具创新性的电源解决方案。这款产品大胆突破传统ATX规格的限制,首次采用了148mm超大尺寸风扇,整体尺寸设计为150×152×86mm,不仅散热效率显著提升,同时也为用户提供了更加震撼的视觉体验。ORA PRO G1系列电源完全符合最...
12:35
2025年12月31日,知名汽车博主@长安AI肉夹馍通过社交媒体平台发布了一则令人瞩目的视频动态,揭示了问界品牌旗下新款测试车型的最新路试进展。从视频画面中可以清晰看到,这辆备受期待的测试车全身覆盖着专业的伪装车衣,其唯一可见的编号为R-0023,整体外观设计明显借鉴了宝马M5车型的经典元素,动感与豪华感十足。值得注意的是,视频拍摄时主驾驶座空无一人,这一细...
12:35
2024年12月30日,内蒙古旭阳新材料股份有限公司(简称"旭阳新材")传来重大喜讯,其上市申报材料正式获得北京证券交易所的受理批准。根据公告,公司计划公开发行股票不超过3964.06万股(不含超额配售部分),此次IPO的保荐机构为知名券商长江证券。作为一家专注于有色金属功能粉体及浆料研发与生产的高新技术企业,旭阳新材的主打产品包括微细球形铝粉、铝颜料等高性...
12:35
2024年12月30日,芜湖莫森泰克汽车科技股份有限公司正式宣布招股说明书已获北交所受理,计划公开发行股票不超过1700万股(不含超额配售部分),此次发行的保荐机构为国投证券。作为国家级高新技术企业,莫森泰克在汽车智能开闭系统领域深耕多年,凭借卓越的研发实力和制造能力,已成为行业内的佼佼者。其核心产品涵盖汽车天窗、玻璃升降器以及智能控制系统,这些产品不仅技术...
12:35
2025年12月31日,中国科研团队传来重大突破性消息,成功研发出一种革命性的神经形态机器人电子皮肤(NRE皮肤)。这种先进的电子皮肤不仅具备触觉感知能力,还能实现损伤检测与即时反射反应,为机器人技术领域带来了前所未有的进展。该电子皮肤的设计灵感源自人类神经系统,通过精密的四层仿生结构和模块化设计,完美模拟了生物皮肤的复杂功能。尤为引人注目的是,它能够在检测...
12:35
2024年12月30日,广德天运新技术股份有限公司的上市申请正式获得北京证券交易所受理,标志着这家专注于汽车零部件与循环经济的企业迈向资本市场的重要一步。公司计划发行不超过3017.57万股股票(不含超额配售权),由中银证券担任保荐机构,为此次资本运作提供专业支持。 天运股份的主营业务聚焦于汽车天窗系统的研发与生产,同时积极拓展废旧纺织品的循环利用领域,打造...
12:35
2024年12月30日,济南森峰激光科技股份有限公司正式向公众披露招股说明书(申报稿),其上市申请已获得北交所的正式受理。这一重要里程碑标志着森峰激光迈出了资本市场化的关键一步,为未来的发展注入强劲动力。公司计划发行不超过1,900万股股票(若未行使超额配售权),并已选定国联民生证券作为保荐机构,共同推动此次资本运作。 森峰激光作为激光加工智能制造领域的领军...
12:35
2024年12月30日,浙江吉宝智能装备股份有限公司(简称"吉宝股份")传来重大喜讯,其上市申报材料已获北交所正式受理,计划公开发行股票不超过1,290万股(不含超额配售部分),保荐机构为国海证券提供全程支持。作为国内机床辅助机械装备领域的领军企业,吉宝股份长期致力于研发、生产与销售高端功能部件,凭借其创新的机床加工废物(液)整体解决方案,在工业机床、工程机...