Deepmind新AI两小时学26游戏效率超人类 - 微新创想

2023-06-21 09:21:43 互联网 118 次阅读

微新创想（Idea2003.com）6月20日消息：谷歌深度学习中心近日宣布，其研发的 “Bigger，Better，Faster”（BBF）AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏，其学习效率与人类相当，为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向，在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈：一是需要海量训练数据，二是计算资源消耗巨大。为了突破这些限制，谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队，共同推出了BBF模型。

在Atari基准测试中，BBF模型的表现不仅超越了人类水平，更创造了惊人的效率。与其他强化学习算法不同，BBF无需预先训练模型，而是通过直接与游戏世界交互，从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术，显著提升了算法效率。值得注意的是，BBF模型仅需单个Nvidia A100 GPU即可完成训练，而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现，但与其他模型的55款游戏对比显示，BBF在数据量仅相当于其他系统1/500的情况下，仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性，也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同，BBF在扩展性方面表现出色，能够随着更多训练数据的加入持续提升性能。

该研究团队表示：”我们希望通过这项工作，激励更多研究者推动深度强化学习的样本效率边界，最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文：https://arxiv.org/pdf/2305.19452.pdf

2026年03月20日

02:59

NASA调整阿尔忒弥斯计划重点 SpaceX登月角色增强波音受冲击

微新创想：3月20日，美国国家航空航天局（NASA）宣布将扩大SpaceX在阿尔忒弥斯登月计划中的任务权重，包括承担更多载人着陆系统开发与执行工作。这一决定是在波音公司“星际客机”飞船多次延期、技术问题频发的背景下做出的。NASA表示，此次调整旨在确保2026年后续登月节点如期推进。波音作为原主要承包商之一，其月球着陆器方案未获新阶段合同授出。分析认为，该决...

02:59

高盛计划4月启动新一轮裁员优化成本应对市场变化

微新创想：2026年3月20日，据知情人士透露，高盛集团计划于2026年4月起启动新一轮裁员。此次调整涉及全球多个业务部门，具体人数及岗位尚未公开。公司称此举旨在优化成本结构、应对市场环境变化及提升运营效率。裁员将分阶段实施，受影响员工将获得相应补偿与职业支持服务。目前高盛未就消息置评。这一举措反映出金融行业在当前经济形势下的调整趋势，也引发了市场对于未...

02:59

中国科学家首次揭示压力加重皮炎的神经免疫调控机制

微新创想：3月20日，复旦大学柳申滨团队在《科学》杂志发表研究，揭示心理应激通过交感神经-嗜酸性粒细胞轴加剧皮肤炎症。研究在小鼠模型及人类样本中证实，大脑应激信号经特定皮肤交感神经通路激活嗜酸性粒细胞，触发炎症级联反应。该成果首次系统阐明‘脑-皮’神经免疫调控通路，为压力相关皮炎干预提供新靶点。这项研究突破了传统对皮肤炎症机制的理解，指出心理因素在皮肤...

01:53

MSC2026年4月2日起对欧印洋航线征收燃油附加费

微新创想：地中海航运公司（MSC）3月20日宣布自2026年4月2日起对欧洲至印度洋群岛航线临时征收燃油附加费（EFS）该附加费将适用于所有新订舱此次燃油附加费的征收旨在应对近期燃油成本持续上涨带来的运营压力。MSC表示由于国际油价波动以及供应链环境变化导致的燃料费用增加公司不得不采取这一措施以维持航线的正常运营普通干货箱的燃油附加费为275美元每标准箱...

01:53

Solidcore计划2026上半年出售黄金库存优化资产结构回笼资金

微新创想：3月20日，哈萨克斯坦黄金开采商Solidcore首席执行官宣布，公司将择机在2026年上半年出售其累积的黄金库存储备。这一决定背后有多个战略考量，包括优化资产结构、回笼资金以及应对当前金价波动和市场流动性需求。公司希望通过出售部分库存，调整其财务状况，增强现金流，从而为未来的业务扩展和投资提供支持。 Solidcore总部位于阿拉木图，是一家专注...

00:04

高盛启动100亿美元私人信贷基金募集抓住利率高位下的融资机遇

微新创想：3月19日，高盛集团宣布启动一只规模达100亿美元的私人信贷基金募集计划。该基金将面向合格机构投资者，重点投向中型企业及结构性融资项目。此举旨在把握当前利率高位环境下企业对替代性融资渠道的需求增长。高盛表示，这一举措是其强化另类信贷业务整体战略的重要组成部分。随着全球经济环境的变化，企业融资方式正经历深刻转型。私人信贷作为传统银行信贷之外的重要补...

00:04

埃克森美孚加速收回圭亚那油田50亿美元投资高油价助力资本回报优化

微新创想：3月19日，埃克森美孚公司宣布将在当前高油价环境下加快成本回收进度，力争尽快收回其在圭亚那油田项目的50亿美元前期投资。这一举措体现了公司在当前市场条件下的灵活应对和战略调整。该项目位于南美洲圭亚那近海斯塔布鲁克区块，由埃克森美孚主导运营。作为全球领先的能源企业，埃克森美孚一直致力于在全球范围内寻找高回报的油气资源。此次加快成本回收，正是基于对市...

00:00

新一代小米SU7上市34分钟锁单1.5万台引爆市场

新一代小米SU7上市34分钟锁单1.5万台引爆市场

微新创想小米汽车刚刚公布最新战报新一代小米SU7正式上市后非常火爆上市仅34分钟锁单量就达到1.5万台此次新一代SU7上市延续了小米汽车一贯的高热度从前期预热到正式发布这款车型一直备受关注不少消费者提前关注配置价格等关键信息就等着上市后第一时间下单此番34分钟1.5万台的锁单成绩直观体现出用户对这款新车的认可与期待有网友感...

00:00

小米Watch S5发布21天超长续航 1199元起全新升级功能亮点

小米Watch S5发布21天超长续航 1199元起全新升级功能亮点

微新创想：今天在新品发布会上，小米正式推出了全新智能手表产品——小米Watch S5。该产品分为蓝牙款和eSIM款两种版本，价格分别为1199元和1399元，满足不同用户群体的需求。小米Watch S5在外观设计方面进行了全面升级。采用10.99mm的轻薄不锈钢表体，整体重量控制在46克，佩戴舒适。表圈为46mm一体式设计，不仅提升了产品的质感，也增强了佩...

00:00

小米AI团队平均年龄25岁雷军三年投入超600亿打造顶尖大模型

小米AI团队平均年龄25岁雷军三年投入超600亿打造顶尖大模型

微新创想在今晚的小米春季新品发布会上，雷军详细介绍了小米在AI大模型领域的最新核心数据与研发进展。这一消息不仅展示了小米在人工智能领域的持续投入，也体现了其在技术布局上的战略眼光。微新创想雷军宣布，小米未来三年在AI领域的投资计划将至少达到600亿元，而仅今年的AI研发与资本开支就已超过160亿元。这一巨额投入彰显了小米对AI技术的高度重视，并为其在智...

00:00

羽绒服到底能不能干洗洗涤误区与正确水洗方法解析

羽绒服到底能不能干洗洗涤误区与正确水洗方法解析

微新创想收冬衣的季节到了很多人都会面临一个共同困扰羽绒服到底要不要洗该怎么洗常听人说羽绒服不能水洗会越洗越薄越洗越不保暖这一说法其实并不准确洗衣行业人士指出羽绒服保暖性下降的问题从来不在水洗本身而在于清洗方法是否正确首先需要明确一点羽绒服只能水洗不能干洗羽绒之所以保暖关键在于蓬松度蓬松的羽绒能够锁住大量空气形成隔热层...

2026年03月19日

23:32

三星电子2026年5月关闭斯洛伐克电视工厂24年运营结束

微新创想：三星电子宣布将于2026年5月关闭位于斯洛伐克加兰塔的电视生产工厂这一决定标志着该工厂自2002年成立以来长达24年的运营历史正式结束三星电子表示关闭加兰塔工厂的主要目的是为了提升全球运营效率以应对当前电视市场面临的多重挑战包括长期低增长竞争日益激烈以及当地能源价格高企和零部件成本不断上升等因素该工厂长期以来是三星在欧洲市场的重要生...