微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月27日

00:26
1月26日,微软正式宣布推出其自主研发的第二代人工智能芯片——Maia 200,这款先进芯片由全球领先的晶圆代工厂台积电负责生产制造。据悉,首批Maia 200芯片已成功部署于美国爱荷华州的数据中心,未来还将逐步扩展至亚利桑那州凤凰城的新数据中心集群。此次芯片的推出,标志着微软在AI基础设施自主化道路上迈出了关键一步,其核心目标在于显著提升Azure云服务的...
00:26
2026年1月26日,知名光学品牌卡色(Kase)正式宣布将推出一款备受期待的150mm f/5.6 REFLEX折返镜头。这款专为全画幅相机设计的镜头将首先适配索尼E卡口,未来计划逐步拓展至尼康Z卡口和富士X卡口,为更多摄影爱好者提供选择。作为卡色产品线的重要补充,该镜头凭借其独特的折返光学结构,将在紧凑便携与长焦拍摄之间实现完美平衡。 这款镜头最引人注目...
00:26
2026年1月26日,宝马集团正式宣布一项重要战略调整——将延续慕尼黑工厂V8发动机零部件的生产线,这一决定基于美国市场独特的市场环境与消费者偏好。据悉,由于美国严格的排放标准相较于欧盟更为宽松,加之当地消费者对大排量高性能车型的持续热情,宝马不得不重新评估其原定于2027年底完成纯电动转型的计划。 为满足这一市场需求,宝马决定自2026年起继续在慕尼黑...
00:26
北京越野品牌重磅官宣,旗下明星车型BJ40增程系列将于2026年1月27日正式开启预售,同步推出三款极具特色的定制版本,分别为BJ40增程悦野飞行版、燃油巨幕版以及增程赤兔版。这三款新车均精准定位于硬派越野市场,以硬核实力和独特设计满足户外探索爱好者的多元化需求。 悦野飞行版作为本次预售的重头戏,创新性地搭载了车顶无人机收纳舱,实现了空中勘测场景的完美拓展。...

2026年01月26日

23:25
1月25日至26日,美国德克萨斯州弗里波特液化天然气出口工厂的天然气输送流量持续处于低位状态。这一波动源于此前1月24日发生的极端天气事件——极地风暴,导致该地区上游输气系统的进气量出现显著下降。值得注意的是,此次事件集中爆发在美国南部地区,主要影响对象为弗里波特LNG出口设施及其配套的上游输气系统。 此次输送流量的异常波动,是极端天气条件下基础设施运行受限...
23:25
2026年1月26日,祥源文旅正式宣布一项重要的战略调整举措。公司全资子公司上海丰豫决定退出盐城黄海汇创科泰低空经济产业投资基金,此次退伙涉及份额价值高达257.15万元,将以现金方式完成支付。这一决策是祥源文旅聚焦低空文旅垂直业态发展的重要布局,体现了公司对产业方向的精准把握。 此次退出操作无需经过董事会或股东会审议,充分展现了公司决策的高效性。值得注意的...
23:25
1月26日,备受瞩目的上海奥科达医药科技股份有限公司正式敲响港交所上市钟声,向资本市场递交了首次公开发行股票的申请材料。这家总部扎根上海的创新药企,此次计划通过IPO募集发展资金,为未来的研发与商业化注入强劲动力。在联席保荐人招商证券国际与建银国际的鼎力支持下,奥科达医药正开启资本市场新征程。 此次上市计划的核心目标,是加速推进公司创新药的研发进程与商业化布...
23:25
2026年1月26日,OpenAI正式宣布进军广告业务领域,以极具震撼力的姿态踏入市场。其首期推出的广告定价策略令人瞩目,定价比肩NFL赛事等顶级媒体资源,显著高于主流社交平台,显示出OpenAI对自身广告价值的自信与高定位。这一举措不仅标志着OpenAI商业化进程的重大突破,也预示着其在广告生态建设上的雄心壮志。 目前,OpenAI的广告业务主要面向广告主...
23:25
1月26日,黑客组织WorldLeaks在暗网公开宣称成功入侵耐克公司,并声称窃取了约1.4TB的数据,涉及超过18.8万份文件。据黑客公布的截图显示,这些资料疑似源自耐克的分公司,其中包含了大量关于运动鞋、服装及健身产品的生产厂房信息。该组织以公开敏感数据为由,向耐克公司索要赎金。耐克公司迅速作出回应,确认已经启动安全事件调查,并正在全面评估此次事件可能造...
23:25
2026年1月26日,备受期待的《世界计划:缤纷舞台》日服官方直播中,游戏开发团队正式公布了即将上线的"活动休息系统"。这一创新机制旨在帮助玩家更好地平衡游戏与生活,通过科学化的时长监控实现健康游戏体验。系统将全面计量玩家在单人LIVE模式、我的「世界」自由探索以及排名竞技等核心玩法中的累计时长。当玩家连续投入约18小时的游戏时间(例如参与《孑然妒火》等高沉...
23:25
国家版权局于1月26日正式发布2026年度第一批重点作品版权保护预警名单,这份备受关注的文件涵盖了包括《新狂蟒之灾》和《御赐小仵作2》在内的31部备受瞩目的院线电影与电视剧作品。此次发布的预警名单旨在通过强化重点作品全链条版权保护机制,有效遏制盗版传播现象,维护影视行业的合法权益。根据相关规定,所有网络服务提供商必须严格遵守要求,不得擅自提供、存储或传播名单...
23:25
2026年1月26日,科技巨头英伟达震撼发布Earth-2开放模型系列,为全球气象预报领域带来革命性突破。这一创新套件精心整合了三大核心模型——中期预报系统、临近预报系统和全球数据同化平台,构建起前所未有的气象预测生态系统。基于Atlas、StormScope和HealDA等前沿AI架构,Earth-2实现了15天全球天气预报与分钟级极端天气预测的双重突破,...