微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年04月14日

02:30
微新创想:2026年4月14日,苹果向注册开发者推送了iOS/iPadOS 26.5开发者预览版Beta 2,版本号为23F5054d。此次更新距离Beta 1的发布仅相隔10天,属于常规的版本迭代。该版本主要面向iPhone和iPad设备,开发者需要加入苹果开发者计划,并通过设备上的【设置>通用>软件更新】进行安装。 此次Beta 2的发布标志着苹果在正式...
02:30
微新创想:2026年4月14日,苹果公司面向注册开发者推送了macOS 26.5开发者预览版Beta 2(版本号25F5053d)。此次更新距离上一版Beta或RC版本的发布已间隔14天,属于常规的版本迭代。该版本仅限已加入苹果开发者计划的用户通过系统设置中的通用选项获取。 本次更新的具体改进内容尚未对外公开,苹果通常会在正式版本发布前保持一定的信息保密。I...
02:30
微新创想:苹果于2026年4月14日向Vision Pro用户推送了visionOS 26.5开发者预览版Beta 2(版本号23O5453d) 此次更新距离上一版Beta或RC版本发布仅间隔14天 由于区域服务器缓存差异部分用户可能会延迟大约半小时收到升级提示 该版本主要面向已注册的开发者群体 目前尚未公布具体的功能改进内容 IT之家将会持续关注并为用户提...
02:30
微新创想:2026年4月14日,苹果公司面向注册开发者推送了watchOS 26.5开发者预览版Beta 2(版本号23T5553d)。此次更新距离上一版Beta/RC发布已间隔14天,属于常规的版本迭代。苹果通常会在这一阶段对系统进行稳定性优化和功能调整,以确保最终版本的成熟度。 升级操作需要开发者登录苹果开发者账号,并通过Apple Watch的“设置→...

2026年04月13日

23:53
微新创想:2026年4月13日,消息人士Igor Bogdanov在X平台发布大疆Osmo Pocket 4 Pro手持云台相机谍照。该机采用双摄像头设计,云台模组体积明显增大,疑似重点提升光学变焦能力;底部屏幕延续现款Pocket系列布局。目前官方尚未公布具体配置与上市时间。 微新创想:值得注意的是,大疆Osmo Pocket 4系列将于4月16日20:0...
23:22
微新创想:2026年4月13日,宁德时代与上汽通用五菱在福建宁德正式签署战略合作协议。此次合作标志着双方在新能源汽车领域迈出了重要一步,未来将围绕产业规模化、乘商兼容换电、联合出海与生态协同四大方向展开深度合作。 宁德时代将作为五菱全谱系新能源车型的核心动力电池供应商,覆盖超过15款不同类型的车型。这一合作不仅提升了五菱新能源产品的竞争力,也为消费者提供了更...
23:22
微新创想:4月12日 爆料人@SadlyItsBradley在X平台透露Valve公司上周于美国收到了首批标为“无线PC控制器”的货物。这一消息引发了业界广泛关注,因为该控制器的设计与功能被认为与即将于2025年11月发布的Steam Controller手柄高度相似。 目前尚无法确认这批货物是否为Steam Controller的正式版本。不过从其命名和设...
23:22
微新创想:青藏铁路自2006年7月1日全线开通以来,已经安全稳定运行了整整20年。这条铁路的建成不仅标志着西藏结束了没有铁路的历史,也极大地促进了西藏与内地的经济联系和文化交流。截至2026年4月13日,青藏铁路累计运输进出藏货物总量已超过1亿吨,成为连接西藏与全国的重要物流通道。 在过去的二十年里,青藏铁路的货运能力实现了显著提升。2006年通车初期,全年...
22:51
微新创想:2026年4月12日,小岛秀夫工作室宣布谍战题材新作《Physint》(代号“Shimmer”)进入演员遴选阶段。这一消息引发了广泛关注,标志着小岛秀夫在影视领域的新尝试。 该剧由小岛秀夫亲自执导,已确定马东锡、查莉·弗雷泽、浜辺美波参演。这三位演员的加入为项目增添了丰富的角色层次和国际影响力。 剧组正在积极寻找一名兼具麦斯·米科尔森式外形与精神错...
22:51
微新创想:2026年4月13日,安全公司Noma披露Grafana AI助手存在‘GrafanaGhost’漏洞,攻击者可通过外部网页嵌入恶意指令,利用间接提示注入诱导AI泄露敏感数据至外部服务器。 该漏洞需要攻击者已经获得用户端权限,并且通过多次交互才能触发,因此不属于零点击类型。这意味着攻击者必须在用户不知情的情况下,逐步引导用户执行某些操作,才能实现数...
22:51
微新创想:2026年4月10日,两名前Epic员工向彭博社透露,Epic游戏商店虽然通过免费游戏活动在短期内提升了用户数量,但大多数玩家在活动结束后又回到了Steam平台。这反映出Epic在用户留存方面仍存在明显短板。 跨平台切换的不便成为玩家流失的重要原因之一。许多用户在使用Epic游戏商店时发现,游戏的跨平台体验并不如预期般顺畅,尤其是在不同设备之间同步...
22:51
微新创想 4月13日,华为终端正式发布鸿蒙智行首款MPV智界V9的智能交互式侧门光毯视频,并宣布刘亦菲成为鸿蒙智行智界品牌代言人。此次发布不仅展示了智界V9在智能交互方面的创新设计,也标志着刘亦菲与鸿蒙智行品牌合作迈入新阶段。 视频中,刘亦菲身着鎏金深V礼裙优雅登场,展现出独特的气质与魅力。当她靠近智界V9时,车辆通过毫米波雷达主动感知,侧滑门随即自动开启,...