微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年04月03日

07:46
微新创想:2026年4月,奔驰宣布对纯电旗舰轿车EQS启动第二次中期改款。此次改款不仅在设计上带来全新元素,更在技术配置方面进行了重要升级。 新车将首次搭载线控转向系统及异形Yoke方向盘,提升操控轻便性与座舱空间利用率。线控转向系统作为选装配置,已完成超100万公里测试,采用双冗余设计保障安全。Yoke方向盘需配套全新安全气囊,以确保驾驶者在各种情况下的安...
07:46
微新创想:2026年4月3日,谷歌正式推出Gemma 4开源大模型系列,包含E2B、E4B、26B MoE和31B四款型号。该系列专为高级推理与智能体工作流优化,单位参数智能水平显著提升。 31B模型位列Arena AI文本榜单全球开源模型第三,性能超越同规模20倍参数模型。这一突破性表现展示了Gemma 4在自然语言处理领域的强大能力。 E2B与E4B支持...
07:46
微新创想:2026年4月3日,国家“十五五”规划纲要明确将新型储能定位为新型能源体系核心支撑,并纳入战略性新兴支柱产业。这一政策导向标志着新型储能技术在国家能源战略中的重要地位日益凸显。 数据显示,截至2025年底,我国新型储能累计装机达1.36亿千瓦,较2024年增长84%,较“十三五”末增长超40倍。这一迅猛增长体现了我国在储能技术领域的快速发展和广泛应...
07:46
微新创想:2026年4月3日,中国科学院国家空间科学中心刘洋团队联合多家高校,基于祝融号火星车原位观测数据,首次在火星岩石表面识别出近平行片状剥落、嵌合碎块及密集凹坑等盐风化特征。这些特征为研究火星地表演化提供了新的视角。 研究团队结合多光谱与短波红外光谱分析,确认着陆区存在含水硫酸盐。这一发现表明,火星地表可能存在水合矿物,为探索火星水历史提供了重要线索。...
07:07
微新创想:2026年4月2日,苹果研究团队与香港大学联合发布了一项重要的技术突破,推出新型3D渲染框架LGTM(Less Gaussians, Texture More)。这项创新技术通过将几何结构与表面纹理进行解耦处理,实现了前所未有的4K级超高清渲染效果。这一突破不仅提升了视觉呈现的细腻程度,也为未来虚拟现实和增强现实应用奠定了坚实基础。 相比传统的前馈...
07:07
微新创想:美国联合航空近日宣布将对行李托运费用进行调整,计划在近期对美国、墨西哥、加拿大以及拉丁美洲地区的航线实施涨价措施。根据最新通知,每件标准托运行李的费用将增加10美元。此次调价主要针对经济舱旅客,适用于所有适用航线,反映出航空公司为应对不断上涨的运营成本所采取的策略。 调整后的首件托运行李基础费用预计将达到约35美元,具体金额将根据不同的航线和购票时...
07:07
微新创想:微软365官方于4月3日发布通报称,其位于美国中部的数据中心部分基础设施出现性能降级情况。该事件发生在美国中部时区,影响范围主要集中在该区域的部分服务节点,未对全球其他数据中心造成波及。微软方面表示已启动应急响应机制,正在全力排查问题的根本原因,并积极优化系统负载以尽快恢复正常运行。 目前,部分用户可能会遇到应用程序响应延迟或短暂的连接不稳定现象。...
07:07
微新创想:2026年4月3日,稳定币发行商Tether宣布以5000亿美元估值启动融资最后阶段。公司敦促潜在投资者于未来两周内完成出资承诺,以推动协议签署。此次融资旨在强化其储备透明度与合规基础设施,并拓展机构服务生态。 Tether未披露具体融资规模及领投方,但强调将严格遵循美国及主要司法辖区监管要求。此举发生在全球稳定币监管框架加速成型的背景下,被视为其...
07:07
微新创想:2026年4月3日,星巴克正式完成与博裕投资的合资交易,出售其中国零售业务60%股权,保留40%股权。新成立的合资公司将运营约8000家星巴克中国自营门店,星巴克继续担任全球品牌所有者及授权方。 交易旨在深化本地化运营能力,提升市场响应效率。通过此次合作,星巴克能够更加灵活地应对中国市场的需求变化,同时借助博裕投资的资源与经验,进一步优化门店管理和...
05:24
微新创想:2026年4月3日,摩根士丹利公布其首席执行官爱德华·皮克2025财年的总薪酬为3720万美元。这一薪酬结构涵盖了基本工资、奖金以及股权激励等多个部分,相较于上一财年有所调整。公司表示,该薪酬方案的设计与业绩目标的实现以及长期股东回报紧密相关,体现了对管理层绩效的全面考量。 爱德华·皮克自2021年起担任摩根士丹利首席执行官,至今已带领公司走过多个...
02:27
微新创想:截至2026年4月3日,美国当周石油钻井数量升至411台,较前一周增加2台。这一数据由贝克休斯公司统计,显示出页岩油生产商在当前油价企稳的背景下,小幅扩大了勘探活动。 微新创想:钻井数连续第二周回升,表明市场参与者对短期增产的意愿有所增强。这可能与全球能源需求的预期变化以及油价走势密切相关。 微新创想:石油钻井数量是观察美国原油供应潜力的重要先行指...
02:27
微新创想:2026年4月3日,印度AI初创公司Sarvam宣布完成新一轮融资,估值达15亿美元,融资规模为3亿至3.5亿美元。这一轮融资由多家国际风投机构领投,显示出市场对公司技术潜力的高度认可。 此次融资将主要用于加速大语言模型的研发进程,同时推动公司在印度及东南亚市场的业务拓展。Sarvam计划利用这笔资金进一步提升其AI技术的本地化能力,满足更多地区用...