微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月25日

07:38
2026年2月25日,Insomniac Games官方宣布《漫威金刚狼》将于2026年9月15日登陆PlayStation 5平台。该消息通过社交平台同步发布,并附6秒新预告。游戏自2021年TGA首次亮相后长期保密,2023年实机预告揭晓暴力风格及配音演员利亚姆·麦金太尔。本作为PS5独占,定位“全球惊悚冒险”,将登场魔形女、欧米茄红等经典角色。
07:38
2026年2月,OpenAI首席运营官布拉德·莱特卡普在印度人工智能影响力峰会期间指出,尽管OpenAI Frontier平台已上线,但企业级AI尚未深度融入实际业务流程。他强调,企业组织复杂、系统多元,AI落地需兼顾协同与场景适配。OpenAI正以“业务成果”而非传统许可数衡量Frontier成效,并宣布与BCG、麦肯锡等咨询公司合作推进企业应用。同期,...
07:38
2026年2月24日起,苹果在巴西、澳大利亚、新加坡及美国犹他州、路易斯安那州上线新版年龄验证API。此举旨在协助开发者履行当地即将生效的未成年人保护法规:如犹他州《应用商店责任法案》(5月6日生效)、路易斯安那州HB570法案(7月1日生效),以及巴西禁止向儿童提供开箱抽奖应用的法律。用户下载18+应用须完成App Store内自动年龄确认;开发者需通过...
07:38
据彭博社及多位知名爆料人消息,2026年秋季发布的iPhone 18 Pro与Pro Max将采用更小尺寸的灵动岛,但不会取消该设计。苹果计划通过将Face ID点阵泛光感应元件移至屏下、结合前置摄像头微型化技术实现缩小,而前置摄像头、点阵投影仪和红外摄像头仍保留在灵动岛内。此举旨在逐步推进无开孔全面屏目标,但整块玻璃正面设计预计要到2027年iPhone...
06:27
微新创想:2026年2月25日,据行业消息,苹果公司计划于今年秋季推出首款配备触摸屏的MacBook Pro机型。这一消息引发了广泛关注,标志着苹果在Mac产品线上的重大创新。此次新机型的研发工作将在美国加州总部主导,随后将面向全球市场正式发售。 苹果此举旨在提升创意工作者的多模态操作体验,将触控交互引入传统笔记本电脑领域。随着用户对高效、直观操作方式的需求...
06:27
微新创想:2026年2月25日,美国媒体公司华纳兄弟探索(WBD)证实,派拉蒙全球已将其现金收购报价上调至每股31美元。此次提价是双方就潜在合并展开多轮磋商后的最新进展,意在提升交易的可行性与确定性。这一举动表明两家公司在整合过程中展现出更强的合作意愿,同时也反映出市场对此次合并的高度关注。 微新创想:交易若达成,将对全球流媒体行业和传统影视产业产生深远影响...
06:27
微新创想:2026年2月25日,美国光伏企业第一太阳能公布2025财年第四季度业绩净销售额达16.8亿美元高于分析师预期的15.6亿美元 公司总部位于亚利桑那州坦佩市主要面向北美及欧洲市场 业绩增长主要得益于大型地面电站项目交付提速及组件均价稳中有升 但全年指引下调至49亿–52亿美元低于此前市场预期的60.9亿美元反映供应链成本压力与部分项目延期影响 公司...
06:27
微新创想:2026年2月25日,惠普发布了2026财年第一财季的财务报告。根据这份报告,当季净营收达到了144.4亿美元,超过了市场分析师预期的139亿美元。这一成绩显示出惠普在当前市场环境下的良好表现。此外,调整后的每股收益为0.81美元,同样高于预期的0.77美元,进一步证明了公司的盈利能力。 个人系统业务作为惠普的重要组成部分,当季营收为102.5亿美...
05:10
微新创想:2026年2月25日,谷歌公司宣布将在美国新增两座数据中心。这一消息引起了广泛关注,尤其是在科技与环保领域。虽然项目选址、投资规模及启用时间尚未公开披露,但谷歌明确表示,此次扩建是为应对人工智能模型训练与云服务需求持续增长所采取的重要举措。 微新创想:随着人工智能技术的快速发展,全球对算力的需求也在不断攀升。谷歌此次新增数据中心,正是为了满足这一趋...
05:10
微新创想:2026年2月25日,美国云计算公司Coreweave正寻求在Meta公司相关交易背书下,向多家银行申请总额85亿美元的贷款 该公司总部位于纽约,专注于AI高性能计算基础设施服务。此举旨在加速其数据中心扩建及GPU集群部署,以满足Meta等大客户日益增长的AI训练需求 贷款将用于资本支出及营运资金,预计由多家国际商业银行联合承贷。目前融资方案尚处洽...
03:53
微新创想:2026年2月25日,据知情人士透露,美国能源基础设施服务商Voltagrid正筹备首次公开募股(IPO)目标估值逾100亿美元。公司已与黑石集团、贝莱德集团等多家顶级私募机构展开接触。此举旨在借助其与甲骨文等企业签订的长期合同提升资本实力。预计至2028年,公司EBITDA将达11亿美元。IPO地点尚未最终确定,可能选择纳斯达克或纽交所。
02:43
微新创想:2026年2月25日,谷歌宣布为其AI Avatars和AI Voiceovers功能新增阿拉伯语、葡萄牙语、印尼语、越南语、泰语、希伯来语及土耳其语七种语言支持。这一更新标志着谷歌在AI语言覆盖范围上的重要拓展。 此次升级面向全球开发者及内容创作者,旨在提升多语言内容生成的效率与本地化体验。随着全球市场的不断扩展,支持更多语言的AI工具能够更好地...