微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月29日

13:21
2026年1月29日,货拉拉在广州正式上线高峰服务费机制,并开展第六次算法公开。该机制将持续至2月23日,单笔订单服务费最高达60%,预计六成订单可叠加,平均为司机每单增收约13元。平台同步优化抽佣规则:对出价单、顺路单、拼车单及100公里以上订单降抽,未使用减佣卡司机抽佣上限为100元/单,使用后降至50元/单。2025年,货拉拉累计降抽让利2.6亿元,...
13:21
2026年1月29日,通光线缆在互动平台回应投资者提问时表示,公司柔性电缆产品已应用于工业机器人拖链系统、港口机械、无人化码头、汽车自动化生产线及铁路轨道车辆等领域,但目前尚未应用于人形机器人。公司指出,该类产品技术适配性需结合人形机器人动态弯曲、高频运动等特殊工况进一步验证。未来将密切关注人形机器人产业发展及下游客户需求变化,适时推进相关研发与验证工作。
13:21
2025年,丰田公司全球销量达1130万辆,同比增长4.6%,创历史新高;全球产量达1120万辆,同比增长5.7%。数据于2026年1月29日公布,反映其供应链韧性与多区域市场增长动力。销量增长主要来自北美、中国及东南亚市场,混动与电动车型占比持续提升。公司表示,产能优化与本地化生产策略是关键驱动因素。
13:21
国家林草局与国家能源局近日联合发布重要通知,明确支持风电场科学选址与空间集约复合利用,推动绿色能源产业高质量发展。通知强调,新建风电项目应优先布局于沙漠、戈壁、荒漠等生态承载力强的区域,以实现资源高效利用与环境保护的平衡。 为严格保护生态环境,通知明确规定,严禁在生态保护红线、自然保护地、重要湿地及重点国有林区林草地上新建扩建风电场。这一举措旨在确保重要生态...
12:50
2026年1月29日,上海市市场监管局发布《上海市食品经营许可审查实施细则》,将于2月10日起施行。该细则系上海首部系统性食品经营许可审查规范文件,面向全市食品经营者,旨在解决申请难、准备烦等问题。细则采用表格化审查要求、清单化专间设置,并为轻食、无人售货等创新业态预留合理优化空间,以明确合规边界、支持业态创新、优化营商环境。
12:50
2025年,特斯拉在亚太市场电动车交付量创历史新高。全年全球交付163.6万辆,其中上海超级工厂交付85.1万辆,占全球超一半。Model Y蝉联中国SUV销量榜首。财报发布于2026年1月29日,数据覆盖2025自然年。增长主要得益于产能提升与本地化供应强化,上海工厂持续发挥亚太核心枢纽作用。
12:50
2026年1月28日,开源项目bilibili-API-collect开发者宣布即日起停止维护并删除全部代码及文档。该项目托管于GitHub,曾获超2万星标,用于支持第三方B站客户端开发。关停直接原因为当日收到B站委托律所发送的律师函,指其系统性收集、传播B站非公开API接口及安全机制,涉嫌侵权。事件发生地为互联网平台GitHub,涉事方为项目维护者与哔哩...
12:50
1月29日,科技圈迎来重磅消息。知名爆料人@Evleaks与@MysteryLupin联手在X平台发布了三星Galaxy S26系列手机的官方渲染图,瞬间引爆了全球粉丝的热议。这些高清渲染图不仅揭示了S26系列全新的设计语言,更预示着三星在智能手机设计领域将迎来新一轮的革新。 从渲染图中我们可以清晰地看到,三星在S26和S26+两款机型上大胆采用了超窄边框设...
12:18
2026年1月29日,国际检验认证机构SGS宣布完成对印度网络安全服务商Panacea Infosec的收购。该公司总部位于班加罗尔,专注于支付安全、数据保护及隐私合规服务。此次收购旨在增强SGS在亚太地区信息安全与合规解决方案领域的技术能力与市场覆盖。交易金额未披露,整合工作将按计划于2026年二季度启动。此举标志着SGS加速布局网络安全服务生态,强化其...
12:18
2026年1月29日,NASA正式宣布,阿尔忒弥斯2号任务的四名宇航员已抵达休斯顿约翰逊航天中心,正式启动为期14天的隔离训练。这支精英飞行团队由美国宇航员维克多·格洛弗、里德·怀斯曼和克里斯蒂娜·科赫,以及加拿大宇航员杰里米·汉森组成,他们将共同执行人类重返月球的关键任务。 据悉,阿尔忒弥斯2号任务计划最早于2月6日搭乘SLS超重型运载火箭,搭载"猎户座"...
12:18
2026年1月,江苏宿迁生物发酵饲料研发商宿迁路德完成A轮融资,投资方为国投聚力投资。公司专注于饲料及饲料添加剂研发生产、畜牧渔业饲料与原料销售。本轮融资将用于扩大产能、加强菌种研发及市场拓展。宿迁路德成立于近年,立足生物发酵技术,服务规模化养殖企业。此次融资标志着其在绿色饲料赛道获得资本认可。
12:18
2026年1月,比格餐饮国际控股有限公司向港交所递交上市申请,拟成为“本土比萨第一股”。公司由赵志强夫妇于2002年在北京创立,主打平价自助比萨,截至2026年1月全国门店达387家,覆盖所有省会城市。其以奥利奥、麻辣小龙虾等创新口味及79.99元/人客单价差异化竞争,但因环卫工人49.99元福利日活动引发“作秀式公益”争议,后调整为9.9元。公司家族持股...