微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月18日

08:23
2026年1月18日,中央气象台正式发布寒潮蓝色预警,提醒公众做好防寒准备。受强冷空气影响,我国中东部地区将在未来四天经历一次明显的降温大风天气过程。预计从18日起,气温将自北向南逐步下降,多数地区日均气温或最低气温降幅普遍在6至12摄氏度之间。 此次寒潮影响范围广泛,其中黄淮南部、江淮西部、江汉东部、江南中西部以及贵州东部和广西北部等地区降温尤为显著,局部...
05:51
2026年1月中旬,非洲南部多国遭遇了持续强降雨引发的严重洪灾,这场灾难给当地人民带来了巨大的生命财产损失。莫桑比克、南非和津巴布韦是受灾最严重的国家,其中莫桑比克报告103人死亡,这些遇难者中包括因洪水、雷击以及霍乱等次生灾害导致的死亡。这场持续至今的强降雨灾害已经造成超过20万人受灾,数万间房屋被毁,超过7万公顷的农作物被淹没,农田被洪水吞噬,农业收成受...

2026年01月17日

23:42
2026年1月17日,亚洲U23足球锦标赛1/4决赛的战火在赛场上激烈燃烧。中国U23男足与乌兹别克斯坦队展开了一场势均力敌的较量。经过90分钟的常规时间鏖战,双方球员都展现了极高的竞技水平,但场上比分始终紧咬,最终以0-0的平局进入加时赛。加时赛阶段双方继续展开激烈对抗,但依然未能打破僵局,比赛不得不通过残酷的点球大战来决出胜负。 在紧张刺激的点球对决中,...
23:42
2026年1月12日,一则来自游戏巨头育碧的内部评级消息引发了行业广泛关注。据多家媒体报道,育碧将旗下备受瞩目的《刺客信条:影》和《刺客信条:幻景》正式定位为"4A游戏"。这一评级由制作人Krasimira Yakovlieva亲自宣布,她特别强调,《幻景》作为首款原生支持苹果移动设备的4A游戏,开创了移动端游戏品质的新标杆;而《影》则实现了历史性突破,成为...
23:42
2026年1月17日,安徽芜湖星光璀璨,奇瑞汽车在此盛大举办AI之夜,向全球揭晓了其在人工智能领域的最新突破。当晚,奇瑞重磅发布了涵盖猎鹰智驾、灵犀智舱、飞鱼数智底盘及鲲鹏动力四大核心的AI技术进展,标志着中国汽车品牌在智能化浪潮中迈出了坚实一步。 猎鹰智驾系统迎来重大升级,猎鹰500车型新增城区导航辅助驾驶功能,让城市驾驶更加轻松自如。猎鹰700产品序列全...
23:42
2026年1月17日,科技界迎来重大突破——埃隆·马斯克的xAI公司宣布其为Grok人工智能模型打造的"Colossus 2"超级计算机正式投入运行。这款全球首个吉瓦级训练集群目前已具备1吉瓦的算力,并计划在4月份通过扩容升级至1.5吉瓦。这一尖端设施坐落于美国田纳西州孟菲斯市,占地面积广阔,相当于13个标准足球场大小,内部配备了20万块英伟达H100高性能...
23:41
2026年1月15日公布的最新日本游戏机销量报告揭示了市场格局的微妙变化。任天堂Switch 2凭借强劲势头再度称霸,在该统计周期内(2025年12月29日至2026年1月11日)销量高达313,838台,进一步巩固了其在便携式游戏领域的领导地位。值得注意的是,Switch 2自发布以来累计销量已突破409.79万台,显示出其持续的热销态势。 与此同时,索尼...
23:41
1月16日,中国铁建大桥局在江苏常州成功下线全球最大规格的打桩船启闭油缸,标志着我国超大超长油缸国产化技术取得重大突破。该油缸直径达2米,重量高达402吨,额定推力可达到5000吨,其举重能力相当于3500辆家用轿车的总重量,展现了我国高端装备制造业的强大实力。 作为"铁建大桥桩1"号打桩船的核心部件,该油缸特别配备了全球首创的闭式能量回收系统,通过先进技术...
22:40
2026年1月17日,美光科技宣布拟以18亿美元收购力积电位于中国台湾铜锣的P5晶圆厂设施。此举旨在扩充其存储芯片产能,交易预计于第二季度完成。美光计划分阶段提升该厂区的DRAM产量,并预计在2027年下半年实现显著晶圆产出。同时,双方将就晶圆后段封装与组装展开合作,美光亦将支持力积电的传统DRAM产品业务。
22:40
2026年1月17日,中国航发集团传来振奋人心的消息,其自主研发的"太行7""太行15""太行110"燃气轮机示范项目顺利通过国家能源局组织的评估验收。这一重大突破不仅彰显了中国在高端装备制造领域的强大实力,更标志着我国在燃气轮机全产业链上实现了从跟跑到并跑再到领跑的历史性跨越。 作为中国航空发动机集团的核心项目,此次通过验收的燃气轮机示范项目涵盖了自主研发...
22:40
2026年中央广播电视总台春节联欢晚会于1月17日完成首次彩排。本次春晚以“科技+艺术”为核心,融合智能技术与舞美设计,提升视听体验。彩排中,各类节目与技术创新、视觉效果初步整合,展现全新年味想象。继去年智能机器人表演扭秧歌引发关注后,今年机器人将再次亮相,通过创意编排展示我国科技发展成果。演出旨在以科技范和新颖形式营造新春氛围。
22:40
2026年1月16日,罗永浩在朋友圈证实其微博账号被禁言15天,并称将此“善意解读为保护”。此前,他与西贝董事长贾国龙因预制菜话题公开争执,双方微博账号随后均被禁言。罗永浩表示个人不再回应此事,未来若有重大谣言将由公司发布合规澄清声明。微博CEO王高飞同日发文强调,网络名人不得组织约架论战,应通过媒体采访方式表达争议,以减少网络戾气。