微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月19日

07:51
2026年1月19日,一项突破性的量子物理研究成果在美国莱斯大学等机构的联合推动下问世,并在国际顶级期刊《自然·物理》上重磅发布。这项研究团队成功观测到一种前所未有的新型量子物质态,其独特之处在于完美融合了量子临界性与电子拓扑学两大前沿领域的理论精髓。通过精密的低温实验条件,科学家们揭示了一种兼具临界涨落现象与非平凡电子结构的量子态,这一发现不仅刷新了我们对...
07:51
2026年1月19日,上海正式发布《“十五五”规划建议》,将城市更新置于城市发展核心战略地位,明确提出加速推进城市更新工程。规划聚焦四大重点领域:一是全面提速城中村改造,通过系统性改造提升城市空间品质;二是大力推进旧住房成套改造,着力解决居住空间短板问题;三是实施老旧供排水设施更新计划,构建现代化城市基础设施体系;四是引导支持楼宇老旧电梯更新换代,消除安全隐...
07:51
2026年1月21日,备受玩家期待的《孤岛惊魂3》经典版将迎来重大升级,正式在PS平台支持60FPS高帧率运行,为玩家带来前所未有的流畅游戏体验。此次优化专为PS5等现役高性能主机打造,确保游戏在最新硬件上发挥最佳性能。据悉,玩家只需订阅PlayStation Plus Premium或Extra会员服务,即可免费享受这一帧率提升带来的视觉盛宴。 早在1...
07:51
《智能工厂大亨》现已登陆Steam平台,正开启限时免费领取活动,国区玩家不容错过的福利!目前游戏定价58元,但只需在北京时间1月21日凌晨2点前行动,即可免费将这款工厂模拟经营佳作加入游戏库。由独立开发商Turquoise Revival Games精心打造,游戏于2022年3月27日首次发售,为玩家提供了一个从零开始建造并自动化管理工厂的沉浸式体验。在游戏...
07:51
2026年1月19日,开源操作系统ReactOS迎来重大技术突破,正式宣布成功合并对异步TCP连接的支持。这一关键功能补丁的诞生,凝聚了长达十年的研发心血,其历史最早可追溯至2016年Jira系统上创建的初始工单。该功能的开发初衷,是为了有效解决非阻塞套接字连接过程中可能出现的异常问题,确保网络通信的稳定性和高效性。 经过团队工程师们数年间的反复重构与精心修...
07:20
2026年1月19日,微软正式宣布将在Xbox云游戏服务中推出创新广告模式,为未订阅Xbox Game Pass的用户提供免费云游戏体验。这一举措允许拥有数字版游戏的用户通过观看广告,即可畅享云端游戏乐趣,无需支付任何费用。微软此举的核心目标在于显著提升Azure服务器的资源利用率,有效降低因闲置算力造成的能源浪费,从而实现成本效益的最大化。 当前,全球半导...
07:20
2026年1月19日,苹果公司通过官方网站发布紧急安全更新通知,强烈建议全球iPhone及iPad用户尽快将系统升级至iOS 26.2或iOS 18.7.3版本。此次更新旨在解决两个严重的安全漏洞,这些漏洞已被黑客组织实际利用,可能导致设备遭受远程代码执行攻击。 这两个高危漏洞(CVE-2025-43529和CVE-2025-14174)由谷歌威胁分析小组首...
07:20
2026年1月19日,备受瞩目的jQuery 4.0正式版终于揭开神秘面纱,这标志着该经典JavaScript库近十年来的首次重大升级。此次更新不仅带来了性能与安全性的显著提升,更预示着jQuery向现代Web开发范式的坚定迈进。 新版本正式宣告停止对IE10及更早浏览器的支持,并启动对IE11的逐步淘汰计划。这一决定虽然可能让部分老用户感到些许不便,但却是...
06:49
1月19日凌晨6时,中央气象台紧急发布暴雪黄色预警,提醒公众高度关注即将到来的强降雪天气。根据最新气象预报,在19日8时至20日8时期间,陕西南部、河南南部、安徽西部以及湖北北部和西部等地区将迎来暴雪袭击,降雪量预计达到10至18毫米,部分地区甚至可能出现更大强度的降雪。 此次暴雪天气影响范围极为广泛,覆盖了我国中西部多个重要省份,形成了一个庞大的降雪影响带...
04:17
2026年1月19日凌晨3时20分,甘肃陇南市文县突发3.1级地震,震源深度达9千米。根据中国地震台网正式测定,震中坐标位于北纬33.19度、东经104.50度。目前暂无人员伤亡及财产损失报告,相关部门已启动应急响应机制,正展开全面排查工作,确保无遗漏隐患。此次地震虽未造成明显影响,但提醒我们时刻保持警惕,加强防震减灾意识。地震部门将持续监测震情动态,及时发...
04:17
2026年1月18日,美国遭遇罕见双风暴袭击,北部平原、五大湖流域、东北部及东南部部分地区均被卷入极端天气漩涡。据气象部门统计,超过5400万人被纳入冬季天气警报范围,面临暴雪与极寒的双重考验。 这场突如其来的灾害性天气系统导致交通网络大面积瘫痪。暴雪覆盖道路,极端低温冻结基础设施,使得公路、铁路及航空运输陷入困境。特别是航空出行受到重创,截至当天上午,...

2026年01月18日

23:41
2026年1月18日,韩国消费者在人工智能订阅服务上的月支出高达803亿韩元,折合人民币约3.81亿元,这一数字已超过Netflix在韩国同期的月均收入750亿韩元。这一惊人数据背后,是韩国人工智能服务市场的蓬勃发展。数据显示,2025年12月,韩国AI服务相关的信用卡交易量达到了惊人的16.66亿笔,其中个人用户月均付费3.47万韩元,企业用户则达到了10...