微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年03月28日

15:04
微新创想:2026年3月27日,日本软银集团宣布获得400亿美元无抵押短期贷款,期限仅12个月,用于履行其对OpenAI的300亿美元投资承诺。该笔贷款由摩根大通、高盛牵头,联合四家日本顶级银行共同提供。此举使软银对OpenAI的总投资额突破600亿美元,显示出其对人工智能领域长期发展的坚定信心。 此次融资背景与OpenAI上月完成的1100亿美元创纪录融资...
15:04
微新创想:2026年3月27日,谷歌面向Pixel系列手机用户上线蓝牙诊断工具(v1.0.885948717) 该工具集成于系统设置中,用户可以通过“设置→已连接设备→蓝牙→蓝牙诊断”或“设置→设备健康与支持→蓝牙诊断”进入 用户可在蓝牙连接异常时使用该工具,帮助快速定位问题 工具支持自动识别Pixel Watch、Pixel Buds等原厂设备,对于非Pi...
15:04
微新创想:3月28日,京东超市与蓝月亮在京签署战略合作协议。双方将聚焦产品运营、全渠道布局、绿色可持续发展及品牌共建四大领域,力争三年内实现蓝月亮在京东平台销售额达50亿元。 合作始于2006年,已持续18年。此次升级为全链路、全周期战略共建,标志着双方从单一渠道销售迈向深度协同。 此举旨在强化快消品数字化供应链能力,提升消费者体验。通过更紧密的合作,双方将...
15:04
微新创想:索尼官方已经正式宣布将调整PS5/PS5 Pro游戏主机在中国大陆市场调整后的建议零售价 全新价格体系将于2026年4月2日正式生效落地 本次调价覆盖国行在售全系主流版本 具体价格如下 PlayStation 5游戏机数字版(轻薄版)新建议零售价 人民币3999元(原价2999元) PlayStation 5游戏机(轻薄版)新建议零售价 人民币43...
15:04
微新创想 一加Ace 6至尊版已经入网,预计将在4月正式发布。这款新机搭载了联发科最新的天玑9500性能旗舰处理器,标志着一加在高端手机市场的进一步布局。据博主数码闲聊站透露,该机型将配备超高刷直屏,带来更流畅的视觉体验。同时,8开头的大电池容量和超高帧FPS游戏表现也让人期待。此外,一加Ace 6至尊版还将拥有全能外围配置,全面提升用户体验。 天玑9500...
14:34
微新创想:3月27日,Bethesda为Switch 2平台《辐射4周年纪念版》推送新更新包。本次更新首次加入NVIDIA DLSS技术,适配40FPS与60FPS模式,在提升画质同时优化性能。这一技术的引入不仅让游戏画面更加细腻,还有效提升了游戏运行的流畅度,为玩家带来更佳的视觉体验。 更新还修复了多类崩溃问题,涵盖存档、任务节点、底座插拔等场景,确保玩家...
14:34
微新创想:3月27日,树莓派官方系统烧录工具Raspberry Pi Imager正式更新至2.0.7版 该版本面向Windows、macOS、Linux及树莓派原生系统,重点优化用户交互界面与跨平台兼容性 Windows 10/11安装程序新增深色模式自动适配,提升用户的视觉体验与操作便捷性 Linux端补充Debian图形库依赖,并为无桌面音效环境增加备...
14:34
微新创想:2026年3月27日,万达电影股份有限公司召开董事会,宣布拟将公司全称变更为“儒意电影娱乐股份有限公司”,证券简称为“儒意电影”。此次更名是公司战略调整的重要一步,反映了其业务发展方向的转变。 微新创想:更名的动因可以追溯至2024年4月,公司完成了控制权变更,上海儒意投资管理有限公司及上海儒意影视制作有限公司合计持有其控股股东100%股权。这一变...
14:34
微新创想:2026年3月28日,中国石化胜利油田碳捕集利用与封存(CCUS)全链条示范工程二氧化碳累计注入量突破13亿立方米,创历史新高。该项目是我国首个百万吨级CCUS示范工程,位于山东东营。该工程的推进不仅体现了我国在低碳技术领域的积极探索,也展示了在能源开发与环境保护之间的平衡能力。 微新创想:通过自主研发低能耗捕集、智能管道输送及驱油封存一体化技术,...
14:34
微新创想:2026年3月27日,Canonical宣布将在Ubuntu 26.10中测试Rust语言编写的时间同步工具ntpd-rs。这一举措标志着Canonical在系统时间同步领域迈出了重要一步。 微新创想:该工具拟于27.04版本正式启用,旨在整合现有的时间服务组件,如chrony和linuxptp。通过统一时间同步机制,Canonical希望简化系统...
14:03
微新创想:2026年3月27日 欧洲核子研究中心(CERN)BASE团队在瑞士日内瓦园区内 首次将92个反质子装入重达一吨的便携式彭宁离子阱中完成安全移动 该设备集成超导磁体 液氦冷却系统与超高真空腔 通过电磁场悬浮反质子 杜绝湮灭风险 此举旨在规避CERN园区微弱磁场干扰(仅为地磁场1/20000) 赴外部低噪声实验室开展高精度质子-反质子电荷质量比测量 ...
13:31
微新创想:3月25日,全国首个以科技安全为主题的‘国家安全教育基地’在南京国睿大厦正式开馆。该基地旨在提升公众对科技安全的认知与防范能力,通过一系列真实案例和现场演示,揭示日常生活中常见的弱口令风险。 基地展示的案例中,记者使用一个仅由六位拼音组成的密码登录Win11电脑,仅用两秒钟就被成功破解。而当使用八位以上包含大小写字母和数字的复杂密码时,系统在两小时...