DeepMind的AI智能体再次突破自我,这次推出的名为BBF的模型堪称效率革命。只需短短2小时,BBF就能掌握26款雅达利游戏,其学习速度与人类不相上下,甚至超越了以往所有同类AI。传统强化学习虽然能解决问题,但效率低下,需要漫长的试错过程。而BBF的突破性进展恰恰体现在效率上,其全名”Bigger、Better、Faster”完美诠释了这一优势。更令人惊喜的是,BBF能在单张显卡上完成训练,大幅降低算力需求。这项由谷歌DeepMind与蒙特利尔大学联合研发的成果已完全开源,为AI领域带来新的可能性。

评价BBF游戏表现的IQM指标,最高可达人类5倍。这一综合评分体系经过归一化处理,本文中的数据均以人类为基准。在包含26款雅达利游戏的Atari100K测试数据集中,BBF取得了所有模型中最高的IQM成绩。值得注意的是,BBF在所有训练过的26款游戏中都超越了人类水平。与表现相近的Eff.Zero相比,BBF的GPU时间消耗减少了近一半;而与GPU消耗相似的SPR和SR-SPR模型相比,BBF的性能优势却十分明显。反复测试显示,BBF在达到某一IQM分数的概率上始终保持较高水准,更有超总测试次数1/8的运行实现了5倍于人类的惊人成绩。即便面对未训练的雅达利游戏,BBF也能取得超过人类一半的IQM分数,在29款未训练游戏中更是达到人类四至五成的表现。

BBF研究的核心问题是如何在样本稀少的情况下扩展深度强化学习网络。DeepMind将研究重点放在Atari100K基准上,却发现单纯扩大模型规模并不能提升表现。在深度学习模型设计中,每步更新次数(Replay Ratio,RR)是关键参数。对于雅达利游戏而言,RR值越高,模型表现越好。以RR值最高可达16的SR-SPR为基础,DeepMind最终将BBF的RR值确定为8,同时开发了RR=2的简化版本以适应不同用户需求。

从SR-SPR到BBF的改进主要体现在以下方面:卷积层重置强度从20%提升至50%,大幅增强模型对随机目标的扰动能力;神经网络层数从3层增至15层,宽度扩大4倍;更新范围(n)采用动态调整机制,每4万梯度步骤重置一次,前1万步内n值以指数形式从10降至3;衰减因子(γ)从0.97提高到0.997;增加权重衰减量至0.1;删除了表现不佳的NoisyNet模块。消融实验表明,硬复位和更新范围缩小对BBF性能影响最为显著,而NoisyNet的影响则不甚明显。

这一突破性成果为AI发展开辟了新路径,相关论文已发布在arxiv上,GitHub项目页也同步开放,为研究人员提供了宝贵资源。https://arxiv.org/abs/2305.19452https://github.com/google-research/google-research/tree/master/bigger_better_faster

最新快讯

2026年02月09日

12:36
微新创想:生物计算领域迎来重磅开源力量 字节跳动近日正式发布了名为Protenix-v1的生物分子结构预测模型 该模型不仅完整复现了 AlphaFold3(AF3)的核心能力 更宣布在 Apache2.0协议下全面开源代码及模型参数 打破了顶尖生物大模型的技术围垒 Protenix-v1的强大之处在于其全原子3D 结构预测能力 能够精准处理包括蛋白质、核...
12:36
微新创想:小红书技术团队正在研发一款名为 OpenStoryline(版本号1.0.0)的视频剪辑类AI产品。该产品目前尚处于测试阶段,未来有开源的可能。OpenStoryline 定位为基于AI智能体的创作工具,核心功能支持对话式剪辑。这一创新设计让用户可以通过自然语言与AI互动,完成视频内容的策划与剪辑。产品效果被认为类比字节跳动的即梦小云雀及商汤的 S...
12:31
微新创想:2026年2月,美国互联网彩妆品牌Live Tinted完成B轮融资,金额达到数千万美元。此次融资由Curate Capital领投,欧莱雅集团旗下战略风投基金BOLD首次作为新战略投资者加入。联合利华旗下Unilever Ventures及Monogram Capital等现有股东也选择跟投。Live Tinted由南亚裔美国网红Deepica ...
12:31
微新创想:2026年2月9日,全球最大AI开源社区HuggingFace出现Qwen3.5接入Transformers库的代码合并申请(PR) 该模型由阿里巴巴研发,属于Qwen系列新一代基座大模型 目前尚未正式发布,但已进入开源生态集成阶段 此举意味着Qwen3.5即将面向开发者开放,或为后续商用版本铺路 业内普遍认为其性能、多语言支持及推...
12:31
微新创想:2026年2月9日,万达电影在投资者互动平台披露,其投资出品的《飞驰人生3》《惊蛰无声》《熊出没·年年有熊》及联合出品的《镖人》均已定档春节档。影片将于2月28日(农历腊月二十九)起陆续上映,覆盖喜剧、悬疑、动画及古装动作类型。 此举系公司强化春节档内容布局、提升票房市场份额的重要举措。四部影片均由万达主控宣发或深度参与制作,预计覆盖全年龄观影群体...
12:31
微新创想:2026年2月,西北工业大学常洪龙、吉博文团队研发的三维锥形碳基柔性大脑皮层电极阵列,搭载“迪迩五号·中国科技城号”空间试验器,在轨成功开展国际首次无线植入式脑机接口离体验证 此次试验在近地轨道上进行,电极阵列在模拟体液环境中持续稳定采集脑电信号,成功获取了噪声水平与服役稳定性等关键数据 该技术突破了极端空间环境下神经传感技术的瓶颈,填补了国际在该...
12:31
微新创想:据科技记者马克·古尔曼报道,2026年2月中旬至3月上旬,苹果公司将在全球范围内密集推出多款新产品。此次发布会涵盖多个产品线,包括iPhone 17e、新款iPad以及搭载M5 Pro和M5 Max芯片的MacBook系列。苹果的这次产品发布主要集中在中端机型和性能提升方面,意在进一步完善其春季产品线布局。 消息来源并未公布具体的发布日期和区域安排...
12:31
微新创想:2025年11月凌晨4时许,美国佐治亚州一名车主在前往亚特兰大途中突发STEMI型心肌梗死。该车主驾驶的是一辆2026款Model Y首发版,车辆已更新至最新的FSD v14.1.3软件系统。在突发状况发生时,车辆的自动驾驶功能依然保持正常运行。 其子杰克·布兰特在紧急时刻通过远程授权的方式,成功操控车辆导航系统。他引导FSD将车辆安全驶入卡罗尔顿...
12:31
微新创想:2026年2月9日 昆明呈贡福朋喜来登酒店在昆明市呈贡新区春融街正式开业 酒店由万豪国际集团运营 位于市政中心旁 拥有优越的地理位置 毗邻多个城市公园及热门商圈 距离昆明南站约5公里 交通便利 便于商务出行和城市探索 距离长水国际机场约28公里 为远道而来的旅客提供了便捷的交通选择 酒店设有116间现代化客房及套房 部分房间可欣赏到公园的美丽景观 ...
12:31
微新创想:2月5日,郑州新郑国际机场相继开通“郑州-巴塞尔”和“郑州-塔林”两条跨境电商全货机航线。前者于2月4日首飞瑞士巴塞尔,后者于2月5日晚首飞爱沙尼亚塔林。两航线均由中大门国际物流集团运营,其中郑州-巴塞尔航线每周三班,郑州-塔林航线每周两班。 此次新航线的开通标志着郑州在跨境电商物流领域迈出了重要一步。作为中国内陆的重要物流节点,郑州一直致力于打造...
12:31
微新创想:2月6日,小米汽车科技有限公司申请的“对开门车辆和锁扣组件”专利正式获国家知识产权局授权。该专利适用于对开门车型,通过创新锁扣与铰链组件协同设计,使左右车门可不分先后顺序独立开启或关闭。这一技术突破为用户带来了更便捷的上下车体验,同时也提升了人机交互的智能化水平。 微新创想:技术方案包括车身、两扇对开式车门、可移动锁扣组件及轨迹可控铰链组件,实现开...
12:31
微新创想:2026年2月9日,宁美旗下品牌名龙星球正式推出新款无线游戏鼠标MX301 PRO。这款鼠标专为中小手用户设计,兼顾了便携性与操控性。整体重量仅为57±3克,轻盈的机身让玩家在长时间游戏过程中也能保持舒适的手感。 微新创想:MX301 PRO采用复合碳纤维材质,不仅提升了产品的耐用性,还有效减轻了重量,使鼠标更加灵活。同时,该鼠标准备支持抓握、趴握...