DeepMind的AI智能体再次突破自我,这次推出的名为BBF的模型堪称效率革命。只需短短2小时,BBF就能掌握26款雅达利游戏,其学习速度与人类不相上下,甚至超越了以往所有同类AI。传统强化学习虽然能解决问题,但效率低下,需要漫长的试错过程。而BBF的突破性进展恰恰体现在效率上,其全名”Bigger、Better、Faster”完美诠释了这一优势。更令人惊喜的是,BBF能在单张显卡上完成训练,大幅降低算力需求。这项由谷歌DeepMind与蒙特利尔大学联合研发的成果已完全开源,为AI领域带来新的可能性。

评价BBF游戏表现的IQM指标,最高可达人类5倍。这一综合评分体系经过归一化处理,本文中的数据均以人类为基准。在包含26款雅达利游戏的Atari100K测试数据集中,BBF取得了所有模型中最高的IQM成绩。值得注意的是,BBF在所有训练过的26款游戏中都超越了人类水平。与表现相近的Eff.Zero相比,BBF的GPU时间消耗减少了近一半;而与GPU消耗相似的SPR和SR-SPR模型相比,BBF的性能优势却十分明显。反复测试显示,BBF在达到某一IQM分数的概率上始终保持较高水准,更有超总测试次数1/8的运行实现了5倍于人类的惊人成绩。即便面对未训练的雅达利游戏,BBF也能取得超过人类一半的IQM分数,在29款未训练游戏中更是达到人类四至五成的表现。

BBF研究的核心问题是如何在样本稀少的情况下扩展深度强化学习网络。DeepMind将研究重点放在Atari100K基准上,却发现单纯扩大模型规模并不能提升表现。在深度学习模型设计中,每步更新次数(Replay Ratio,RR)是关键参数。对于雅达利游戏而言,RR值越高,模型表现越好。以RR值最高可达16的SR-SPR为基础,DeepMind最终将BBF的RR值确定为8,同时开发了RR=2的简化版本以适应不同用户需求。

从SR-SPR到BBF的改进主要体现在以下方面:卷积层重置强度从20%提升至50%,大幅增强模型对随机目标的扰动能力;神经网络层数从3层增至15层,宽度扩大4倍;更新范围(n)采用动态调整机制,每4万梯度步骤重置一次,前1万步内n值以指数形式从10降至3;衰减因子(γ)从0.97提高到0.997;增加权重衰减量至0.1;删除了表现不佳的NoisyNet模块。消融实验表明,硬复位和更新范围缩小对BBF性能影响最为显著,而NoisyNet的影响则不甚明显。

这一突破性成果为AI发展开辟了新路径,相关论文已发布在arxiv上,GitHub项目页也同步开放,为研究人员提供了宝贵资源。https://arxiv.org/abs/2305.19452https://github.com/google-research/google-research/tree/master/bigger_better_faster

最新快讯

2025年11月23日

00:09
2025年11月22日,宾利汽车以创新科技重新定义奢华体验,正式推出支持定制动画的迎宾灯光系统。这项前沿技术允许客户自由创作最长11秒的独特动画效果,为每一次出行注入个性化魅力。据悉,该技术首次亮相于在罗马尼亚雅典娜神庙举办的特别活动中,通过车门下方精密投影装置,为宾客呈现令人惊叹的光影艺术。 该系统采用尖端光学设计,集成了三色光源、五个高精度镜头、两个特殊...

2025年11月22日

23:32
微新创想11月22日讯 谷歌近日震撼发布全新Gemini3系列大模型,凭借卓越性能强势超越OpenAI,成为当前AI领域的顶尖力量,其影响力更推动谷歌股价实现历史性飞跃。Gemini 3系列的崛起,离不开谷歌自研TPU生态的强大支撑,这一技术壁垒为谷歌在AI领域的持续领先奠定了坚实基础。展望未来,若想保持Gemini 4的领先地位,谷歌必须进一步强化算力基础...
23:32
近日,航天技术领域传来重大进展,Axiom Space与KBR公司成功联手完成了一项关键性的新型舱外机动单元航天服测试。此次测试的核心目标是为NASA备受瞩目的“阿尔忒弥斯”重返月球计划提供坚实的技术支撑。整个测试过程在模拟真空环境下严谨进行,重点聚焦于航天服在极端环境下的热性能表现以及先进材料的实际应用效果。 据研究员Russell Ralston透露,本...
23:32
2025年11月25日至12月2日,《战地6》将开启为期一周的盛大免费试玩活动,为广大玩家提供深度体验的机会。本次试玩内容丰富多样,涵盖征服、突破、破坏、团队死斗以及一种神秘未公布模式,让玩家可以在“东方木林”“布莱克韦尔农场”“开罗围城”三张精心设计的地图中尽情探索。这三张地图各具特色,从紧张刺激的战场到充满策略的据点争夺,将为玩家带来全方位的游戏体验。 ...
22:58
微新创想11月22日讯 小米集团于当晚隆重举办小米17与澎湃OS3庆功盛典,以"软硬融合 共赴巅峰"为主题,向全球用户展示其创新成果。卢伟冰在社交媒体上分享的菜单细节,堪称一场精心策划的感官盛宴,从"澎湃启航"到"卓越并肩",四个篇章精心呈现了18道精致菜品及各式主食水果,每道菜名均巧妙融入"初心"、"希望"、"开拓"等关键词,将产品理念巧妙地编织在宴席的每...
22:58
微新创想11月22日重磅消息,知名科技博主罗永浩在最新一期《罗永浩的十字路口》播客节目中,首次公开透露了锤子科技濒临倒闭时的关键决策。他坦言,若没有推出备受争议的TNT项目,锤子科技或许能多存活数年。罗永浩回忆道,当时他并不满足于传统的产品迭代,渴望进行颠覆性的创新,正是这种雄心壮志催生了TNT项目。 在节目中,罗永浩详细阐述了TNT项目的初衷和愿景。他认为...
22:58
微新创想11月22日重磅消息,知名分析师Jeff Pu在其最新发布的研究报告中透露,苹果将推出全新iPhone 17e机型,计划于2026年第一季度中期正式发售。相较于前代iPhone 16e,iPhone 17e最引人注目的核心升级在于搭载了前置1800万像素摄像头,该配置与万元旗舰iPhone 17 Pro Max看齐,预示着苹果在移动影像领域的再次突破...
22:58
微新创想11月22日讯 近期,百川智能创始人王小川在一场重要活动上发表了一场引人深思的主题演讲。在回顾自身职业发展历程的同时,他也清晰阐述了未来的宏伟愿景。他坦诚地表示,早在2021年将公司出售给腾讯时,告别信中便已明确写下自己的梦想——生命科学与大健康领域。面对外界的疑问,他强调自己并非在寻找方向,而是早已目标明确,只是在等待技术的成熟。"当时的技术尚未...
22:58
小米汽车安全技术再获突破 微新创想11月22日重磅消息 中国汽研权威发布的四大安全辅助功能测试中 小米YU7紧急转向辅助系统(AES)以全项通过的成绩惊艳亮相 董事长雷军亲自宣布这一里程碑式成果 就在前一天 小米创始人 首席执行官雷军公开表示 中国汽研组织的四大安全辅助功能测试中 小米AES紧急转向辅助功能已全部成功通过 这标志着小米汽车在智能驾驶安全领...
22:58
11月22日最新消息,河南一位女子近日在网上分享了一则令人惊叹的经历:她的丈夫仅用8万元人民币,成功拍下了一套位于威海乳山的70平米海景房,迅速引发全网热议。据女子详细描述,其丈夫偶然在某知名网络拍卖平台上发现了一套位于威海乳山的海景房,令人意外的是起拍价仅为1111元。在看到如此低廉的价格后,丈夫一时冲动缴纳了保证金,开启了一场惊心动魄的竞拍之旅。 起拍后...
22:58
2025年广州国际车展盛大启幕,212越野车携全新力作T01高地版震撼登场,官方指导价定格于20.58万元。这款硬核越野利器精准定位于"全地形战士",专为户外探险、长途穿越等极限场景量身打造,以强悍性能征服各种复杂路况。 外观设计上,T01高地版采用极具辨识度的"晨曦金"车身配色,搭配独特的高地纹理设计,彰显硬朗气质。细节处彰显专业越野基因:配备加厚防滑...
22:58
2025年11月22日,铭凡正式发布了备受瞩目的MS-02 Ultra迷你工作站,这款创新产品以惊人的4.8升紧凑体积,重新定义了高性能计算设备的界限。作为行业首款真正意义上的微型工作站,MS-02 Ultra不仅集成了尖端硬件配置,更在空间利用和性能释放上实现了完美平衡,为专业用户和小型办公环境提供了前所未有的解决方案。 这款迷你工作站的核心配置堪称顶级—...