DeepMind的AI智能体再次突破自我,这次推出的名为BBF的模型堪称效率革命。只需短短2小时,BBF就能掌握26款雅达利游戏,其学习速度与人类不相上下,甚至超越了以往所有同类AI。传统强化学习虽然能解决问题,但效率低下,需要漫长的试错过程。而BBF的突破性进展恰恰体现在效率上,其全名”Bigger、Better、Faster”完美诠释了这一优势。更令人惊喜的是,BBF能在单张显卡上完成训练,大幅降低算力需求。这项由谷歌DeepMind与蒙特利尔大学联合研发的成果已完全开源,为AI领域带来新的可能性。

评价BBF游戏表现的IQM指标,最高可达人类5倍。这一综合评分体系经过归一化处理,本文中的数据均以人类为基准。在包含26款雅达利游戏的Atari100K测试数据集中,BBF取得了所有模型中最高的IQM成绩。值得注意的是,BBF在所有训练过的26款游戏中都超越了人类水平。与表现相近的Eff.Zero相比,BBF的GPU时间消耗减少了近一半;而与GPU消耗相似的SPR和SR-SPR模型相比,BBF的性能优势却十分明显。反复测试显示,BBF在达到某一IQM分数的概率上始终保持较高水准,更有超总测试次数1/8的运行实现了5倍于人类的惊人成绩。即便面对未训练的雅达利游戏,BBF也能取得超过人类一半的IQM分数,在29款未训练游戏中更是达到人类四至五成的表现。

BBF研究的核心问题是如何在样本稀少的情况下扩展深度强化学习网络。DeepMind将研究重点放在Atari100K基准上,却发现单纯扩大模型规模并不能提升表现。在深度学习模型设计中,每步更新次数(Replay Ratio,RR)是关键参数。对于雅达利游戏而言,RR值越高,模型表现越好。以RR值最高可达16的SR-SPR为基础,DeepMind最终将BBF的RR值确定为8,同时开发了RR=2的简化版本以适应不同用户需求。

从SR-SPR到BBF的改进主要体现在以下方面:卷积层重置强度从20%提升至50%,大幅增强模型对随机目标的扰动能力;神经网络层数从3层增至15层,宽度扩大4倍;更新范围(n)采用动态调整机制,每4万梯度步骤重置一次,前1万步内n值以指数形式从10降至3;衰减因子(γ)从0.97提高到0.997;增加权重衰减量至0.1;删除了表现不佳的NoisyNet模块。消融实验表明,硬复位和更新范围缩小对BBF性能影响最为显著,而NoisyNet的影响则不甚明显。

这一突破性成果为AI发展开辟了新路径,相关论文已发布在arxiv上,GitHub项目页也同步开放,为研究人员提供了宝贵资源。https://arxiv.org/abs/2305.19452https://github.com/google-research/google-research/tree/master/bigger_better_faster

最新快讯

2026年03月30日

22:46
微新创想:2025年,视觉中国实现营收7.78亿元,同比下降4.03%;归母净利润8302.75万元,同比下降30.31%。业绩下滑主要受到宏观经济承压的影响,导致广告客户订单减少,传统版权授权业务出现收缩。 公司持续加强在人工智能领域的布局,设立控股子公司大象视觉(深圳),并获得深圳市龙岗区引导基金1亿元的增资支持。这一举措有助于公司在AI技术研发和应用方...
22:46
微新创想:据韩媒ETNEWS报道,美光公司已于近日启动垂直堆叠GDDR内存的研发工作,原型产品最早有望于2027年发布。这项技术的推出标志着内存行业在提升性能与降低成本之间找到了新的突破口。垂直堆叠GDDR内存旨在填补标准GDDR与高带宽内存(HBM)之间的性能与成本空白,为市场提供更具竞争力的产品选择。 当前,GDDR内存仍在英伟达RTX PRO显卡及部分...
22:46
微新创想:2026年3月30日晚,阿里巴巴正式发布全模态大模型Qwen3.5-Omni。这一全新模型的推出标志着阿里巴巴在人工智能领域又迈出了坚实的一步。 该模型支持文本、图片、音频及音视频输入,具备细粒度带时间戳的音视频理解与Caption生成能力。这意味着用户不仅可以上传文字或图像,还能直接输入音频或视频内容,获得更加精准和全面的分析结果。 Qwen3....
22:46
微新创想:2025年第四季度,美国PC(不含平板)出货量达到1820万台,同比增长3%。这一数据标志着此前连续两个季度的下降趋势在此终结。全年来看,美国PC出货总量为7150万台,同样实现了3%的同比增长。 微新创想:然而,存储器供应紧张的问题正在对市场产生深远影响。据预测,2026年的PC出货量将出现显著下滑,预计减少13%至6190万台。这一变化主要归因...
22:46
微新创想:赛力斯在2025年交出了一份亮眼的业绩答卷 3月30日赛力斯正式发布了2025年年度报告 全年营业收入约为1648.88亿元同比增长13.63% 归属于母公司所有者的净利润达到59.57亿元相比去年同期微增0.18% 公司在研发方面的投入力度显著加大全年研发投入金额高达125.12亿元同比增长77.4% 新能源汽车业务表现尤为突出毛利率达到28.8...
22:46
微新创想:当地时间2026年3月30日 法国人工智能初创公司Mistral AI宣布完成8.3亿美元债务融资 此次融资由7家银行组成的银团提供支持。资金将用于在巴黎近郊布吕伊埃雷勒沙特建设一座AI数据中心 该数据中心将部署13800块英伟达GB300 GPU 总功率达到44MW 预计将在2026年第二季度正式上线 Mistral AI的CEO Arthur ...
22:13
微新创想:蓝思科技近日发布了2025年年度报告,展示了公司在过去一年中的强劲表现。根据年报显示,公司全年实现营业收入744.1亿元,同比增长6.46%。归属于母公司股东的净利润达到40.18亿元,同比增长10.87%。这一增长主要得益于公司在多个核心业务领域的持续发力。 智能手机与电脑业务依然是蓝思科技的主要收入来源,全年营收为611.84亿元,占总营收的8...
21:42
微新创想:2026年3月,微星(MSI)在中国大陆推出MAG Z890 TOMAHAWK WIFI II主板,适配英特尔酷睿Ultra 200S Plus处理器。这款主板在设计上做出了一些调整,例如在I/O面板上将雷电4接口由2个减至1个,同时Wi-Fi 7的频宽也从320MHz降至160MHz。这些改动使得主板的扩展能力有所下调。 尽管部分接口和无线规格进...
21:42
微新创想:3月30日,央视财经曝光一起虚假投资理财平台诈骗案。山东菏泽市民潘先生被所谓“理财大师”诱导下载“恒健优配”App,初期小额试投获利后,追加投资50万元。平台显示高额收益,但提现时仅成功取出1000元。 警方证实,账户余额及收益均为后台篡改的虚假数据,50万元资金早已被诈骗团伙转移。此类平台无金融牌照,通过伪造交易界面实施“杀猪盘”式诈骗。 提醒公...
21:42
微新创想:2026年4月1日傍晚 索尼将官宣PS Plus当月会免游戏 2026年4月1日傍晚 索尼将官宣PS Plus当月会免游戏 4月7日起开放领取 本次Essential及以上三档订阅用户均可免费获取《堕落之主》与《刀剑神域碎梦边境》 前者为虚幻5引擎打造的黑暗奇幻ARPG 2023年发售 后者是万代南梦宫于2024年10月推出的20人联机动作游戏 消...
21:09
微新创想:vivo于3月30日春季新品发布会正式推出X300 Ultra手机。该机定位为「专业V单」,搭载第五代骁龙8至尊版处理器,性能强劲,为用户带来更流畅的使用体验。 X300 Ultra配备3+2蔡司大师镜头群,包括14mm超广角、35mm人文纪实以及85mm云台级长焦镜头。这一组合覆盖了全焦段拍摄需求,满足用户在不同场景下的拍摄需求。同时,该机还支持...
21:09
微新创想:2026年3月30日,美的集团发布2025年年度报告。全年营业总收入达4585亿元,同比增长12%;归母净利润439.5亿元,增长14%。海外收入1959亿元,增长16%,本地化自营业务覆盖全球50个国家。ToB业务收入1228亿元,增长17.5%,完成对Arbonia、东芝电梯中国业务及锐珂医疗国际业务的收购。目前美的在全球拥有超600家子公司、...