微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月06日

03:42
2026年2月6日,高盛发布预测称,2025至2030年间,欧洲TTF与亚洲JKM天然气现货均价将低于5美元/百万英热单位,较当前水平下挫超50%。分析指出,全球LNG供应增速将显著高于亚洲需求增速,供需格局转向宽松。该预测基于新投产液化项目加速释放产能,叠加亚洲部分经济体能源结构转型放缓需求增长。价格下行趋势或持续至2030年前后。
03:42
2026年2月6日,埃隆·马斯克在社交媒体上明确表示,SpaceX公司当前并未研发手机。该声明旨在回应近期外界关于SpaceX涉足消费电子领域的猜测。马斯克强调,公司核心聚焦于航天运输、星链(Starlink)卫星互联网及火星探索等任务。SpaceX总部位于美国得克萨斯州,其研发资源持续向火箭复用、星舰系统及低轨通信网络倾斜。此举有助于厘清市场误读,稳定公...
03:42
2月6日2时06分,印尼爪哇岛南部海域(南纬8.95度、东经111.05度)发生5.7级地震,震源深度50千米。此次地震由中囯地震台网正式测定,未通报人员伤亡及海啸预警。事发地位于印度洋板块与欧亚板块交界带,属地震多发区。当地有关部门已启动初步监测响应。
03:42
2026年2月6日,中国科学技术大学潘建伟、汪野、包小辉、张强、万雍等团队在合肥成功构建国际首个可扩展量子中继基本模块。该成果首次实现单原子节点间远距离高保真纠缠,并将器件无关量子密钥分发传输距离突破百公里,为远距离量子网络奠定核心基础。研究旨在解决量子通信中光子损耗导致的传输距离瓶颈,通过模块化设计提升网络可扩展性。相关论文当日同步发表于《自然》与《科学...
02:41
2026年2月6日,沙特阿美宣布下调3月份运往亚洲的阿拉伯轻质原油官方售价(OSP)30美分/桶。此次调整适用于销往亚洲市场的主力出口品种,反映其对区域供需及炼厂利润变化的评估。调整后价格将自3月1日起生效,影响范围涵盖中日韩及东南亚主要进口国。此举旨在增强价格竞争力,应对近期亚洲炼油 margins 收窄及替代供应增加的压力。
02:41
2026年2月5日上午,2029年亚洲冬季运动会举办城市签约仪式在意大利米兰举行。哈萨克斯坦阿拉木图正式签约成为本届亚冬会主办城市。此次签约标志着阿拉木图继2011年后第二次承办亚冬会,旨在推动中亚地区冬季运动发展与国际体育交流。亚奥理事会确认赛事将于2029年2月举行,具体日期及项目设置将后续公布。
02:41
2026年2月6日,美国科技公司Meta在其内部启动‘Vibes’短视频应用的独立测试。该应用面向部分员工及有限外部用户,聚焦AI驱动的个性化视频推荐与轻量创作功能。测试地点位于加州门洛帕克总部及远程协作环境,旨在评估产品稳定性、用户参与度及内容安全机制。此举标志着Meta在TikTok竞争背景下加速布局新一代短视频生态。测试周期暂定为8周,后续将视数据反...
02:41
2月6日,全球首台20兆瓦海上风电机组在福建闽南海域成功并网发电。该机组由三峡集团主导实施,是我国首次完成超大容量海上风电机组吊装、调试及并网全流程。机组采用国产自主研发翼型叶片,通过轻量化与数字化智能集成,单位兆瓦重量降低超20%,捕风与发电效率显著提升。此举标志着我国在超大容量海上风电研发制造、深远海施工及运营能力实现重大突破。
02:41
2026年2月6日,沙特阿拉伯国家航空公司正与波音、空中客车就采购至少150架窄体及宽体客机展开初步谈判。此举旨在支持沙特打造全球旅游中心的战略目标,拟用新机替换并扩充现役约200架机队。谈判尚未确定具体机型、数量及交付安排,亦未签署任何协议。目前仍处于早期评估阶段,交易存在不确定性。
02:41
2026年2月6日,OpenAI正式推出新平台Frontier,旨在帮助企业高效构建、部署和管理AI智能体(即‘AI同事’)。该平台提供统一的安全管控与数据权限配置能力,降低企业规模化应用门槛。此举意在强化OpenAI在高价值任务自动化领域的领导地位。当前,AI智能体正加速替代人工执行复杂工作,仅需少量干预。行业竞争加剧,Anthropic等头部公司亦同步...
01:11
2026年2月6日,大众汽车公司与美国汽车工人联合会(UAW)宣布达成协议,将对位于美国田纳西州查塔努加工厂的工人实施20%薪资上调。此次调整覆盖约1500名生产及维护岗位员工,自2026年3月起分阶段生效。协议旨在提升薪酬竞争力、稳定劳动力队伍,并回应近年UAW在美车企系列谈判中的核心诉求。双方未披露具体财务安排,但强调该协议不涉及新增工作岗位或产能扩张...
00:40
2026年2月6日至2月13日期间,Epic Games商城免费赠送冒险解谜游戏《波坦尼庄园》及射击游戏《Pixel Gun 3D》的‘剧毒复古套装’DLC。活动面向所有Epic账户用户,无需付费即可领取。《波坦尼庄园》设定于19世纪英格兰植物庄园,玩家扮演退休植物学家阿拉贝拉·格林开展植物研究;DLC则包含三款带中毒效果的复古风格武器。下周(2月13日起...