微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月25日

16:35
微新创想:2月25日,极兔速运全国转运中心已实现100%复工 春节假期结束后,快递物流行业迎来首波发货高峰 目前其全国网点营业率与人员复工率均超95% 此次复工覆盖华东、华南、华北等全部区域 旨在保障电商订单高效履约 极兔表示将通过智能分拣系统和运力动态调度 提升节后首周处理能力 支撑平台大促及日常寄递需求
16:35
微新创想:2026年2月25日,瑞典开发商Resolution Games正式上线街机模拟器游戏《Retrocade》(中文名:复古游戏)该游戏仅限Apple Arcade订阅用户游玩 《Retrocade》是一款专为怀旧玩家打造的街机模拟器游戏,它将玩家带回了上世纪80年代的街机时代。游戏不仅复刻了经典街机游戏的玩法,还通过先进的技术手段,为玩家提供了前所...
16:35
微新创想:2026年2月24日 微信官方宣布上线两项新功能 微信官方在2026年2月24日发布了一项重要更新 为用户带来更加便捷和安全的文件共享体验 第一项功能是面对面收照片和文件 用户可以通过生成专属二维码的方式 实现跨系统免流量接收照片及视频 这一功能打破了传统文件传输方式的限制 使得用户在没有网络连接的情况下也能轻松分享重要资料 第二项功能是查看该图片...
16:35
微新创想:vivo将在2026年3月的新品发布会上推出X300 Ultra旗舰手机。这款手机由vivo自主研发,标志着其在影像技术领域的又一重大突破。X300 Ultra将首发支持两支光学增距镜,其中一支为现有成熟型号,另一支则是独家400mm定焦“巨炮”镜头,为用户带来前所未有的拍摄体验。 同时,该机还将搭载200mm加400mm的双长焦组合,用户可以在单...
16:35
微新创想:2026年2月25日,TikTok面向TikTok Shop卖家推出多项新工具。这些更新旨在进一步提升卖家在平台上的运营效率与市场竞争力。 新功能包括全面开放AI驱动的Seller Assistant(卖家助手)。该工具已集成至卖家中心,帮助商家更高效地处理日常运营事务。通过智能化的辅助功能,Seller Assistant能够优化订单管理、数据分...
16:35
微新创想:Square Enix于2026年2月25日正式在Steam和GOG平台推出《最终幻想7》新版 此次推出的《最终幻想7》新版面向全球玩家开放购买。对于Steam国区的玩家而言,游戏定价为40元人民币,相较于以往版本更具吸引力。此外,已购买2013年原版的玩家可以免费升级至新版,而旧版游戏已于市场中停售,因此新版将成为主要的游玩版本。 新版游戏在玩法...
16:35
微新创想:2026年2月,德国知名硬件厂商Sharkoon正式发布了SKILLER SGM25W游戏鼠标。这款鼠标以其对称式右手设计而备受关注,能够满足不同玩家的握持习惯,无论是抓握还是指握都能获得良好的体验。同时,它支持USB有线和2.4GHz无线双模连接,为用户提供了灵活的使用方式。 SKILLER SGM25W配备了高性能的原相PAW3311光学传感器...
16:35
微新创想:2月23日,在海南三亚,春节长达9天的假期刚刚结束,不少游客还沉浸在假期的余韵中。一位游客来到沙滩上,或许是假期结束要回归工作的落差感让他心绪难平,便蹲下身在沙滩上写下了“不想上班”四个大字,以此抒发内心的感受。 大自然的“回应”总是出人意料。就在他写完不久,一个浪花涌来,冲刷过沙滩,原本写下的“不想上班”瞬间被“改写”,只留下了部分文字“小心一点...
16:35
微新创想:2月24日消息 在四川内江发生了一件令人惊喜的暖心事 过年期间 刘女士和兄妹们回到父母的老房子 一同整理菜地时 意外挖出了一个金戒指 仔细辨认后发现 这竟是已过世母亲2年多前丢失的那枚 这枚金戒指有着30多年的历史 是当年她特意买黄金为父母打造的 当时价格是80元一克 虽然不记得具体克数 但印象中“挺重的” 2年前 母亲生病时曾想把戒指给她 刘女士...
16:35
微新创想:中国大模型领域的“独角兽”纪录再次被刷新。2026年2月25日据企查查援引腾讯科技消息Kimi的母公司北京月之暗面科技有限公司Moonshot AI近期完成了总额超过7亿美元的新一轮融资本轮融资由阿里腾讯等互联网巨头领投融资完成后月之暗面的估值已飙升至100亿至120亿美元之间 核心亮点:模型爆发带动营收“奇迹”相比于单纯的融资数据月之暗面近期的商...
16:35
微新创想:随着企业对增长效率的追求达到新高度,AI 智能体正迅速成为销售领域的“标配”。根据 Salesforce 最新发布的《2026 年销售现状报告》,全球销售行业正经历一场由 AI 驱动的职业变革,九成销售团队已经或计划在未来两年内启用 AI 智能体。报告通过对全球 22 个国家、超过 4000 名销售专业人士的调研发现,AI 智能体已不再是锦上添花的...
16:35
微新创想:OpenAI今日宣布任命Arvind KC为首席人力资源官(CHRO)KC曾先后在Roblox、Google及Meta等公司担任要职拥有深厚的工程技术背景与大规模组织管理经验 OpenAI应用首席执行官菲吉·西莫表示KC将负责确保公司的人员政策与雄心勃勃的技术愿景相匹配在快速扩张的同时保留核心创新文化 随着AI深度重塑全球职场KC的核心使命包括组织...