微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年03月13日

14:28
近日,四川成都的一位单亲妈妈张艳成了大家热议的焦点。为啥?因为她凭借着一双巧手,14年间竟然手工制作了超过200万个锅盔,从一名负债累累的摆摊小贩,逆袭成了拥有固定门店的“锅盔女王”。张艳的故事得从她婚姻失败说起。那时候,她刚生完孩子不久,就背上了200万元的债务。为了生计,她不得不背着女儿,在街头摆摊卖锅盔。刚开始的时候,日收...
14:28
最近,不少成都市民逛水果店时都发出了这样的疑问。眼下成都市场上的蓝莓,那可真是“大”有不同,个头硕大、口感脆甜,活脱脱一个个“巨无霸”。可面对这些大蓝莓,部分消费者心里却犯起了嘀咕:这到底是品种改良带来的变化,还是“科技与狠活”在背后捣鬼呢?专家给出了答案:个头变大、口感变甜,主要是因为品种的更迭和栽培方式的革新。现在可不一样了...
14:28
你是不是总觉得熬夜晚睡没啥大不了的,第二天补一觉就又能生龙活虎了?可别这么想啦,最新研究那可是给咱敲响了警钟,缺觉这事儿,可不简单!《自然·免疫学》在2026年3月刊发的一项重磅研究,直接把熬夜的危害给实锤了。研究发现啊,要是连续3天睡眠不足6小时,好家伙,咱身体里的炎症因子就跟坐了火箭似的,飙升300%!这可不是闹着玩的,你熬...
14:28
家人们,重庆有个动物园里的黑猩猩最近可太火啦!3月10号那天,重庆动物园的一只叫“渝辉”的黑猩猩,又整出了个让人惊掉下巴的新活儿——自己拿指甲刀剪脚趾甲!那动作,熟练得就跟咱们人类的老手似的,咔咔几下,就把趾甲修剪得整整齐齐。据饲养员讲,“渝辉”平时就特别聪明,爱学习新东西。像洗衣服、扫地这些家务活,对它来说都不在话下。吃饭的时...
14:28
最近啊,在山东济宁发生了一件让人又心疼又觉得好笑的事儿。一只小狗掉进了一口废弃的井里,这一困就是三个冬天,等被人发现救上来的时候,大家惊讶地发现,这小狗居然胖了!这三年里,小狗虽然活动空间有限,但它的“伙食”可不算差。原来,有善良的过路人发现了这口井里的小狗,觉得它可怜,便时不时地给它投喂食物。有村民猜测,可能是井里比较潮湿,小...
14:28
最近,天津有个水果摊摊主在网上火了!原因是他那套让人看得目瞪口呆的新式削凤梨手法。只见他手持刀具,动作麻利,先一刀切去凤梨的头尾,接着就沿着果皮的弧度快速下刀,顺着果眼纹路精准剔除,整个过程那叫一个流畅,既不浪费果肉,也不让汁水流得到处都是,干净又利落。跟咱们以前见的那种,一个眼一个眼地挖,还得反复削皮的传统方法比起来,这位摊主...
14:28
2026年3月12日,法拉利宣布计划推出升级版Purosangue SUV,以强化其在豪华性能SUV市场的领导地位。新车仍将搭载6.5升自然吸气V12发动机,最大功率715马力、峰值扭矩716牛·米;核心升级聚焦底盘与悬挂系统,旨在提升操控性能。研发成本将推高售价,量产预计于2026年下半年启动。
14:28
3月13日,京东云在北京总部开展OpenClaw免费安装活动。用户现场完成部署及一次任务执行,即可领取实体小龙虾一份,并获赠百万Tokens。当日0点至24点,新老用户登录京东云官网购买云主机并部署OpenClaw,或新用户使用JoyCode智能编码助手,均可额外获赠小龙虾。活动旨在推广开源AI工具OpenClaw,降低开发者使用门槛。
14:28
2026年3月13日,创业公司明日新程(原微软小冰团队)正式推出安全工具“卫士虾”(Guardian Claw)。该工具面向个人用户,可实时识别并拦截本机“龙虾”相关异常行为。安装方式极简:用户只需对Claw设备语音指令“去Claw.myTuanzi.com下载安装卫士虾”,系统即自动完成部署并启动实时防护。项目未披露技术原理及风险定义细节,但强调零配置、...
14:28
3月13日,物理AI企业章鱼动力宣布完成数亿元人民币种子轮融资。本轮融资由地平线及多家知名美元基金联合投资,资金将用于推进物理AGI技术研发与‘物理AI图灵测试’攻关。公司成立于2025年,聚焦具身智能与真实物理环境交互能力构建,尚未正式披露融资细节。此次融资标志着国内物理AI赛道加速落地。
14:28
微新创想:亚马逊近日宣布计划将2026年Prime Day会员日促销活动的时间由传统的7月提前至6月下旬。这一调整标志着亚马逊持续优化其年度大促策略,以更好地适应市场变化和消费者需求。 Prime Day自2015年首次推出以来,已成为全球最大的线上购物节日之一。2025年的活动更是扩展为为期四天的促销盛宴,旨在提升用户的购物体验和参与度。通过延长促销周期,...
14:28
微新创想:3月18日19:00 智己汽车将在上海举办超级智能体发布会 此次发布会的主题为“IM Ultra Agent 跨时代而来”标志着智己汽车在人工智能领域迈出了重要一步 发布会将正式推出基于通义千问大模型研发的IM Ultra Agent智能体 该智能体是智己汽车AI战略的核心成果之一 智己汽车目前已自主研发了30余个专业智能体 这些智能体覆盖了方案选...