微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月31日

08:58
微新创想1月31日讯 苹果公司近日发布了其历史性的季度财务报告,多项核心数据创下历史新高,其中iPhone业务成为推动营收增长的关键引擎。本季度苹果总营收达到1437.56亿美元,同比增长16%;净利润高达420.97亿美元,同比增长同样为16%。iPhone业务收入为852.69亿美元,同比增长23%,在总营收中占比超过59%,成为苹果最耀眼的明星。 在电...
08:58
1月30日,微博热议话题#网红小黑妮官宣生女#迅速引爆网络。这位备受关注的河南网红小黑妮通过抖音平台正式宣布喜得千金,她在动态中深情写道:"1月30号是我人生中最勇敢的一天,从一个爱哭的小女孩变成了妈妈,你好啊小朋友。"这份真挚的喜悦感染了无数网友。 去年10月20日,小黑妮已在社交平台分享了自己怀孕的喜悦。她透露老公曾开玩笑说:"咱们家人口少,孩子可以随我...
08:56
2026年1月30日,微软公司正式宣布对其Windows 11的AI战略进行重大调整,暂时搁置原定于"AI无处不在"的全面推广计划。这一决策背后,是近期Recall功能引发的广泛隐私安全争议,以及用户对系统内强行植入AI交互入口的强烈不满。值得注意的是,微软已紧急叫停在文件资源管理器、记事本等核心内置应用中新增Copilot按钮的部署工作。 尽管微软并未完全...
08:56
2026年1月31日,在享誉全球的瑞士圣莫里茨ICE冰上盛会期间,玛莎拉蒂以一场震撼视觉盛宴震撼了全场,正式首发了其定制敞篷超跑——MCPura Cielo Frozen Magma。这款由品牌顶级定制部门Fuoriserie精心打造的非凡座驾,完美诠释了"冰与火"的极致设计主题,将冰雪世界的纯净与炽热激情融为一体,成为当之无愧的冰雪精灵。 该车车身采用了玛...
08:26
2026年1月30日,迪士尼首席执行官鲍勃·艾格尔在公司内部会议上宣布了个人重要决定——将在现有合同期满前正式卸任CEO职务。这位于2022年11月重返迪士尼掌舵的领导者在发言中强调,此举的核心目的是为了确保公司领导层平稳过渡,为新任CEO提供充足的时间进行工作交接与团队磨合。据悉,艾格尔的合同原定于2026年底到期,但此次主动提出提前卸任,充分展现了迪士尼...
08:26
2026年1月31日,财联社独家披露,全球人工智能领域的两大巨头英伟达与OpenAI之间价值高达1000亿美元的战略合作谈判已陷入僵局。据悉,双方曾计划在AI芯片供应、定制化算力基础设施以及联合研发三大领域展开深度合作,其中英伟达承诺在未来三年内向OpenAI持续提供最先进的AI加速器及相关技术支持。然而,谈判目前因关键条款分歧而停滞不前。据多方消息人士透露...
08:26
1月31日,备受瞩目的铁路12306平台正式开启2月14日(春节假期前夜)火车票的预售工作。今年春节假期安排为2月15日至23日,共计9天,时间跨度较长,返乡与旅游客流预计将呈现高峰态势。值得注意的是,首日车票已于2月1日率先开售,而返程高峰日的2月23日车票也将于2月9日同步放票,为旅客提供更充足的购票时间窗口。 铁路部门为提升旅客购票体验,此次推出多项便...
08:26
截至1月30日8时30分,日本多地持续强降雪已造成14人死亡、198人受伤。事件发生于1月20日至30日,覆盖本州北部及日本海沿岸多地。强降雪由冬季异常气压分布引发,导致道路封闭、列车停运、航班取消。总务省消防厅负责统筹灾情统计与应急响应。目前救援与清雪作业仍在持续。
08:26
1月31日至2月1日,中国北方多地遭遇雾霾天气,华北中南部、黄淮中西部、汾渭平原及新疆天山北坡等地空气质量普遍下降,轻至中度霾覆盖范围广泛,局部地区更出现重度霾现象,对居民出行和健康造成一定影响。31日清晨至上午,河北南部与河南中部地区更是被大雾笼罩,局地能见度不足200米,严重影响了交通出行安全。 2月2日,随着弱冷空气的南下,华北中部与黄淮中部地区的霾天...
08:26
2026年1月30日,国际顶级投资银行摩根大通正式宣布将苹果公司的目标股价从1月26日的315美元上调至325美元,展现出对该科技巨头未来发展的强烈信心。此次股价调整主要基于三个关键因素:苹果公司刚刚公布的强劲12月季度业绩、对未来两个季度的乐观业绩指引,以及iPhone 17在全球市场的火爆销售和服务业务创收再创新高。摩根大通在详细的市场分析报告中指出,苹...
08:26
2026年1月31日凌晨,Meta正式宣布Instagram将推出一项备受期待的新功能,允许用户主动退出由他人添加的“密友”名单。这一重要更新目前仍处于早期开发阶段,尚未面向公众开放测试,具体的上线时间表尚未公布。自2018年推出以来,Instagram的“密友”功能一直备受争议,其核心问题在于用户无法自主选择退出,只能被动接受被他人归类为密友的身份。 该新...
08:26
2026年1月30日,科技界迎来重磅消息。彭博社资深记者马克·古尔曼独家披露,苹果公司曾与人工智能巨头Anthropic就Siri的全面升级展开深度合作,计划采用其Claude大型语言模型进行彻底重构。然而,这场看似前景光明的合作最终因商业分歧无疾而终。据马克·古尔曼详细披露,谈判破裂的核心症结在于Anthropic提出的惊人授权条件——要求苹果每年支付数十...