微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2025年12月18日

13:59
近日,广东省佛山市顺德区勒流育贤实验学校初中部传来喜讯,该校一名女生陈嘉欣在跳绳比赛中展现出惊人的实力,以1分钟跳绳422次的优异成绩,成功打破了吉尼斯世界纪录,引起了广泛关注和赞誉。陈嘉欣的跳绳速度之快,令人目不暇接。她的绳子在空中划出一道道虚影,仿佛隐形一般,而她的双脚则如同“无影脚”般连击,每一次落地都精准而有力。这样的表...
13:59
近期,不少消费者发现面包价格悄然上涨,原本几元钱的面包如今身价倍增,这一现象引发了广泛关注与讨论。究竟是什么原因导致面包变贵了呢?首当其冲的是原材料成本的攀升。近年来,小麦、糖、油等面包主要原材料的价格持续上涨,尤其是进口原材料受国际市场波动影响,价格更是居高不下。一位面包店主透露,仅小麦粉的价格近一年来就上涨了近两成,直接推高...
13:59
近日,浙江一位网友分享的家庭趣事在网络上引发了广泛关注。视频中,由于妈妈不在家,爸爸第一次亲自下厨煮鱼,不料掀开锅盖的瞬间,却出现了令人啼笑皆非的一幕——锅中的鱼竟然“在偷吃”配菜葱。据女儿描述,当天妈妈因事外出,煮鱼的任务便落在了爸爸肩上。由于缺乏烹饪经验,爸爸在未对鱼进行宰杀处理的情况下,便直接将其下锅水煮。当煮制一段时间后...
13:59
近日,一段记录美国纽约曼哈顿地铁轨道惊人景象的视频在网络上掀起轩然大波,引发无数网友惊叹。当人们将这段真实画面与经典动画《猫和老鼠》进行对比时,竟发现两者之间存在着令人难以置信的相似之处,甚至有人幽默地称这部动画实为“现实版纪录片”。据当地媒体12月17日的深度报道,纽约曼哈顿地铁轨道上出现了一幕令人瞠目结舌的场景:满地垃圾堆积如山,几只老鼠在轨道上肆无忌惮...
13:59
近日,一则关于2262年将出现两个春节的奇闻在网络上掀起轩然大波。这一罕见现象并非天方夜谭,而是源于中国农历独特的置闰规则。据历法专家深入解析,2262年将因"闰正月"的特殊安排,让人们在同一年迎来两个正月初一,从而形成传统意义上的"双春节"现象。 农历作为阴阳合历的瑰宝,通过巧妙设置闰月来协调太阳年与月亮年的周期差异。在农历体系中,闰月的设置与二十四节气中...
13:57
12月18日,备受瞩目的FORCE原动力大会圆满落幕,火山引擎在此交出了一份令人瞩目的成绩单。截至今年12月,豆包大模型的日均Tokens使用量已强势突破50万亿大关,不仅稳居中国第一,更在全球范围内排名第三,展现出强大的市场号召力与用户粘性。 大会上,火山引擎正式发布了备受期待的豆包大模型1.8版本与视频生成模型Seedance1.5pro。豆包1.8版本...
13:57
AIbase 近期发布的一份深度报告揭示了科技巨头 Alphabet(谷歌母公司)正在酝酿一场针对 AI 芯片市场的重大变革。为打破英伟达在高端 AI 芯片领域的长期垄断,谷歌正全力推进一项名为"PyTorch TPU"(TorchTPU)的全新战略计划。这一计划的核心目标是通过技术突破,大幅增强其张量处理单元(TPU)芯片与全球最受欢迎的开源 AI 框架 ...
13:57
在人工智能深刻变革浏览器定义的当口,Mozilla迎来了其新的掌舵者——Anthony Enzor-DeMeo正式接任CEO一职,由临时CEO劳拉·钱伯斯(Laura Chambers)交棒。这位曾担任Firefox业务总经理的资深人士的升任,不仅象征着Mozilla的领导层正在经历重要更迭,更标志着这家始终坚守隐私与开放网络理念的机构,决心在AI浪潮中开辟...
13:27
2025年12月18日,火山引擎原动力大会现场,火山引擎总裁谭待发布了豆包大模型的最新发展里程碑。他透露,这款备受瞩目的AI大模型日均处理量已突破50万亿Tokens,这一惊人数字不仅彰显了其强大的算力支撑,更标志着豆包大模型自发布以来实现了令人瞩目的417倍增长。 这一突破性进展的背后,是豆包大模型在企业级市场的深度渗透与广泛认可。目前,“万亿Toke...
13:27
2025年12月,我国在虚拟数字人领域迎来历史性突破,正式发布首部国家标准——《信息技术客服型虚拟数字人通用技术要求》。这一重要举措由相关部门牵头制定,标志着我国在虚拟数字人技术标准化方面迈出关键一步,旨在全面规范客服型虚拟数字人的技术研发与应用流程。作为行业首个权威标准,该文件系统性地明确了从研发设计、生产制造到服务运营全过程中的技术规范与评估方法,为行业...
13:27
2025年12月18日,科技界迎来重磅消息。小米创始人、董事长兼CEO雷军通过个人微博正式官宣,备受瞩目的小米17 Ultra旗舰手机将于下周揭开神秘面纱。此次发布会将全面聚焦影像技术的革新与突破,彰显小米在高端智能手机市场持续深耕的决心与实力。雷军在预告中并未透露具体的发布时间与详细配置参数,但明确表示这款新机将代表小米手机影像能力的最高水准,有望再次刷新...
13:27
2023年11月,国家统计局发布了最新全国城镇分年龄组失业率数据,揭示了不同年龄段劳动力市场的显著差异。数据显示,不包含在校生的16-24岁劳动力失业率高达16.9%,这一数字凸显了青年群体面临的严峻就业挑战。相比之下,25-29岁群体的失业率为7.2%,虽然仍处于相对较高的水平,但已明显低于青年群体。而30-59岁劳动力的失业率则降至3.8%,显示出更为稳...