微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2025年12月25日

09:15
近日,北京市房山区人民法院审理了一起因高空抛物引发的刑事案件,引发社会广泛关注。69岁的李老太因一时疏忽,将垃圾从12层阳台抛下,最终付出了沉重代价。今年8月13日中午12时左右,家住房山某小区的的李老太,将装有厨余垃圾和生活垃圾的垃圾袋,从自家阳台直接扔下。这些垃圾袋如同“炸弹”般坠落至楼下南侧停车场,不偏不倚砸中了苏女士停放的白色汽车,导致车辆前挡风玻璃...
09:15
12月24日清晨,正值城市早高峰,一场因电梯占位引发的激烈冲突在某小区内骤然爆发。据现场目击者回忆,当时一名女子强行占据电梯入口,无视身后乘客的焦急催促,执意阻止电梯关门。这一行为迅速点燃了其他乘客的怒火,尤其是电梯内一名女乘客,在长达数分钟的等待后情绪逐渐失控,最终情绪激动地将占位女子推出了电梯外 被推出的女子并未就此罢休,她迅速转身返回,与被推的女乘...
09:15
辽宁街头上演了一幕充满温情的画面,让人瞬间被感动。当天,一位交警正在执行交通疏导任务时,敏锐地发现一只小狗在车流不息的马路上焦躁地来回踱步,眼神中透露出明显的恐惧与不安。见此情形,交警立刻放下手中的工作,快步走上前,用温和的语气和动作安抚着小狗,并耐心地将其引导到路边安全地带。令人惊喜的是,这只小狗似乎对这位交警产生了强烈的信任感,从那以后便形影不离地跟在他...
09:07
2023年12月22日,巨力自动化设备(浙江)股份有限公司正式在浙江证监局完成备案,标志着其IPO辅导工作正式启动,保荐机构为国信证券提供全程支持。这家成立于2011年5月的国家级专精特新"小巨人"企业,由法定代表人章日平先生掌舵,始终专注于扁线电机定子产线等电驱动自动化整线解决方案的研发与制造。 作为行业领军者,巨力自动化凭借卓越的技术实力和创新能力,已成...
09:07
2025年12月25日,我国能源领域迎来重大突破,单机容量最大的抽水蓄能电站——浙江天台抽水蓄能电站正式宣告首台机组成功并网发电这一标志性时刻标志着我国在清洁能源和智能电网建设方面迈出了坚实一步。该电站坐落于风景秀丽的浙江省台州市天台县,总装机容量高达170万千瓦,总投资超过100亿元人民币,堪称我国抽水蓄能电站建设的里程碑之作。电站内部精心安装了4台单机容...
09:06
2025年11月,我国增材制造装备产量再创新高,同比增长率高达100.5%,而前三季度累计增幅也达到了40.5%。这一强劲的增长势头预示着全年行业产值的突破,预计将超过700亿元,同比增长超过30%。更令人瞩目的是,同期增材制造装备出口表现同样亮眼,总额同比增长135.7%,1至11月的出口总额已突破100亿元大关,展现出中国在该领域的强大竞争力。 中国增材...
09:06
2025年初,《赛博朋克2077》续作的开发工作已全面加速,CD Projekt Red工作室已紧急调配135名核心员工组建专项开发团队,并透露未来两年内团队规模可能实现翻倍增长。为满足玩家对多人互动体验的期待,项目团队决定将游戏模式扩展至支持在线多人互动,这一调整导致整体开发周期有所延长。根据最新规划,游戏发售日预计定于2030年第四季度,这一时间点恰好与...
09:06
2025年12月25日凌晨4点36分,中国玩家迎来好消息——Steam游戏平台及社区服务成功恢复运行。此前,该平台曾遭遇约一小时的大规模宕机,给全球玩家带来不小困扰。这场故障发生在12月24日下午3点36分(美国东部时间),正值备受期待的Steam冬季特卖活动高峰期,导致全球多地用户遭遇客户端黑屏、网页加载错误等问题。 据DownDetector平台统计,故...
09:04
OpenAI 正在积极探索将商业化广告融入其标志性产品 ChatGPT 的创新路径,这一举措标志着这家生成式 AI 巨头在长期保持对广告的审慎态度后,开始向商业化领域迈出实质性步伐。据 The Information 从内部人士处获悉,OpenAI 团队正深入研发一套精密的广告整合方案,旨在在不损害用户体验的前提下,实现可持续的盈利增长。 在具体实施层面,O...
09:04
英伟达(NVIDIA)近期完成了一项具有里程碑意义的技术布局,正式与AI芯片领域的创新先锋Groq达成深度技术授权合作。根据双方签署的协议,英伟达不仅获得了Groq核心知识产权的全面授权,更将将其革命性的芯片设计方案无缝整合进下一代产品体系中。这一合作中最引人注目的亮点,莫过于Groq创始人兼CEO乔纳森·罗斯(Jonathan Ross)将带领多位核心技术...
08:44
日本北海道稚内市外海的一座无人岛近日成为全球瞩目的生态奇观——约1300头北海狮突然聚集于此,形成罕见的大规模迁徙景象。这些体型可达吨级的海洋哺乳动物自11月下旬开始陆续抵达,将原本寂静的岛屿变成了喧闹的栖息地。这一现象不仅吸引了大量游客和科研人员,也引发了当地渔业与生态保护之间的深刻矛盾。 据当地渔民反映,北海狮每年冬季都会南下至这一海域觅食,但今年的聚集...
08:07
2025年12月25日,中国银行业在并购金融领域的创新浪潮正加速推进,多家头部银行纷纷推出首批具有突破性的项目,并同步举办了一场高规格的行业论坛。这一系列动作不仅彰显了银行业对金融科技与产业融合的深刻洞察,更预示着并购金融服务的全新发展阶段已经到来。北京银行率先在湖南地区发放了首笔数字人民币科技企业并购贷款,通过将数字货币技术与并购融资创新结合,为科技企业提...