微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月25日

16:34
2026年1月25日,据多方消息证实,育碧并未正式雪藏《看门狗》系列。内部人士Shinobi602澄清称,该IP仍存续,且与即将上映的电影无关。系列全球销量超2500万份,前两作为主力贡献逾2000万份。尽管《看门狗:军团》表现不佳,但因体量庞大及育碧新战略聚焦开放世界与服务型游戏,《看门狗》有望重启。不过核心开发成员大量流失,创意革新成复兴关键。
16:34
2026年1月24日,北京国际商业航天展览会举行。银河航天创始人、董事长兼CEO徐鸣在展会主旨演讲中指出,中国商业航天已从“补充性力量”跃升为“战略性支柱”,正成为全球太空基础设施建设的重要参与者。他强调,太空科创时代已开启,当前处于第一阶段——太空数字基建阶段,核心是让数据“上天”;手机直连卫星将引领6G通信革命,6G架构=地面网络+卫星宽带+手机直连。...
16:34
2026年1月25日,招金黄金(000506.SZ)发布2025年度业绩预告,预计归母净利润1.22亿元至1.82亿元,上年同期亏损1.27亿元。公司实现同比扭亏为盈,主因斐济瓦图科拉金矿技改完成、产能提升,叠加黄金价格上行,推动主营业务毛利润显著增长。业绩预告覆盖2025年1月1日至12月31日,未经审计。
16:02
2026年1月19日0时23分,中国航天史迎来又一重要时刻——神舟二十号飞船正式从中国空间站组合体撤离,以无人模式踏上返回地球的征程。这一里程碑事件标志着我国航天技术的持续突破,也彰显了空间站长期运营的稳定性和可靠性。 神舟二十号飞船于2025年4月24日从酒泉卫星发射中心成功发射升空,经过270天的在轨运行,不仅完成了各项既定任务,更关键的是验证了飞船长达...
16:02
2026年1月25日,全球领先的跨境支付服务商Payoneer正式宣布成功完成对爱尔兰雇主记录(EOR)平台Boundless的战略收购。Boundless作为一家总部位于都柏林的创新型企业,专注于为全球范围内的企业提供合规的雇佣管理、薪酬发放以及本地化人事服务解决方案。此次收购标志着Payoneer在国际化用工服务领域的重大布局,将显著提升其在全球人才管理...
16:02
1月24日,一位名为Dazzling_Course8755的海外玩家在Reddit平台上发布了一则令人震惊的帖子,揭露了其在亚马逊Resale渠道购买RTX 5090显卡时遭遇的离奇事件。该玩家表示,当他满怀期待地打开包裹时,却发现包装内空空如也,根本找不到预期的显卡。取而代之的,是一块用浴巾包裹的神秘石头,让人不禁怀疑这是否是一场恶作剧。 更令人不安的是,...
16:02
2026年1月,俄罗斯特罗伊茨克研究所(隶属于全球领先的核能企业Rosatom)正式启动了一项突破性的太空技术测试计划。在该研究所的地面真空舱内,科研团队正对一款革命性的氢燃料等离子体推进发动机进行严格测试。这款新型发动机采用了先进的星载核反应堆供能技术,通过强大的电磁场精确加速氢粒子,实现了每秒100公里的超高速喷射,并展现出6牛顿的稳定推力。尤为值得关注...
16:02
1月25日,申通快递迎来重要里程碑——第二批100台新能源智能重卡正式交付使用,使得数智车队的规模成功扩展至700台。这一批次的交付全面融入申通全国干线运输网络,实现了对华东、华北、华南等核心区域的广泛覆盖。此次规模化的交付标志着申通在新能源物流车应用上实现了从局部试点到全国性网络化应用的重大跨越,不仅显著提升了干线运输效率,更在降低碳排放方面迈出了坚实步伐...
15:31
2026年1月24日10时至25日10时,阿里拍卖平台对内蒙古巴彦淖尔归属地手机号“15**8888888”进行公开拍卖。该号码月租199元,无欠费及使用限制,起拍价100万元,保证金10万元。截至竞拍结束,无人出价,最终流拍。此类稀缺靓号在市场中关注度高,去年同类尾号八连6号码曾以275万元成交。流拍原因或与高额保证金及起拍价门槛有关。
15:31
1月25日,九州通医药集团在银行间债券市场成功发行2026年度第一期科技创新债券。本期债券发行规模3亿元,期限180天,票面利率1.70%,认购倍数达3.1倍。该债券系九州通获AAA主体信用评级后首单信用债,亦为湖北省民营企业首单科技创新债券。发行旨在支持企业医药供应链数字化与智慧物流等科技项目投入,凸显其强化科技创新融资能力的战略方向。
15:01
科技媒体MacRumors最新消息透露,苹果计划在2026年6月WWDC开发者大会结束后,通过iOS 27版本正式发布全新AI驱动的Siri聊天机器人。这次重大升级将彻底重构Siri的底层架构,赋予其支持多轮对话、复杂任务处理以及屏幕内容理解等先进能力。值得注意的是,此前iOS 26.4版本已率先引入个性化上下文识别功能,为此次Siri的全面革新奠定了基础。...
15:01
2026年1月24日,爆料者Kepler_L2披露AMD核显架构规划。面向中端及办公本等低图形需求场景,AMD将持续采用RDNA 3.5架构至2029年;而高端APU产品线则将升级为全新RDNA 5图形架构,配备“Premium”核显。此举意在对标英特尔Panther Lake平台(含Arc B390核显,性能接近RTX 4050),并依托Strix Ha...