微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月27日

20:40
2026年1月,YouTube正对播放速度调节功能开展分组测试,部分用户需订阅Premium才能使用。该功能长期免费开放,现A组用户仍可正常使用,B组则被限制。测试覆盖全球多地区用户,具体 rollout 时间未公布。YouTube Premium当前售价13.99美元/月,若该功能正式付费化,将强化其学习与效率场景的会员价值,但也可能引发免费用户不满。目...
20:40
2026年1月26日,Mozilla在Firefox Nightly 149版本中正式推出备受期待的分屏浏览(Split View)模式,为用户带来革命性的多任务处理体验。该功能允许用户在单个窗口内并排展示两个网页标签,极大地提升了工作效率和信息获取的便捷性。用户可以轻松地将现有标签拖入分屏区域,或者直接选择两个标签进行并排显示,操作简单直观。这一创新不仅优...
20:40
2026年1月27日,微软面向Xbox预览体验用户开放Xbox云游戏(Xbox Cloud Gaming)网页端新版界面测试。新版采用圆角设计语言、滑动入场动画及动态图标效果,导航更流畅,整体风格趋近Xbox主机系统。此次更新是近两年来最大规模UI升级,旨在提升网页端操作体验,并为未来主机与PC端Xbox应用界面统一奠定基础。用户可通过play.xbox....
20:40
捷尼赛思于1月27日在韩国首尔盛大揭幕了其首款高性能量产车型——GV60 Magma,为豪华纯电SUV市场注入了前所未有的活力。这款车型以惊人的性能参数震撼全场,最大功率高达650PS,峰值扭矩更是达到了790N·m,配合锻造轮毂的加持,零百加速仅需3.4秒,展现了极致的加速性能。 在技术配置上,GV60 Magma可谓诚意满满。它搭载了专属的Magma悬架...
19:40
1月27日,海关总署发布境外旅行健康提示,提醒公众防范尼帕病毒病。据悉,印度西孟加拉邦近日报告5例确诊病例,含医护人员。尼帕病毒为人畜共患传染病,主要流行于南亚、东南亚,我国迄今无本土感染病例。提示建议赴疫区人员密切关注疫情动态,避免接触蝙蝠、病畜及患者分泌物,做好手卫生与呼吸道防护。该提示旨在加强科学防控,保障出入境人员健康安全。
19:40
2026年1月27日,沐曦股份(688802.SH)正式发布2025年度业绩预告,透露公司预计将面临6.50亿元至7.98亿元的归属于母公司所有者的净利润亏损。尽管面临盈利挑战,公司仍坚定不移地推进GPU核心技术的研发与产业化进程,积极落实“1+6+X”战略布局,通过持续扩大市场开拓力度,实现收入规模同比显著增长。值得注意的是,尽管公司目前仍处于亏损状态,但...
19:40
2026年1月27日,工业和信息化部公开征求《电动轮椅车用电池安全技术规范》强制性国家标准(征求意见稿)意见。该标准由工信部组织编制,旨在规范电动轮椅车用电池的安全要求,提升产品可靠性与用户安全性。征求意见面向全社会,同步公示标准文本及编制说明。此举系落实国家标准委强制性国家标准制修订计划,预计后续将经修改完善后报批发布。
19:40
中芯国际(688981.SH)即将于2026年2月10日交易结束后正式公布2025年第四季度业绩报告,并于次日即2月11日召开备受瞩目的业绩说明会。此次会议将采用网络直播与电话会议相结合的创新形式,面向全球投资者及媒体界人士开放,旨在第一时间回应市场关切,全面解读当季经营成果、关键技术进展以及未来发展蓝图。值得注意的是,公司方面尚未公布具体的会议时间安排及网...
19:40
2026年1月27日,英国金融行为监管局(FCA)宣布启动一项前瞻性AI影响评估。该评估由高管谢尔登·米尔斯牵头,旨在分析生成式AI、智能体AI等新兴技术对消费者、零售金融市场及监管自身的长期影响。评估围绕四大主题展开:AI技术演进、市场与企业变革、消费者行为与期望变化、监管能力适配需求。意见征集截止至2026年2月24日,相关建议将于同年夏季提交董事会审...
19:40
1月26日,上海奥科达医药科技股份有限公司向港交所主板递交上市申请,招商证券国际与建银国际为联席保荐人。该公司成立于2012年,专注中枢神经系统疾病、代谢性疾病及罕见病创新药研发与商业化。截至申请时,已构建15款产品管线,其中10款聚焦癫痫治疗;核心产品Motpoly XR™为全球首款FDA批准的每日一次缓释拉考沙胺。公司拟借上市加速临床推进与商业化落地。
19:40
1月26日,宁波舜宇智行科技股份有限公司向港交所递交上市申请,中金公司与中信证券担任联席保荐人。该公司为全球领先的车载光学技术企业,主营智能感知、智能座舱及车载镜头等解决方案。2024年其车载相机出货量全球第一,车载镜头市占率连续13年居首。2023—2024年收益分别为52.62亿元、59.89亿元;2025年前三季度收益51.46亿元,同比增长15.4...
19:40
1月26日,广州研趣信息科技股份有限公司向港交所提交上市申请,申万宏源香港为独家保荐人。公司成立于2015年,运营“人人租”线上租用消费服务平台,覆盖手机、电脑、摄影、健康理疗等品类,服务全国主要城市。2024年GTV约75亿元,市占率27.5%,居行业首位。截至2025年9月30日,平台注册商家超2万家,注册用户约6120万,日均订单逾1.3万笔。202...