微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2025年12月27日

15:12
2025年12月27日,B站正式揭晓年度弹幕关键词——"致敬",这一充满力量与温度的词汇全年累计被发送超过2282万次,参与用户数量高达459万人,其中80%为00后年轻群体。这一现象级弹幕词首次出现在UP主小何教官-铁手版发布的视频中,正是源于他对截肢后依然乐观生活的坚韧态度所引发的广泛共鸣与崇高敬意。 在众多高光时刻中,UP主江汤锅底呀受老兵委托清理烈士...
15:12
2025年12月27日10时15分,济南地铁4号线、6号线东段和8号线开通运营,实现三线同步通车。三条线路均采用具备全自动运行功能的A型车,额定载客1860人,最大载客约2590人。4号线全长40.3公里,设站33座,贯穿经十路客流密集区;6号线东段长19.5公里,设站17座,连接山东大学、CBD及济南东站;8号线全长25.3公里,途经历城、高新至章丘,服...
15:12
2025年跨年夜当天,全国主打异国风味的餐厅预订量同比增长98%。上海、北京、广州、深圳、杭州成为国际美食消费最热门城市,大连、天津、济南预订量增长超2倍,表现亮眼。数据显示,最近一周美团平台上“跨年”主题预售套餐订单量同比增幅达166%,消费者更倾向通过特色餐饮迎接新年。
15:12
2025年12月27日,备受瞩目的《以标准提升牵引设备更新和消费品以旧换新行动方案》迎来重大进展。市场监管总局携手发改委、工信部等七部门正式宣布,方案中涉及的294项国家标准已全部完成审批并正式发布。这些新标准广泛覆盖了能源、交通、电子、家居等13个关键领域,标志着我国在推动产业升级和绿色转型方面迈出坚实一步。 新标准体系围绕三大核心任务展开:一是全面提升能...
15:12
2025年12月27日,京东航空“深圳=十堰”全货机航线正式首航并进入常态化运营。该航线由波音B737-800F全货机执飞,往返于深圳宝安国际机场与十堰武当山机场,最大业载达36吨。货运品类主要包括汽车零部件、绿色农产品、快递包裹及轻工业产品,每周执行1至2班。此次开航标志着鄂西北地区实现全货机航空货运“从无到有”的突破,十堰成为湖北省第四个开通全货机航班...
15:12
2025年,尼康正式宣布将针对Z系列全画幅无反相机ZR推出一系列重磅固件升级计划。此次系统优化将全面覆盖自动对焦性能、视频录制功能、音频处理质量以及工作流连接效率等多个核心领域。通过深度算法调优,相机主体识别精准度与动态追焦速度将得到显著提升,更有望将先进的鸟类识别与3D立体追焦技术下放至ZR机型,让自然生态摄影创作更加得心应手。在低光环境拍摄方面,系统升级...
15:12
2025年12月26日,工业和信息化部在北京正式成立“人形机器人与具身智能标准化技术委员会”。该标委会将负责制定涵盖基础共性、关键技术、整机系统及安全标准在内的全流程标准体系,推动人形机器人与具身智能产业规范化发展。成立大会同期召开第一届第一次全体会议,审议通过了章程、工作细则及标准制修订程序等文件。此举标志着行业从“野蛮生长”迈向标准化、协同化新阶段,旨...
14:40
2025年12月27日,广州市教育局正式发布重要通知,明确强调所有学科类校外培训机构在节假日期间不得组织任何形式的培训活动。这一举措旨在进一步规范校外培训市场秩序,切实减轻学生过重的课外负担。通知中特别指出,任何在法定节假日、寒暑假期间开展的学科类教学行为均属违规操作,教育部门将对此类行为进行严厉查处。同时,官方呼吁广大家长提高警惕,谨慎选择合规的培训机构,...
14:40
2025年12月27日,星曜光学正式开启旗下全新MF 35mm f/1.4全画幅手动对焦镜头的预热活动,为摄影爱好者带来一款兼具经典与创新的镜头选择。这款镜头精心提供黑色与银色两种时尚配色方案,满足不同用户的审美需求。其核心特点在于支持f/1.4至f/16的光圈范围调节,为用户在复杂光线条件下提供更灵活的拍摄控制。 星曜光学MF 35mm f/1.4镜头特别...
14:40
2025年12月27日,AI代码编辑器Windsurf推出Wave 13版本,全面升级多智能体工作流与终端功能。此次更新引入SWE-1.5(代号“Penguin Alpha”)默认模型,性能达SWE-Bench-Pro标准且运行高效,并将免费提供三个月。新版本新增上下文窗口指示器、多会话并行视图及Cascade Hooks机制,提升开发交互灵活性。同时支持...
14:09
2025年12月27日,丰田汽车公司遭遇两起大规模集体诉讼,指控其UA80八速自动变速箱存在严重设计缺陷。这起诉讼直指该变速箱因散热系统效率低下和过于激进的换挡逻辑,导致产品过早失效,进而影响包括凯美瑞、汉兰达在内的多款车型。原告在诉状中明确指出,丰田公司不仅知晓该问题,却长期未采取有效解决措施,反而通过软件升级进一步加剧了变速箱的磨损程度。更令人愤慨的是,...
14:09
深光影像正式宣布推出一款备受期待的中画幅手动对焦镜头——75mm f/1.2,专为哈苏XCD和富士GFX卡口设计。这款镜头以其精湛的工艺和出色的光学性能,为专业摄影师和摄影爱好者带来全新的创作体验。 镜头采用全金属镜身设计,不仅坚固耐用,更彰显高级质感。其重量仅为642克,便于长时间手持拍摄,同时保持稳定的构图。镜头光圈范围可调节至f/1.2-f/16,提供...