微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年03月06日

08:21
微新创想:2026年2月27日起,美国联合航空正式实施新规,要求乘客在航班上收听音频或观看视频时必须佩戴耳机。这一规定适用于所有执飞航班,旨在改善机舱内的整体环境,确保每位乘客都能享受到安静、舒适的飞行体验。 微新创想:根据新规,如果乘客在飞行过程中未佩戴耳机而播放音频或视频,可能会面临被临时或永久拒绝乘机的风险。机组人员有权在发现此类行为时立即请其下机,以...
08:20
微新创想:2026年3月5日,微软必应AI增强搜索功能被曝存在漏洞,错误推荐托管于GitHub的虚假OpenClaw安装程序。这一事件引发了广泛关注,网络安全公司Huntress指出,用户在搜索‘OpenClaw’时,结果页面优先展示了伪装成开源AI智能体的恶意仓库。 攻击者创建了仿冒GitHub组织‘openclaw-installer’,通过抄袭真实代码...
08:20
微新创想:微软近日宣布将企业用户强制迁移至新版Outlook的时间从原定的2026年4月推迟至2027年3月。这一调整为组织提供了额外的12个月缓冲期,以便更好地适应新系统。 微软在公告中明确表示,经典版Outlook将继续获得支持,直至2029年4月。这意味着企业在过渡期间仍有充足的时间进行准备和测试,以确保业务的连续性和数据的安全性。 此次推迟的主要原因...
07:48
微新创想:3月5日,Roc Nation公布数据显示,坏痞兔携手苹果音乐呈现的2026年超级碗中场秀,在上线首24小时内全球总播放量达41.57亿次。这一成绩不仅展现了演出的高人气,也反映了数字平台在现代娱乐传播中的巨大作用。 该数据涵盖电视直播、YouTube及全球社交媒体等多渠道数字资产。通过多种平台的协同传播,坏痞兔的表演迅速吸引了全球观众的关注,成为...
07:48
微新创想:2026年3月5日,Netflix宣布收购好莱坞影星本·阿弗莱克创立的AI影视技术公司InterPositive。此次收购标志着Netflix在影视制作领域的技术升级迈出了重要一步。InterPositive是一家专注于电影制作与后期环节的AI技术公司,致力于开发能够提升创作效率的智能工具。与直接生成视频的AI公司不同,InterPositive更...
07:48
微新创想:2026年3月5日,苹果悄然调整Mac Studio配置,移除512GB内存版本,可选内存范围缩至48GB–256GB。这一变动引发了业界广泛关注,显示出苹果在应对市场变化方面的策略调整。 256GB顶配机型发货周期延至5月,且升级价格由1600美元涨至2000美元。价格的上调不仅影响了消费者的购买决策,也反映出当前硬件供应链面临的挑战。 此举疑似...
07:14
微新创想:2026年3月6日,蓝箭航天研制的220吨级液氧甲烷全流量补燃循环发动机“蓝焱”完成整机全系统长程试车。此次试车的成功标志着我国在可重复使用重型运载动力领域取得实质性突破。 微新创想:该发动机于2025年5月首次试车,迄今已累计点火超过100次。经过多次试验验证,其性能稳定,技术成熟度显著提升。 微新创想:蓝焱发动机采用高集成、高室压设计,具备高效...
07:14
微新创想:2026年3月6日,OpenAI正式发布GPT-5.4系列模型,包括面向ChatGPT与API的GPT-5.4 Thinking版及面向复杂任务的GPT-5.4 Pro版。此次发布的模型标志着OpenAI在人工智能领域迈出了重要的一步。 该模型首次整合前沿推理、编码与智能体能力,使其在处理复杂任务时表现出更强的适应性和效率。GPT-5.4不仅支持高...
06:07
微新创想:3月6日,美国零售巨头开市客(Costco)公布2026财年第二季度财报。当季总营收达696亿美元,高于市场预估的692.7亿美元。这一成绩显示出公司在当前经济环境下的强劲表现。 财报显示,强劲的会员续费率是推动公司业绩增长的重要因素。开市客持续吸引新会员并保持现有会员的忠诚度,为公司带来了稳定的收入来源。 同时,通胀环境下消费者对高性价比商品的需...
04:05
微新创想:2026年3月6日,美国甲骨文公司宣布将裁员数千人。此次调整发生于其大规模投资人工智能技术导致现金流承压的背景下。裁员涉及全球多个部门,主要集中在非核心业务与重复职能岗位。公司表示,此举旨在优化成本结构、提升运营效率,以支撑长期AI战略落地。 目前裁员具体时间表及地区分布尚未完全公布,但首批调整预计将于2026年第二季度启动。甲骨文强调,研发与云基...
04:05
微新创想:地中海航运公司宣布自2026年3月16日起对所有自北欧地区发往红海和东非的货物征收燃油附加费 此次调整旨在应对不断上升的燃油成本以及该区域航行过程中所面临的风险 根据公告燃油附加费将按照标准集装箱每箱40美元冷藏箱每箱60美元的标准进行收取 该费用适用于所有相关出口货物并覆盖订舱及提单签发环节 燃油附加费的实施反映了当前国际航运市场的不稳定性 ...
04:05
微新创想:3月6日,中科院化学所朱道本院士、狄重安研究员团队成功研制出不规则多级孔结构塑料热电薄膜。该材料在同温区zT值达1.64,创柔性热电材料世界纪录。 这项突破性研究采用了‘聚合物相分离’法,不仅提升了材料的性能,还实现了与喷涂工艺的兼容。这种创新方法使得热电薄膜能够在一次成型过程中完成制造,大大简化了传统制备流程,显著降低了生产难度。 研究成果为可穿...