微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年04月06日

13:57
微新创想:2026年4月6日8时,江西鄱阳湖星子站水位达到13.19米,这是今年首次突破13米大关,较前一日上涨了0.28米。同时,湖口站水位为12.91米。随着近期集中降雨以及上游来水不断增多,鄱阳湖的水体面积已扩展至1900平方公里,比去年同期增加了1530平方公里。鄱阳湖的总容积也达到了43.7亿立方米,较去年同期增长了33.6亿立方米。 水位的持续回...
13:57
微新创想:4月6日,据OpenRouter最新数据显示,3月30日至4月5日期间,中国AI大模型周调用量达12.96万亿Token,环比增长31.48%。美国为3.03万亿Token,环比微增0.76%。全球总调用量27万亿Token,环比升18.9%。中国已连续五周调用量位居全球第一,显著领先美国。数据表明中国大模型应用活跃度快速提升,产业落地加速推进。
13:57
微新创想:2026年4月6日,英特尔正式推出面向消费级市场的酷睿Ultra X9 378H处理器。这款芯片采用了全新的4P+8E+4LP-E+12Xe核心架构,为性能与能效的平衡提供了更优的解决方案。P核的最大睿频达到了5.0GHz,E核为3.8GHz,LP-E核为3.6GHz,进一步提升了整体处理能力。同时,核显的动态频率也达到了2.5GHz,显著增强了图...
13:26
微新创想:北京时间4月6日12:41,NASA阿耳忒弥斯2号任务的四名宇航员成功搭乘“猎户座”飞船进入月球引力主导区。这一区域距离月球约6.28万公里,距离地球约37.3万公里。这是自1972年阿波罗17号任务以来,人类首次再次抵达这一区域。 此次任务不涉及月球着陆或轨道运行,而是以飞越月球的方式进行科学探索。4月6日19时,飞船将飞越月球背面,这是任务中的...
12:54
微新创想:2026年4月5日,据多方行业数据显示,苹果App Store 2026年第一季度应用提交量达23.58万次,同比上涨84%。这一显著增长主要源于AI驱动的“氛围编程”工具在开发者群体中的普及。例如Claude Code、ChatGPT Codex以及Xcode 26.3版内置的AI辅助功能,这些工具正在改变传统软件开发的方式。 这些AI编程工具的...
12:54
微新创想:2026年4月6日,红果短剧官方发布治理公告,宣布第一季度累计下架违规漫剧1718部,其中针对AI短剧素材滥用问题专项核查1.5万部作品,处置违规AI短剧670部。此次治理行动旨在进一步规范内容创作环境,提升平台整体质量。 治理聚焦四类典型行为,包括擅自使用卡通形象、AI品牌标识、游戏原创角色及真人演员形象。这些行为均因未提供合法授权证据而被下架。...
12:22
微新创想:2026年4月5日,NASA局长贾里德·艾萨克曼在CNN节目中表示,探索“我们是否孤独”是航天任务的核心科学目标,直接影响任务规划。他强调,这一问题不仅关乎人类对宇宙的认知,也推动着航天探索的方向和优先级。 艾萨克曼提到,未来月球南极基地将部署望远镜,以进一步深化对外星生命的搜寻。这一举措旨在利用月球独特的地理位置,增强对深空信号的接收能力,为寻找...
11:45
微新创想:4月6日,中通快递正式上线“无人车小视频”功能,新石器作为其无人车唯一战略合作伙伴完成即时接入。这一创新举措标志着智能配送技术在快递行业中的进一步应用。用户在快件详情页可以看到“无人车派送”的标识,同时能够实时查看车辆的运行轨迹以及周边环境的视频画面。这不仅提升了派送信息的透明度,也让用户对包裹的配送过程有了更直观的了解。 该功能将无人车的运行数据...
11:45
微新创想:4月5日,美国职场兴起新型焦虑FOBO(对被淘汰的恐惧)。毕马威调查显示,40%员工担忧AI导致失业,63%认为工作正失去“人味”;岗位技能更新速度较一年前加快66%。 Anthropic与微软高管预测五年内半数初级白领岗位或消失,参议员预警新毕业生失业率两年内或达35%。麻省理工研究则指出AI影响呈渐进式,2029年文本任务成功率或达80%–95...
11:45
微新创想:2026年4月6日,云汉芯城与国产通用MCU厂商国民技术达成战略合作,正式成为其官方授权线上分销平台。合作即日起生效,覆盖全国市场。此次合作标志着云汉芯城在电子元器件供应链服务领域迈出了重要一步。 微新创想:双方将面向工业控制、机器人、数字能源、汽车电子及消费AI等领域客户,提供国民技术全系列高性能MCU及无线射频产品,并配套技术支持。这一合作将为...
11:45
微新创想:2026年4月,荷兰莱顿大学研究人员成功3D打印出尺寸为0.5–5微米的微型机器人。这项突破性成果标志着微型机器人技术迈出了重要一步。 该机器人无需大脑、传感器、电机或外部控制,仅凭柔性结构与环境相互作用,例如通过电场刺激即可实现自主移动。其移动速度达到每秒7微米,展现出极高的灵活性与响应能力。 研究团队由丹妮拉·克拉夫特教授领衔,致力于探索微型机...
11:14
微新创想:4月6日,沈阳(沈北)跨境电商公共服务中心在沈北新区会展中心正式启动。该中心由沈阳市沈北新区建设,整合海关、主流跨境平台及专业服务机构资源,面向本地企业提供一站式、低成本、全流程跨境电商服务。这一举措标志着沈北新区在推动外贸高质量发展方面迈出了坚实一步。 微新创想:启动仪式同步举行‘辽货出海 智赢未来’跨境电商赋能大会,旨在提升区域企业出海能力,推...