微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月02日

17:47
近日,马斯克旗下的 X 平台在印尼遭遇的聊天机器人 Grok 的禁令,终于迎来了转机。根据印度尼西亚通信与数字事务部的最新声明,政府在 X 公司承诺加强合规措施之后,决定有条件地解除对 Grok 的禁令。这一决定标志着印尼成为东南亚首个对 Grok 解禁的国家。几周前,印尼政府因担忧 Grok 生成的 AI 色情内容对社会造成潜在风险,率先对其实施禁令。这一...
17:47
 中国 AI 领军企业 DeepSeek 近日发布了全新的视觉编码器 DeepSeek OCR2,在文档处理和图像识别领域实现重大突破。该模型通过模拟人类视觉的灵活扫描模式,彻底颠覆了传统视觉模型平铺直叙的处理逻辑。DeepSeek 研究人员指出,人类眼睛在观察物体时会根据内容进行灵活聚焦。为了实现这一特性,DeepSeek OCR2引入了全新的架...
17:15
自动驾驶汽车通常依靠识别路标来安全行驶,但这一核心能力正成为其致命弱点。近日,加州大学圣克鲁斯分校的一项研究揭示,攻击者只需通过一张带有特定文本的打印标识,就能诱导人工智能系统做出极度危险的决策,甚至将车辆引向行人群。这项被称为“CHAI”(针对具身智能的指令劫持)的攻击方法,利用了现代无人系统对视觉语言模型(VLM)的过度依赖。研究表明,这类模型在处理环境...
17:15
声明:本文来自于微信公众号 锌刻度,作者:李觐麟,授权站长之家转载发布。1月28日,“85后”晏周和赵定终于带着鸣鸣很忙在香港正式挂牌上市,站在了资本的聚光灯下。上市当日,鸣鸣很忙开盘较发行价236.6港元大涨超88%,对应总市值超952亿港元。有人说,这不仅是资本市场的开年狂欢,更是“小孩哥们”的消费平权。事实上,鸣鸣很忙从一...
17:15
声明:本文来自于微信公众号 光子星球,作者:郝鑫,授权站长之家转载发布。即将到来的2026年春节注定不平静,两个并行战场硝烟四起。一边是基础模型的技术攻坚,以DeepSeek为首的模型厂商埋下了预告;另一半则是新一轮的AI入口争夺战,字节、腾讯、百度、阿里罕见全部下场。2026年央视春晚,字节豆包已锁定独家AI互动合作;腾讯元宝...
17:15
声明:本文来自于微信公众号 Tech星球,作者:陈桥辉,授权站长之家转载发布。打开手机里的AI应用,常陷入这样的窘况:想查资料时点开Agent助手,问完就关;刷到AI生成的表情包,存完就忘;偶尔拉朋友一起用AI规划旅行,还得反复在不同App间复制粘贴需求……而行业喊了一年多的“AI社交”,大多时候只是把AI塞进聊天框当工具人,并...
17:03
2026年2月2日,Enfinity Global与Microsoft在意大利强强联手,共同宣布其合作开发的购电协议(PPA)项目取得重大突破——首座33.8兆瓦交流容量的太阳能光伏电站正式投入商业运营。这座现代化的绿色能源基地坐落于意大利阳光充足的地区,由Enfinity Global独立负责开发与运营,而全球科技巨头Microsoft则作为主要的电力承购...
17:03
2026年2月,羽希环境完成1.3亿港币天使轮融资。该公司成立于1988年,总部位于中国,是专注大气污染治理的国家高新技术企业。本轮融资将用于技术研发、市场拓展及产能升级。公司核心业务覆盖除尘、脱硫脱硝及垃圾焚烧烟气全流程净化,具备设计、制造及EPC总承包能力。此举标志着其发展进入新阶段。
17:03
2月2日,蚂蚁集团CEO韩歆毅发布全员邮件,宣布启动“AI Credit”特别激励方案。该方案面向在AI领域作出开创性贡献并获市场初步认可的团队与个人,在原有绩效激励外提供额外奖励。相关成果若在未来两年内有效提升公司价值,可兑换为SERs(经济受益权),否则自动失效。此举旨在加速AGI前沿探索与应用落地,重点突破健康等核心业务场景,支撑未来十年战略发展,推...
17:03
2026年2月2日,光荣特库摩正式发售《三国志8 REMAKE:威力加强版套装》,登陆PS4/5、Switch及PC(Steam)平台。国区Steam定价398元,含本体及全部DLC;单DLC售价168元。2月11日前购入可获特典剧本「汉忠臣马腾」。本作为系列首次大规模重制升级版,新增宝珠、转机系统、中文语音、5个虚构剧情及强化编辑功能。目前Steam玩家...
17:03
2025年,中国能源领域迎来历史性突破,全国新增发电装机容量高达5.5亿千瓦,其中风电与太阳能发电合计贡献了4.4亿千瓦,占比高达80.2%,彰显了可再生能源的强劲发展势头。尤为引人注目的是,风光生物质新增发电量占全社会新增用电量的比例达到了惊人的97.1%,标志着中国能源结构正在发生深刻变革。 截至2025年底,全国总装机容量已攀升至38.9亿千瓦,其中太...
17:03
2026年2月2日,国科离子宣布完成8亿元首轮股权融资。本轮融资由社保基金中关村自主创新专项基金(君联资本担任管理人)与君联资本共同领投。公司总部位于兰州,专注于重离子治疗技术产业化,提供涵盖设备制造、运维服务、人员培训、医疗大数据及前沿技术研究的诊疗康养一体化解决方案。融资将用于加速重离子治疗装备规模化生产、全国临床中心建设及核心技术研发。