微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年03月12日

15:47
微新创想:2026年3月12日 英国通信管理局(Ofcom)与信息专员办公室(ICO)联合要求Facebook、Instagram、TikTok等主流平台 于4月30日前提交强化青少年保护的具体方案 此举旨在落实《在线安全法》 应对平台年龄验证失效 算法推送成瘾性及有害内容等问题 监管方强调 平台须升级年龄核验技术 限制陌生人接触未成年人 禁止向其测试新产品...
15:47
微新创想:3月11日 汽车媒体CarBuzz在瑞典拍到梅赛德斯-AMG全新C级纯电性能轿车(AMG C-Class EQ)测试车 测试车披着伪装贴纸 局部露出亮蓝色漆面 透露出新车的高性能定位 车辆配备了打孔刹车盘 大尺寸轮毂以及罕见的主动式后扰流板 这些配置都显示出其在赛道性能方面的追求 新车基于GLC EQ同平台打造 采用800V高压系统 以及超快充技术...
15:47
微新创想:2025财年,宝马集团在全球汽车市场中交付了246.37万辆汽车,总营收达到1334.53亿欧元,相比前一年略有下降。尽管整体营收出现下滑,但宝马集团依然保持了稳健的盈利能力,税前利润为102.36亿欧元,净利润为74.51亿欧元。在新能源领域,宝马集团表现突出,纯电动汽车销量达到44.2万辆,同比增长3.6%,占总销量的17.9%。同时,电动化车...
15:46
微新创想:2026年3月12日,摩根士丹利宣布将阿里巴巴集团上调为其中国互联网行业首选股,取代腾讯。这一决定标志着市场对阿里巴巴在人工智能领域的长期发展潜力给予了高度认可。 此次评级调整主要基于阿里巴巴在全栈AI领域的结构性优势。阿里不仅拥有自主研发的AI芯片,还在云计算服务方面处于中国领先地位,并在全球范围内占据第四的位置。这些技术积累为其在AI领域的持续...
15:46
微新创想:2026年3月12日,1688平台宣布,原定于3月10日生效的《严选行家选规则变更公告》暂缓实施 此次调整是为了给严选行家选商品的商家提供更加稳定和可靠的成长环境。平台希望通过延后规则的执行,让商家有更多时间适应新的运营模式,同时确保整体服务的稳定性和用户体验的连续性 平台表示,变更的具体生效时间将根据实际情况另行通知。这意味着商家们暂时不需要按照...
15:46
微新创想:3月12日,京东3C数码“放学3点半·科学体验教室”在北京亦庄实验小学正式挂牌。这一举措标志着京东与教育机构在课后服务领域的深度合作迈出了重要一步。该科学体验教室由京东联合校方共同打造,集智慧学习、3D创意、科学手工与美育功能于一体,为学生提供了一个多元化、互动性强的学习空间。 微新创想:教室首批配备了包括学而思学习机、拓竹3D打印机在内的数十种科...
15:46
微新创想:3月12日,摩根大通发布研报,维持腾讯“增持”评级及750港元目标价。报告指出,市场过度担忧腾讯在AI领域落后,忽视其将AI深度嵌入微信、广告、游戏等高频生态系统的变现能力。该行认为,腾讯虽未主导独立聊天机器人竞赛,但凭借成熟利润池和低财务风险的AI落地路径,仍是中国互联网中基本面最稳健企业。估值回调提供建仓机会,后续有望迎来重估。
15:46
微新创想:2026年3月12日,国际评级机构标普全球宣布将日本索尼公司的长期发行人信用评级由A上调至A+,评级展望维持“稳定”。此次调整主要基于索尼公司展现出的强劲现金流生成能力,以及其在多个高盈利领域中的多元化业务结构。标普全球认为,索尼在游戏、影视、音乐和电子产品等领域的协同效应不断增强,进一步巩固了其信用质量。 微新创想:此外,索尼公司持续改善的财务杠...
15:46
微新创想:国内大模型领域的人才版图正迎来新一轮重构 近日原阿里通义实验室大模型技术负责人林俊旸离职后原Qwen大模型后训练负责人郁博文也被曝正式加盟字节跳动出任其Seed团队视觉模型与多模态交互团队的后训练负责人 阿里架构调整引发人才流动此次核心人才的流失并非孤立事件据悉阿里通义实验室在3月初进行了大规模组织架构调整导致原Qwen团队被拆分作为主导过Qwen...
15:46
微新创想:腾讯旗下自研的 AI 原生桌面智能体工作台 WorkBuddy(原 OpenClaw 腾讯版)今日宣布重大升级 此次更新不仅实现了与微信的深度直连 更宣布即日起面向所有用户全量开放 这意味着用户只需通过手机发送指令 即可远程“遥控”办公室电脑 开启7×24小时的随身 AI 助理时代 微信一键直连 随时随地 语音“遥控”过去 使用 AI 智能体往往受...
15:46
微新创想:3 月 12 日 全球流媒体巨头奈飞正式宣布 将收购由知名影星本·阿弗莱克创立的 AI 电影制作公司InterPositive 据悉 这笔交易的总价值最高可达 6 亿美元 标志着 AI 技术正从幕后工具走向内容创作的核心舞台 影帝入局 AI 制片进入“正规军”时代InterPositive由好莱坞资深电影人本·阿弗莱克发起 致力于将前沿 AI 技术...
15:46
微新创想:为了彻底扭转对外部算力供应链的过度依赖,社交媒体巨头 Meta 最近发布了其最新一代自研 AI 芯片。这款名为 MTIA3 的加速器不仅在内部基准测试中表现卓越,Meta 更在官方声明中直言,其推理效能已在特定工作负载下超越了英伟达的主力产品 H100。 微新创想:与英伟达追求通用性的算力逻辑不同,Meta 的新芯片走的是“深度定制”路线。其核心设...