微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月03日

10:00
微新创想2月3日重磅报道,小米董事长雷军今日通过官方渠道详细介绍了小米汽车轮耦合道路模拟试验室这一核心研发设施。雷军强调,该试验室作为汽车工程领域的尖端设备,被业界俗称"四立柱试验室",其核心功能在于模拟整车在各种复杂颠簸路面上的动态响应,全面验证车辆结构的耐久性能。 通过先进的载荷采集系统和迭代技术,该试验室能够将比利时路、减速带、搓板路、方坑路等全球...
10:00
微新创想2月3日电 近期,广西一名从事刮腻子工作的韦女士遭遇了罕见的健康危机。她在工作时左眼不慎溅入腻子粉末,这一看似寻常的意外,却引发了棘阿米巴原虫感染,最终导致角膜穿孔和视力丧失。幸运的是,经过广西医科大学第二附属医院的紧急救治,韦女士的病情得到了控制,眼球得以保住,目前仍在接受后续治疗。 2025年4月,韦女士在工作时左眼意外进入腻子粉末。起初,她只...
10:00
微新创想2月2日讯,理想汽车CEO李想近日在朋友圈分享了对现象级AI产品的前瞻性思考,他预测2025年将迎来三大突破性AI产品——ClaudeCode、豆包手机和Manus。这一观点迅速引发行业热议,今日,中兴通讯副总裁、努比亚旗舰产品总经理张雷对此作出积极回应,强调努比亚豆包手机将引领手机体验进入自动驾驶式升级的新纪元。 据悉,李想曾精准预判全自动驾驶技术...
09:59
微新创想2月2日讯 微信官方近日发布重要公告,正式启动针对视频号虚假摆拍乱象的专项整治行动。此次行动剑指那些以剧本演绎冒充真实记录的短视频,旨在彻底清除此类违规内容,维护平台内容的真实性和可信度。 自1月23日公告发布以来,平台已高效处置相关违规视频2467条,并封禁恶意账号23个。为规范内容生态,微信还启动了分级分类试点提示,要求创作者对未标注"剧情演绎"...
09:54
2月3日,全球领先的机器人租赁服务平台擎天租正式宣布完成新一轮关键管理层升级,标志着公司在战略布局与市场拓展方面迈入全新发展阶段。此次任命由资深行业专家领衔,阿里资深渠道专家李立恒(花名:黑猫警长)与商业战略专家王明峰(花名:天相)分别出任联席总裁和首席战略官,旨在全面提升渠道建设效能与战略执行能力,为即将启动的全国城市合伙人计划提供强有力的人才支撑。 此次...
09:54
2月2日,自动驾驶领域的领军企业Waymo传来振奋人心的消息,宣布成功完成高达160亿美元的巨额融资,投后估值飙升至1260亿美元,这一数字不仅刷新了行业纪录,更彰显了资本市场对自动驾驶技术的狂热追捧。本轮融资阵容堪称豪华,由Dragoneer Investment Group、DST Global以及红杉资本联合领投,a16z、Mubadala Capit...
09:54
2026年2月2日,美国SpaceX公司宣布完成对人工智能企业xAI的收购,xAI同步确认已“加入SpaceX”。xAI由埃隆·马斯克于2023年7月创立,专注于开发Grok系列大模型及科学导向AI应用。此次整合旨在强化AI技术在航天研发、任务规划与宇宙科学研究中的协同能力。交易为同一体系内资源整合,不涉及外部资本或股权变更。目前xAI团队与技术将融入Sp...
09:53
2026年2月2日,树莓派官方正式宣布了一项重大价格调整策略,由于内存等核心元器件成本出现急剧上涨——部分型号的生产成本在短短三个月内实现了惊人的翻倍增长,公司不得不对旗下多款主流产品进行新一轮的涨价。此次调价主要针对2GB及以上内存配置的Raspberry Pi 4/5、CM4、CM5、500及500+等机型,具体涨幅如下:2GB版本上调10美元,4GB版...
09:53
2026年2月3日,微软Xbox官方在X平台发布暗示性帖文,预告一款神秘大作即将加入Xbox Game Pass(XGP)游戏库。帖文配图中疑似《阿凡达:潘多拉边境》的伊卡兰飞龙坐骑眼部特写,引发广泛推测。该游戏由育碧开发,2023年12月发售,已登陆Xbox Series X|S及PC平台。XGP版本预计于本月晚些时候上线,并覆盖主机与PC双端。作为开放...
09:53
2026年2月3日,贵州茅台官方电商平台“i茅台”正式发布了2026年1月的运营报告,一系列亮眼数据揭示了平台在春节消费旺季的强劲表现。当月平台月活跃用户数量高达1531.2万人,这一数字不仅体现了品牌影响力的持续扩大,更彰显了消费者对茅台产品的热烈追捧。在活跃用户中,有145.3万名用户完成了购买行为,累计成交订单数达到212.6万笔,这些关键指标均创下历...
09:53
2026年2月,初芯基金与青岛西海岸新区海控集团联合宣布完成对大连优美芯光电光源有限公司的战略性控股收购,标志着中国高端光电装备产业链迈入新阶段。优美芯光电作为大连地区光电领域的领军企业,长期专注于大功率紫外曝光灯等高端特种光源的研发与制造,其产品凭借卓越性能广泛应用于LCD、OLED等主流显示屏产线的核心制程环节。此次战略并购的核心目标在于显著增强国产高端...
09:53
2026年2月3日,智谱科技震撼发布并正式开源其全新GLM-OCR模型,为文档解析领域带来革命性突破。该模型参数量仅为0.9B,却展现出惊人的性能,凭借vLLM、SGLang和Ollama三大主流部署框架的全面兼容性,在OmniDocBench V1.5等权威文档解析基准测试中,以高达94.6分的卓越成绩登顶SOTA(State-of-the-Art)榜单。...