微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月13日

16:27
微新创想1月13日重磅消息,全球知名芯片制造商联发科正式官宣,将于1月15日召开备受瞩目天玑芯片新品发布会,届时将震撼推出两款旗舰级SoC——天玑8500与天玑9500s。其中,天玑9500s将成为REDMI Turbo 5 Max的首次搭载平台,标志着REDMI Turbo系列历史性地首次首发搭载天玑9系旗舰芯片,这一突破性合作备受行业期待。 据悉,天玑9...
16:25
2026年1月13日,苏科智能宣布完成B轮融资,由长沙领新基金投资。苏科智能是一家专注于公共安全领域的人工智能企业,依托万物互联技术,以智能化终端为载体,通过数据与知识驱动,提供安全管控与态势分析服务。本轮融资将用于技术研发、产品迭代及市场拓展,进一步提升其在公共安全智能化领域的竞争力。此次融资标志着资本市场对公共安全数字化升级方向的持续看好。
16:25
2026年1月13日,专注于临床决策支持领域的创新企业VieCure成功斩获4300万美元战略融资,标志着其在人工智能医疗领域的快速发展获得资本市场的广泛认可。本次融资由知名投资机构Mitch Rales与Northpond Ventures联合领投,Sator Grove Holdings、Durable Capital Partners以及Socium ...
16:25
2026年1月,备受瞩目的电池零配件领军企业长晟创新正式宣布成功斩获A+轮资本注入,总金额令人瞩目。此次投资由常州高新投、实力雄厚的伟驰投资以及行业新锐中瑞股份联合领投,展现了资本市场对该企业未来发展的坚定信心。 作为新能源产业链上的关键参与者,长晟创新始终专注于电池制造技术的创新与突破。其核心业务涵盖电池零配件的研发、生产及销售全链条服务,凭借卓越的技术实...
16:25
2026年1月,OpenAI宣布收购医疗技术服务商Torch。Torch致力于开发“统一医疗记忆”系统,旨在整合来自不同厂商和格式的患者健康数据。此次收购将有助于OpenAI在人工智能与医疗健康领域的深度融合,提升其在医疗数据处理与AI应用方面的能力。交易细节未披露。
16:25
2026年1月,弈安智能宣布完成天使轮融资,由宜宾人才基金投资。弈安智能专注于人工智能应用与物联网技术开发,本轮融资将用于技术研发和团队扩充。此次融资标志着该公司在AI与IoT领域的发展迈出关键一步。
16:25
2026年1月,亿咖通与吉利控股集团签署股份认购协议。吉利控股将通过定向配售,以每股1.67美元价格认购2729.7万股A类普通股,总投资额4560万美元。亿咖通为吉利战略投资的独立运营科技企业,专注汽车智能化与网联化,提供数字座舱、主动安全、自动驾驶传感器及车联网云平台等产品与服务。此次注资将强化其技术研发与业务拓展。
16:25
2026年1月13日,追觅正式进军具身智能领域,发布首款“折叠服务机器人”。该机器人采用四足轮腿结构,集成扫地功能与仿生双臂,可灵活移动并上下楼梯。它能完成家庭清洁、衣物叠放、物品递送及桌面整理等任务,并内置居家养老服务模块,支持24小时健康监测、跌倒预警与药品递送。此举标志着追觅在智能家居生态布局的进一步扩展。
16:25
2026年1月13日,TrendForce集邦咨询报告显示,全球8英寸晶圆代工市场供应趋紧。台积电、三星自2025年起缩减8英寸产能,转向12英寸产线,导致2025年全球8英寸产能下滑0.3%,2026年跌幅扩大至2.4%。与此同时,AI服务器与边缘AI带动电源IC需求增长,PC供应链也积极备货。部分晶圆厂已通知客户将代工价格上调5%~20%。预计2026...
16:25
2026年1月13日,鑫耀国际物流宣布成功完成500万元天使轮融资。该公司是一家专注全球海运拼箱进出口业务的综合物流服务商,已获中国交通部无船承运人资质,并注册于美国FMC。本轮融资将用于数字化平台升级、全球代理网络拓展及核心团队建设。公司在中国多个城市设有仓库与本地车队服务,业务覆盖海运拼箱、整箱、空运、中港运输、电商物流等。此次融资旨在提升全链路服务效...
16:23
百川智能今日举办Baichuan-M3模型发布媒体沟通会,创始人兼CEO王小川正式发布公司新一代开源医疗增强大语言模型Baichuan-M3。该模型在问诊能力、医疗幻觉控制、Healthbench和Healthbench Hard四项核心评测中均位列第一,性能超越OpenAI GPT-5.2,且在所有测试环节表现均优于人类医生。王小川在会上表示,2023年创...
16:23
AI Agent的能力边界正在被彻底打破。近日,前端开发平台Vercel正式推出Agent Browser——一款专为AI代理设计的浏览器自动化命令行工具(CLI),首次赋予大模型“不仅看得懂网页,还能亲手操作”的能力。这意味着,未来的AI将不再局限于分析与回答,而是能像人类一样点击、填写、提交甚至完成整套在线任务。零配置上手,开发者友好Agent Brow...