微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月19日

14:29
2026年伊始,爱奇艺便收获了一份令人惊喜的"开门红"——《罚罪2》上线后迅速在站内热度破万,跻身平台荣誉殿堂。作为一部时隔三年回归的续篇剧集,它仅用4天就重新将《罚罪》拉回云合热播榜前十,完美实现了跨越时间的热度接力。若将时间轴再向后延伸至2025年,爱奇艺在IP系列化运营上更是硕果累累,逐渐形成了一条清晰可见的成功轨迹。 《唐朝诡事录》系列连续三季引爆全...
14:29
2026年1月19日,智能穿戴与通讯产品研发领域的领军企业海创华芯正式宣布成功斩获1000万元天使轮融资,标志着其高速发展迈入新阶段。作为业内专注于创新科技产品的先行者,海创华芯不仅拥有强大的研发实力,更具备完善的生产与销售体系。公司斥资打造了占地1万平米的现代化自有生产基地,内设全自动SMT生产线和严格的无尘装配车间,确保产品从设计到交付的每一个环节都达到...
14:29
2026年1月19日,人工智能公司Listen Labs宣布完成6900万美元B轮融资。本轮融资由Evantic、红杉资本(Sequoia Capital)、Pear VC与Conviction Partners共同投资。Listen Labs专注于利用生成式大语言模型、自动化招募和智能文档工程技术,构建端到端的调研基础设施,可在数小时内完成传统机构需数周...
14:28
2026年1月19日,极算技术宣布完成天使轮融资,投资方为中银粤财。极算技术专注于人工智能、物联网和云计算等技术服务,本轮融资将用于技术研发和团队扩充。此次融资标志着资本市场对其技术方向和商业潜力的认可。
14:28
2025年保时捷全球销量为27.94万辆,同比下降10%,其中中国市场销量为4.19万辆,同比下滑26.28%。保时捷中国总裁潘励驰表示,销量回调是面对市场挑战的主动调整,旨在维护健康的供需关系与品牌价值体系。尽管短期承压,但Cayenne、Macan及Panamera等中国专属车型获得积极反馈,显示战略调整初见成效。保时捷正推进‘赢回中国’战略,聚焦产品...
14:28
2026年1月,备受瞩目的微电子领域新星——煜达微电子成功敲开了天使轮融资的大门,正式宣告其加速发展的新篇章。此次投资由实力雄厚的沈阳产研院领投,虽然具体金额尚未对外公布,但这一举动无疑为煜达微电子注入了强劲的发展动力。 作为一家专注于电子制造服务的高新技术企业,煜达微电子始终深耕微电子领域,致力于前沿技术的研发与创新生产。凭借其卓越的技术实力和前瞻性的市场...
14:28
2026年1月19日,领先的ESG软件解决方案提供商osapiens正式宣布成功完成总额高达1亿美元的C轮融资,此举标志着企业可持续发展领域迎来重要投资里程碑。由全球碳减排解决方案领军企业Decarbonization Partners担任本轮融资领投方,彰显了资本市场对osapiens创新解决方案的高度认可。 osapiens的核心产品——智能ESG合...
14:28
2026年1月19日,富锂盈新能源正式宣布成功完成天使轮融资,投资方为知名风险投资机构锡创投。作为一家专注于新能源与新材料研发的高科技企业,富锂盈新能源的核心业务聚焦于硅碳负极材料的创新研发。此次融资不仅为公司注入了强劲的资金支持,更将全面助力其在技术研发、团队建设以及产能扩张等多个关键领域实现跨越式发展。本轮融资的落地,标志着富锂盈新能源在高性能电池材料产...
14:09
根据权威科技媒体AIbase最新报道,Neuralink公司首位人类受试者诺兰·阿博近日公开分享了脑机接口技术的重大突破。他透露,其体内植入的Neuralink芯片已成功支持类似特斯拉汽车的OTA(Over-The-Air)无线升级模式。这一创新技术使得医疗团队能够通过云端平台远程优化设备固件,在无需进行二次手术的前提下,显著提升系统在信号处理和意念控制物体...
13:59
微新创想1月19日重磅发布,小米首款140W桌面充电站今日正式登陆小米商城、京东等主流电商平台,首发售价269元,并随赠1米6A 240W C to C高速数据线,为用户带来前所未有的充电体验。 这款充电站采用创新的8口合一设计,集成了2个USB-C、2个五孔AC、2个USB-A以及2个两孔AC接口,总承载功率高达2500W,满足多设备同时充电需求。US...
13:58
2026年1月19日,全球知名电脑外设品牌思民(Zalman)正式推出全新一代ZM-VS3 DS显卡支架,为游戏玩家和电脑爱好者带来更具科技感与实用性的桌面优化解决方案。这款创新产品不仅继承了传统显卡支架的稳固支撑功能,更在细节设计上实现了突破性升级,集成了多功能数显面板与ARGB灯效,为用户打造沉浸式的个性化桌面体验。 ZM-VS3 DS显卡支架最引人注目...
13:58
2026年1月16日,比格餐饮国际控股有限公司正式向香港交易所递交招股书,正式启动冲击港股IPO的征程,中银国际作为其独家保荐人全程保驾护航。这家以比格比萨闻名全国的餐饮巨头,自2002年在北京开设首店以来,凭借其独特的品牌魅力和优质的产品服务,迅速在全国范围内扩张,目前已拥有超过380家门店,稳居本土比萨品牌门店数量之首。根据最新财报显示,2025年前三季...