微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月11日

20:24
2026年2月11日,中国南方航空接收第九架国产C919飞机并正式投入运营,首航执飞广州至西安航线。该机将于春运期间每日执行长沙黄花机场至北京大兴机场2个往返航班,分别为CZ3717/CZ3718和CZ3147/CZ6137。截至当日,南航C919机队达9架。春运启动以来,南航C919已执行航班275班次,承运旅客超3.8万人次,客座率达86.3%。
20:24
2026年2月11日,爆料人Evan Blass公布联想moto Edge 70 Fusion官方海报。该机将于近期发布,提供乡村空气、冲浪蓝、运动绿、东方蓝和剪影五种潘通认证配色。手机采用曲面屏设计,后置三摄;搭载骁龙7s Gen 3处理器,最高12GB RAM+256GB存储,内置7000mAh电池,支持68W有线快充。具体上市时间与售价尚未公布。
20:24
2026年2月,保时捷在瑞典北部和德国偏远地区测试2028款Panamera。两辆伪装测试车均搭载新倾斜式格栅、更新Matrix LED灯组及纯电Macan同款安全辅助传感器。尾部采用新式尾灯与发光Porsche标识,后保险杠与排气结构优化。新车将升级数字座舱、车机系统及互联功能,并重新调校悬架以兼顾舒适性与操控性。此次改款延续其运动豪华轿车定位,预计20...
20:24
2026年2月11日,曜越正式发布新款49英寸曲面带鱼屏显示器TGM-V49CDQ。该显示器采用5120×1440分辨率、240Hz刷新率Fast VA面板,具备1ms GTG响应、400尼特亮度、95% DCI-P3色域及10-bit色彩。机身配备RGB氛围灯,支架支持升降/倾斜/旋转,并兼容VESA 100×100mm壁挂。接口包括2个HDMI 2.1...
20:24
2026年2月11日,复星集团控股的葡萄牙忠诚保险公司(Fidelidade)正推进首次公开募股(IPO),潜在估值逾30亿欧元。该计划由复星国际主导,拟在里斯本证券交易所上市,或引入战略投资者。此举旨在优化集团海外保险资产结构,提升资本效率。目前尚无明确上市时间表,相关尽职调查与监管审批正在进行中。
20:24
2026年2月11日,航旅纵横民航官方直销平台上线春运机票“买贵免费退”服务。旅客在该平台购买带“买贵退”标签的机票后,若出票24小时内发现同一航班有更低价格,可购新票并提交退旧票申请。服务覆盖国航、南航、东航三大航,后续将拓展至更多航司。此举旨在提升旅客购票保障与服务体验。
20:24
2026年2月10日,微软在“补丁星期二”更新中修复了Windows记事本应用的高危远程代码执行漏洞(CVE-2026-20841)。该漏洞影响Microsoft Store分发的新版记事本,尤其在处理恶意Markdown(.md)文件时,用户点击特制链接即可触发远程代码执行,导致系统被完全控制。漏洞成因是记事本对命令中特殊字符过滤不当,CVSS评分为8....
20:24
微新创想:2026年2月11日,游戏科学创始人冯骥就AI生成游戏能力发表评论。他在试用Seedance 2.0后指出,AIGC已结束童年时代,并调侃若AI真能轻松制作《黑神话:悟空》同级作品,团队或将转型为‘新时代非遗手工作坊’。 该回应发生于其个人社交平台,针对网友关于AI冲击高品质单机游戏开发的提问。冯骥强调,当前顶尖游戏仍高度依赖创意、审美与工程深度协...
20:24
微新创想:2026年2月11日,江钨装备(600397.SH)发布公告,计划向特定对象发行不超过2.97亿股A股,募集资金总额不超过18.82亿元。此次发行的目的是通过全资收购江西江钨硬质合金有限公司、赣州华茂钨材料有限公司以及九江有色金属冶炼有限公司,实现对相关企业100%股权的掌控。此举将有助于公司整合钨与钽铌产业链资源,进一步优化产业布局,提升整体竞争...
20:24
微新创想:2026年2月11日,一项国际研究取得重大突破,成功制备出一种能够特异性识别细菌表面伪胺酸分子的合成抗体。伪胺酸是一种独特的糖分子,仅存在于多种致病菌中,对于细菌的生存和致病能力具有关键作用。由于人体内并不存在该分子,因此这种合成抗体展现出极高的靶向性,同时大大降低了对非目标组织的潜在伤害。 微新创想:这项研究的成果为解决抗生素耐药性问题提供了全新...
20:24
微新创想:2月13日至14日,中东部地区迎来了一波显著的回暖,气温迅速上升,给人们带来了短暂的舒适体验。然而,这种温暖并未持续太久,随后一股强冷空气自北向南强势来袭,给我国大部分地区带来了明显的降温影响。 2月14日起至16日,冷空气持续南下,中东部大部地区的气温下降幅度在4~8℃之间。其中,内蒙古中部、江淮地区以及江南一带的部分区域降温更为剧烈,气温骤降幅...
20:24
微新创想:2026年2月11日,东方国信(300166.SZ)发布公告称,其内蒙古智算中心项目已部分建成并交付客户使用,其余建设仍在推进中。该项目当前收入占公司总营收比重较小,对当期业绩无重大影响。 微新创想:收入贡献后续取决于剩余工程交付进度及客户设备上架节奏,存在不确定性。公司提示投资者注意相关投资风险。