微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年03月26日

22:51
微新创想:2026年3月24日,欧洲核子研究中心(CERN)在瑞士日内瓦总部园区内成功完成了首次反质子卡车运输试验。此次试验标志着反物质运输技术迈出了重要一步,为未来的跨机构研究奠定了基础。 本次运输所采用的系统是CERN自主研发的BASE-STEP彭宁离子阱系统。该系统重量仅为一吨,却能够稳定地束缚多达92个反质子。这一突破性的技术成果,为实现反物质的高效...
22:51
微新创想:智己汽车于3月26日晚正式开启全新中大型增程SUV LS8的预售活动。此次共推出四款车型,权益价格区间为25.98万至30.98万元。LS8基于800伏超快充平台打造,不仅在动力系统上实现了突破,更在续航能力上表现出色。 新车提供五座与六座两种布局,满足不同家庭用户的多样化需求。搭载的1.5T“恒星”增程系统,为车辆带来了高效能的能源解决方案。其中...
22:51
微新创想:3月26日22时19分,日本本州岛附近海域发生6.2级左右地震。地震的震中坐标为北纬39.81度、东经141.96度,位于太平洋近海区域。根据初步测定,震中距离陆地大约数十公里。目前尚未收到有关人员伤亡的报告,也未发布海啸预警。 此次地震属于中强震级别,震感较为明显。当地部分居民和建筑物在地震发生后感受到了震动,但未造成严重的破坏。地震发生后,中国...
22:51
微新创想:3月26日晚,美团在2025年第四季度及全年业绩电话会上表示,2026年第一季度餐饮外卖业务单均亏损环比优化幅度将好于2025年第四季度。此前,2025年Q4核心本地商业经营亏损为100亿元,较Q3显著收窄。公司指出,减亏趋势主要得益于运营效率提升与单量稳健增长。 该预期基于当前订单结构优化、骑手调度改善及补贴策略精细化调整。美团在优化运营效率方面...
22:51
微新创想:3月26日,紫光股份在互动平台披露,其推出H3C UniPoD S80000超节点产品。该产品采用液冷高密部署方案,单机柜可支持64张AI加速卡,较传统8卡服务器显著提升卡间互联带宽与单卡推理效率。 产品以算力芯片多元化、互联协议标准化、基础设施集成化为设计核心,柜内实现全互联通信,并兼容下一代高性能AI加速卡。此举旨在满足大模型训练与推理对高密度...
22:51
微新创想:2026年3月26日,奔驰全新小尺寸G级(代号“小G”)实车影像由海外媒体曝光。该车基于全新平台打造,车身长约4.4米,较标准G级缩短约30厘米,定位城市友好型硬派越野。 外观延续方正造型与外扩轮拱,尾部采用储物箱设计替代外挂备胎。整体设计风格保持了G级经典的硬派气质,同时在细节上进行了优化,使其更适应城市驾驶环境。 当前测试车为纯电版本,后续将提...
22:51
微新创想:2026年3月26日,美国抵押贷款公司Better Home & Finance与Coinbase推出创新产品,允许借款人以比特币或USDC稳定币为抵押,申请专项首付贷款。该贷款符合房利美(FNMA)标准,适用于常规住房按揭流程。 此举使购房者无需出售数字资产即可满足首付要求,提升流动性与资产效率。通过将加密货币纳入抵押范畴,借款人能够更灵...
22:51
微新创想:2026年3月26日,中国信息通信研究院联合40余家单位正式发布了具身智能行业标准。这一标准的出台标志着具身智能领域迈入规范化发展阶段,为相关技术的推广与应用提供了重要依据。 该标准构建了统一的基准测试框架,明确了系统架构与能力要求。它不仅涵盖了仿真与真实环境下的基础能力,还涉及认知推理等关键环节,为具身智能系统的评估提供了全面的指标体系。 标准内...
22:51
微新创想:中国国航于3月26日发布了2025年年度报告 中国国航(601111.SH)公布了其2025年的财务表现 公司全年营业收入达到1714.85亿元同比增长了2.87% 然而归属于母公司所有者的净亏损扩大至17.70亿元同比加深 亏损扩大的原因包括国际航线恢复速度低于预期航油成本持续攀升以及汇兑损失增加等多重因素 面对当前的市场环境中国国航表示将采取一...
22:51
微新创想:3月24日,日本电装向罗姆提交了收购提案。然而,截至3月26日,罗姆已开始推进替代方案,并启动了与三菱电机、东芝就三方功率半导体业务合并的谈判。这一举措旨在通过资源整合提升全球竞争力。 当前全球功率半导体市场中,英飞凌位居榜首,三菱电机排名第四,而罗姆与东芝则均处于前十左右的位置。如果此次合并能够成功,新成立的实体将成为全球第二大的功率半导体企业,...
22:51
微新创想:2026年3月25日,英特尔发布了面向Windows平台的Q1.26版本锐炫Arc Pro专业显卡驱动(v32.0.101.8515) 此次更新的驱动支持Arc Pro B70和B65独立显卡,同时也兼容部分搭载酷睿Ultra处理器的设备所集成的B390和B570核显 驱动版本带来了多项重要改进,其中统一内存分配上限从原来的87%提升至93...
22:51
微新创想:3月26日晚,零跑汽车正式发布智能精品长续航SUV A10,售价区间为6.58万–8.68万元。这款新车的推出标志着零跑在智能电动领域进一步拓展产品矩阵,为消费者提供更多选择。零跑创始人朱江明在发布会后的群访中表示,当前国内有17家新能源汽车企业,但市场容量有限,无法支撑所有企业持续生存。他强调,如果零跑要保持每年举办发布会的节奏,就必须付出更多努...