微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年04月08日

18:45
微新创想:2026年4月8日,新能源储能科技企业思格新能源宣布启动全球发售。公司拟发行1357.39万股股份,其中国际发售1221.65万股,香港公开发售135.74万股,并附203.60万股超额配股权。 此次全球发售吸引了多家知名机构投资者的参与。Aranda Investments、陆家嘴集团(通过国泰君安香港场外掉期)、UBS资管、高盛资管及CPE能源...
18:45
微新创想:4月8日,腾讯控股有限公司在香港市场以10亿港元回购200万股公司股份。此次回购于当日完成,均价约500港元/股,系公司持续推行的股份回购计划一部分。 回购资金来源于公司自有资金,旨在优化资本结构并增强股东信心。腾讯表示,该举措体现了公司对自身业务前景的坚定信心以及对长期价值的重视。 此次股份回购不仅有助于提升公司股票的市场价值,还可能对投...
18:45
微新创想:2026年4月,泽璟制药(688266.SH)获国家药监局批准,开展注射用ZG006联合HS-20093、或加阿得贝利单抗治疗广泛期小细胞肺癌的临床试验。此次批准标志着公司在肿瘤免疫治疗领域迈出重要一步。 ZG006为该公司自主研发的全球首个靶向DLL3的三特异性抗体。该药物通过独特的结构设计,能够同时结合三种不同的靶点,展现出更广泛的治疗潜力。这...
18:45
微新创想:2026年4月,高盛发布研究报告,将潍柴动力2026至2030年的每股盈利预测上调1%至4%。这一调整主要源于AI数据中心发电业务的增长超出市场预期。 高盛在报告中指出,潍柴动力在AI数据中心发电领域的表现尤为亮眼。随着人工智能技术的快速发展,数据中心的能耗需求持续上升,而潍柴动力凭借其在发电设备方面的技术积累和市场布局,成功抓住了这一机遇。 根据...
18:45
微新创想:2026年4月,数据挖掘者Gabe Follower在解包最新Steam客户端更新文件时发现,Valve正在开发名为SteamGPT的AI工具。这一发现引发了广泛的关注和讨论,因为SteamGPT的出现意味着Valve在游戏服务领域迈出了重要的一步。 SteamGPT的用途主要集中在自动化处理玩家工单方面。它将被用于处理诸如作弊举报、启动故障以及退...
18:45
微新创想:2026年4月,里昂证券发布研报,因金山软件(03888.HK)游戏业务疲软及估值调整,将其目标价由35.5港元下调至29.1港元,维持“跑赢大市”评级。研报指出,金山软件去年第四季收入符合预期,但游戏收入同比出现大幅下滑,降幅达33%。与此同时,办公室软件业务表现相对稳健,收入同比增长17%。 根据里昂证券的预测,2026年金山软件的游戏业务...
18:45
微新创想:2026年4月8日,微星在海外市场推出第二代MAG Infinite S AI游戏PC整机。这款新品延续了前代产品的高性能定位,同时在智能化和扩展性方面进行了全面升级。 该机最高搭载英特尔酷睿Ultra 7 265处理器与英伟达RTX 5070 Ti显卡,为玩家带来更强大的计算能力和图形处理性能。配合DLSS 4.5及动态多帧生成技术,能够显著提升...
18:45
微新创想:2026年4月,中科可蓝完成新一轮融资,杭州开到等新锐投资机构参投。此次融资标志着公司在绿色材料领域迈出了重要一步,进一步巩固了其在环保科技行业的领先地位。 微新创想:该公司专注研发全自然域降解塑料PDA(Polyesters Bio-Degradable in All Nature Environment),该材料可在土壤、海水、淡水等多种自然环...
18:15
微新创想:4月8日,盒马旗下茶饮品牌盒补补宣布,今年将拓展黄茶、西安茯茶、广西六宝茶等小众及地方特色茶产品。此举延续其去年春茶试水策略——2025年上线头采明前龙井,带动绿茶品类在4—6月同比增长近10倍。这一策略不仅丰富了产品线,也进一步提升了品牌在茶饮市场的竞争力。 西安、北京、成都成为江浙沪外三大茶叶消费高地。随着消费者对茶叶品质和文化内涵的关注度不断...
18:15
微新创想:4月8日,淘宝直播在十周年盛典上正式推出主播AI产品“直播助手”。该工具覆盖设备诊断、商机洞察、选品组货、手卡生成、播中商品与评论管理及复盘分析等全流程。 直播助手的推出标志着淘宝直播在智能化转型方面迈出了重要一步。通过AI技术的深度应用,主播在直播前的筹备时间从原本的1到3天大幅缩短至仅需约1小时。这一效率的飞跃不仅降低了直播的准备门槛,也为...
18:15
微新创想:4月8日,海正药业发布2025年年度报告。公司全年实现营业收入105.5亿元,同比增长2.03%;扣除非经常性损益后净利润5.86亿元,同比增长36.11%。这一显著的净利润增长表明公司在成本控制和效率提升方面取得了实质性进展。 研发方面投入4.79亿元,同比增长33.79%。公司通过自主创新与外部合作双轮驱动,不断提升研发能力。这种多元化的研发策...
18:15
微新创想:4月28日,上海美术电影制片厂首部宣纸手绘动画长片《燃比娃》将通过全国艺术电影放映联盟(艺联)专线上映。影片改编自羌族传说《燃比娃盗火》,讲述猴形少年燃比娃与伙伴狗狗赴神山追寻“温暖”秘密的成长冒险。 影片以独特的东方艺术风格为特色,将传统非遗技艺与现代动画技术相结合。全片手绘宣纸画稿超过5万张,展现了极高的艺术水准和制作诚意。通过创新融合多种非遗...