微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月22日

07:05
微新创想:2026年2月22日,OpenAI CEO萨姆·奥尔特曼在印度新德里举行的AI峰会上回应了关于AI环保问题的质疑。他明确否认了‘ChatGPT单次提问耗水17加仑’等说法,指出这些数据并不准确。奥尔特曼强调,当前的数据中心已经不再使用蒸发冷却技术,因此相关数据‘完全不符合事实’。 微新创想:面对全球AI总能耗上升的现实,奥尔特曼承认这是合理的关注点...
00:54
微新创想:2026年2月21日(春节假期第七天),广东省4A级及以上景区共接待游客361.1万人次,同比增长4.0%。这一数据表明,随着假期的推进,游客数量稳步上升,显示出文旅市场在节假日期间的强劲复苏态势。 同期,古驿道沿线重点区域接待游客78.8万人次,同比增长2.2%。红色旅游经典景区接待游客21.0万人次,同比增长5.0%。乡村旅游点接待游客52.4...
00:54
微新创想:2月22日中午前后,受西北地区沙尘气团东移影响,上海将出现短时中度及以上空气污染,首要污染物为PM10。此次沙尘天气自22日凌晨开始影响长三角地区,随着空气流动的变化,预计在23日中午前后,随着东北风逐渐转起,污染状况将有所缓解,空气质量有望恢复优良。市民在污染天气期间应尽量减少不必要的外出,尤其是对空气质量敏感的特殊人群,如儿童、老人及患有呼吸系...
00:54
微新创想:2026年全球净乙烯产能新增达到1460万吨 创下年度新高 2026年全球乙烯产能的新增量达到1460万吨 这一数字是过去五年平均值的两倍 彭博新能源财经(BNEF)于2026年2月21日发布的数据显示 乙烯产能的扩张速度显著加快 新增产能主要集中在中国 中国贡献了全球新增乙烯产能的56% 中国成为全球乙烯产能扩张的主要力量 此次产能扩张主要得益于...

2026年02月21日

23:45
微新创想:2026年2月,美国多地农村农民拒绝科技公司数千万美元的收购要约,以保护世代耕作的土地。这一举动引发了广泛关注,反映出农民对土地价值与未来发展的深刻思考。 肯塔基州一位82岁的农妇艾达·赫德尔森,毅然决然地拒绝了一家科技公司提出的3300万美元收购合同。她的决定不仅代表了个人立场,更象征着许多农民的共同心声。 在宾夕法尼亚州和威斯康星州等地,也出现...
23:03
微新创想:2026年2月20日,清华大学戴琼海院士与蔡峥副教授团队在《科学》杂志优先发表成果,提出了一种名为‘星衍’(ASTERIS)的时空自监督计算成像模型。这一突破性研究解决了在极低信噪比条件下光子高保真重构的难题,显著提升了观测的精度和可靠性。 微新创想:该模型通过创新性的‘分时中位、全时平均’策略,有效平衡了探测的完备性与准确性。这一方法不仅优化了数...
22:30
微新创想:2021年至2023年期间 哥伦比亚大学Karen I. Perez团队利用美国绿湾射电望远镜对银河系中心最内侧1.4角分区域进行了迄今为止最灵敏的脉冲星搜寻工作 观测累计时间超过20小时 研究过程中 他们发现了潜在的脉冲星候选体 这颗天体具有8.19毫秒的自转周期 每秒可旋转122次 因此被暂时命名为“突破聆听脉冲星” 如果该天体最终被确认为真实...
22:30
微新创想:2026年2月21日,智谱发布致歉信,承认在GLM Coding Plan上线过程中存在三大问题。这些问题主要包括规则透明度不足、GLM-5灰度节奏过慢以及老用户升级机制不够精细。由于GLM-5的参数规模是GLM-4.7的两倍,因此采用了分层消耗策略,即在高峰期消耗速度为3倍,非高峰期为2倍。然而,这一策略并未提前清晰告知用户,导致部分用户在使用过...
22:29
微新创想:春节假期进入尾声,不少人已经踏上了返程,准备开启新一年的工作模式。但在返岗上班之前,返程高速堵车则又是不得不经历的一难。多位网友发布的视频显示,大年初四、初五就开车返程,仍被堵在了高速上。多段高速公路变成了大型停车场,车辆停在路上几乎一动不动,夜间亮起的刹车灯,更是把高速路变成了鸳鸯锅。 网友调侃称,第一批返程的人已经堵上了,马上就会和第二批返程的...
22:29
微新创想:荣耀Magic V6的配置已经确认,通过曝光的关于手机页面截图来看,该机将搭载第五代骁龙8至尊版,是目前安卓最强处理器。这一芯片的加入,为手机带来更强大的性能表现,无论是日常使用还是高强度任务都能轻松应对。 最大的亮点是电池配置,将配备7150mAh青海湖刀片电池,刷新折叠屏手机的容量极限。相比前代产品,这一升级显著提升了续航能力,让用户在使用过程...
22:29
微新创想:今天是农历正月初五,9天超长春节假期已进入倒计时,随着复工日益临近,不少民众开始出现精神涣散、焦虑失眠、肠胃不适等症状。专家提醒,这是典型的节后综合征表现,并非疾病,通过作息、饮食、心理三方面科学调整,即可平稳切换至工作模式。 本次春节假期自2月15日持续至2月23日,是近年来最长的一次连休。专家指出,假期越长,生物钟与生活节奏被打乱的程度越严重,...
22:29
微新创想 小米旗下两块新电池正在试产中 其中一块额定7850mAh 典型值8000mAh 这块8000mAh电池将会用在小米17 Max上 成为小米手机最大电池机型 小米17 Max机型将在上半年发布 预计5月左右登场 该机与此前的小米17 Pro Max有很大不同 取消了比较出圈的背屏设计 用节省下来的空间堆更大的电池容量 预计依然维持100W有线快充...