微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月17日

12:58
微新创想:2026年2月17日凌晨,中科院广州健康院等单位联合团队在《细胞》期刊发表重要研究成果。他们成功解析了小鼠胚胎8个核心器官中血管内皮细胞的全阶段基因表达数据,构建了一个覆盖26个时间点的内皮细胞发育谱系图。这项研究揭示了血管内皮细胞在胚胎发育过程中的动态变化,为理解器官形成和血管系统发育提供了全新的视角。 微新创想:研究团队发现,在孕中期阶段,血管...
12:58
微新创想:2026年2月10日至2月17日(除夕至元宵节前)期间 豆包APP与中央广播电视总台春晚携手推出了一系列精彩的新春互动活动 为全国用户带来了前所未有的节日体验 活动期间 豆包APP向广大用户发放了超过10万份科技好礼和现金红包 用户参与热情高涨 生成了5000万张个性化新春头像和1亿条祝福语 AI技术的广泛应用使整体互动量达到了惊人的19亿次 这不...
12:39
微新创想:2026年2月16日除夕,阿里巴巴正式开源全新一代大模型千问Qwen3.5-Plus。该模型在性能上实现了重大突破,其表现堪比Gemini3Pro,成功登顶全球最强开源大模型的榜单。 Qwen3.5-Plus在底层架构上进行了全面革新,显著提升了计算效率和模型表现。该模型总参数量达到3970亿,但激活参数仅需170亿,相较于前几代产品,实现了以更小...
12:39
微新创想:2026年除夕,总台春晚迎来历史上首次由AI驱动的全民实时创作互动,字节跳动旗下豆包成为核心载体,当日AI互动总数高达19亿次。这一突破性的尝试不仅展现了人工智能在娱乐领域的强大潜力,也标志着传统节日与现代科技的深度融合。 其中“豆包过年”活动表现亮眼,助力用户生成超5000万张新春主题头像与1亿条新春祝福,AI图片生成、拜年祝福等玩法成为民众欢度...
12:39
微新创想:健康是福,健康的事问问阿福 2月16日的马年央视春晚舞台上,“蚂蚁阿福”出现在小品《血压计》中 成为又一个登上春晚舞台的科技品牌 2月10日 蚂蚁阿福官宣成为央视CCTV健康生活合作伙伴 随即在除夕夜亮相央视春晚舞台 这个春节 返乡青年教家人用阿福管理健康成为新趋势 拉动蚂蚁阿福App下载量持续提升 推动其在除夕前 连续三天登顶App Store应...
12:21
微新创想:2026年2月,北京砹尔法纽克莱科技有限公司宣布完成数千万人民币A+轮融资,由海创汇、方正多策、源创多盈及沿海基金共同投资。此次融资标志着公司在核素药研发领域迈出了重要一步,进一步巩固了其在行业内的领先地位。 微新创想:该公司专注诊疗一体化核素药研发,以阿尔法核素生产与标记技术为核心,致力于为多种癌症提供精准的诊断与治疗方案。目前,公司聚焦肝癌、肺...
12:21
微新创想:2026年2月,电动出行产品研发商派电科技宣布完成数亿元人民币战略融资,由邛崃轻电领投。此次融资标志着公司在智能电动出行领域迈出了重要一步,进一步巩固了其在行业内的领先地位。 公司总部位于中国,专注于智能电动出行产品的研发与创新,同时致力于OMO智慧出行场景的构建。通过技术与场景的深度融合,派电科技不断推动电动出行方式的智能化与便捷化,引领行业发展...
12:21
微新创想:2026年2月17日 网友在社交平台上晒出《流浪地球3》万达影城春节档独家贴片预告 引起广泛关注 该预告片中 沈腾饰演的角色身着制服 持枪戴镜 在标有“171A”的场景中 因突发强光惊恐倒地 的画面极具冲击力 影片相关负责人已确认 这一片段为真实物料 并非剪辑或合成内容 该预告片由万达电影官方发布 同时也得到了《流浪地球》系列电影制作团队的认可 《...
12:21
微新创想:2026年2月17日,宇树科技创始人王兴兴在公开采访中透露,公司今年人形机器人目标出货量为1至2万台。这一数据表明宇树科技在人形机器人领域正加速推进商业化进程。 其参演的G1与H2机型首次展示全自主集群控制技术,实现全球首例集群快速跑位,最高速度达4m/s。这项技术的突破标志着人形机器人在多机协作与智能调度方面迈出了重要一步。 王兴兴预计全球人形机...
12:21
微新创想:近日网络上兴起一个新梗AI;DR,用来标记低质量的AI生成内容,提醒他人无需浪费时间阅读。这个词汇源自传统的TL;DR(太长不看),现在被广泛应用于Threads、Bluesky等社交平台。随着2025年《韦氏词典》年度词“slop”(烂货)的公布,可以看出公众对于AI内容泛滥的不满情绪正在加剧,AI;DR也因此迅速走红。 微新创想:AI;DR的流...
12:09
微新创想:新年第一天苹果CEO库克发布拜年视频 马年快乐Happy Year of the Horse 苹果CEO库克在新年第一天通过视频向全球用户送上祝福,用“马年大吉”点燃了网友的热情。视频发布后,社交媒体上迅速掀起热议,许多用户纷纷留言表达对苹果的祝福与期待。库克的拜年视频不仅传递了节日气氛,也为即将到来的苹果新品发布会增添了更多关注。 除夕当天苹果公...
12:09
微新创想:特斯拉在奥斯汀推出的Robotaxi无人出租车服务自八个月前启动以来,其运营数据尚未达到马斯克此前的承诺。根据最新报告,该服务在奥斯汀地区的可用率仅为19%。这意味着在大部分时间里,车辆无法正常提供服务,影响了用户体验和实际应用效果。 马斯克曾公开表示,计划在2025年底前向奥斯汀投放500辆Robotaxi。然而,据Robotaxi Tracke...