微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月16日

19:56
2026年1月16日,分析师上调ASML和ASM太平洋目标价。美国银行分析师Didier Scemama指出,因台积电今年资本支出超预期,半导体设备供应商阿斯麦(ASML)和ASM太平洋将直接受益。受此利好推动,该分析师将ASML目标价从1205欧元上调至1373欧元,ASM太平洋目标价由658欧元升至777欧元。此次调整反映台积电扩产对上游设备厂商的积极...
19:26
1月16日,上纬新材公告称,董事长彭志辉未参与公司研发工作。彭志辉作为外部董事,职责限于战略决策与监督,不担任高管职务,不介入具体研发事务。公司研发由联席CEO兼CTO周斌全权负责,团队直接向其汇报。彭志辉仅履行对外沟通职责,研发与宣传职能分离。公司称该安排符合治理规范,后续将审慎处理其对外活动,避免身份误读,确保治理独立性。
19:26
2026年1月16日,中国市场监管总局正式发布《直播电商经营者落实食品安全主体责任监督管理规定》,这一具有里程碑意义的法规将于2026年3月20日起正式施行。该规定标志着我国对直播电商食品安全监管迈入全新阶段,首次将直播电商平台、直播间运营者、营销人员及服务机构等全链条主体纳入统一监管体系。 此次新规的核心亮点在于构建了全方位的食品安全监管机制。根据规定,各...
19:26
2026年全球半导体行业收入预计首次突破1万亿美元,同比增长30.7%。这一增长主要由人工智能市场需求驱动,其中存储IC受益最为显著,市场规模预计增长约90%。计算与数据存储领域将成为主力,同比增幅达41.4%,规模超5000亿美元。消费电子和无线应用领域也将为整体增长作出贡献。分析指出,AI技术的快速发展是推动半导体产业跃升的核心因素。
19:26
NACON宣布《无限试驾:太阳王冠》在Steam平台开启免费试玩活动,玩家可于北京时间1月20日凌晨2点前免费体验。游戏以1:1比例复刻香港岛,支持多人在线竞速与社交互动,需强制联网并注册账号。目前Steam国区售价55.2元(4折),好评率37%,玩家主要批评优化差和强制联网机制。
18:56
2026年1月15日,OpenAI向投资者发信警告称,埃隆·马斯克将在双方诉讼案期间发表“刻意离谱、博人眼球的言论”。该案定于今年4月开审,起因是马斯克指控OpenAI背离初心,从非营利转向盈利,并与微软合作,其间存在“欺骗”行为。马斯克于2015年参与创立OpenAI,2018年因与萨姆·奥尔特曼意见不合退出。OpenAI在信中表示对胜诉有信心,认为案件...
18:56
2026年1月16日,誉研堂中医正式向港交所递交招股书。该机构是一家以中医为核心的健康管理机构,致力于提供中医药健康服务。此次申请上市,旨在通过资本市场进一步拓展业务布局,提升品牌影响力与服务能力。具体融资金额及发行细节尚未披露。
18:56
2026年1月16日,智能对讲产品与解决方案提供商睿云联向港交所递交招股书,拟在主板上市。该公司专注于人工智能、SIP、Android、云计算及安全技术的研发与应用,致力于通过技术创新提升沟通效率、安全性和生活便利性。此次上市募集资金将用于技术研发、市场拓展及业务升级。睿云联持续推动智能对讲行业变革,提供覆盖多场景的智能化解决方案,服务领域包括智慧社区、智...
18:55
2026年1月16日,AI初创公司Symbolic.ai宣布完成种子轮融资,新闻集团(News Corp)参与投资。该公司开发的AI平台可辅助生成高质量新闻内容,并在复杂研究任务中实现高达90%的效率提升。此次融资将加速其技术迭代与市场拓展,进一步推动AI在新闻生产领域的应用。
18:55
2026年1月16日,由中国航天科技集团商业火箭有限公司抓总研制的长征十二号乙运载火箭,在东风商业航天创新试验区完成静态点火试验,取得圆满成功。本次试验全面模拟真实发射流程,验证了加注、控制时序等关键环节,箭上系统工作稳定,参数正常。CZ-12B为新一代四米级可重复使用火箭,采用液氧煤油动力,具备20吨级近地轨道运力。试验工位由该公司自主建设,支持多型推进...
18:25
2026年1月16日,微软确认部分Win11 23H2设备在安装KB5073455更新后出现无法正常关机问题。该问题影响启用系统防护安全启动(SMM)的Windows 11 Enterprise和Windows IoT系统,设备可能无法关机或休眠,转而自动重启。系统防护安全启动旨在防御固件级攻击和恶意软件。微软已提供临时解决方案,用户可通过命令提示符执行“...
18:25
2026年1月16日,Rich Sparkle正式宣布成功完成对全球知名创作者运营商Step Distinctive的全面收购。Step Distinctive作为网红IP商业化和电商直播领域的领军企业,长期致力于为全球年轻消费市场提供全方位服务,其业务范围涵盖内容创作、账号矩阵管理、品牌合作及供应链整合等多个关键环节。此次战略收购不仅标志着Rich Spa...