微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年04月08日

11:00
微新创想:4月8日,小米科技有限责任公司向国家知识产权局申请注册多枚“XIAOMI YU7 GT”商标,涵盖运输工具、珠宝钟表等国际分类,目前处于等待实质审查阶段。此次商标申请表明小米正在积极布局多个潜在业务领域,显示出其在产品多元化方面的战略意图。 该公司成立于2010年3月,法定代表人为雷军,注册资本约14.8亿元人民币。作为中国知名的科技企业,小米一直...
11:00
微新创想:4月9日至10日,时空壶将在新加坡滨海湾金沙举办的GITEX Asia 2026展会首次亮相,展出全新W4 AI翻译耳机。这款耳机是时空壶在智能翻译设备领域的重要创新,旨在为用户提供更高效、更精准的多语言沟通体验。 W4 AI翻译耳机搭载了最新的Babel OS 2.0系统,该系统集成了先进的AI骨传导拾音技术与SOTA引擎选择器。通过直接捕捉声带...
11:00
微新创想:4月2日,梅特勒-托利多仪器(上海)有限公司在上海徐汇区桂平路厂区举行工业上楼项目奠基仪式。该项目由梅特勒-托利多投资建设,旨在升级研发与运营能力。通过引入先进的工业设计理念,该项目将打造集研发、生产、仓储于一体的现代化制造空间。 微新创想:建成后将推动绿色、精益、智能生产转型,并提升仓储物流效率与便捷性。这不仅有助于企业优化资源配置,还能显著降低...
11:00
微新创想:2026年4月,量子计算公司Q-Factor宣布完成2400万美元种子轮融资。本轮融资由TPY Capital与NFX联合领投,The Matias Family、Deep33、英特尔投资(Intel Capital)、KIP韩投伙伴及以色列创新署(Israel Innovation Authority)跟投。这标志着Q-Factor在量子计算领域...
10:59
微新创想:3月底,字节跳动全资子公司北京云岫长石科技有限公司以约33.05亿元竞得海淀区学院路街道双泉堡一宗科研用地。该地块总面积达4.89万平方米,规划建筑面积为12.8万平方米,容积率为2.62,用途为办公研发,出让年限为50年。项目要求在2027年3月31日前开工,并于2030年3月30日前完成竣工。 地块位于地铁15号线北沙滩站附近,交通便利。其周边...
10:59
微新创想:2026年4月8日,TechPowerUp报道,多伦多大学研究人员发现新型GPU侧通道攻击GPUBreach。该攻击利用英伟达GDDR6显卡驱动内存安全漏洞,在IOMMU启用状态下诱使内核级驱动执行越界写入,成功绕过IOMMU保护并提升至CPU端Root权限。 微新创想:传统DMA防护机制在此攻击面前失效,其危害程度显著高于以往Rowhammer变...
10:59
微新创想:2026年4月8日,韩国新世界集团与OpenAI签署合作备忘录,宣布在零售领域推进AI应用。合作以旗下超市品牌E-Mart为试点,基于ChatGPT技术构建覆盖搜索、选品、支付及配送的全流程AI电商系统。项目旨在2027年实现商业化落地,并逐步推广至新世界集团全业务体系。此举旨在提升消费者购物效率与体验,推动传统零售智能化升级。
10:59
2026年4月3日,名创优品依据2020年股份激励计划,向7名员工授予327,558份受限制股份单位,对应同等数量新发行股份。授出地点为中国广州(公司注册地),授出对象为公司雇员,旨在强化长期激励与人才保留。该授出须遵守股份激励计划及个人奖励协议所载条款与条件。此举系公司持续完善股权激励体系的常规安排。
10:59
微新创想:4月7日,明光瑞尔竞达科技股份有限公司披露招股意向书,正式启动发行;4月9日进行网上申购,拟在北京证券交易所上市,证券代码920191。本次发行总量4435万股,发行价7.71元/股,市盈率14.99倍,其中网上发行3991.5万股。公司主营高炉长寿技术及耐火材料研发生产,为国家级专精特新“小巨人”企业,拥有专利60项、参编国家标准2项。 微新...
10:59
微新创想:2026年4月8日,DXC Technology与ServiceNow宣布签署多年期合作协议。双方将基于ServiceNow核心业务套件,以DXC为Customer Zero,在其全球业务服务职能中率先部署代理式人工智能。 合作旨在加速企业核心运营现代化,提升运营智能性与韧性。DXC将整合自身转型经验与ServiceNow AI平台能力,向客户规模...
10:57
微新创想:在最新发布的 GLM-5.1中,这一开源模型展示了其卓越的智能水平,能够在长达8小时的任务中独立工作,完成复杂的工程项目。与之前仅能进行短时间交互的模型相比,GLM-5.1在代码能力和长程任务执行上都有显著提升。 微新创想:该模型在全球开源模型中表现出色,在多个代码评测基准上取得了优异成绩。在 SWE-Bench Pro 基准测试中,GLM-5.1...
10:57
微新创想:据报道被业内誉为“GPT-4o 之母”的OpenAI高管 Joanne Jang 在 X 平台正式发文宣布结束其在公司长达四年半的职业生涯。作为赋予ChatGPT“灵魂”的关键人物她的离去无疑为这家AI巨头的IPO之路蒙上了一层阴影 核心人物Joanne Jang —— 赋予AI情感的“灵魂工程师”Joanne Jang 在OpenAI长期负责核心...