微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月02日

10:35
彭博社报道,苹果公司的人工智能(AI)研发团队正经历严重的人才流失。在当前激烈的全球 AI 人才争夺战中,苹果核心技术力量流向竞争对手的情况引发了业界对其研发稳定性的高度关注。核心研究力量外流本次被披露离职的四位关键 AI 研究员及其去向如下:Yinfei Yang:离职后计划投身 AI 创业领域。Haoxuan You:已加盟 Meta 的超级智能(Sup...
10:35
1月31日晚,国产大模型独角兽月之暗面(Moonshot AI)通过官方微博“Kimi智能助手”公开向百度“喊话”求助,直指百度搜索结果中存在严重的误导信息。月之暗面在博文中表示:“有人能帮忙at一下百度的同学吗?刚才试了试,前4个写着 Kimi 的网站都不是 Kimi。”该公司随后在评论区补充称,搜索结果中大量网站标题冠以“Kimi官网”字样,极易误导用户...
10:35
近日,智元机器人在成都成立了全新的子公司 —— 智元创新(成都)科技有限公司。这一举措标志着智元机器人在人工智能领域的扩张步伐进一步加快。根据企查查 APP 的信息显示,新公司的业务范围涵盖了多个重要的人工智能相关领域,包括人工智能公共数据平台、通用应用系统的开发、AI 硬件的销售以及基础资源与技术平台的建设等。智元创新(成都)科技有限公司由智元机器人的关联...
10:35
阶跃星辰(Stepfun)近日正式发布了其最新一代开源基座模型——Step3.5Flash。该模型专为智能体(Agent)场景打造,凭借强大的推理能力与极致的响应速度,旨在为开发者提供一个更聪明、更稳定且成本可控的“Agent 大脑”。作为一款针对性极强的轻量化模型,Step3.5Flash 在多个维度实现了突破:极致速度:推理速度最高可达350TPS(每秒...
10:35
 随着全球人工智能竞争进入白热化阶段,科技巨头苹果公司(Apple)正面临严峻的人才流失挑战。继此前失去一位 Siri 高管后,近几周内又有至少四位人工智能领域的资深研究员相继离职,转投 Meta 和谷歌旗下的 DeepMind 等主要竞争对手。据了解,最新离职的人员包括 Yinfei Yang、Haoxuan You、Bailin Wang 和 ...
10:35
近日,微软 Windows 总裁帕万・达武鲁里(Pavan Davuluri)公开承认,由于 Windows 11 的用户反馈持续走低,微软将不得不重新评估其人工智能(AI)战略方向。自 Windows 10 停止官方支持后,Windows 11 被寄予厚望,然而现实却令人失望——系统性能和可靠性问题频发,导致用户口碑急剧下滑。尤其是近期推出的几项 AI 功...
10:35
中国智能电动汽车领域迎来重大全球化突破。据小鹏汽车官方消息,被誉为“全球首款 AI 汽车”的 2026款小鹏 P7+ 已于近日正式开启海外大规模发运。这一举动不仅标志着该车型在全球市场的全面铺开,也展现了中国 AI 智驾技术加速输出海外的雄心。AI 算力“天花板”,定义智驾新标准作为小鹏汽车的年度力作,2026款 P7+ 在智能化硬件上实现了跨越式升级:顶尖...
10:22
2026年1月,北京全市二手房网签量达15082套,连续三个月站稳1.4万套关口。市场企稳态势进一步巩固,主要受入学季需求释放带动,部分区域购房者观望情绪减弱、加速入市,相关片区单月成交量稳定在60—70套。同时,在刚需主导区域,因高性价比房源减少,改善型房源成交占比回升。数据截至2026年2月2日。
10:22
2026年2月2日,深圳台铃科技有限公司正式向香港交易所递交首次公开发行(IPO)招股说明书。公司主营电动自行车、电动摩托车及电动三轮车,拥有六大研发生产基地,年产能超600万辆,产品销往全球70多个国家和地区。此次赴港上市旨在拓展融资渠道,强化研发与国际化布局。
10:22
2026年2月2日,MRO工业品电商平台锐锢商城正式向香港交易所递交上市招股书。公司自2015年成立以来,专注服务中国MRO工业品生产企业及中小流通企业,以信息技术和数字基建赋能行业流通效率提升。此次IPO旨在进一步强化平台技术能力与供应链服务能力,扩大市场覆盖。锐锢总部位于上海,业务遍及全国,尚未披露具体募资规模及发行时间表。
10:22
2026年1月底,湖南零河投资控股集团有限公司、湖南国垦投资有限公司及湖南达腾投资有限公司联合对生物技术推广服务商博益德完成战略投资。博益德总部位于湖南,专注共建生物饲料、生态养殖及健康畜产品产业生态圈。本轮融资将用于技术研发升级、产业链协同拓展及区域生态养殖示范项目建设。此次合作旨在强化中南地区绿色农业服务能力建设,推动畜禽养殖低碳化与标准化发展。
10:22
2月1日,小米创始人雷军在北京亦庄汽车实验室通过一场备受瞩目的直播,正式宣告新一代小米SU7已完成研发,并正式进入量产准备阶段。雷军透露,首批样车预计将在春节前,即2月28日前抵达线下门店,让消费者能够提前体验到这款备受期待的新车型。 作为小米自主研发的重要成果,小米SU7历经多年技术攻关,在智能驾驶、电驱系统以及车身结构等多个核心领域实现了全面升级。智...