微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年01月26日

10:37
声明:本文来自于微信公众号 光子星球,作者:吴先之,授权站长之家转载发布。过去一年,电商行业经历了诸多变化。国补政策调整、流量红利消退、新技术重构,种种迹象表明,过往流量驱动下的大水漫灌时代一去不复返,潮水正不断涌向新的滩头。作为全网体量最大的平台,淘宝天猫的动作,预示了新一年的风向。1月20日,2026淘宝天猫商家服务大会上披...
10:37
声明:本文来自于微信公众号 新熵,作者:辛夷,授权站长之家转载发布。1月20日,爱奇艺国际版正式发布2025年度内容热播榜,平台全年内容播放量同比增长114.5%,创下历史新高。在这份榜单中,融合中医文化的都市爱情剧《爱你》登顶华语剧集热播榜,创下国际版现偶大陆剧集历史新高;国漫《灵武大陆》与电影《哪吒之魔童降世》分别成为华语动...
10:37
当一件三年前购买的冲锋衣被用户寄回,破损的口子不仅意味着一段户外旅程的终结,更折射出品牌服务的深度思考。大多数商家可能会将此视为一笔需要核算的维修成本,但专业户外品牌拓路者却看到了不同的价值——这不仅是服务承诺的兑现,更是将一次性维修成本转化为消费者终身信任的宝贵机会。通过AI知识库精准匹配合适的面料批次,由经验丰富的老师傅进行修复,当衣服完好无损地回到用户...
10:36
声明:本文来自于微信公众号 定焦One,作者:金玙璠,授权站长之家转载发布。最近科技圈的两场“AI秀”先后刷屏。在大洋彼岸,当地时间1月12日,苹果和谷歌宣布合作,要给Siri用上谷歌的Gemini。但苹果的做法,不是直接让Gemini操作手机上的App,而是用户说什么,Siri先理解意图,然后去调用相应的应用。换句话说,AI只...
10:36
声明:本文源自微信公众号硅星人Pro,作者郭海惟,经站长之家授权转载发布。若将“00后”视为AI浪潮的原住民,Ancher创始人Vincent Wu显然并非最典型的AI创业者。这位历经美国媒体从报纸到网站再到移动客户端的三代变革的“老兵”,在以白人为主导的美国新闻业中,以同样“非典型”的亚洲面孔,成为极少数打入核心圈层的华人。他曾担任美国最大本地资讯平台Ne...
10:36
微新创想1月26日深度报道 在汽车销售领域,牟倩文凭借惊人的业绩一跃成为备受瞩目的焦点人物。这位来自山东的女性销售精英,在短短三年内成功售出532台保时捷汽车,这一骄人成绩不仅让她荣获"保时捷女销冠"的殊荣,更使其迅速在网络上声名鹊起,成为无数人津津乐道的销售传奇。 2024年1月,当"山东女销售一年卖出170辆保时捷"的话题冲上微博热搜时,一位名叫mol...
10:36
医疗人工智能领域再迎重磅消息。近日,专注于为医生开发AI软件的初创公司OpenEvidence成功完成2.5亿美元新一轮融资,本轮融资由知名投资机构Thrive Capital和DST Global联合领投,直接将公司估值推升至惊人的120亿美元。这一估值较去年2月首轮融资时暴涨10倍以上,彰显了市场对OpenEvidence的巨大认可。 OpenEvide...
10:36
在生成式AI的浪潮中,大语言模型(LLM)的红利正逐渐被巨头瓜分,而“AI教母”李飞飞早已敏锐地锁定并领跑在下一条黄金赛道上。根据彭博社的最新消息,由李飞飞创办的初创公司World Labs正在进行一轮估值高达50亿美元的新融资,计划筹集资金规模达5亿美元。这意味着,在短短一年的时间里,World Labs的身价从10亿美元直接翻了五倍。资本市场的这种“春季...
10:36
1月24日,新东方创始人俞敏洪在2026崇礼论坛上发表了关于人工智能与教育变革的深度见解。他直言不讳地指出,随着AI技术的持续升级,教育模式正经历从知识传递向情感陪伴的根本性转变。若以“未来老师”的标准衡量,目前中国一大半的中小学教师正面临“不合格”的风险。 AI冲击下的教育本质回归 俞敏洪回顾了教育从“黑板时代”到“AI时代”的三次变革。他指出,AI已经几...
10:36
长期以来,大众舆论普遍将ChatGPT在2022年11月的问世视为职场大环境转冷的“分水岭”。然而,一项由多家美国顶尖大学联合发布的最新研究却颠覆了这一认知。研究指出,对于那些最容易受AI影响的高科技职业(如计算机、数学等),其就业增长的停滞和失业风险的攀升,实际上早在ChatGPT发布前的数月就已显现。通过深度分析1060万份LinkedIn档案、300万...
10:06
人工智能技术的飞速发展正将职场中的"技术焦虑"转化为触手可及的数据。国际人力资源巨头Randstad最新发布的年度职场调查报告揭示了一个令人深思的现象:约27%的英国受访员工对五年内的职业前景感到忧虑,认为自身岗位存在被AI取代的潜在风险。这一数据凸显了当前职场生态正在经历的深刻变革。 调查特别指出,雇主与员工在AI认知上存在显著差异。尽管66%的英国雇主在...
10:06
1月26日,上海大模型独角兽企业**阶跃星辰(StepFun)**传来重磅消息,宣布成功完成超50亿元人民币的B+轮融资,这一数字不仅刷新了近期中国大模型赛道单笔融资的最高纪录,更彰显了资本市场对该领域的高度认可与持续看好。本轮融资阵容强大,上国投先导基金、国寿股权等多家知名国资及地方基金强势领投,腾讯、五源资本等老股东也纷纷加码投资,共同为阶跃星辰的快速发...