微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月21日

23:45
微新创想:2026年2月,美国多地农村农民拒绝科技公司数千万美元的收购要约,以保护世代耕作的土地。这一举动引发了广泛关注,反映出农民对土地价值与未来发展的深刻思考。 肯塔基州一位82岁的农妇艾达·赫德尔森,毅然决然地拒绝了一家科技公司提出的3300万美元收购合同。她的决定不仅代表了个人立场,更象征着许多农民的共同心声。 在宾夕法尼亚州和威斯康星州等地,也出现...
23:03
微新创想:2026年2月20日,清华大学戴琼海院士与蔡峥副教授团队在《科学》杂志优先发表成果,提出了一种名为‘星衍’(ASTERIS)的时空自监督计算成像模型。这一突破性研究解决了在极低信噪比条件下光子高保真重构的难题,显著提升了观测的精度和可靠性。 微新创想:该模型通过创新性的‘分时中位、全时平均’策略,有效平衡了探测的完备性与准确性。这一方法不仅优化了数...
22:30
微新创想:2021年至2023年期间 哥伦比亚大学Karen I. Perez团队利用美国绿湾射电望远镜对银河系中心最内侧1.4角分区域进行了迄今为止最灵敏的脉冲星搜寻工作 观测累计时间超过20小时 研究过程中 他们发现了潜在的脉冲星候选体 这颗天体具有8.19毫秒的自转周期 每秒可旋转122次 因此被暂时命名为“突破聆听脉冲星” 如果该天体最终被确认为真实...
22:30
微新创想:2026年2月21日,智谱发布致歉信,承认在GLM Coding Plan上线过程中存在三大问题。这些问题主要包括规则透明度不足、GLM-5灰度节奏过慢以及老用户升级机制不够精细。由于GLM-5的参数规模是GLM-4.7的两倍,因此采用了分层消耗策略,即在高峰期消耗速度为3倍,非高峰期为2倍。然而,这一策略并未提前清晰告知用户,导致部分用户在使用过...
22:29
微新创想:春节假期进入尾声,不少人已经踏上了返程,准备开启新一年的工作模式。但在返岗上班之前,返程高速堵车则又是不得不经历的一难。多位网友发布的视频显示,大年初四、初五就开车返程,仍被堵在了高速上。多段高速公路变成了大型停车场,车辆停在路上几乎一动不动,夜间亮起的刹车灯,更是把高速路变成了鸳鸯锅。 网友调侃称,第一批返程的人已经堵上了,马上就会和第二批返程的...
22:29
微新创想:荣耀Magic V6的配置已经确认,通过曝光的关于手机页面截图来看,该机将搭载第五代骁龙8至尊版,是目前安卓最强处理器。这一芯片的加入,为手机带来更强大的性能表现,无论是日常使用还是高强度任务都能轻松应对。 最大的亮点是电池配置,将配备7150mAh青海湖刀片电池,刷新折叠屏手机的容量极限。相比前代产品,这一升级显著提升了续航能力,让用户在使用过程...
22:29
微新创想:今天是农历正月初五,9天超长春节假期已进入倒计时,随着复工日益临近,不少民众开始出现精神涣散、焦虑失眠、肠胃不适等症状。专家提醒,这是典型的节后综合征表现,并非疾病,通过作息、饮食、心理三方面科学调整,即可平稳切换至工作模式。 本次春节假期自2月15日持续至2月23日,是近年来最长的一次连休。专家指出,假期越长,生物钟与生活节奏被打乱的程度越严重,...
22:29
微新创想 小米旗下两块新电池正在试产中 其中一块额定7850mAh 典型值8000mAh 这块8000mAh电池将会用在小米17 Max上 成为小米手机最大电池机型 小米17 Max机型将在上半年发布 预计5月左右登场 该机与此前的小米17 Pro Max有很大不同 取消了比较出圈的背屏设计 用节省下来的空间堆更大的电池容量 预计依然维持100W有线快充...
22:29
微新创想 一转眼春节假期已经过半 你是不是已经踏上了回城的路了呢 如果说春节的团圆是一场热闹的梦 那么拔充电器的那个瞬间 就是梦醒的时刻 随着春节假期进入尾声 一个话题悄悄冲上热搜 让无数游子瞬间破防 离家的全国统一仪式是拔充电器 这也引发了网友的热议 有网友说 这是过年最不想刷到的视频 也有网友感叹 只有过年回家的人才知道 充电器一拔 就又...
22:29
微新创想:今日正月初五,腾讯旗下新推出的AI原生社群“元宝派”宣布,用户只需在群内保持活跃,与派友聊天、一起听音乐、观看视频,共同迎接财神,当群内气氛达到高潮时,“元宝”便会化身财神,派发惊喜红包。此次红包发放方式简单易懂,无需复杂操作,即便是父母长辈也能轻松参与领取。红包类型为拼手气红包,抢到多少金额全凭个人运气,增添了活动的趣味性和刺激性。 据了解,“元...
21:43
微新创想:2026年2月19日(周三),谷歌宣布启动“美印连接”基础设施计划。该计划将在印度维沙卡帕特南新建国际海缆登陆站,铺设三条跨洲海底光缆,分别连通新加坡、南非和澳大利亚。同时还将建设四条陆上光纤路由,进一步提升美、印、澳、非之间的网络容量与冗余性。 微新创想:这一举措是谷歌在印度五年内投入150亿美元用于人工智能领域投资的一部分。通过加强数字基础设施...
21:43
微新创想:2026年2月20日,泡泡玛特正式宣布推出全新IP“放学后的Merodi”。这一系列盲盒包含12个常规款和1个隐藏款,常规款的抽取概率为1:12,隐藏款则为1:144,进一步提升了收藏价值与玩家的期待感。每个盲盒的单价为69元,而整盒包含12个常规款的售价为828元,为消费者提供了更多选择。线上发售时间定为2月26日22:00,线下渠道则在2月27...