微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年02月21日

11:08
微新创想:今天是正月初五,俗称破五”,是春节民俗中承上启下的关键节点,也是民间最具烟火气的迎财神”吉日。支付宝宣布,2月21日(正月初五)-3月3日(正月十五)期间,用户可以通过碰一下支付的方式获得红包或黄金奖励。其中,红包奖励为实时到账,而2026份黄金将在活动结束后统一寄送。 迎财神的习俗由来已久,最早可追溯至唐代,明清时期逐渐定型为全国性民俗。相传正月...
11:08
微新创想:苹果首款低价MacBook计划于两周内发布大概率亮相于3月4日在纽约、伦敦、上海举办的小型活动 这款产品主打入门级市场核心面向学生群体也是苹果首次在Mac笔记本中采用手机同款A系列芯片产品定位对标教育市场主流的Chromebook 外观设计接近MacBook Air采用铝制机身屏幕尺寸传闻为12.9英寸或13英寸苹果大概率不会追求极致轻薄预计沿用低...
10:52
微新创想:2026年2月21日,印度IT服务商Ramco Systems正式发布企业级对话式AI智能体平台Chia。该平台作为其AI任务自动化套件rTask的核心组件,支持推理、决策与跨系统端到端流程执行。Chia基于无代码开发平台,允许客户体验团队通过英文指令快速配置部署智能体,无需工程介入。 微新创想:其设计严格遵循企业合规策略与安全边界,并实现与现有业...
10:52
微新创想:2026年2月21日(除夕)当天,银联与网联共同处理了49.31亿笔支付交易,相比去年同期增长了21.64%。这一数据由中国人民银行正式发布,涵盖了全国范围内的银行卡支付和网络支付业务。随着春节的到来,消费活动进入高峰期,人们在购物、餐饮、出行等方面的需求显著增加,同时线上年货采购和各类红包发放也进一步推动了支付交易量的上升。 微新创想:在如此庞大...
10:52
微新创想:2026年2月20日,三星通过One UI 8.5 Beta更新,在德国、韩国等六国开放Galaxy S25系列用户测试升级版Bixby 此次更新标志着三星在智能语音助手领域迈出了重要一步。Bixby作为三星生态系统中的核心组件,经过升级后展现出更强的交互能力和本地化处理能力。新版Bixby被重新定义为“对话式本地智能体”,不仅提升了用户体验,还增...
10:52
微新创想:2026年2月21日,美国人工智能公司OpenAI宣布将2030年前算力总支出目标调整为约6000亿美元,并同步推进新一轮融资。据悉,本轮融资规模或超1000亿美元其中约90%来自战略投资者包括英伟达(拟投最多300亿美元)、软银集团和亚马逊。新资金将主要用于采购英伟达芯片等硬件建设数据中心与基础设施。 公司预计2030年营收将突破2800亿美元消...
10:52
微新创想:2月21日,交通运输部最新数据显示,全国高速公路车流量突破6500万辆次,创下节后返程高峰的新纪录。这一数据主要受到春节假期结束后的集中返程影响,大量民众选择在这一天返回工作岗位或继续探亲旅行,导致全国主要高速公路出现不同程度的拥堵现象。 微新创想:京沪、沪渝、沪昆、深岑等干线高速公路成为拥堵重灾区,部分路段车流密集,通行速度明显下降。交通管理部门...
10:52
微新创想:2026年2月20日,微软删除其Azure官方博客一篇发布于2024年11月的技术教程。该文由高级产品经理Pooja Kamath撰写,旨在演示如何利用Azure SQL与LangChain构建生成式AI应用。然而,教程的核心案例却引发了广泛关注和争议。 该教程使用了盗版的《哈利·波特》全集作为训练数据,进而生成包含微软Logo的版权角色营销内容。...
10:52
微新创想:2026年2月21日 英国Everyman Cinema网站上线了《超级马力欧银河大电影》的预告片及剧情简介 引发了广泛关注 影片中透露了库巴 Jr.与瓦力欧组成邪恶联盟 企图统治整个世界 马力欧将联合耀西等经典伙伴共同阻止这一阴谋 该电影计划于2026年4月1日在海外正式上映 为任天堂旗下知名IP带来了全新的视觉体验 目前尚无法确认该信息是否为官...
10:52
微新创想:2月21日,中通云仓科技与信发集团在山东正式签署战略合作协议。此次合作标志着双方在农业产业链整合方面迈出了重要一步,未来将共同打造具有全球竞争力的蔬菜加工产业基地。 双方决定通过整合各自在技术、渠道及产业资源方面的优势,推动蔬菜产业的转型升级。中通云仓科技将充分发挥其在智慧仓储和供应链运营方面的专业能力,为合作项目提供高效、智能的物流与仓储解决方案...
10:34
微新创想:这个春节,超级巨无霸麻将在社交平台走红,四川等地的网友纷纷晒出实拍画面,让这项传统棋牌游戏摇身变成了全身运动,成为假期最火的互动新玩法。 与传统麻将不同,这款巨无霸麻将的尺寸远超常规,洗牌、码牌、抓牌、出牌的每一个环节都需要大幅动作。玩家想要摸到远处的牌,得小跑到桌角;出牌时更是需要双手抱起牌面,用力抛出才能到位。 这种特殊的玩法完美解决了传统麻将...
10:34
微新创想:前谷歌DeepMind首席科学家席尔瓦近日正式离职并创立了AI初创公司Ineffable Intelligence。席尔瓦曾是AlphaGo的核心负责人,其离开标志着DeepMind历史上一次重要的人事变动。DeepMind方面在声明中表示,席尔瓦的贡献无可估量,公司对他的工作充满感激。 目前,席尔瓦的新公司正在推进一轮规模达10亿美元的种子轮融资...