微新创想(Idea2003.com)6月20日 消息:谷歌深度学习中心近日宣布,其研发的 “Bigger,Better,Faster”(BBF)AI算法在强化学习领域取得重大突破。该算法仅用两小时便成功掌握26款Atari游戏,其学习效率与人类相当,为AI解决现实世界问题提供了新的可能性。

强化学习作为谷歌深度学习中心的核心研究方向,在推动人工智能发展方面发挥着关键作用。然而传统强化学习算法存在两大瓶颈:一是需要海量训练数据,二是计算资源消耗巨大。为了突破这些限制,谷歌深度学习中心联合米拉大学和蒙特利尔大学的研究团队,共同推出了BBF模型。

在Atari基准测试中,BBF模型的表现不仅超越了人类水平,更创造了惊人的效率。与其他强化学习算法不同,BBF无需预先训练模型,而是通过直接与游戏世界交互,从获得的奖励和惩罚信息中学习最佳策略。研究团队通过采用更大规模的神经网络、自我监督训练方法等创新技术,显著提升了算法效率。值得注意的是,BBF模型仅需单个Nvidia A100 GPU即可完成训练,而传统方法则需要更强大的计算资源支持。

尽管目前BBF模型尚未在所有29款基准测试游戏中超越人类表现,但与其他模型的55款游戏对比显示,BBF在数据量仅相当于其他系统1/500的情况下,仍能保持相当水平。这一发现不仅验证了Atari基准测试作为强化学习评估的有效性,也为小型研究团队提供了宝贵的资源支持。与以往高效强化学习算法不同,BBF在扩展性方面表现出色,能够随着更多训练数据的加入持续提升性能。

该研究团队表示:”我们希望通过这项工作,激励更多研究者推动深度强化学习的样本效率边界,最终实现人类水平的智能表现。”这一突破性进展或将对当前以自我监督模型为主导的AI技术格局产生深远影响。

BBF算法相关论文:https://arxiv.org/pdf/2305.19452.pdf

最新快讯

2026年04月01日

01:56
微新创想:2026年4月1日,苹果公司正在内部测试Siri的新功能,该功能支持在单次语音或文本输入中并行处理多项任务。这一突破性进展将集成于即将发布的iOS 27、iPadOS 27及macOS 27系统中。目前,这项开发工作由苹果内部团队主导,尚未对外公开具体细节。 新功能的引入意味着用户可以一次性发出复合指令,例如‘查北京天气、订明天上午10点会议、给张...
00:38
微新创想:2026年3月31日 日本存储芯片厂商铠侠向客户发布通知 将逐步退出传统浮栅式2D NAND及第三代BiCS FLASH产品线 铠侠的这一决定标志着其在存储技术领域的重要战略调整。公司表示 停产范围涵盖部分2D NAND及第三代BiCS FLASH 最后客户预测订单截止日为2026年9月30日 最终出货截止日为2028年12月31日 此举旨在优化产...
00:38
微新创想:2026年3月31日 上海晨光文具股份有限公司(603899.SH)发布公告称 拟将控股子公司科力普集团分拆至香港联合交易所主板上市 此举意在优化集团整体治理结构 通过分拆提升科力普的独立运营能力 并进一步拓展融资渠道 为公司未来发展注入更多活力 科力普集团主要业务涵盖办公用品B2B电商平台以及集约化供应链服务 在晨光文具的旗下运营多年 一直承担着...
00:38
微新创想:2026年3月10日起 微软正式移除Microsoft支持和恢复助手(SaRA)命令行工具 微软宣布从2026年3月10日开始 在所有受支持的Windows版本中正式移除Microsoft支持和恢复助手(SaRA)命令行工具。这一变更影响广泛 涵盖了多个重要操作系统版本 包括Windows 11的25H2、24H2以及23H2版本 Windows ...

2026年03月31日

23:30
微新创想:2026年3月31日,Meta在美国正式推出第二代Ray-Ban Meta Blayzer Optics与Scriber Optics智能眼镜。这是Meta首款专为处方用户优化的AI眼镜,支持几乎全部近视、远视及散光度数。产品起售价499美元,4月14日上市。新眼镜采用超弹铰链、可调鼻托与镜腿末端,适配不同脸型。Meta与依视路陆逊梯卡联合研发,旨...
23:30
微新创想:2026年3月31日,巴西国家石油公司(Petrobras)宣布其3月份单日原油产量达到290万桶。这一数据由公司勘探与生产部门负责人在当日确认,创下近年来的新高。此次产量的显著提升,主要得益于深海盐下层油田的稳定生产以及多个新项目的顺利投产。 巴西国家石油公司总部位于里约热内卢,其业务范围覆盖巴西全国主要的油气产区。公司长期以来致力于提升国内能源...
23:30
微新创想:2026年3月31日,诚邦股份(603316.SH)发布公告,宣布拟通过简易程序向特定对象发行股票。此次发行计划募集资金总额不超过1亿元。扣除相关发行费用后,募集资金净额将用于嵌入式存储芯片扩产项目以及补充公司流动资金。目前,该定增方案仍需上海证券交易所审核通过,并获得中国证监会的注册批准。 微新创想:公司指出,此次扩产项目将有助于提升其在高端存储...
23:30
微新创想:2026年3月31日,由前Millennium高级交易员Diego Megia创立的对冲基金TAULA宣布成功募集17.5亿美元新资金。该基金总部位于纽约,专注于量化多策略交易领域。此次融资主要面向机构投资者,资金将被用于扩充技术团队、增强算力基础设施以及拓展亚太市场。 微新创想:Diego Megia表示,此次融资反映市场对其风险控制与收益稳定性...
23:30
微新创想:3月31日,珞石(山东)机器人集团股份有限公司向港交所再次递交上市申请,拟主板挂牌。公司注册地为山东,由中金公司与国泰君安国际担任联席保荐人。此次为该公司第二次提交IPO申请,旨在拓展融资渠道并加速机器人技术研发与产业化布局。目前上市进程尚处审核阶段,具体发行时间及规模未披露。
23:30
微新创想:2026年3月31日,恒大汽车发布公告称,截至公告日仍未物色到合适的战略投资者以提供亟需的财务支持。公司正将有限资金集中于维持基本营运。 微新创想:其股份自2025年4月1日9时起暂停于港交所主板买卖,至今持续停牌。此举旨在保障核心业务运转,缓解流动性压力。 微新创想:目前恒大汽车面临较大的资金压力,公司管理层表示正在积极寻求外部投资以改善财务状况...
22:56
微新创想:2026年3月31日,《幻兽帕鲁》官方发布衍生校园恋爱模拟游戏《幻兽♡帕鲁!~已经不想只做朋友了~》最新宣传片。该游戏虽于2024年愚人节首次公布但确为真实开发中作品现已登陆Steam并支持中文发售日未定 预告中Pocketpair CEO沟部拓郎与发行负责人Bucky出镜确认游戏突破传统框架融入恐怖解谜及时空轮回等多元玩法 开发团队强调其非普通恋...
22:56
微新创想:2026年3月31日,优必选公布2025财年业绩数据显示全年营收达到20.01亿元,同比增长53.3%。这一增长主要得益于全尺寸人形机器人业务的强劲表现。该业务全年收入为8.21亿元,销量突破1079台,同比增长超过358倍。这一成绩标志着公司在人形机器人领域取得了显著进展。 微新创想:在盈利能力方面,全尺寸人形机器人业务的毛利达到7.54亿元,毛...