Meta首席人工智能科学家Yann LeCun历经数年探索,终于将人类无需过多干预即可自主学习世界模型的深度学习愿景推向现实。近日,Meta正式发布了I-JEPA模型的第一个版本,这一创新机器学习模型通过图像自我监督学习,能够高效构建世界的抽象认知框架。初步测试结果令人瞩目,I-JEPA在众多计算机视觉任务中展现出卓越表现,其计算资源消耗仅为同类先进模型的十分之一。Meta已公开模型训练代码与完整架构,并计划在下周CVPR计算机视觉与模式识别国际会议上进行详细展示。

自我监督学习这一概念源自人类与动物的自然学习机制。我们的大多数知识都源于对世界的直接观察,人工智能系统同样应当具备通过原始数据自主学习的能力,无需人类进行繁琐的数据标注。近年来,自我监督学习已在生成模型与大型语言模型等领域取得突破性进展。2022年,LeCun提出”联合预测嵌入架构”(JEPA)理论,这是一种能够自主学习世界模型与常识性知识的创新自我监督框架。JEPA在方法论上具有显著创新——不同于传统生成模型(如DALL-E和GPT)对像素级细节的精准预测,JEPA聚焦于高阶抽象认知,通过预测场景构成要素与物体间关联关系,构建更稳定的认知框架。这种抽象预测方法使模型在构建环境认知时更为稳健,同时大幅降低学习成本。

I-JEPA作为JEPA理论在图像领域的具体实现,采用独特的”抽象预测目标”机制。该架构通过Vision Transformer(ViT)变体对图像信息进行编码,再由预测器ViT生成语义表示,有效规避了像素级预测的局限性。研究人员还开发了配套生成模型,能够根据I-JEPA的语义预测结果生成场景草图。实验证明,I-JEPA的抽象认知与真实场景高度吻合,虽然无法生成逼真图像,但在机器人与自动驾驶等场景中具有巨大应用潜力。

I-JEPA最突出的优势在于其惊人的计算效率。预训练阶段无需依赖其他自我监督学习方法所需的复杂数据增强技术。研究团队仅用16块A100 GPU,在不到72小时内就成功训练出参数量达632百万的模型,效率提升达十倍。实验表明,I-JEPA能够直接从真实未标记数据中学习强大的语义表示,无需人工构建的模拟场景。在ImageNet-1K图像分类任务中,该模型仅需1%的训练数据(每类仅12-13张图像)即可微调超越其他先进模型,这得益于其更简洁的架构与更少认知偏差。

随着互联网未标记数据的爆炸式增长,I-JEPA等高效学习模型为众多传统依赖人工标注的应用领域带来革命性突破。该项目完整资料已开放访问,详情请参阅https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/。这一创新不仅验证了LeCun关于自主学习世界模型的科学构想,更为人工智能的普惠化发展开辟了新路径。

最新快讯

2026年01月29日

16:21
字节跳动在 AI 硬件领域的布局正全面加速。据《智能涌现》消息,字节已正式启动“豆包手机助手”正式版项目,备受关注的第二代豆包手机预计将于 2026 年第二季度中晚期正式发布。在手机业务上,字节跳动采取了“自研+合作”的双轨并行策略:深度定制机型:二代手机将继续与努比亚联合开发,供应链对其市场预期较一代测试版有显著提升。生态开放合作:字节正与打车、外卖等主流...
16:21
据知情人士披露,科技巨头英伟达、亚马逊和微软正在洽谈一笔总额高达600亿美元 的投资,目标直指 AI 领军企业OpenAI。 这笔巨额资金有望为OpenAI在与谷歌的激烈竞争中提供强有力的财务支持。顶级投资天团的资金分布此次潜在的融资计划展示了各巨头对 AI 赛道的志在必得:英伟达:拟投资金额可能高达300亿美元。亚马逊:作为新晋投资者,正考虑投入100亿至...
16:21
1月29日,昆仑万维(Skywork AI)宣布正式开源其自研的“全能型”视频生成大模型——SkyReels-V3。 该模型的发布标志着视频生成技术进入了高保真、多模态的新阶段,通过单一建模架构实现了参考图像转视频、视频延长以及音频驱动虚拟形象三大核心能力的深度集成。在**参考图像转视频(I2V)**领域,SkyReels-V3支持1至4张参考图输入,能够精...
15:25
微新创想1月29日重磅消息,苹果公司正式宣布调整其年度产品发布策略,自iPhone 18系列起将显著优化上市节奏。今年秋季苹果将仅推出iPhone 18 Pro系列和革命性的iPhone Fold折叠屏手机,而备受关注的标准版iPhone 18预计将于明年春季与消费者见面。 据多家权威科技媒体报道,苹果正在积极与太空探索技术公司SpaceX展开深度合作洽谈,...
15:25
微新创想1月29日消息,iQOO 15 Ultra将于2月4日正式发布,这是首款性能Ultra手机,性能和游戏体验堆满,新机目前已进入预热阶段。今日,iQOO手机官微介绍该机游戏直播功能,支持一键投屏,开播0门槛,号称游戏直播神器”。iQOO 15 Ultra单机直播时,支持直驱供电2.0,一直播都有电,配合自研电竞芯片Q3,带...
15:25
声明:本文来自于微信公众号 白鲸出海,作者:智婷,授权站长之家转载发布。在科技创新和风险投资领域,流传着这样一条不成文的共识:如果你想知道大众消费市场的下一个风口在哪里,可以看看那些“原罪行业”的变化。从 VHS 击败 Betamax,到高速信用卡处理技术的诞生,再到直播技术的普及,不可否认,成人娱乐产业始终走在推进前沿科技应用...
15:24
2021年以来,我国水库安全工作取得了令人瞩目的成就,全国水库安全状况得到显著提升。水利部最新数据显示,大中型水库累计成功拦蓄洪水高达5591亿立方米,有效保障了下游区域的安全。更为关键的是,我国实现了大江大河重要堤防零决口、连续四年水库零垮坝的卓越记录,彰显了我国水利工程建设的强大实力。在洪灾损失方面,洪灾损失占GDP比重已从0.28%大幅降至0.17%,...
15:24
2026年1月26日,奇瑞新能源品牌LEPAS首批500余台L4车型在江苏太仓港装船,发往南非德班港。此举标志着LEPAS正式进军非洲市场,将依托南非这一非洲汽车核心枢纽,推进本地化运营。该战略旨在强化新能源出行资源的全球布局,后续计划向更多国家输出相关产品与服务。
15:24
2025年2月5日,韩国半导体巨头SK海力士传来振奋人心的消息,将在京畿道利川市与忠清北道清州市同步向约3.3万名员工发放总额高达1.4亿韩元(约合67.4万元人民币)的利润分享(PS)奖金。这一慷慨举措的背后,是公司2025财年营业利润创下历史性新高——47.2万亿韩元,同比增长显著。根据公司推行的PS制度,10%的利润(4.7万亿韩元)将直接惠及全体员工...
15:24
1月28日,湖南深湖科技有限公司宣布完成天使轮融资,投资方为麓山投资。该公司注册地在湖南,专注于人工智能应用软件研发。本轮融资将用于核心算法优化、团队扩充及行业解决方案落地。据悉,公司成立不足一年,已与多家制造与政务类客户开展POC验证。融资具体金额未披露。
15:24
2026年1月28日,科技媒体nikonrumors首次公开尼康Nikkor Z 120-300mm f/2.8 TC VR S镜头实物图。该镜头为Z卡口新品,内置可切换增距镜,支持焦距扩展,延续f/2.8恒定光圈与VR防抖。此举拓展了尼康高端远摄镜头产品线,补全中长焦变焦空白。此前尼康已推出400mm f/2.8和600mm f/4两款内置1.4x增距镜...
15:24
2026年1月29日,美国康宁公司公布2025年财务业绩。全年核心销售额达164.1亿美元,同比增长13%;核心每股收益2.52美元,增长29%。第四季度核心销售额44.1亿美元,增长14%。公司预计2026年第一季度核心销售额将达42–43亿美元,同比增约15%。得益于“Springboard”计划,2025年调整后自由现金流达17.2亿美元,较2023...