Meta首席人工智能科学家Yann LeCun历经数年探索,终于将人类无需过多干预即可自主学习世界模型的深度学习愿景推向现实。近日,Meta正式发布了I-JEPA模型的第一个版本,这一创新机器学习模型通过图像自我监督学习,能够高效构建世界的抽象认知框架。初步测试结果令人瞩目,I-JEPA在众多计算机视觉任务中展现出卓越表现,其计算资源消耗仅为同类先进模型的十分之一。Meta已公开模型训练代码与完整架构,并计划在下周CVPR计算机视觉与模式识别国际会议上进行详细展示。

自我监督学习这一概念源自人类与动物的自然学习机制。我们的大多数知识都源于对世界的直接观察,人工智能系统同样应当具备通过原始数据自主学习的能力,无需人类进行繁琐的数据标注。近年来,自我监督学习已在生成模型与大型语言模型等领域取得突破性进展。2022年,LeCun提出”联合预测嵌入架构”(JEPA)理论,这是一种能够自主学习世界模型与常识性知识的创新自我监督框架。JEPA在方法论上具有显著创新——不同于传统生成模型(如DALL-E和GPT)对像素级细节的精准预测,JEPA聚焦于高阶抽象认知,通过预测场景构成要素与物体间关联关系,构建更稳定的认知框架。这种抽象预测方法使模型在构建环境认知时更为稳健,同时大幅降低学习成本。

I-JEPA作为JEPA理论在图像领域的具体实现,采用独特的”抽象预测目标”机制。该架构通过Vision Transformer(ViT)变体对图像信息进行编码,再由预测器ViT生成语义表示,有效规避了像素级预测的局限性。研究人员还开发了配套生成模型,能够根据I-JEPA的语义预测结果生成场景草图。实验证明,I-JEPA的抽象认知与真实场景高度吻合,虽然无法生成逼真图像,但在机器人与自动驾驶等场景中具有巨大应用潜力。

I-JEPA最突出的优势在于其惊人的计算效率。预训练阶段无需依赖其他自我监督学习方法所需的复杂数据增强技术。研究团队仅用16块A100 GPU,在不到72小时内就成功训练出参数量达632百万的模型,效率提升达十倍。实验表明,I-JEPA能够直接从真实未标记数据中学习强大的语义表示,无需人工构建的模拟场景。在ImageNet-1K图像分类任务中,该模型仅需1%的训练数据(每类仅12-13张图像)即可微调超越其他先进模型,这得益于其更简洁的架构与更少认知偏差。

随着互联网未标记数据的爆炸式增长,I-JEPA等高效学习模型为众多传统依赖人工标注的应用领域带来革命性突破。该项目完整资料已开放访问,详情请参阅https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/。这一创新不仅验证了LeCun关于自主学习世界模型的科学构想,更为人工智能的普惠化发展开辟了新路径。

最新快讯

2026年02月21日

00:02
微新创想:2026年2月18日,印度AI实验室Sarvam在班加罗尔举行的印度人工智能影响力峰会上发布了两款自主研发的MoE架构大语言模型。这两款模型的开源权重已经上传至Hugging Face平台,后续还将提供API接口与仪表盘功能,方便开发者和用户进行调用与管理。 两款模型分别针对不同的应用场景进行了优化。其中,小型号模型为30B-A1B,支持高达32K...

2026年02月20日

23:23
微新创想:2026年2月20日,美国地区最新游戏销售数据显示,《使命召唤:黑色行动7》成为2026年1月最畅销游戏。该作由动视暴雪开发、微软发行,在当月销量超越《NBA 2K26》《麦登橄榄球NFL 26》等热门作品。 榜单前五名多为美式偏好题材包括赛车、射击和体育类游戏。《最终幻想7:重制版》在单月内跃升216位,成功进入榜单第9名。这一成绩显示出该作在游...
23:23
微新创想:2026年2月20日,微软研究院与Salesforce联合研究证实,当前顶尖大语言模型在多轮对话中可靠性显著下降。研究涵盖GPT-4.1、Gemini 2.5 Pro等15款模型,分析超20万次模拟对话。 结果显示:单轮任务成功率约90%,拆分为多轮后降至约65%。核心能力仅降15%,但不可靠性飙升112%。研究指出,主要原因是模型在对话初期就生成...
23:23
微新创想:2026年2月20日,YouTube宣布其对话式AI工具已全面支持电脑、Android、iPhone和iPad平台。这一更新标志着YouTube在智能化视频内容交互方面迈出了重要一步。用户现在可以通过文字或语音的方式向AI提问,从而更深入地解析视频内容,获取个性化的信息和见解。 微新创想:该工具的推出不仅提升了用户体验,也拓宽了视频内容的可访问性。...
23:23
微新创想:2026年2月20日,Linux内核开发者已提交首批PCIe 7.0适配补丁。该工作由开发者Ionut Nechita主导,新增128 GT/s速率检测、带宽控制及散热管理相关寄存器定义。这一进展标志着Linux系统对下一代高速总线技术的积极应对和深入研究。 PCIe 7.0规范由PCI-SIG于2025年中发布,理论带宽达512GB/s(x16双...
23:23
微新创想:2月20日17时39分(当地时间),阿富汗北部兴都库什地区发生5.7级地震,震源深度约79公里。此次地震由德国地球科学研究中心测定,北京时间同日21时09分。阿富汗首都喀布尔震感强烈,居民普遍感受到明显的摇晃。目前暂无人员伤亡和财产损失的官方通报,但相关部门仍在持续监测灾情。 此次地震属于中源地震,发生于欧亚板块与印度板块的交界地带。该区域地质活动...
23:23
微新创想:2026年2月20日,美国纽约。摩根士丹利首次覆盖分拆上市的通用电气航空航天公司(GE AEROSPACE),给予“增持”评级,目标股价425美元。此举标志着该投行对该司独立运营后增长潜力与现金流韧性的认可。 分析指出,GE Aerospace在商用航空发动机领域占据全球领先地位,其技术实力和市场份额均处于行业顶端。随着全球航空业逐步复苏,公司迎来...
23:23
微新创想:2026年2月16日,谷歌发布了Google Play服务的最新版本v26.06。此次更新面向全球所有Android用户,带来了多项实用功能和性能优化。其中,新增的本地下载文档自动同步至Google Drive功能,让用户在不同设备间更方便地访问和管理文件,同时增强了数据的安全性。 此次更新还优化了手机端的地震警报视觉提示,使用户在紧急情况下能够更...
23:23
微新创想:2月20日,意大利米兰-科尔蒂纳丹佩佐冬奥会自由式滑雪男子空中技巧决赛圆满落幕。中国选手王心迪凭借精湛的技术和稳定的发挥,在激烈的竞争中脱颖而出,成功夺得金牌。这是中国代表团在本届冬奥会获得的第四枚金牌,标志着中国在该项目上的实力进一步提升。 比赛在意大利北部山区的雪场举行,环境恶劣但条件优越,为运动员提供了绝佳的竞技舞台。王心迪在决赛的最后一轮中...
23:23
微新创想:2026年2月20日,OpenAI正加速布局硬件领域,已组建约200人的研发团队,专注开发面向消费者的AI硬件 首款产品为一款无屏幕、配备摄像头的AI智能音箱,定价200~300美元(约合1383~2075元人民币),预计最早于2027年2月发货 此举源于2025年9月与苹果前设计总监乔纳森·艾维的合作,旨在打造具备深度语境感知与自然语音交互能力的...
23:23
微新创想:Meta公司宣布将于2026年4月正式关闭Messenger.com网页服务 这一决定标志着用户将无法再通过网页版访问Messenger服务 只能依赖移动端应用或Facebook内置的消息功能 关闭Messenger.com是Meta持续减少对桌面端支持的举措之一 此前该公司已于2025年底停止了Windows和macOS桌面客户端的运营 ...