Meta首席人工智能科学家Yann LeCun历经数年探索,终于将人类无需过多干预即可自主学习世界模型的深度学习愿景推向现实。近日,Meta正式发布了I-JEPA模型的第一个版本,这一创新机器学习模型通过图像自我监督学习,能够高效构建世界的抽象认知框架。初步测试结果令人瞩目,I-JEPA在众多计算机视觉任务中展现出卓越表现,其计算资源消耗仅为同类先进模型的十分之一。Meta已公开模型训练代码与完整架构,并计划在下周CVPR计算机视觉与模式识别国际会议上进行详细展示。

自我监督学习这一概念源自人类与动物的自然学习机制。我们的大多数知识都源于对世界的直接观察,人工智能系统同样应当具备通过原始数据自主学习的能力,无需人类进行繁琐的数据标注。近年来,自我监督学习已在生成模型与大型语言模型等领域取得突破性进展。2022年,LeCun提出”联合预测嵌入架构”(JEPA)理论,这是一种能够自主学习世界模型与常识性知识的创新自我监督框架。JEPA在方法论上具有显著创新——不同于传统生成模型(如DALL-E和GPT)对像素级细节的精准预测,JEPA聚焦于高阶抽象认知,通过预测场景构成要素与物体间关联关系,构建更稳定的认知框架。这种抽象预测方法使模型在构建环境认知时更为稳健,同时大幅降低学习成本。

I-JEPA作为JEPA理论在图像领域的具体实现,采用独特的”抽象预测目标”机制。该架构通过Vision Transformer(ViT)变体对图像信息进行编码,再由预测器ViT生成语义表示,有效规避了像素级预测的局限性。研究人员还开发了配套生成模型,能够根据I-JEPA的语义预测结果生成场景草图。实验证明,I-JEPA的抽象认知与真实场景高度吻合,虽然无法生成逼真图像,但在机器人与自动驾驶等场景中具有巨大应用潜力。

I-JEPA最突出的优势在于其惊人的计算效率。预训练阶段无需依赖其他自我监督学习方法所需的复杂数据增强技术。研究团队仅用16块A100 GPU,在不到72小时内就成功训练出参数量达632百万的模型,效率提升达十倍。实验表明,I-JEPA能够直接从真实未标记数据中学习强大的语义表示,无需人工构建的模拟场景。在ImageNet-1K图像分类任务中,该模型仅需1%的训练数据(每类仅12-13张图像)即可微调超越其他先进模型,这得益于其更简洁的架构与更少认知偏差。

随着互联网未标记数据的爆炸式增长,I-JEPA等高效学习模型为众多传统依赖人工标注的应用领域带来革命性突破。该项目完整资料已开放访问,详情请参阅https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/。这一创新不仅验证了LeCun关于自主学习世界模型的科学构想,更为人工智能的普惠化发展开辟了新路径。

最新快讯

2026年03月03日

20:00
微新创想:2026年3月2日,芬兰初创公司Donut Lab与联合国下属的科研机构VTT技术研究中心合作,完成了对一款固态电池在高温环境下的性能测试。此次测试覆盖了20℃、80℃和100℃三个温度区间,旨在评估固态电池在极端条件下的表现。 测试结果显示,这款3.6V/26Ah的固态电池在100℃的高温环境下,其放电容量达到了27.6Ah,相比室温下的表现提升...
19:26
微新创想:2026年3月3日 中国电影股份有限公司发布公告称 拟使用不超过54亿元暂时闲置的自有资金进行现金管理 此举旨在提高资金使用效率 增加公司收益 资金来源为公司日常经营中暂时闲置的自有资金 不涉及募集资金 投资范围限于安全性高 流动性好的低风险金融产品 该事项尚需公司董事会审议通过 不构成关联交易或重大资产重组
18:54
微新创想:据知情人士消息,埃隆·马斯克旗下X平台与xAI公司拟全额清偿合计约175亿美元债务。此举由摩根士丹利协调,已于近日通知现有债权人。xAI所发30亿美元高收益债券将按面值117%溢价赎回。资金来源未披露。 此次偿债计划涉及的金额巨大,显示出马斯克旗下企业集团在财务上的重大调整。X平台与xAI公司作为马斯克的重要资产,其债务清偿不仅关系到两家公司的运营...
18:54
微新创想:2026年3月3日,国盾量子副总工程师唐世彪荣获2025年“大国工匠年度人物”称号。这一荣誉不仅是对他个人专业能力的认可,也体现了他在量子通信领域的重要贡献。唐世彪所带领的团队研发的量子手机在央视活动现场进行了展示,这款手机搭载了先进的量子密话功能,基于单光子通信技术,具有不可复制、不可分割的特性,能够实时发现任何窃听行为,为信息安全提供了前所未有...
18:53
微新创想:2026年3月3日,晶泰科技孵化企业ReviR宣布其自主研发的小分子药物RTX-117完成首例受试者给药。这一重要进展标志着该药物正式迈入临床研究阶段。 RTX-117是由晶泰科技与ReviR联合发现的创新药物。作为我国首个基于人工智能技术靶向RNA的小分子候选药物,它代表了药物研发领域的一项重大突破。 此次临床试验在境内合规的临床中心启动,主要目...
18:53
微新创想:2026年3月2日,社交媒体X平台正式推出内置“披露付费推广”标签功能。这一功能位于发帖界面底部旗标中,创作者可一键开启,明确标识商务合作或利益相关帖文。该功能的推出,标志着X平台在内容透明化方面迈出了重要一步。 微新创想:此举旨在提升内容可信度,帮助用户更清晰地区分真实分享与广告内容。对于经常浏览社交媒体的用户而言,这一变化将显著改善信息获取的体...
18:53
微新创想:2026年3月3日,谷歌家居负责人阿尼什·卡图卡兰宣布平台多项更新。此次升级面向全球Google Home用户,重点修复长期存在的交互异常问题,并为集成摄像头设备新增Live Search实时搜索功能。 依托新版Gemini模型,系统可即时理解摄像头画面内容,支持自然语言查询,如“车道上有车吗?”。这一功能的引入,极大地提升了用户在智能家居环境中的...
18:53
微新创想:2026年3月3日,美国医疗费用管理平台Ease Health宣布完成4100万美元A轮融资,由Andreessen Horowitz(a16z)领投。此次融资标志着公司在医疗科技领域的重要进展,进一步巩固了其在行为健康服务管理方面的领先地位。 该公司专注于为行为健康服务提供者打造AI驱动的一体化平台,集成客户关系管理、电子健康档案与收费管理功能。...
18:53
微新创想:2026年3月2日,Efor公司正式完成对ND公司的收购。ND是一家总部位于中国、专注于制药行业调试、确认与验证(C&Q)及质量合规服务的解决方案提供商,以患者为中心理念著称。 此次收购旨在强化Efor在生命科学领域的一站式合规服务能力。通过整合ND的专业资源,Efor能够进一步拓展其在制药行业的服务范围,为客户提供更加全面和高效的解决方案...
18:53
微新创想:在本次MWC大会上 小米正式展示了旗下的超级跑车Vision Gran Turismo 这款充满未来感的赛车一经亮相 便迅速吸引了全球汽车爱好者与科技博主的关注 根据官方介绍 这款概念车在设计之初就追求极致的空气动力学性能 它不仅拥有极低的风阻系数 还具备强大的下压力表现 设计师试图通过创新的车身结构 彻底突破传统超跑的效率边界 在设计细节上 ...
18:53
微新创想:中国 AI 硬件出海再传捷报 2026年3月3日,乐奇 Rokid 宣布对其海外版 AI 眼镜 Rokid Glasses 进行重磅软件升级,正式成为全球首款原生支持谷歌 Gemini 的 AI 眼镜。此次升级不仅提升了产品的功能性,更标志着中国 AI 硬件在全球市场上的重要突破。 此次升级后,Rokid Glasses 彻底打破了单一模型的束缚,...
18:19
微新创想:2026年3月3日,Aqara正式推出集悦妙控屏S1 Plus(Siri版) 这款产品是全球首款支持苹果Siri语音控制的智能家居中控屏,标志着Aqara在智能家庭领域迈出了重要一步 设备配备了一块6.9英寸的高清屏幕,为用户带来更加直观的交互体验。同时,内置的双扬声器和四麦克风阵列,确保了语音识别的精准性和稳定性 用户可以通过简单的“嘿,Siri...