Meta首席人工智能科学家Yann LeCun历经数年探索,终于将人类无需过多干预即可自主学习世界模型的深度学习愿景推向现实。近日,Meta正式发布了I-JEPA模型的第一个版本,这一创新机器学习模型通过图像自我监督学习,能够高效构建世界的抽象认知框架。初步测试结果令人瞩目,I-JEPA在众多计算机视觉任务中展现出卓越表现,其计算资源消耗仅为同类先进模型的十分之一。Meta已公开模型训练代码与完整架构,并计划在下周CVPR计算机视觉与模式识别国际会议上进行详细展示。

自我监督学习这一概念源自人类与动物的自然学习机制。我们的大多数知识都源于对世界的直接观察,人工智能系统同样应当具备通过原始数据自主学习的能力,无需人类进行繁琐的数据标注。近年来,自我监督学习已在生成模型与大型语言模型等领域取得突破性进展。2022年,LeCun提出”联合预测嵌入架构”(JEPA)理论,这是一种能够自主学习世界模型与常识性知识的创新自我监督框架。JEPA在方法论上具有显著创新——不同于传统生成模型(如DALL-E和GPT)对像素级细节的精准预测,JEPA聚焦于高阶抽象认知,通过预测场景构成要素与物体间关联关系,构建更稳定的认知框架。这种抽象预测方法使模型在构建环境认知时更为稳健,同时大幅降低学习成本。

I-JEPA作为JEPA理论在图像领域的具体实现,采用独特的”抽象预测目标”机制。该架构通过Vision Transformer(ViT)变体对图像信息进行编码,再由预测器ViT生成语义表示,有效规避了像素级预测的局限性。研究人员还开发了配套生成模型,能够根据I-JEPA的语义预测结果生成场景草图。实验证明,I-JEPA的抽象认知与真实场景高度吻合,虽然无法生成逼真图像,但在机器人与自动驾驶等场景中具有巨大应用潜力。

I-JEPA最突出的优势在于其惊人的计算效率。预训练阶段无需依赖其他自我监督学习方法所需的复杂数据增强技术。研究团队仅用16块A100 GPU,在不到72小时内就成功训练出参数量达632百万的模型,效率提升达十倍。实验表明,I-JEPA能够直接从真实未标记数据中学习强大的语义表示,无需人工构建的模拟场景。在ImageNet-1K图像分类任务中,该模型仅需1%的训练数据(每类仅12-13张图像)即可微调超越其他先进模型,这得益于其更简洁的架构与更少认知偏差。

随着互联网未标记数据的爆炸式增长,I-JEPA等高效学习模型为众多传统依赖人工标注的应用领域带来革命性突破。该项目完整资料已开放访问,详情请参阅https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/。这一创新不仅验证了LeCun关于自主学习世界模型的科学构想,更为人工智能的普惠化发展开辟了新路径。

最新快讯

2026年04月12日

23:17
微新创想:2026年4月12日,摩尔线程宣布已完成MiniMax M2.7大模型的Day-0适配,全面支持其MTT S5000 AI训推一体GPU。这一进展标志着摩尔线程在人工智能硬件与软件协同发展的道路上迈出了重要一步。 M2.7是业界首个具备深度自我进化能力的大模型,能够自主构建Agent Harness,协调Agent Teams,并调用复杂的Skil...
23:17
微新创想:据多方消息,4A Games开发的《地铁》系列新作暂定名为《地铁2039》,预计于2026年4月17日在索尼PlayStation State of Play发布会上首次亮相。这是继2019年《地铁:离去》之后,该系列迎来的首部主线续作,预计将延续末世生存的题材设定。 此前,YouTuber @That darn Crow曝光了疑似新作的开场动画及...
22:44
微新创想:2026年4月12日,新石器无人车CEO余恩源在智能电动汽车发展高层论坛上表示,无人车将替代物流运输环节,使快递员能够更加专注于用户服务。这一变革不仅提升了配送效率,也为城市物流带来了新的可能性。 目前,新石器无人车已在青岛城阳、即墨等多个区域投放超过1200台L4级无人车。随着技术的不断成熟和应用场景的拓展,预计到2026年底,这一数量将突破30...
22:44
微新创想:2026年4月12日,Valve Linux图形驱动工程师Natalie Vock发布新内核补丁及工具dmemcg-booster与plasma-foreground-booster,旨在解决Linux下显存分配无优先级导致的游戏卡顿问题。这一创新方案通过赋予前台游戏显存独占优先权,使得后台任务的数据能够溢出至系统内存,从而优化整体资源使用效率。该...
22:44
微新创想:2026年4月,海外电商平台Waveshare正式上线了PocketTerm35掌上电脑。这款设备以其独特的设计和实用的功能吸引了众多科技爱好者的关注。PocketTerm35配备了一块3.5英寸的触控屏,分辨率为640×480,为用户提供了清晰的视觉体验。同时,它还拥有六行物理键盘,不仅提升了操作的便捷性,也保留了经典掌机的使用习惯。 微新创想:...
22:44
微新创想:据行业消息,佳能计划于2026年5月底发布新一代超长焦镜头,其中包括RF 400mm f/2.8L IS USM以及RF 600mm f/4L USM的继任型号。这一消息表明佳能正在积极布局其高端镜头产品线,以应对即将到来的大型赛事。 此次产品发布的时间节点颇具意义,佳能希望在2026年FIFA世界杯正式开赛前完成新镜头的推出。FIFA世界杯作为全...
22:44
微新创想:2026年4月12日晚 总台《财经调查》栏目播出专题报道 揭露利用AI技术制作传播色情擦边内容的非法产业链 记者调查发现 多平台公开兜售AI造黄教程 定制化提示词及换脸软件 部分应用可绕过审核生成半裸视频 涉事行为违反《清朗·整治AI技术滥用》专项行动要求 亦触犯新施行的《人工智能拟人化互动服务管理暂行办法》 监管部门已将此类AI滥用列为重点打击对...
22:44
微新创想:2026年4月12日,任天堂正式推出《超级马力欧银河1+2》同捆版Switch 2主机,售价为500美元,约合人民币3423元。该套装包含了Switch 2主机与《超级马力欧银河1》和《超级马力欧银河2》两款游戏,相比单独购买主机和游戏,消费者可以节省20美元。这一策略旨在借助同名大电影的票房热度,进一步推动Switch 2的销量。 此次发布发生在...
22:44
微新创想:2026年4月12日,智能电动汽车发展高层论坛在北京举行。论坛汇聚了行业专家、企业代表及政策制定者,共同探讨智能电动汽车行业的未来方向。宇通集团新能源研究院院长李高鹏在会上发表讲话,指出电动化技术已经显著推动了整个产业的快速发展,而智能化将成为下一阶段的重要发展方向。 李高鹏强调,尽管智能驾驶技术在乘用车领域取得了诸多进展,但在大客车的应用上仍需保...
22:44
微新创想:2026年4月11日,Adobe官网发布紧急安全更新,修复了CVE-2026-34621原型链污染漏洞。该漏洞的CVSS评分高达8.6分,表明其潜在危害性极高。 此次安全更新主要针对Acrobat DC、Acrobat Reader DC以及Acrobat 2024等多个版本,涵盖Windows和macOS平台。该漏洞的存在可能被攻击者利用,实现任...
22:44
微新创想:2026年4月12日,阿里云宣布其开源桌面Agent工具CoPaw正式更名为QwenPaw,并同步发布了1.1.0版本。此次更名旨在进一步强化与通义千问(Qwen)开源生态的深度整合,突出其在本地模型支持以及大小模型协同方面的优势。 微新创想:QwenPaw延续了其作为陪伴型个人助手的核心定位,致力于为用户提供更加智能、便捷的服务体验。项目仍然坚持...
22:44
微新创想:据彭博社记者马克·古尔曼4月8日透露,苹果正研发一款名为iPhone Ultra的折叠机型,旨在攻克屏幕折痕明显和整体耐用性不足两大行业痛点。这款新机的设计理念与传统智能手机截然不同,采用了书本式开合结构,使得用户在使用时能够获得更接近平板电脑的体验。 微新创想:展开后的iPhone Ultra将配备一块7.7英寸的内屏,外屏则保持在约5.3英寸的...