Meta首席人工智能科学家Yann LeCun历经数年探索,终于将人类无需过多干预即可自主学习世界模型的深度学习愿景推向现实。近日,Meta正式发布了I-JEPA模型的第一个版本,这一创新机器学习模型通过图像自我监督学习,能够高效构建世界的抽象认知框架。初步测试结果令人瞩目,I-JEPA在众多计算机视觉任务中展现出卓越表现,其计算资源消耗仅为同类先进模型的十分之一。Meta已公开模型训练代码与完整架构,并计划在下周CVPR计算机视觉与模式识别国际会议上进行详细展示。

自我监督学习这一概念源自人类与动物的自然学习机制。我们的大多数知识都源于对世界的直接观察,人工智能系统同样应当具备通过原始数据自主学习的能力,无需人类进行繁琐的数据标注。近年来,自我监督学习已在生成模型与大型语言模型等领域取得突破性进展。2022年,LeCun提出”联合预测嵌入架构”(JEPA)理论,这是一种能够自主学习世界模型与常识性知识的创新自我监督框架。JEPA在方法论上具有显著创新——不同于传统生成模型(如DALL-E和GPT)对像素级细节的精准预测,JEPA聚焦于高阶抽象认知,通过预测场景构成要素与物体间关联关系,构建更稳定的认知框架。这种抽象预测方法使模型在构建环境认知时更为稳健,同时大幅降低学习成本。

I-JEPA作为JEPA理论在图像领域的具体实现,采用独特的”抽象预测目标”机制。该架构通过Vision Transformer(ViT)变体对图像信息进行编码,再由预测器ViT生成语义表示,有效规避了像素级预测的局限性。研究人员还开发了配套生成模型,能够根据I-JEPA的语义预测结果生成场景草图。实验证明,I-JEPA的抽象认知与真实场景高度吻合,虽然无法生成逼真图像,但在机器人与自动驾驶等场景中具有巨大应用潜力。

I-JEPA最突出的优势在于其惊人的计算效率。预训练阶段无需依赖其他自我监督学习方法所需的复杂数据增强技术。研究团队仅用16块A100 GPU,在不到72小时内就成功训练出参数量达632百万的模型,效率提升达十倍。实验表明,I-JEPA能够直接从真实未标记数据中学习强大的语义表示,无需人工构建的模拟场景。在ImageNet-1K图像分类任务中,该模型仅需1%的训练数据(每类仅12-13张图像)即可微调超越其他先进模型,这得益于其更简洁的架构与更少认知偏差。

随着互联网未标记数据的爆炸式增长,I-JEPA等高效学习模型为众多传统依赖人工标注的应用领域带来革命性突破。该项目完整资料已开放访问,详情请参阅https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/。这一创新不仅验证了LeCun关于自主学习世界模型的科学构想,更为人工智能的普惠化发展开辟了新路径。

最新快讯

2026年01月09日

10:28
2025年,即时零售的“东风”依旧猛烈,市场规模逼近万亿大关,“餐饮+非餐”品类单量均刷新了历史纪录,验证即时零售的天花板远未见顶;另一方面,零售供给侧的变革,引发新一轮“外卖大战”,如何充分链接平台、商家和消费者,寻找实现多赢的平衡点,成为即时配送行业贯穿全年的核心主题。也是在这一年,顺丰同城作为行业内稀缺的全场景第三方即配平...
10:28
微新创想1月9日电 根据苹果公司最新披露的文件显示,其CEO蒂姆库克在2025年的总薪酬将达到惊人的7430万美元,折合人民币约5.2亿元。这份文件不仅包含了薪酬明细,还附有一封库克亲自写给苹果股东的感谢信,字里行间流露出他对公司未来的无限信心。 在信中,库克明确表示"我未来从未如此乐观"。他深情回顾了苹果过去一年的辉煌成就,特别提到iPhone 17 P...
10:28
微新创想1月9日深度报道,近日一则关于"上海地铁代坐服务"的帖子在二手交易平台闲鱼上引发轩然大波,迅速成为网络热议焦点。据多位网友提供的截图显示,部分代坐服务价格低至1.99元,专门负责上海地铁9号线特定路段的座位占位。这些可疑帖子主要集中在2、9、10、13、18等热门线路,发帖者大多声称从站点附近上车,并承诺为买家提供座位服务。 一位自称利用午休时间从事...
10:16
2026年1月8日,任天堂宣布新作《马力欧网球狂热》将于2月12日独占登陆Nintendo Switch 2。游戏首发收录38名可玩角色,为系列之最,并引入含30种特殊能力的“狂热球拍”机制,通过积累能量释放干扰技能。同时提供“经典模式”还原纯粹竞技,另有受《惊奇》启发的场地变化模式及冒险、在线多人等玩法,满足多样化需求。
10:16
2026年1月9日,润建股份正式对外宣布与京东科技达成战略合作,双方签署了《战略合作框架协议》,标志着两家企业在人工智能领域的深度合作迈入新阶段。根据协议内容,双方将重点聚焦AI应用创新、智算云平台拓展以及智算AIDC等前沿领域,共同推动人工智能技术的商业化落地进程。此次合作的核心目标在于整合双方优势资源,显著提升技术创新能力,并积极探索智能化场景在各个行业...
10:16
2026年1月9日,技嘉科技在CES 2026发布CQDIMM技术。该技术通过Z890 AORUS TACHYON ICE CQDIMM Edition主板与BIOS优化,实现两条128GB内存满载运行,总容量达256GB,频率高达DDR5-7200,创下业界新纪录。此举解决了高容量与高频率内存难以兼顾的技术难题,为高性能计算提供更强支持。
10:16
2026年1月,揽能新能源宣布完成800万元天使轮融资。揽能新能源是一家专注于别墅户用及工商业场景的分布式能源综合解决方案提供商,主营业务覆盖光伏发电与储能系统的研发、定制化设计及一体化建设。本轮融资资金将用于核心技术迭代、高端人才引进及华东区域市场的深度拓展。此举旨在强化公司在清洁能源领域的技术优势与市场布局,提升综合竞争力,推动绿色能源应用的普及。
10:16
2026年11月,首届电子竞技国家杯(ENC)将在沙特利雅得举行。赛事由EWCF基金会主办,为期四周,设16个游戏项目,每项持续一周。与EWC不同,ENC选手将代表国家参赛,每个国家每项目限派1支队伍或2名选手。参赛名额半数通过预选产生,半数为直邀。赛事此后将每两年在全球轮办一次。
10:16
2026年1月8日,在CES 2026展会上,雷克沙推出THOR Z RGB DDR5内存套件。该产品定位“基准性能”市场,提供32GB(2x16GB)容量,支持6000 MT/s频率,配备Intel XMP 3.0与AMD EXPO技术,可实现一键超频。内存提供两种时序版本,分别为CL36-40-40-96/1.4V和CL38-48-48-96/1.35...
10:16
2026年1月9日,东南亚网约车平台Grab与广汽国际宣布达成战略合作伙伴关系。双方计划在未来两年内,向东南亚六国投放20,000台广汽高性能电动汽车,推动区域绿色出行发展。首批车型将包括广汽埃安Y、埃安S和埃安V三款主力电动车型,丰富Grab平台的车辆供给。此次合作旨在提升电动车在共享出行领域的渗透率,加速东南亚交通可持续化进程。
10:16
2026年1月9日,数码圈传来重磅消息,知名数码博主@数码闲聊站率先披露了一加即将发布的新机信息。这款备受期待的机型代号为D9500,预计将搭载旗舰级配置,正式亮相后有望成为市场焦点。 据悉,D9500将采用一块6.78英寸的LTPS直屏,采用先进的1.5K分辨率显示技术,配合165Hz的高刷新率,带来极致流畅的视觉体验。屏幕不仅支持高分辨率显示,更具备出色...
10:16
2026年1月8日,多家媒体证实,《巫师3:狂猎》或将推出第三个大型DLC,预计于2026年5月发布,恰逢游戏发售11周年。新DLC可能以沙漠地区“瑟瑞卡尼亚”为舞台,亦或引入科维尔和波维斯,形成视觉与剧情的新突破。消息显示,DLC或由Fool's Theory等外部团队主导开发,CDPR仅少量人员参与。此举旨在平衡新作开发与经典内容更新,满足玩家期待。