Meta首席人工智能科学家Yann LeCun历经数年探索,终于将人类无需过多干预即可自主学习世界模型的深度学习愿景推向现实。近日,Meta正式发布了I-JEPA模型的第一个版本,这一创新机器学习模型通过图像自我监督学习,能够高效构建世界的抽象认知框架。初步测试结果令人瞩目,I-JEPA在众多计算机视觉任务中展现出卓越表现,其计算资源消耗仅为同类先进模型的十分之一。Meta已公开模型训练代码与完整架构,并计划在下周CVPR计算机视觉与模式识别国际会议上进行详细展示。

自我监督学习这一概念源自人类与动物的自然学习机制。我们的大多数知识都源于对世界的直接观察,人工智能系统同样应当具备通过原始数据自主学习的能力,无需人类进行繁琐的数据标注。近年来,自我监督学习已在生成模型与大型语言模型等领域取得突破性进展。2022年,LeCun提出”联合预测嵌入架构”(JEPA)理论,这是一种能够自主学习世界模型与常识性知识的创新自我监督框架。JEPA在方法论上具有显著创新——不同于传统生成模型(如DALL-E和GPT)对像素级细节的精准预测,JEPA聚焦于高阶抽象认知,通过预测场景构成要素与物体间关联关系,构建更稳定的认知框架。这种抽象预测方法使模型在构建环境认知时更为稳健,同时大幅降低学习成本。

I-JEPA作为JEPA理论在图像领域的具体实现,采用独特的”抽象预测目标”机制。该架构通过Vision Transformer(ViT)变体对图像信息进行编码,再由预测器ViT生成语义表示,有效规避了像素级预测的局限性。研究人员还开发了配套生成模型,能够根据I-JEPA的语义预测结果生成场景草图。实验证明,I-JEPA的抽象认知与真实场景高度吻合,虽然无法生成逼真图像,但在机器人与自动驾驶等场景中具有巨大应用潜力。

I-JEPA最突出的优势在于其惊人的计算效率。预训练阶段无需依赖其他自我监督学习方法所需的复杂数据增强技术。研究团队仅用16块A100 GPU,在不到72小时内就成功训练出参数量达632百万的模型,效率提升达十倍。实验表明,I-JEPA能够直接从真实未标记数据中学习强大的语义表示,无需人工构建的模拟场景。在ImageNet-1K图像分类任务中,该模型仅需1%的训练数据(每类仅12-13张图像)即可微调超越其他先进模型,这得益于其更简洁的架构与更少认知偏差。

随着互联网未标记数据的爆炸式增长,I-JEPA等高效学习模型为众多传统依赖人工标注的应用领域带来革命性突破。该项目完整资料已开放访问,详情请参阅https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/。这一创新不仅验证了LeCun关于自主学习世界模型的科学构想,更为人工智能的普惠化发展开辟了新路径。

最新快讯

2026年01月20日

17:33
2026年1月20日,显卡制造商映众在荷兰知名科技论坛Tweakers上发布了一份重要声明,揭示了其欧洲RMA中心过去三年多时间里处理过的RTX 4090/5090显卡因12V-2×6供电端子过热熔毁的售后案例仅有15起。这一数据引发了业界的广泛关注,也进一步印证了该系列显卡在供电系统方面的稳定性。据该中心透露,尽管存在供电接口故障的案例,但由用户使用不当导...
17:33
2026年1月20日,零刻发布SER10系列迷你主机,搭载AMD锐龙AI 9 HX 470处理器,基于Zen 5架构,具备12核24线程,加速频率达5.2GHz,并集成XDNA 2 NPU,提供55 TOPS AI算力。该机配备Radeon 890M核显,支持4K剪辑与3D渲染。分为Pro与Max两款型号,分别采用板载LPDDR5X内存和可扩展DDR5内存...
17:33
2026年1月,江苏中科可蓝宣布完成数千万元天使+轮融资。本轮融资由金桥基金、安徽丰原生物联合投资,老股东麟阁创投超额跟投。资金将用于全自然域降解塑料PDA的研发迭代、产能扩充及商业化落地。PDA是一种可在全自然环境下完全降解的生物聚酯材料,适用于包装、医疗、3D打印等多个领域,助力解决塑料污染问题。
17:33
2026年1月20日,大桥局控股宣布完成1200万元天使轮融资。本轮融资将用于深化北京、河南区域市场布局,拓展涵盖投资、商务、财税、供应链等全链条企业服务业务。作为一家多元化的综合企业管理服务提供商,大桥局控股已构建覆盖物业管理、珠宝销售、数字化运营及专业维保等核心板块的生态体系。此次融资标志着公司正式进入加速发展新阶段。
17:33
2026年1月20日,珠海机场开通首条跨境电商货运航线,由京东航空执飞。该航线使用波音738全货机,每周运营6班,从珠海飞往菲律宾克拉克,单次载货约18.5吨。此次开通的航线是珠海机场国际货运口岸启用以来的第二条定期货运航线,主要服务于希音、拼多多等电商平台的华南地区出口货物运输。在珠海市商务局、交通运输局及珠海交控集团推动下,新航线将提升跨境电商物流效率...
17:33
2026年1月20日,Rokid宣布其Rokid Ai Glasses Style正式上市销售。该产品此前在2026年国际消费电子展(CES)全球首发,标志着AI眼镜迈向主流应用的重要一步。新品重38.5克,起售价299美元,支持语音为核心的多模态交互,配备全天候舒适佩戴设计与处方镜片解决方案,续航达每日12小时使用、24小时待机。
17:33
2026年1月20日,蚂蚁阿福升级其PC端,面向医生群体推出DeepSearch(深度搜索)功能,旨在打造中国版“Open Evidence”。该功能免费向医生、医学生及基层医疗工作者开放,提供文献搜索、临床诊疗与科研支持等专业服务。通过健康咨询与DeepSearch两大能力,蚂蚁阿福助力医学从业者提升工作效率,减轻工作负担。此次升级标志着其在用户端与医生...
17:33
据科技媒体MacRumors近日报道,苹果预计将于2026年9月发布iPhone 18 Pro及Pro Max,两款机型将标配12GB LPDDR5内存,与现款iPhone 17 Pro系列保持一致。天风证券郭明錤与广发证券蒲得宇均对此作出预测。此外,iPhone 18标准版也有望升级至12GB内存,较当前8GB提升明显,但发布时间或推迟至2027年3月。...
17:32
2026年1月,备受瞩目的国际消费电子展(CES)上,雷蛇震撼发布了其前沿概念产品——Project AVA,一款搭载革命性Grok AI技术的AI全息桌面设备。这款创新设备能够将3D虚拟形象栩栩如生地投射到现实空间中,无论是深受喜爱的二次元女友绮罗,还是电竞界传奇人物Faker,都能以逼真的虚拟形态与用户互动。除了引人注目的形象投射功能外,Project ...
17:14
1月20日,《华尔街日报》发布重磅消息,百度旗下文心助手月活跃用户数成功突破2亿大关,正式跻身中国AI领域三强之列,与字节跳动的豆包、阿里巴巴的通义千问形成三足鼎立之势。这款具备深度思考与长期记忆能力的AI助手,凭借其精准的上下文交互能力,为用户量身定制个性化推荐服务,功能覆盖视频通话、AI创作、拍照问答及拍题答疑等全方位多模态场景。 通过引入MCP服务...
17:14
研究机构TrendForce在最新报告中指出,全球AI 服务器市场正迎来新一轮爆发。预计到2026年,全球AI 服务器出货量将实现28.3% 的同比增长,而包含通用服务器在内的整体市场增幅也将达到12.8%,扩张速度明显快于2025年。这一增长背后的核心驱动力正发生结构性变化。随着人工智能产业的重心从“模型训练”逐渐转向“推理应用”,大量的推理负载正为通用服...
17:14
百度旗下的智能助手文心助手月活跃用户数已正式突破2亿大关。这一里程碑式的增长,标志着文心助手已与豆包、千问共同构成了中国大模型市场的“三大亿级 AI 入口”。目前,文心助手已深度整合至百度搜索应用及 PC 端,并展现出从“信息提供”向“服务交付”的跨越。该助手不仅具备深度思考与长期记忆能力,能根据对话上下文提供个性化推荐,还支持多模态全能交互。通过调用 MC...