商汤开源原生多模态架构NEO 实现视觉语言底层统一处理

2025-12-02 23:14:24 快讯 2 次阅读

2025年12月2日，商汤科技携手南洋理工大学S-Lab共同发布并开源了革命性的多模态模型架构NEO，这一创新成果标志着行业首个实现深层次融合的原生视觉语言模型的诞生。NEO架构通过突破性的原生图块嵌入技术、三维旋转位置编码以及创新的多头注意力机制，成功实现了视觉与语言在底层层面的统一处理，为多模态AI领域开辟了全新路径。

NEO架构采用了独特的Pre-Buffer & Post-LLM双阶段训练策略，在仅使用3.9亿数据量的情况下，便达到了令人瞩目的顶尖视觉理解能力。这一成就不仅彰显了NEO架构的高效性，更在MMMU、SEED-I等多项权威评测中取得了优异表现，充分验证了其强大的技术实力和广泛的应用潜力。

相较于传统的模块化模型，NEO架构在数据效率、推理性能以及边缘部署方面展现出显著优势。其创新的设计理念使得模型能够在资源受限的环境下依然保持高效运行，为实际应用场景提供了更多可能性。这一突破性进展将极大推动多模态AI技术在各领域的落地应用。

目前，NEO架构的2B与9B版本已正式面向全球开发者开源，这一举措将加速推动多模态AI技术的普及与发展，为全球开发者提供更加强大、高效的AI工具，共同探索人工智能的无限可能。

2025年12月02日

23:45

商汤开源原生多模态架构NEO 实现视觉语言底层统一处理

最新快讯

2025年12月02日

龙蟠科技孙公司签下45亿磷酸铁锂大单销售额达55亿

辰安科技14.19亿定增获控股权变更合肥国投成控股股东

Luma AI获9亿美元融资估值40亿扩招200人加速AI视频研发

波音CFO：暂缓投资者回报聚焦改善现金流

波音2025年内完成Spirit收购整合供应链提升效率

江苏神通实控人亲属增持405万股未来6月拟增1亿至1.55亿

普华永道报告香港营商环境全球领先营商信心超全球平均水平

索尼FE 28-70mm F3.5-5.6 OSS II新镜头发布支持高连拍

市场监管总局修订国家食品安全事故应急预案征求意见

交易商协会发布并购票据新规优化机制助力企业融资升级

中鼎股份拟发25亿可转债加码智能机器人与新能源汽车研发

星聚生态链启未来2025卫星互联网产业生态大会12月上海启幕