商汤开源NEO架构:原生多模态模型性能突破数据减90%

商汤科技携手南洋理工大学 S-Lab 联合推出行业首创的原生多模态架构 NEO,并同步向公众开放2B与9B两款预训练模型。这一创新架构彻底颠覆了传统的”视觉编码器+投影器+语言模型”三段式设计,从注意力机制到位置编码再到语义映射进行了全面重构。据官方公布的数据显示,在保持同等性能表现的前提下,NEO架构的数据需求量仅为行业平均水平的三十分之一,开创性地实现了”像素到Token”的连续映射模式。

商汤开源NEO架构:原生多模态模型性能突破数据减90%插图1

商汤技术负责人详细解释道,NEO架构的核心突破在于原生图块嵌入层的设计,该层能够直接读取像素信息,从而取消了传统模型中独立的图像Tokenizer。特别值得一提的是其创新的三维旋转位置编码技术(Native-RoPE),这一技术能够在同一向量空间内同时处理文本与视觉时空频率信息。此外,NEO采用”视觉双向+文本自回归”的混合多头注意力计算机制,通过强化空间结构关联得分,使模型性能提升高达24%。

经过严格测试验证,NEO架构在0.6B至8B的参数规模区间内表现出色,在ImageNet、COCO以及Kinetics-400等多个权威数据集上均取得了当前最优(SOTA)的实验结果。值得注意的是,该架构在边缘设备上的推理延迟控制在80毫秒以下,充分展现了其在实际应用中的高效性。目前,所有模型权重与训练脚本已完整上传至GitHub平台,供开发者自由使用。

商汤开源NEO架构:原生多模态模型性能突破数据减90%插图2

展望未来,商汤科技计划在明年第一季度进一步扩大开源范围,推出支持3D感知与视频理解的升级版本。业内专家普遍认为,NEO架构所倡导的”深层融合”理念有望彻底改变当前多模态模型”拼积木式”的集成方式,为终端小模型性能树立全新的基准线,将多模态AI技术推向更加智能化、高效化的新阶段。

最新快讯

2025年12月03日

11:45
接力挑战的风,在抖音越刮越猛了。今年8月,MC游戏圈开启了一场建筑生存接力挑战。这场挑战本意是一场主打休闲的友谊赛,却意外演变成了一场神仙打架的极限创作。MC创作者们仿佛肝王转世,用一个个令人惊叹的作品,刷新了人们对《我的世界》建造能力的认知。 MC,即全球知名沙盒类电子游戏《我的世界》,因其极高的自由度,让玩家可以在由方块构成的3D世界中自由探索、建造与冒...
11:45
微新创想12月3日深度报道 一颗小小的鱼胆竟成致命毒药 深圳阿姨险些丧命 近日深圳发生一起令人震惊的鱼胆中毒事件,一位阿姨因轻信民间偏方,生吞鱼胆后几小时内出现严重中毒症状,最终在紧急救治下才侥幸脱险。这起事件再次敲响食品安全警钟,提醒公众切勿盲目相信传统偏方而忽视潜在风险。 据媒体报道,这位深圳阿姨在处理草鱼时,想起民间流传的"鱼胆能清火、明目、解毒"的说...
11:45
豆包输入法:字节对微信的又一次精妙突袭 几天前,字节跳动再次推出重磅产品——豆包输入法。作为一款古老的工具型应用,输入法在移动端早已形成稳定格局。用户要么习惯使用手机自带的输入法,要么延续PC时代习惯,选择搜狗、QQ等传统输入法。直到2022年微信输入法横空出世,这块看似稳固的市场才迎来全新变量。凭借微信庞大的用户池,这款输入法迅速成为众多用户的新宠。然而,...
11:44
12月3日重磅消息,阿里千问AI在全球高难度考试与竞赛领域取得令人瞩目的突破性成绩,其优异表现已覆盖多个国家的高等教育入学考试、国际学科竞赛以及国家级职业认证等多个关键领域。这一系列成就不仅彰显了千问AI强大的学术能力,更凸显了其在复杂知识体系解析与解题策略方面的卓越表现。与此同时,千问APP针对学习场景进行了重磅升级,全新推出的“拍题答疑”和“作业批改”功...
11:44
12月2日,英伟达首席财务官科莱特·克雷斯在瑞银全球科技与人工智能大会上,针对"AI泡沫"的质疑掷地有声地作出回应。她明确指出,全球目前正处于AI基础设施转型的关键"早期阶段",而英伟达在该领域的领先优势不仅稳固,反而持续扩大。 面对市场对"AI泡沫"的普遍担忧,克雷斯用一组关键数据有力回击了质疑。数据显示,目前交付的英伟达全新AI芯片中,绝大多数被用于新建...
11:44
OpenAI首席研究员Mark Chen近日在12月2日播出的播客节目中,披露了一场令人啼笑皆非的AI人才争夺战。据悉,Meta为吸引顶尖AI专家,竟采取亲自送热汤上门的温情策略,而OpenAI则以赠送自制浓汤作为巧妙反击,这场别开生面的"汤战"迅速成为硅谷猎头市场的最新焦点。 Chen详细描述了Meta的招聘攻势:"他们的招聘团队会端着热汤站在候选人门前,...
11:44
Gradium,这家来自法国的AI语音初创公司,于12月3日正式揭开神秘面纱,宣布成功斩获7000万美元种子轮融资,这一数字不仅刷新了欧洲语音AI领域的种子轮纪录,更彰显了其在技术创新领域的巨大潜力。本轮融资由FirstMark Capital与Eurazeo联合领投,法国电信亿万富翁Xavier Niel、DST Global Partners以及前Goo...
11:44
美国初创企业Arcee AI近日重磅发布全新Trinity系列AI模型,旨在重塑开源人工智能领域的竞争格局,重新确立美国在该领域的领先地位。与当前众多主流开源大语言模型不同,Trinity系列模型实现了全美本土化训练,并创新性地采用了开放权重的混合专家(MoE)架构,彰显了美国在开源AI领域的决心与实力。 Trinity系列目前包含Trinity Mini和...
11:44
科技媒体The Register近日曝光了一起令人震惊的AI编程事故,希腊摄影师Tassos M.在使用谷歌AI编程平台Antigravity时,遭遇AI错误生成并自动执行代码,导致其Windows 11系统下的整个D盘数据被清空。这一事件不仅给受害者带来巨大损失,更引发全球范围内对AI辅助开发安全性的广泛担忧。 事件经过:AI自认"错误严重指向根目录" T...
11:24
2025年12月3日,AMD通过其官方技术门户网站正式发布了备受期待的EPYC Embedded 2005系列处理器。这一全新系列基于先进的Zen 5架构,采用代号"Fire Range"的设计理念,为市场带来了强大的性能与灵活性。该系列处理器最高配备16个核心,能够满足严苛的多任务处理需求。在内存支持方面,EPYC Embedded 2005系列率先兼容D...
11:24
2025年12月3日,倍通医药正式向香港交易所提交了招股书,正式宣告进军资本市场。作为医药健康领域渠道数据整合的领军企业,倍通医药凭借其专业的数据采集与整合技术,为行业客户提供全方位的信息服务、智能工具及定制化解决方案。公司致力于通过高效的数据分析,帮助客户优化渠道管理策略,提升销售执行效率,强化合规管控体系,从而实现业务增长与风险控制的双重提升。此次IPO...
11:24
2025年12月3日,备受瞩目的草本护肤品领军品牌林清轩正式向香港交易所递交招股书,宣布正式启动主板上市计划。作为植萃护肤领域的深耕者,林清轩扎根中国,构建起从源头种植到终端销售的全产业链生态体系。其核心竞争力在于以山茶花、芦荟、红石榴等珍贵草本植物为原料,通过现代科技与传统智慧的完美融合,研发出一系列高品质的护肤及个人护理产品。此次资本市场的战略布局,不仅...