AI21发布开源迷你模型Jamba Reasoning3B 专为边缘AI设计

2025-10-09 10:48:48 AI动态 26 次阅读

AI21Labs 近期震撼发布其最新开源小型语言模型——Jamba Reasoning3B，这款被誉为”迷你语言模型”的系统专为在设备端进行高效的人工智能计算而设计。Jamba Reasoning3B 是该公司在特拉维夫精心研发的 Jamba 系列模型的最新力作，并采用业界通用的 Apache2.0许可证公开发布。与市面上大多数大型语言模型(LLM)不同，Jamba Reasoning3B 建立在AI21自有的混合状态空间模型(SSM)-变换器架构之上，这种创新架构在序列建模任务中展现出比传统变换器更高的效率。状态空间模型作为深度学习算法的新星，通过精准预测当前状态来推演下一个状态，而Mamba这一基于SSM的神经网络架构，正是Jamba架构的核心组成部分。

这款迷你语言模型拥有惊人的上下文窗口长度，达到256,000个标记，最高可处理1,000,000个标记，其性能之强足以与Anthropic Claude、Google Gemini和Meta Llama等大型语言模型相媲美，但更令人惊叹的是，它能够在iPhone、Android设备、Mac和PC等小型设备上流畅运行。Futurum Group分析师Brad Shimmin对此表示高度赞赏，作为状态空间模型的支持者，他认为这一理念虽在行业内已有较长的历史积淀，但直到现在才真正实现突破。他指出，随着技术的不断演进，状态空间模型的使用变得更加可行，其强大的扩展性和卓越的速度表现令人瞩目。SSM类型模型通过创新的绳索缩放技术来扩展模型的注意机制，在高效优先处理任务的同时，所需计算能力显著低于大型语言模型。

尽管AI21作为生成AI领域的后起之秀，公司规模相对较小，但凭借Google和Nvidia等重量级企业的鼎力支持，以及自2017年成立以来累计超过6亿美元的融资，AI21正积极构建围绕Jamba Reasoning3B的生态系统，以实现商业价值最大化。在正式发布活动中，AI21展示了Jamba模型在IFBench、MMLU-Pro和Humanity’s Last Exam等权威基准测试系统上的卓越表现，其成绩超越了阿里巴巴的Qwen3.4B、谷歌的Gemma3.4B、Meta的Llama3.23B、IBM的Granite4.0Micro和微软的Phi-4Mini等多个大型开源LLM，充分证明了其技术领先性。

Shimmin进一步指出，这款迷你语言模型在企业市场具有广阔的应用前景，其支持检索增强生成技术的特性，使企业能够根据自身需求进行灵活定制，同时确保数据安全。他特别提到，在客户服务中心领域，Jamba Reasoning3B的强大推理能力可用于高效处理客户投诉，智能判断问题是否需要升级到人工服务或其他高级模型，为企业降本增效提供强大助力。✨ AI21Labs 发布了 Jamba Reasoning3B，一个开放源代码的迷你语言模型，专为边缘 AI 应用设计。 🔍 Jamba Reasoning3B 采用了混合的状态空间模型架构，能够高效处理大量数据并在小型设备上运行。 💼 该模型在企业市场具有潜力，能够根据企业需求进行定制，同时确保数据安全。

2025年11月28日

19:01

AI21发布开源迷你模型Jamba Reasoning3B 专为边缘AI设计

最新快讯

2025年11月28日

胜科纳米5亿投建青岛检测项目提升半导体检测分析能力

贝达药业恩沙替尼获欧洲受理有望治疗ALK阳性肺癌

M&M’S上海迪士尼小镇新店2026开业购物餐饮娱乐一体沉浸体验

美团Q3核心本地商业巨亏141亿同比由盈转亏

海特生物参股ZM-02眼用注射液获FDA临床试验批准迈向国际

泰恩康子公司获巴瑞替尼片注册证开拓自身免疫疾病治疗市场

首旅如家引入煮面机器人提升早餐效率

昂利康恩格列净二甲双胍缓释片获注册证丰富糖尿病治疗选择

全球存储芯片短缺加剧多家美企或提价应对AI需求

新疆首单火电ABS成功发行引领基础设施融资创新

2025年10月中国货物贸易顺差6413亿元进出口分析

华阳股份七元煤业正式投产年产能达500万吨