
AI21Labs 近期震撼发布其最新开源小型语言模型——Jamba Reasoning3B,这款被誉为”迷你语言模型”的系统专为在设备端进行高效的人工智能计算而设计。Jamba Reasoning3B 是该公司在特拉维夫精心研发的 Jamba 系列模型的最新力作,并采用业界通用的 Apache2.0许可证公开发布。与市面上大多数大型语言模型(LLM)不同,Jamba Reasoning3B 建立在AI21自有的混合状态空间模型(SSM)-变换器架构之上,这种创新架构在序列建模任务中展现出比传统变换器更高的效率。状态空间模型作为深度学习算法的新星,通过精准预测当前状态来推演下一个状态,而Mamba这一基于SSM的神经网络架构,正是Jamba架构的核心组成部分。
这款迷你语言模型拥有惊人的上下文窗口长度,达到256,000个标记,最高可处理1,000,000个标记,其性能之强足以与Anthropic Claude、Google Gemini和Meta Llama等大型语言模型相媲美,但更令人惊叹的是,它能够在iPhone、Android设备、Mac和PC等小型设备上流畅运行。Futurum Group分析师Brad Shimmin对此表示高度赞赏,作为状态空间模型的支持者,他认为这一理念虽在行业内已有较长的历史积淀,但直到现在才真正实现突破。他指出,随着技术的不断演进,状态空间模型的使用变得更加可行,其强大的扩展性和卓越的速度表现令人瞩目。SSM类型模型通过创新的绳索缩放技术来扩展模型的注意机制,在高效优先处理任务的同时,所需计算能力显著低于大型语言模型。
尽管AI21作为生成AI领域的后起之秀,公司规模相对较小,但凭借Google和Nvidia等重量级企业的鼎力支持,以及自2017年成立以来累计超过6亿美元的融资,AI21正积极构建围绕Jamba Reasoning3B的生态系统,以实现商业价值最大化。在正式发布活动中,AI21展示了Jamba模型在IFBench、MMLU-Pro和Humanity’s Last Exam等权威基准测试系统上的卓越表现,其成绩超越了阿里巴巴的Qwen3.4B、谷歌的Gemma3.4B、Meta的Llama3.23B、IBM的Granite4.0Micro和微软的Phi-4Mini等多个大型开源LLM,充分证明了其技术领先性。
Shimmin进一步指出,这款迷你语言模型在企业市场具有广阔的应用前景,其支持检索增强生成技术的特性,使企业能够根据自身需求进行灵活定制,同时确保数据安全。他特别提到,在客户服务中心领域,Jamba Reasoning3B的强大推理能力可用于高效处理客户投诉,智能判断问题是否需要升级到人工服务或其他高级模型,为企业降本增效提供强大助力。✨ AI21Labs 发布了 Jamba Reasoning3B,一个开放源代码的迷你语言模型,专为边缘 AI 应用设计。 🔍 Jamba Reasoning3B 采用了混合的状态空间模型架构,能够高效处理大量数据并在小型设备上运行。 💼 该模型在企业市场具有潜力,能够根据企业需求进行定制,同时确保数据安全。
