阶跃星辰(Stepfun)近日正式发布了其最新一代开源基座模型——Step3.5Flash。该模型专为智能体(Agent)场景打造,凭借强大的推理能力与极致的响应速度,旨在为开发者提供一个更聪明、更稳定且成本可控的“Agent 大脑”。

作为一款针对性极强的轻量化模型,Step3.5Flash 在多个维度实现了突破:
-
极致速度:推理速度最高可达350TPS(每秒生成的词数),尤其在代码类任务中表现卓越。
-
性能比肩闭源:在 Agent 核心应用场景和数学逻辑任务上,其表现足以媲美主流闭源大模型。
-
长链条任务保障:具备处理复杂、长逻辑链条任务的稳定性,能够高效应对256K 的超长上下文。
技术架构:兼顾效率与深度
Step3.5Flash 采用了先进的稀疏 MoE(混合专家)架构,总参数量达到1960亿,但每个 Token 激活的参数量仅约为110亿。 为了进一步提升效率,模型引入了 MTP-3 技术,实现一次预测3个 Token,效率直接翻倍。 此外,通过滑动窗口与全局注意力的混合架构,模型能够精准捕捉长文本中的“重点”,大幅降低了计算开销。
多场景实测:从代码到端云协同
在实际应用演示中,Step3.5Flash 展现了多样化的才华:
-
智能编程:仅凭一段文字描述,即可自动编写并输出基于 WebGL2.0引擎的高性能可视化平台。
-
复杂计算:在不使用外部工具的情况下,能够快速完成等差数列求和、阶乘累加等高难度数学运算。
-
端云协同:作为“云端大脑”,它能将用户模糊的需求(如对比各平台价格)拆解为具体的搜索与抓取子任务,极大地简化了本地执行端的难度,确保结果的可靠性。
目前,Step3.5Flash 已在主流平台全量上线,包括 GitHub、HuggingFace 以及 OpenRouter。 为了降低本地部署门槛,阶跃星辰专门优化了模型在个人工作站(如 NVIDIA DGX、Apple M4Max 等)上的运行性能。 此外,公司宣布已经启动 Step4 模型的训练,并邀请全球开发者共同定义下一代 Agent 基础模型。
-
OpenRouter 限免中,0成本升级你的 Agent:https://openrouter.ai/stepfun/step-3.5-flash
-
GitHub 下载快速部署,打造专属 Agent:https://github.com/stepfun-ai/Step-3.5-Flash/tree/main
-
HuggingFace 获取模型权重:https://huggingface.co/stepfun-ai/Step-3.5-Flash
