阶跃星辰 Step 3.5 Flash 发布：为 Agent 而生的开源“轻骑兵”

2026-02-02 10:35:27 AI动态 3 次阅读

阶跃星辰（Stepfun）近日正式发布了其最新一代开源基座模型——Step3.5Flash。该模型专为智能体（Agent）场景打造，凭借强大的推理能力与极致的响应速度，旨在为开发者提供一个更聪明、更稳定且成本可控的“Agent 大脑”。

作为一款针对性极强的轻量化模型，Step3.5Flash 在多个维度实现了突破:

极致速度:推理速度最高可达350TPS（每秒生成的词数），尤其在代码类任务中表现卓越。
性能比肩闭源:在 Agent 核心应用场景和数学逻辑任务上，其表现足以媲美主流闭源大模型。
长链条任务保障:具备处理复杂、长逻辑链条任务的稳定性，能够高效应对256K 的超长上下文。

技术架构:兼顾效率与深度

Step3.5Flash 采用了先进的稀疏 MoE（混合专家）架构，总参数量达到1960亿，但每个 Token 激活的参数量仅约为110亿。为了进一步提升效率，模型引入了 MTP-3 技术，实现一次预测3个 Token，效率直接翻倍。此外，通过滑动窗口与全局注意力的混合架构，模型能够精准捕捉长文本中的“重点”，大幅降低了计算开销。

多场景实测:从代码到端云协同

在实际应用演示中，Step3.5Flash 展现了多样化的才华:

智能编程:仅凭一段文字描述，即可自动编写并输出基于 WebGL2.0引擎的高性能可视化平台。
复杂计算:在不使用外部工具的情况下，能够快速完成等差数列求和、阶乘累加等高难度数学运算。
端云协同:作为“云端大脑”，它能将用户模糊的需求（如对比各平台价格）拆解为具体的搜索与抓取子任务，极大地简化了本地执行端的难度，确保结果的可靠性。

目前，Step3.5Flash 已在主流平台全量上线，包括 GitHub、HuggingFace 以及 OpenRouter。为了降低本地部署门槛，阶跃星辰专门优化了模型在个人工作站（如 NVIDIA DGX、Apple M4Max 等）上的运行性能。此外，公司宣布已经启动 Step4 模型的训练，并邀请全球开发者共同定义下一代 Agent 基础模型。

OpenRouter 限免中，0成本升级你的 Agent:https://openrouter.ai/stepfun/step-3.5-flash
GitHub 下载快速部署，打造专属 Agent:https://github.com/stepfun-ai/Step-3.5-Flash/tree/main
HuggingFace 获取模型权重:https://huggingface.co/stepfun-ai/Step-3.5-Flash

2026年02月02日

11:35

阶跃星辰 Step 3.5 Flash 发布：为 Agent 而生的开源“轻骑兵”

最新快讯

2026年02月02日

灵光App再进化：支持上传图片生应用、集成近20项新API，实用又好玩

革命性 AI 医疗大模型 “羲和一号” 亮相

具身智能领跑者“逐际动力”获2亿美元 B 轮融资，双核产品驱动生态变革

超半数游戏开发者反对AI：行业前景堪忧

旭擎智能获千万级天使轮融资

瓴术科技完成千万级人民币A轮融资

山西新能源装机占比首超煤电达55.1%

德州仪器2025年数据中心营收暴涨64%达15亿美元

中阜复合材料完成B轮融资，瑞木投资领投

《逃离塔科夫》开发商公布新作《COR3》概念预告

美迪凯光学获浙江富浙绍芯基金投资

千问App投入30亿元启动春节请客计划