阶跃星辰Step3.5Flash开源轻量Agent大模型极速超闭源

2026-02-08 12:59:57 AI动态 5 次阅读

阶跃星辰（Stepfun）近日隆重发布了其划时代的开源基座模型——Step3.5Flash，这款模型专为日益增长的智能体（Agent）应用场景量身打造。它以卓越的推理能力和极致的响应速度为核心，旨在为全球开发者提供一个更为智能、稳定，且运营成本高度可控的“Agent 大脑”，从而彻底革新AI智能体的构建与部署方式。作为一款定位精准的轻量化模型，Step3.5Flash在多个关键维度上实现了行业领先的突破。

Step3.5Flash展现出无与伦比的“极致速度”，其推理速度最高可达每秒生成350个词（350 TPS），特别是在处理复杂的代码生成类任务时，这一优势表现得尤为突出，极大提升了开发效率和用户体验。更令人振奋的是，在Agent核心应用场景以及需要高精度逻辑推理的数学任务上，Step3.5Flash的综合性能已能与主流的闭源大模型一较高下，为开源AI社区树立了新的性能标杆。此外，它还提供了对“长链条任务”的稳健保障，能够高效应对长达256K的超长上下文，确保在处理复杂、多步骤的逻辑链条任务时，模型依然能保持卓越的稳定性和准确性，这对于构建高级智能体至关重要。

在技术架构层面，Step3.5Flash巧妙地兼顾了效率与深度。它采用了先进的稀疏MoE（混合专家）架构，模型总参数量高达1960亿，但每个Token激活的参数量却仅为约110亿，这种设计在赋予模型强大知识容量的同时，又保证了推理时的计算效率。为了进一步将效率推向极致，Step3.5Flash引入了MTP-3技术，实现了在一次预测中同时生成3个Token，这直接将模型的处理效率翻倍。不仅如此，通过结合滑动窗口与全局注意力的混合架构，模型能够精准地捕捉长文本中的关键信息，有效降低了冗余计算开销，确保了长上下文处理的性能与成本效益。

Step3.5Flash在多场景的实际应用中展现了其广泛而强大的才华。在“智能编程”方面，开发者只需一段简短的文字描述，Step3.5Flash便能自动编写并输出基于WebGL2.0引擎的高性能可视化平台代码，极大地加速了开发进程。面对“复杂计算”任务，即使在不依赖任何外部工具的情况下，该模型也能迅速完成等差数列求和、阶乘累加等高难度数学运算，凸显其卓越的逻辑推理能力。而在“端云协同”场景下，Step3.5Flash作为强大的“云端大脑”，能够将用户模糊的需求（例如对比各平台商品价格）智能拆解为具体的搜索与数据抓取子任务，极大地简化了本地执行端的负担，同时确保了结果的准确性和可靠性，为构建无缝的用户体验提供了可能。

目前，Step3.5Flash已在多个主流开放平台实现全量上线，包括GitHub、HuggingFace以及OpenRouter，为开发者提供了便捷的获取途径。为了进一步降低本地部署的门槛，阶跃星辰团队专门对模型进行了深度优化，确保它能够在个人工作站（如NVIDIA DGX、Apple M4Max等高端设备）上高效稳定运行。与此同时，阶跃星辰已正式启动下一代旗舰模型Step4的训练工作，并热情邀请全球的AI开发者、研究者共同参与，携手定义和塑造下一代Agent基础模型，共同推动AI智能体技术的未来发展。OpenRouter目前提供限时免费体验，助力开发者0成本升级您的AI Agent。开发者可以通过GitHub快速部署属于自己的智能Agent，并从HuggingFace获取模型权重，开启创新之旅。

2026年02月08日

17:05

阶跃星辰Step3.5Flash开源轻量Agent大模型极速超闭源

最新快讯

2026年02月08日

美科学家开发TimeVault技术实现细胞7天基因活动全程记录

湖南白银董事荣起因工作调整辞职战略委员会委员职务变动

林洋能源控股股东计划增持5000万至1亿元彰显信心

众生药业创新药昂拉地韦儿童青少年甲流III期试验获积极成果

金富科技拟收购液冷散热企业卓晖金属与联益热能拓展新业务领域

阿里泽泰完成减持三江购物套现2.52亿元持股比例降至27%

千问1分钱奶茶引倒卖乱象官方警告取消资格冻结权益

小米SU7冰雪实拍揭秘 22.99万起底盘操控质感全面进化

美国消费者对设备端AI态度谨慎隐私担忧成主要障碍

春运购票攻略 2月8日全国铁路1325万人次出行 2折特价票抢购指南

49部完结！超级战队告别荧幕 50年辉煌历程回顾

捷尼赛思2027年全新专属平台首发纯电混动齐发力打造差异化驾趣