
阶跃星辰(Stepfun)近日隆重发布了其划时代的开源基座模型——Step3.5Flash,这款模型专为日益增长的智能体(Agent)应用场景量身打造。它以卓越的推理能力和极致的响应速度为核心,旨在为全球开发者提供一个更为智能、稳定,且运营成本高度可控的“Agent 大脑”,从而彻底革新AI智能体的构建与部署方式。作为一款定位精准的轻量化模型,Step3.5Flash在多个关键维度上实现了行业领先的突破。
Step3.5Flash展现出无与伦比的“极致速度”,其推理速度最高可达每秒生成350个词(350 TPS),特别是在处理复杂的代码生成类任务时,这一优势表现得尤为突出,极大提升了开发效率和用户体验。更令人振奋的是,在Agent核心应用场景以及需要高精度逻辑推理的数学任务上,Step3.5Flash的综合性能已能与主流的闭源大模型一较高下,为开源AI社区树立了新的性能标杆。此外,它还提供了对“长链条任务”的稳健保障,能够高效应对长达256K的超长上下文,确保在处理复杂、多步骤的逻辑链条任务时,模型依然能保持卓越的稳定性和准确性,这对于构建高级智能体至关重要。

在技术架构层面,Step3.5Flash巧妙地兼顾了效率与深度。它采用了先进的稀疏MoE(混合专家)架构,模型总参数量高达1960亿,但每个Token激活的参数量却仅为约110亿,这种设计在赋予模型强大知识容量的同时,又保证了推理时的计算效率。为了进一步将效率推向极致,Step3.5Flash引入了MTP-3技术,实现了在一次预测中同时生成3个Token,这直接将模型的处理效率翻倍。不仅如此,通过结合滑动窗口与全局注意力的混合架构,模型能够精准地捕捉长文本中的关键信息,有效降低了冗余计算开销,确保了长上下文处理的性能与成本效益。
Step3.5Flash在多场景的实际应用中展现了其广泛而强大的才华。在“智能编程”方面,开发者只需一段简短的文字描述,Step3.5Flash便能自动编写并输出基于WebGL2.0引擎的高性能可视化平台代码,极大地加速了开发进程。面对“复杂计算”任务,即使在不依赖任何外部工具的情况下,该模型也能迅速完成等差数列求和、阶乘累加等高难度数学运算,凸显其卓越的逻辑推理能力。而在“端云协同”场景下,Step3.5Flash作为强大的“云端大脑”,能够将用户模糊的需求(例如对比各平台商品价格)智能拆解为具体的搜索与数据抓取子任务,极大地简化了本地执行端的负担,同时确保了结果的准确性和可靠性,为构建无缝的用户体验提供了可能。
目前,Step3.5Flash已在多个主流开放平台实现全量上线,包括GitHub、HuggingFace以及OpenRouter,为开发者提供了便捷的获取途径。为了进一步降低本地部署的门槛,阶跃星辰团队专门对模型进行了深度优化,确保它能够在个人工作站(如NVIDIA DGX、Apple M4Max等高端设备)上高效稳定运行。与此同时,阶跃星辰已正式启动下一代旗舰模型Step4的训练工作,并热情邀请全球的AI开发者、研究者共同参与,携手定义和塑造下一代Agent基础模型,共同推动AI智能体技术的未来发展。OpenRouter目前提供限时免费体验,助力开发者0成本升级您的AI Agent。开发者可以通过GitHub快速部署属于自己的智能Agent,并从HuggingFace获取模型权重,开启创新之旅。
