阶跃星辰Step3.5Flash开源轻量Agent大模型极速超闭源

阶跃星辰(Stepfun)近日隆重发布了其划时代的开源基座模型——Step3.5Flash,这款模型专为日益增长的智能体(Agent)应用场景量身打造。它以卓越的推理能力和极致的响应速度为核心,旨在为全球开发者提供一个更为智能、稳定,且运营成本高度可控的“Agent 大脑”,从而彻底革新AI智能体的构建与部署方式。作为一款定位精准的轻量化模型,Step3.5Flash在多个关键维度上实现了行业领先的突破。

Step3.5Flash展现出无与伦比的“极致速度”,其推理速度最高可达每秒生成350个词(350 TPS),特别是在处理复杂的代码生成类任务时,这一优势表现得尤为突出,极大提升了开发效率和用户体验。更令人振奋的是,在Agent核心应用场景以及需要高精度逻辑推理的数学任务上,Step3.5Flash的综合性能已能与主流的闭源大模型一较高下,为开源AI社区树立了新的性能标杆。此外,它还提供了对“长链条任务”的稳健保障,能够高效应对长达256K的超长上下文,确保在处理复杂、多步骤的逻辑链条任务时,模型依然能保持卓越的稳定性和准确性,这对于构建高级智能体至关重要。

阶跃星辰Step3.5Flash开源轻量Agent大模型极速超闭源插图1

在技术架构层面,Step3.5Flash巧妙地兼顾了效率与深度。它采用了先进的稀疏MoE(混合专家)架构,模型总参数量高达1960亿,但每个Token激活的参数量却仅为约110亿,这种设计在赋予模型强大知识容量的同时,又保证了推理时的计算效率。为了进一步将效率推向极致,Step3.5Flash引入了MTP-3技术,实现了在一次预测中同时生成3个Token,这直接将模型的处理效率翻倍。不仅如此,通过结合滑动窗口与全局注意力的混合架构,模型能够精准地捕捉长文本中的关键信息,有效降低了冗余计算开销,确保了长上下文处理的性能与成本效益。

Step3.5Flash在多场景的实际应用中展现了其广泛而强大的才华。在“智能编程”方面,开发者只需一段简短的文字描述,Step3.5Flash便能自动编写并输出基于WebGL2.0引擎的高性能可视化平台代码,极大地加速了开发进程。面对“复杂计算”任务,即使在不依赖任何外部工具的情况下,该模型也能迅速完成等差数列求和、阶乘累加等高难度数学运算,凸显其卓越的逻辑推理能力。而在“端云协同”场景下,Step3.5Flash作为强大的“云端大脑”,能够将用户模糊的需求(例如对比各平台商品价格)智能拆解为具体的搜索与数据抓取子任务,极大地简化了本地执行端的负担,同时确保了结果的准确性和可靠性,为构建无缝的用户体验提供了可能。

目前,Step3.5Flash已在多个主流开放平台实现全量上线,包括GitHub、HuggingFace以及OpenRouter,为开发者提供了便捷的获取途径。为了进一步降低本地部署的门槛,阶跃星辰团队专门对模型进行了深度优化,确保它能够在个人工作站(如NVIDIA DGX、Apple M4Max等高端设备)上高效稳定运行。与此同时,阶跃星辰已正式启动下一代旗舰模型Step4的训练工作,并热情邀请全球的AI开发者、研究者共同参与,携手定义和塑造下一代Agent基础模型,共同推动AI智能体技术的未来发展。OpenRouter目前提供限时免费体验,助力开发者0成本升级您的AI Agent。开发者可以通过GitHub快速部署属于自己的智能Agent,并从HuggingFace获取模型权重,开启创新之旅。

最新快讯

2026年02月08日

14:58
微新创想:金融巨擘强强联手,共绘支付新蓝图 2月8日,中国支付行业的两大关键基础设施运营机构——中国银联与网联清算有限公司——在上海召开了具有里程碑意义的会晤。中国银联董事长董俊峰与网联清算有限公司总裁崔嵬一行进行了深入的交流与座谈,为中国支付行业的发展注入了新的活力。 此次会谈的主题聚焦于支付行业内的协同深化、清算基础设施效能的全面提升,以及如何更好地支持...
14:58
2026年2月8日,春节临近,短视频平台涌现大量AI生成的名人拜年视频。此类内容依托深度合成技术,融合AI换脸与语音模仿,但未经授权使用他人肖像及声音,涉嫌侵犯人格权(含肖像权、声音权)、名誉权、著作权及商标权。《互联网信息服务深度合成管理规定》明确要求编辑生物识别信息须获被编辑人单独同意。专家呼吁平台落实事前提示、事中审核、事后追溯机制,公众亦需提升法律...
14:34
微新创想2月8日消息,日前,有网友发帖称,微信鸿蒙版更新后,拍照界面和安卓版本一样,怀疑不再调用系统相机。对此,微信员工客村小蒋”晒出华为客服的官方解答进行回应。华为客服明确表示,微信鸿蒙版当前仍然调用的是华为系统相机能力,此次调整主要是对微信拍照交互进行优化,因此界面显示更加简洁。客服进一步说明,微信相机依旧支持华为红枫影像、...
14:28
2月8日(春运第七天),全国铁路预计发送旅客1325万人次。当日计划加开旅客列车1688列,以应对节前出行高峰。客流主要集中于京津冀、长三角、珠三角及成渝等地区,热门方向为北京、上海、广州、深圳、成都等地。铁路部门加强安检、候乘、换乘等环节组织,并动态调整运力,保障旅客安全有序出行。
14:28
2026年2月8日,记者走访成都、深圳、西安等地医美机构获悉,受春节临近影响,全国多地医美消费旺季较往年提前10天以上,部分机构自元旦起即进入高负荷运营。客流集中、热门项目预约周期拉长,夜间营业延至23时。消费结构以光电类(如光子嫩肤)、注射类(水光针、肉毒素、再生材料)等轻医美项目为主。业内人士分析,求美者偏好恢复快、风险低、见效适中的轻医美,推动节前市...
14:28
2026年2月7日,上海召开上海市健康数据产业协会第一届第二次会员大会暨高质量发展学术大会。复旦大学附属中山医院牵头建设的国家人工智能应用中试基地(医疗领域)正式发布国产全栈高性能GPU医疗AI应用解决方案。该方案旨在降低医疗AI落地门槛,推动其从创新研发向临床生产力工具转化。沐曦集成电路与协会现场签约,将提供算力券等多元支持。此举标志着国产GPU在医疗A...
14:28
2026年2月8日14:00至2月9日07:00,贵州茅台自营电商平台“i茅台”APP将进行系统维护升级。此次升级旨在应对近期高流量导致的页面卡顿等问题,提升系统稳定性与服务质量。维护期间,用户登录及部分功能可能出现短暂异常。升级覆盖全国范围,面向所有APP用户。平台建议用户避开该时段办理申购、支付等关键操作,待系统恢复后正常使用。
14:28
2026年2月8日,资深游戏设计师布鲁斯·奈史密斯指出,美国主机/PC游戏全价版15年来维持59.95美元未变,未反映通胀与开发成本上升。他认为涨价本身合理,但玩家对价格极为敏感——一旦突破心理阈值,常未评估内容即放弃购买。这种‘价格冲击’效应强于对流程长度、重玩性等理性的权衡。在核心玩家更清醒、舆论传播更快的当下,盲目提价风险显著。他预测《上古卷轴6》将...
14:28
2026年2月,索尼旗下Guerrilla工作室确认正全力开发在线服务型游戏《地平线:猎手集结》,导致《地平线3》开发进度延后,暂无明确发售时间。该作设定于《地平线》世界观,由原班团队打造,旨在实现工作室长期构想。此举延续索尼近年侧重多人服务型游戏的战略,尽管其过往同类产品超半数失败。粉丝期待的单人续作因此需长期等待,此前传闻的2027年发售计划已被否认。
14:28
2026年2月8日,阿里千问APP与腾讯元宝红包口令在微信平台恢复可复制功能。此前2月6日下午,微信曾限制相关口令的复制操作,用户在微信中选中口令时无法调出复制按钮,元宝口令亦一度被屏蔽。此次调整意味着平台间口令分享限制有所缓和。目前用户可在微信内正常长按选择并复制口令,用于兑换红包。具体技术原因及平台协商细节未公开。
14:04
微新创想2月8日消息,日前,阿里正式发布夸克网盘独立App,目前已在各大应用商店上架。此前夸克网盘集成在夸克App内,此次独立推出为用户提供更加纯粹的网盘使用体验。官方表示,夸克网盘App取消信息流和开屏广告,打开App即可直接访问文件。夸克网盘依托阿里云安全体系,通过ISO认证、等保三级及SOC审计,并采用多重加密机制,全面保...
14:04
微新创想2月8日消息,日前,小米汽车官微发布最新一期答网友问,针对在冬季积雪路面,是否要一直打开湿滑模式”等问题进行详细解答。小米汽车表示,当车辆行驶在湿滑/冰雪路面时,强烈建议车主切换驾驶模式到湿滑模式,以提升行车安全性。进入湿滑模式后,系统会将起步和加速时的动力输出调的更舒缓、驱动车轮之间的扭矩分配更均衡、能量回收力度调的更...