硅基流动上线Ling-flash-2.0大模型 推理速度创纪录

硅基流动大模型服务平台近日迎来重大更新,正式上线了蚂蚁集团百灵团队最新开源的 Ling-flash-2.0 模型,这已是该平台上线的第130个创新模型。Ling-flash-2.0 作为一款基于 MoE 架构的百亿参数大型语言模型,在性能与效率上实现了突破性平衡——激活时仅需6.1亿参数(非嵌入激活更仅需4.8亿),却能在6亿以上参数的激活状态下,展现出媲美40亿参数 Dense 模型的卓越表现。通过20TB以上高质量语料的深度预训练、精细化监督微调及多阶段强化学习,Ling-flash-2.0 在复杂推理、代码生成和前端研发等前沿领域展现出惊人的应用潜力,其最大128K的上下文长度支持,更是为用户提供了前所未有的文本处理能力。

Ling-flash-2.0 不仅性能卓越,性价比同样出众。其定价策略极为亲民:输入成本为每百万Token1元,输出成本为每百万Token4元,让更多开发者能够轻松体验尖端AI技术。为回馈新用户,国内站与国际站分别提供了14元和1美元的免费使用体验金,让全球开发者都能零门槛探索模型魅力。在性能对比中,Ling-flash-2.0 凭借其独特的MoE架构优势,超越了40亿参数以下的 Dense 模型(如 Qwen3-32B-Non-Thinking 和 Seed-OSS-36B-Instruct),也展现出优于更大激活参数的 MoE 模型(如 Hunyuan-A13B-Instruct 和 GPT-OSS-120B/low)的复杂推理能力,尤其在创作类任务中表现亮眼。

硅基流动上线Ling-flash-2.0大模型 推理速度创纪录插图1

其极速推理性能更是令人惊叹。在 Ling Scaling Laws 的科学指导下,Ling-flash-2.0 采用了1/32激活比例的MoE架构,并通过多项细节优化,实现了小激活MoE模型与Dense架构同等性能的突破。通过H20高效部署后,模型输出速度可达每秒200余Token,是36B Dense模型的3倍以上,为开发者带来闪电般的响应体验。硅基流动平台始终致力于打造快速、经济、可靠的大模型API服务生态,除Ling-flash-2.0外,平台还汇聚了丰富多样的语言、图像、音频、视频等模型资源,满足不同场景的开发需求。开发者可自由对比组合各类模型,通过高效API轻松调用,加速生成式AI应用落地实践。

划重点:🌟 Ling-flash-2.0 是一款基于MoE架构的百亿参数语言模型,复杂推理能力突出。⚡ 支持最大128K上下文长度,极速推理性能达每秒200+Token。💰 新用户可享国内外站专属体验金,硅基流动平台提供全方位大模型服务,助力开发者创新突破。国内站在线体验:https://cloud.siliconflow.cn/models国际站在线体验:https://cloud.siliconflow.com/models

最新快讯

2025年09月18日

14:13
GPT-5发布后不久,OpenAI却出人意料地决定让GPT-4o等前代模型“复活”,这一决策背后隐藏着用户对旧模型的深厚情感。当GPT-4o被下线时,许多用户表现出强烈的失落感,仿佛失去了一位熟悉的伙伴,这种情感反应远超OpenAI的预期。在最近的一次采访中,OpenAI首席产品官Nick Turley深入剖析了这一现象,坦言GPT-5的发布并未达到预期效果...
14:13
近日,OpenAI高级副总裁Nick Turley在一场深度访谈中坦诚,公司在推出GPT-5模型时遭遇了意想不到的舆论风波。他透露,这场风波的根源在于OpenAI未能制定周密的过渡方案,同时严重低估了用户对GPT-4o形成的情感纽带。作为ChatGPT产品负责人,Turley强调,当前OpenAI面临的最大挑战是如何妥善处理用户与AI模型之间日益增强的"人格...
14:13
科技媒体The Verge最新报道,微软即将随新一代Xbox Ally掌机在下月正式发布全新的Xbox全屏体验功能。不过令人惊喜的是,已有技术爱好者发现这一创新模式并非遥不可及,他们成功在搭载Windows 11 25H2预览版的多款设备上提前体验。通过专业工具ViVeTool的辅助以及精巧的注册表调整,包括微星Claw、华硕ROG Ally等备受关注的便携...
14:13
Synthesize生物医学发现软件开发商近日宣布成功斩获1000万美元种子轮融资,投资方阵容强大,涵盖AI2 Incubator、Point Field Partners等知名机构。这家创新企业专注于将人工智能技术深度应用于生物数据生成与分析领域,通过革命性技术手段将传统耗时数月的科研流程压缩至短短几分钟内完成,极大地降低了科研时间与资源成本。Synthe...
14:13
2025年9月18日,备受瞩目的中国国际城市轨道交通展览会于山东青岛盛大开幕。展会现场,我国首列自主研发的中国标准智能市域列车震撼亮相,引发全场关注。这款时速高达200公里的市域D型车不仅代表了我国轨道交通技术的最新成就,更以其GoA4级全自动驾驶技术,成为全国首列、全球最快的全自动运行轨道车辆,树立了行业新标杆。 该列车在技术创新上实现了多项突破,全面融合...
14:11
近日,演员谢孟伟(网名“嘎子哥”)因直播带货时身着警服的违规行为,引发社会广泛关注并最终受到行政处罚。据悉,谢孟伟在云南拍摄电影期间,利用网络直播平台进行带货活动,期间公然穿着带有警察肩章和臂章的人民警察制式服装,这一行为迅速触发了大量网友的举报。与此同时,谢孟伟在快手平台上的账号也因该事件遭到封禁。9月18日,“嘎子哥”的快手账号已被平台正式封禁,彻底无法...
14:11
近期,蜜雪冰城多地区门店柠檬水出现暂时性缺货,引发广泛关注。不少消费者反映,部分门店柠檬水及相关饮品如柠檬奶等供应紧张,甚至出现排队"抢货"现象。面对这一情况,蜜雪冰城迅速作出回应,展现出高度的责任感。 蜜雪冰城相关人士透露,目前公司柠檬整体储备充足,大量进口柠檬即将到港,同时储存的柠檬已通过严格质量评测,完全符合使用标准,并将陆续下发至各门店。该人士强调,...
14:11
微新创想9月18日重磅报道,备受瞩目的iPhone 17 Pro及iPhone 17 Pro Max终于解除了评测禁令,其搭载的A19 Pro芯片性能表现成为业界焦点。极客湾率先对iPhone 17系列进行了全面测试,通过多款3A级游戏的帧率对比,揭示了A19 Pro在性能上的惊人突破,大幅超越了苹果前代A18 Pro与A17 Pro芯片。 在实测数据中,A...
13:41
央视新闻报道,我国自主研发的首列中国标准智能市域列车在山东青岛举办的2025中国国际城市轨道交通展览会上惊艳亮相。这款时速200公里的市域D型车不仅代表了我国轨道交通技术的最新成就,更以其GoA4级全自动驾驶技术,刷新了全球最快全自动运行轨道车辆的纪录。 该列车通过深度融合数字孪生技术与先进AI算法,实现了智能运维与高效故障预警功能。这一创新技术的应用,...
13:41
2025年9月18日,重庆润生药业传来振奋人心的消息,其自主研发的丙酸氟替卡松吸入粉雾剂正式获批上市。这款创新药物作为国内首款同类吸入粉雾剂,专用于哮喘治疗,凭借其卓越的疗效、便捷的使用方式和高度的安全性,为哮喘患者带来了全新的治疗选择。该产品在重庆两江新区完成研发,不仅彰显了润生药业在高端吸入制剂领域的雄厚实力,更标志着企业在该领域实现了重大技术突破。此次...
13:41
2025年9月18日,备受瞩目的中国—东盟人工智能部长圆桌会议在广西南宁隆重举行。此次盛会由中国国家发展改革委携手广西壮族自治区人民政府联合主办,不仅标志着中国与东盟国家在人工智能领域合作迈入新阶段,更正式宣布启动建设中国—东盟国家人工智能应用合作中心这一里程碑项目。会议期间,与会各方就夯实人工智能发展基础、推动开源服务共享、深化产业精准对接以及优化人才培养...
13:41
智界产品总监近日正式宣布,搭载前沿ADS 4.0智能驾驶系统的最新版本已完成备案,即将全面启动推送工作。根据可靠渠道提供的用户群聊截图,此次升级计划于本周五正式启动,预计在9月23日实现全量覆盖。该消息来源权威可信,与总监此前公开披露的信息高度吻合,充分验证了升级计划的严肃性和执行力。 作为鸿蒙智行生态的重要组成部分,旗下多品牌正同步推进ADS 4.0系统的...