字节跳动旗下Seed团队近日在AI代码分享平台Hugging Face上重磅发布了全新开源大型语言模型Seed-OSS-36B,这一突破性成果专为高级推理能力和开发者友好性而设计。其最引人注目的特性在于能够处理长达512,000个tokens的输入文本,这一能力显著超越了OpenAI和Anthropic等美国科技公司的同类产品,为长文本处理领域树立了新的标杆。

Seed-OSS-36B系列精心设计了三个主要变体,以满足不同场景的需求。Seed-OSS-36B-Base(含合成数据)凭借在标准基准测试中的卓越表现,成为适合各类通用用途的理想选择;不含合成数据的Seed-OSS-36B-Base版本则为研究人员提供了更为纯净的实验基础;而Seed-OSS-36B-Instruct则专注于任务执行和指令遵循能力,通过针对性后训练显著提升了模型在实际应用中的表现。所有模型均采用业界通用的Apache-2.0许可协议,确保研究人员和开发者可以完全免费地使用、修改和重新分发这些模型,无需承担任何字节跳动的许可费用。

这一开源举措不仅标志着中国公司在开放源代码模型领域取得的重大突破,更为全球开发者提供了更多创新可能。Seed-OSS-36B的设计核心在于其强大的技术参数:36亿个参数、64层架构以及155,000个tokens的词汇量,这些配置共同构成了模型强大的处理能力。特别值得一提的是,该模型的长文本处理能力和推理预算设置允许开发者根据具体任务的复杂程度灵活调整模型的推理深度,从而实现资源的最优配置。

在性能表现方面,Seed-OSS-36B在多个权威基准测试中展现了惊人的实力,特别是在数学和编程任务上取得了业界领先的成绩。Seed团队还充分考虑了模型的实用性和可访问性,用户可以通过Hugging Face Transformers平台轻松部署,并支持4位和8位量化格式以有效降低内存需求。此外,团队提供的推理脚本、提示自定义工具和工具集成的解决方案,进一步降低了小团队的技术门槛,让更多开发者和研究人员能够便捷地利用这一强大模型。

字节跳动开源Seed-OSS-36B长文本模型 支持超512k tokens插图

通过提供兼具高性能和灵活部署的开放模型,字节跳动的Seed团队为企业、研究人员和开发者群体带来了前所未有的选择,推动AI技术的创新应用和广泛普及。Seed-OSS-36B的发布不仅彰显了中国在人工智能领域的研发实力,也为全球AI生态系统的繁荣发展注入了新的活力。huggingface:https://huggingface.co/collections/ByteDance-Seed/seed-oss-68a609f4201e788db05b5dcd

划重点:? Seed-OSS-36B模型支持长达512,000个tokens的输入,超越竞争对手。  ? 模型分为合成数据和不含合成数据的版本,以适应不同用户需求。  ? 所有模型均可免费使用,且支持多种部署和集成方案,便于开发者操作。

最新快讯

2026年03月05日

18:30
2026年3月5日,TÜV莱茵北美洲正式完成对咨询与培训机构Quality Support Group Inc.(QSG)的整合。此次整合在北美地区实施,由TÜV莱茵主导,旨在强化其在该区域的业务布局。整合后,TÜV莱茵将提升为制造业、医疗、汽车等多个行业提供高质量、以客户为中心的合规与培训解决方案的能力。此举是TÜV莱茵深化本地化服务战略的重要举措。
18:30
2026年3月,爱立信在巴塞罗那举行的MWC世界移动通信大会期间,凭借“意图感知切片(ARRP)”技术荣获GTI年度大奖——移动技术创新突破奖。该技术实现无线资源自动划分,具备动态频谱分配、自动化运营、极致灵活性与意图驱动设计四大特性。目前,ARRP已在亚洲市场正式商用,旨在提升5G网络效率与服务响应能力。
18:30
3月5日,杭州瓴通智能科技有限公司在浙江杭州注册成立,注册资本1000万元,法定代表人为林鸣晖。公司由阿里巴巴旗下北京锐讯灵通科技有限公司100%持股。经营范围涵盖软件开发与销售、计算机软硬件及外围设备制造等。此举系阿里巴巴进一步布局智能科技与基础软件领域的重要举措,旨在强化其在AI底层技术及产业应用方面的整合能力。
18:30
微新创想:2026年3月5日,万马股份(SZ002276)发布公告,宣布拟筹划发行境外股份(H股)并在香港联交所上市。这一重大举措标志着公司国际化战略迈出了实质性步伐,将进一步拓宽融资渠道,优化资本结构,提升国际品牌影响力,并为海外业务拓展提供有力支持。 目前,公司正在与相关中介机构就具体方案进行深入探讨,相关细节尚未最终确定。值得注意的是,此次境外上市不会...
18:30
微新创想:2026年3月,西班牙巴塞罗那举行的世界移动通信大会(MWC)期间,智元机器人携搭载移远通信5G、Wi-Fi等模组的灵犀X2半尺寸人形机器人亮相移远展台。该机器人不仅具备多语种交互功能,还能够进行太极与舞蹈表演,充分展现了人工智能与机器人技术的创新融合。 移远通信提供的模组及天线方案已经通过全球多项认证,能够确保机器人在不同地区稳定运行。这些模组支...
18:30
微新创想:3月5日,阿里巴巴CEO吴泳铭通过内部邮件回应通义千问核心负责人林俊旸离职事件。林俊旸于3月4日在社交平台宣布卸任,其曾为阿里最年轻的P10级技术高管,主导构建Qwen全系列开源大模型。 吴泳铭表示,阿里将持续加大AI研发投入,坚持开源模型策略,并成立由其本人、阿里云CTO周靖人及饿了么董事长范禹牵头的基础模型支持小组,统筹资源强化基础模型建设。 ...
18:30
微新创想:3月5日,均胜电子与恩力动力宣布达成战略合作,共同开拓具身智能机器人动力能源市场。双方将整合电池管理系统(BMS)、固态电池及具身智能技术优势,在产品协同、技术融合与市场共建等方面深度合作,提供“电芯+BMS+数据服务”一体化能源解决方案。 此次合作旨在应对人形机器人对高能量密度、高安全性、轻量化电池的迫切需求。随着具身智能机器人技术的快速发展,市...
18:30
微新创想:2026年3月5日,PingPong以3760万元竞得信航支付剩余49%股权,实现100%控股 此次交易标志着PingPong在跨境支付领域的重要布局 信航支付持有多项支付牌照,业务覆盖全国互联网支付、浙江预付卡发行与受理、跨境外汇及跨境人民币支付 通过收购信航支付,PingPong能够进一步优化业务结构,提升整体运营效率 交易已完成竞价程序,后续...
18:30
微新创想:英伟达近期宣布将复产GeForce RTX 3060显卡 该产品预计将在2026年3月10日至20日期间陆续抵达各大品牌销售渠道 此次复产的GeForce RTX 3060显卡采用128-bit位宽设计 配备8GB显存版本 性能相比之前推出的12GB显存版本有所下降 厂商表示将在产品到货后正式开始销售 这一举措主要是为了增加入门级游戏显卡的市场供应...
18:30
微新创想:2026年3月5日,小鹏汇天在广州黄埔区量产工厂实现5台“陆地航母”飞行器同日下线并完成多机试飞。这一里程碑事件不仅展示了飞行汽车制造的技术突破,也标志着小鹏汇天在智能出行领域迈出了坚实一步。 该工厂作为全球首个飞行汽车现代化流水线量产基地,具备高度自动化的生产能力。在满产状态下,每30分钟即可下线一台飞行器,大幅提升了生产效率和产品交付能力。这一...
18:30
微新创想:2025年10月起,我国自主研发的CR450动车组在沪渝蓉高铁开展运用考核,目标完成60万公里模拟载客运行。截至2026年3月,考核进度已过半,各项试验指标均达标。其单列试验速度达453公里/小时,交会相对速度896公里/小时,噪声、能耗达优级,空气阻力降低超20%,整车减重约50吨。 微新创想:该车型设计适配现有350公里/小时线路,仅需少量基础...
18:30
微新创想:2026年3月,路虎在英国正式发布了揽胜运动版SV Ultimate Edition特别版车型。这款特别版车型限量发售500台,仅面向英国本土市场,旨在向2015年初代SVR车型致敬。外观方面,该车采用了标志性的Velocity Blue Gloss车漆,展现出独特的视觉效果。内饰则采用了双色温莎真皮材质,营造出豪华而舒适的驾乘环境。 在动力系统方...