中科院SpikingBrain类脑大模型:2%数据百倍速突破长文本处理瓶颈

近日,中国科学院自动化研究所的李国齐与徐波团队联合发布了一项革命性成果——全球首款大规模类脑脉冲大模型SpikingBrain1.0。这一创新模型在处理长文本任务时展现出惊人的性能,其速度比当前主流的Transformer模型高出百倍以上,能够高效处理高达400万token的超长文本,同时仅需2%的数据量即可达到同等效果。这一突破性进展为人工智能领域带来了新的曙光。

当前主流的大语言模型,如GPT系列,普遍基于Transformer架构。尽管Transformer凭借其强大的自注意力机制在自然语言处理领域取得了显著成就,但其计算复杂度却成为制约其发展的瓶颈。随着文本长度的增加,Transformer的计算量呈现平方级别的增长,导致处理长文本时耗时且能耗巨大。这一局限性使得AI在分析长篇小说、法律文书等复杂文本时显得力不从心。

为了突破这一瓶颈,研究团队将目光投向了自然界最精密的智能系统——人脑。人脑由千亿神经元构成,却能以仅为20瓦的功耗高效运行。受此启发,团队提出了“基于内生复杂性”的理念,旨在通过模拟人脑神经元的工作方式提升模型的内部效率与智能。

SpikingBrain模型通过全新的架构模拟了人脑神经元的工作原理,推出了两个版本:SpikingBrain-7B(70亿参数)和SpikingBrain-76B(760亿参数)。首先,该模型创新性地抛弃了传统Transformer的二次方复杂度自注意力机制,采用了“混合线性注意力架构”,将计算复杂度降至线性(O(n)),大幅提升了处理长文本的效率。这一改进使得模型在处理超长文本时能够保持极高的速度和效率。

其次,SpikingBrain引入了“自适应阈值脉冲神经元”机制。这种机制使神经元的激活状态取决于接收到的信号强度,通过动态调整阈值,模型能够在高效能状态下运行。这种事件驱动的机制显著降低了能耗,计算稀疏度高达69.15%,为AI模型的绿色计算提供了新方案。

中科院SpikingBrain类脑大模型:2%数据百倍速突破长文本处理瓶颈插图1

此外,研究团队还开发了一套高效的模型转换技术,能够将现有的Transformer模型直接转化为SpikingBrain架构,极大地降低了模型训练的成本和门槛。所有技术细节和代码已在GitHub及魔搭平台上开源,供全球研究人员免费使用,这一举措将加速类脑计算技术的普及与发展。

此次SpikingBrain的问世不仅在计算效率上取得了重大突破,更为未来的通用人工智能发展提供了一条全新的思路。通过模拟人脑的工作原理,SpikingBrain展现了在处理复杂任务时的巨大潜力,有望推动人工智能领域迈向更高水平的发展。

GitHub:https://github.com/BICLab/SpikingBrain-7B

划重点:
🌟 研究团队推出的SpikingBrain模型在处理长文本时速度比主流模型快100倍,仅需2%训练数据。
🧠 该模型采用混合线性注意力架构,计算复杂度从二次方降至线性,显著提升了处理效率。
💡 SpikingBrain的自适应阈值脉冲神经元机制大幅降低能耗,实现高达69.15%的计算稀疏度。

最新快讯

2026年02月13日

07:34
微新创想:2026年2月12日,OpenAI与Cerebras在美国联合发布GPT-5.3-Codex-Spark模型。该模型主打超低延迟实时编程协作,旨在提升开发者的效率与体验。 GPT-5.3-Codex-Spark由Cerebras Wafer-Scale Engine提供算力支持,推理速度超过1000 tokens/s。这一突破性的性能表现使得模型在...
07:34
微新创想:2026年2月12日起 谷歌面向Google AI Ultra订阅用户及部分研究人员、工程师开放升级版Gemini 3 Deep Think推理模式 该模式专为科学、工程与研究场景设计 由谷歌联合多领域科学家共同开发 应对边界模糊 解不唯一 数据杂乱等真实科研挑战 新版通过Gemini应用及API(早期访问计划)提供 在IMO 2025、IPhO、...
07:34
微新创想:2026年2月13日,微软面向Windows Insider Canary频道用户推送了Build 28020.1611(KB5077221)预览版更新。此次更新带来了多项改进和新增功能,进一步提升了系统的稳定性和用户体验。 此次更新的一个重要亮点是首次原生集成Sysmon系统监控功能。Sysmon是一种强大的系统监控工具,能够帮助用户追踪和分析系...
07:03
微新创想:2026年2月12日 爆料账号@Evleaks在X平台发布谷歌Pixel 10a高清渲染图 该机首发浆果色、雾灰色、薰衣草紫和黑曜石色四款配色 延续环保包装策略 盒内仅含USB-C数据线、SIM卡针及保修指南 欧盟能源标签显示其获“A”级能效评级 实测续航53小时14分钟 略优于Pixel 9a(B级 52小时19分钟) 新机尚未官宣发布时间
07:03
微新创想:2026年2月13日,美国纽约,花旗集团宣布将其首席执行官简·弗雷泽年度薪酬上调至4200万美元。此举旨在反映其任内业绩表现及市场竞争力考量。调整后薪酬包含基本工资、奖金及长期激励,较此前增长约15%。花旗董事会表示,该决定经薪酬委员会综合评估后作出,符合公司治理规范与股东利益。此次调薪即日起生效。
07:03
微新创想:2026年2月13日,英伟达预计将租赁一座位于美国内华达州斯托里县的200兆瓦数据中心。这一决定标志着公司在人工智能领域持续加大投入力度。该数据中心由Tract Capital支持的实体负责建设,其融资方式为38亿美元的高收益债券。由于市场需求旺盛,项目原定规模被追加了1.5亿美元,进一步扩大了基础设施的容量。 微新创想:此次债券融资预计收益率约为...
05:28
微新创想:2026年2月13日,标普全球评级宣布将卡夫亨氏公司信用展望由“稳定”下调至“负面”,同时维持其“BBB”长期发行人信用评级不变。此次调整主要基于公司持续面临高杠杆压力、核心业务增长乏力及成本通胀传导受限等因素。标普指出,若未来12–24个月内EBITDA未能改善或债务水平未显著下降,评级可能被进一步下调。此次行动不涉及评级变动,但强化了对该公司财...
05:28
微新创想:2026年2月13日,美国应用材料公司公布2026财年第一财季业绩。当季净销售额达70.1亿美元,高于分析师预期的68.6亿美元。这一成绩显示出公司在当前市场环境下的强劲表现。 调整后每股收益为2.38美元,亦高于预期的2.21美元。这表明公司不仅实现了收入增长,还在盈利能力方面取得了显著提升。整体财务状况良好,为未来的发展奠定了坚实基础。 财报显...
04:25
微新创想:2026年2月13日,礼来公司宣布自2026年7月1日起美国医疗保险Medicare受益人将可享受其获批减肥药物的折扣优惠 此举旨在提升患者用药可及性缓解部分处方药费用负担 折扣计划将通过Medicare Part D处方药计划实施具体覆盖药物包括已获批的替尔泊肽tirzepatide等 礼来表示该安排系与美国联邦医疗保险和医疗补助服务中心CMS协...
04:25
微新创想:2026年2月13日,梅赛德斯-奔驰美国公司宣布召回11,895辆汽车。此次召回范围仅限于美国境内,涉及部分2024至2025款的C级、E级以及GLE车型。 微新创想:根据美国国家公路交通安全管理局NHTSA的报告,这些车辆存在前部线束装配不当的问题。这种缺陷可能导致线束短路,从而引发起火风险。 微新创想:为确保用户的安全,梅赛德斯-奔驰将为所有受...
04:25
微新创想:2026年2月13日,人工智能公司Anthropic宣布其当前年化收入已达140亿美元。这一数字标志着公司在人工智能领域取得了显著的商业成功。Anthropic总部位于美国旧金山,由前OpenAI研究人员创立。公司自成立以来一直致力于开发具有高度安全性和可控性的大型语言模型。 此次披露未说明具体收入来源,但业界普遍认为主要来自企业级API服务及与亚...
04:25
微新创想:2026年2月13日,美国人工智能初创企业Anthropic宣布完成G轮300亿美元融资,投后估值升至3800亿美元。此次融资由多家知名投资机构共同参与,包括光速创投、门洛风险投资、摩根士丹利投资、NX1资本及卡塔尔投资局。公司总部位于旧金山,专注于安全、可解释的大模型研发。 此次融资为AI领域迄今最大单轮融资之一,标志着Anthropic在人工智...