中科院SpikingBrain类脑大模型:2%数据百倍速突破长文本处理瓶颈

近日,中国科学院自动化研究所的李国齐与徐波团队联合发布了一项革命性成果——全球首款大规模类脑脉冲大模型SpikingBrain1.0。这一创新模型在处理长文本任务时展现出惊人的性能,其速度比当前主流的Transformer模型高出百倍以上,能够高效处理高达400万token的超长文本,同时仅需2%的数据量即可达到同等效果。这一突破性进展为人工智能领域带来了新的曙光。

当前主流的大语言模型,如GPT系列,普遍基于Transformer架构。尽管Transformer凭借其强大的自注意力机制在自然语言处理领域取得了显著成就,但其计算复杂度却成为制约其发展的瓶颈。随着文本长度的增加,Transformer的计算量呈现平方级别的增长,导致处理长文本时耗时且能耗巨大。这一局限性使得AI在分析长篇小说、法律文书等复杂文本时显得力不从心。

为了突破这一瓶颈,研究团队将目光投向了自然界最精密的智能系统——人脑。人脑由千亿神经元构成,却能以仅为20瓦的功耗高效运行。受此启发,团队提出了“基于内生复杂性”的理念,旨在通过模拟人脑神经元的工作方式提升模型的内部效率与智能。

SpikingBrain模型通过全新的架构模拟了人脑神经元的工作原理,推出了两个版本:SpikingBrain-7B(70亿参数)和SpikingBrain-76B(760亿参数)。首先,该模型创新性地抛弃了传统Transformer的二次方复杂度自注意力机制,采用了“混合线性注意力架构”,将计算复杂度降至线性(O(n)),大幅提升了处理长文本的效率。这一改进使得模型在处理超长文本时能够保持极高的速度和效率。

其次,SpikingBrain引入了“自适应阈值脉冲神经元”机制。这种机制使神经元的激活状态取决于接收到的信号强度,通过动态调整阈值,模型能够在高效能状态下运行。这种事件驱动的机制显著降低了能耗,计算稀疏度高达69.15%,为AI模型的绿色计算提供了新方案。

中科院SpikingBrain类脑大模型:2%数据百倍速突破长文本处理瓶颈插图1

此外,研究团队还开发了一套高效的模型转换技术,能够将现有的Transformer模型直接转化为SpikingBrain架构,极大地降低了模型训练的成本和门槛。所有技术细节和代码已在GitHub及魔搭平台上开源,供全球研究人员免费使用,这一举措将加速类脑计算技术的普及与发展。

此次SpikingBrain的问世不仅在计算效率上取得了重大突破,更为未来的通用人工智能发展提供了一条全新的思路。通过模拟人脑的工作原理,SpikingBrain展现了在处理复杂任务时的巨大潜力,有望推动人工智能领域迈向更高水平的发展。

GitHub:https://github.com/BICLab/SpikingBrain-7B

划重点:
🌟 研究团队推出的SpikingBrain模型在处理长文本时速度比主流模型快100倍,仅需2%训练数据。
🧠 该模型采用混合线性注意力架构,计算复杂度从二次方降至线性,显著提升了处理效率。
💡 SpikingBrain的自适应阈值脉冲神经元机制大幅降低能耗,实现高达69.15%的计算稀疏度。

最新快讯

2026年02月13日

09:09
微新创想:2026年2月7日,苹果机器学习研究团队发布论文《绘制计算机操作智能体用户体验设计空间》。该研究通过分析9款主流AI智能体,并结合20名用户参与的‘绿野仙踪’实验,系统梳理出‘用户指令’‘活动可解释性’‘用户控制’和‘心智模型’四大设计维度。 研究结果显示,用户在与AI智能体交互时非常重视透明度与可控性的平衡。在执行探索性任务时,用户希望看到智能体...
09:09
微新创想:深圳第零智能科技股份有限公司于2025年2月10日向港交所主板提交了上市申请。作为一家专注于企业级AI智能体解决方案的科技企业,公司自2020年8月成立以来,迅速在行业内崭露头角。2024年,第零智能在国内企业级AI智能体市场中位列第五,市场占有率达到了3.0%。 微新创想:公司核心技术平台BlackZero成功融合了大模型与领域小模型,为客户提供...
09:09
微新创想:2026年2月,天马微电子旗下厦门新型显示技术研究院成功点亮12英寸Micro LED高亮车载显示屏。该屏专为全景HUD系统设计,亮度超50,000nits,对比度达1,000,000:1,色域覆盖NTSC 110%。其出色的显示性能不仅提升了视觉体验,也为车载显示技术带来了新的突破。 微新创想:采用无背光自发光架构,结合新型TFT驱动、优化LED...
09:09
微新创想:2026年2月13日,索尼State of Play发布会上,卡普空正式公开了《生化危机:安魂曲》的终极预告。这款游戏定于2月27日全球发行,标志着生化危机系列迎来了又一重要里程碑。 预告片中,主角里昂·S·肯尼迪被确认感染了T病毒。他的手臂呈现出灰败的状态,颈部也出现了明显的黑斑,展现出病毒带来的严重变异。里昂正与时间赛跑,努力寻找解药,以阻止病...
09:09
微新创想:近日,微博话题“杭州 9 岁男孩拍短剧 1 天赚 2000 元”冲上热搜榜,引发公众对儿童演员及微短剧行业的广泛关注。该话题迅速成为讨论热点,不仅展现了微短剧行业的快速发展,也引发了关于未成年人参与商业活动的思考。 据媒体报道,浙江籍童星李星澄已参与拍摄近 200 支广告及 10 余部微短剧作品,并与林更新等知名演员有过合作。他的成功并非偶然,而是...
09:09
微新创想:人工智能领域的领头羊Anthropic于本周四正式宣布公司已成功募集300亿美元的G轮融资。凭借这笔巨额注资,该公司的估值已飙升至3800亿美元,相较于上一轮(F轮)融资时的1830亿美元,实现了翻倍增长。此次融资不仅彰显了市场对其技术实力的认可,也为其未来的发展注入了强大动力。 顶级资本加持本轮融资由新加坡主权财富基金GIC与投资巨头Coatue...
09:09
微新创想:针对此前彭博社关于“Siri 新功能推迟发布”的报道以及随后引发的股价波动 苹果公司正式向 CNBC 发表声明 明确重申 新版 Siri 仍按既定计划在 2026 年内推出 此前有消息称 苹果在推进更智能 更具个性化的 Siri 落地过程中遭遇技术挑战 导致部分原定于 iOS 26.4 上线的功能可能推迟至 5 月的 iOS 26.5 甚至 9 月...
09:09
微新创想:针对彭博社披露的新版 Siri 功能跳票消息及由此引发的股价动荡 苹果公司今日通过 CNBC 发表紧急声明 确认更智能 更个性化的新版 Siri 仍将按原计划于2026年内正式推出 市场动荡 传闻引发股价 大跳水 此前彭博社消息 苹果在推进 Siri 的深度智能化过程中遭遇落地挑战 部分关键功能疑似从 iOS26.4 延期至5月的 iOS26.5 ...
09:09
微新创想:为了在算力战场上掌握更多主动权 OpenAI正加速推行其“去英伟达化”战略。2026年2月12日 OpenAI正式发布了首款基于Cerebras Systems芯片的AI模型——GPT-5.3-Codex-Spark。这款模型的推出标志着OpenAI在算力自主化道路上迈出了重要一步。 编程体验的“闪电”进化作为一款专为软件工程师打造的生产力工具 G...
09:09
微新创想:当多数科技巨头正因人工智能的冲击而缩减初级岗位时,IBM 却选择了一条截然相反的道路。全力加码入门级人才,成为这家科技巨头在人工智能浪潮中的独特战略。在昨日由 Charter 举办的“引领人工智能峰会”上,IBM 首席人力资源官尼克尔·拉莫罗克斯宣布,IBM 计划在 2026 年将其在美国的入门级招聘人数增加两倍。这一举措直接挑战了“AI 将掏空初...
09:09
微新创想:在经历了一场导致多名高管离职的大规模重组后,埃隆·马斯克昨日为其人工智能公司 xAI 勾勒出了一个惊世骇俗的未来蓝图。月球基地将成为人工智能进军深空的“补给站”。马斯克明确表示,xAI 与 SpaceX 合并并计划上市后,招聘重心已从传统的通用人工智能(AGI)研发转向了更宏大的航天工程。他向潜在求职者抛出橄榄枝:“如果你对月球上的大规模自动驾驶汽...
09:09
微新创想:曾经坚称“广告是商业模式最后手段”的山姆·奥特曼(Sam Altman),最终还是向现实低了头。2026年2月13日,据格隆汇报道,OpenAI已于本周正式在旗下的旗舰产品 ChatGPT 中上线广告业务。 昔日诺言VS今日现实:两年前,奥特曼在哈佛大学演讲时曾明确表示,他非常反感在聊天机器人中插入付费广告,认为这会破坏用户对产品的信任。然而,随着...