中科院SpikingBrain类脑大模型:2%数据百倍速突破长文本处理瓶颈

近日,中国科学院自动化研究所的李国齐与徐波团队联合发布了一项革命性成果——全球首款大规模类脑脉冲大模型SpikingBrain1.0。这一创新模型在处理长文本任务时展现出惊人的性能,其速度比当前主流的Transformer模型高出百倍以上,能够高效处理高达400万token的超长文本,同时仅需2%的数据量即可达到同等效果。这一突破性进展为人工智能领域带来了新的曙光。

当前主流的大语言模型,如GPT系列,普遍基于Transformer架构。尽管Transformer凭借其强大的自注意力机制在自然语言处理领域取得了显著成就,但其计算复杂度却成为制约其发展的瓶颈。随着文本长度的增加,Transformer的计算量呈现平方级别的增长,导致处理长文本时耗时且能耗巨大。这一局限性使得AI在分析长篇小说、法律文书等复杂文本时显得力不从心。

为了突破这一瓶颈,研究团队将目光投向了自然界最精密的智能系统——人脑。人脑由千亿神经元构成,却能以仅为20瓦的功耗高效运行。受此启发,团队提出了“基于内生复杂性”的理念,旨在通过模拟人脑神经元的工作方式提升模型的内部效率与智能。

SpikingBrain模型通过全新的架构模拟了人脑神经元的工作原理,推出了两个版本:SpikingBrain-7B(70亿参数)和SpikingBrain-76B(760亿参数)。首先,该模型创新性地抛弃了传统Transformer的二次方复杂度自注意力机制,采用了“混合线性注意力架构”,将计算复杂度降至线性(O(n)),大幅提升了处理长文本的效率。这一改进使得模型在处理超长文本时能够保持极高的速度和效率。

其次,SpikingBrain引入了“自适应阈值脉冲神经元”机制。这种机制使神经元的激活状态取决于接收到的信号强度,通过动态调整阈值,模型能够在高效能状态下运行。这种事件驱动的机制显著降低了能耗,计算稀疏度高达69.15%,为AI模型的绿色计算提供了新方案。

中科院SpikingBrain类脑大模型:2%数据百倍速突破长文本处理瓶颈插图1

此外,研究团队还开发了一套高效的模型转换技术,能够将现有的Transformer模型直接转化为SpikingBrain架构,极大地降低了模型训练的成本和门槛。所有技术细节和代码已在GitHub及魔搭平台上开源,供全球研究人员免费使用,这一举措将加速类脑计算技术的普及与发展。

此次SpikingBrain的问世不仅在计算效率上取得了重大突破,更为未来的通用人工智能发展提供了一条全新的思路。通过模拟人脑的工作原理,SpikingBrain展现了在处理复杂任务时的巨大潜力,有望推动人工智能领域迈向更高水平的发展。

GitHub:https://github.com/BICLab/SpikingBrain-7B

划重点:
🌟 研究团队推出的SpikingBrain模型在处理长文本时速度比主流模型快100倍,仅需2%训练数据。
🧠 该模型采用混合线性注意力架构,计算复杂度从二次方降至线性,显著提升了处理效率。
💡 SpikingBrain的自适应阈值脉冲神经元机制大幅降低能耗,实现高达69.15%的计算稀疏度。

最新快讯

2025年11月28日

23:14
2025年11月28日,领先的物联网通信解决方案提供商广和通正式宣布一项具有战略意义的资本布局计划,即设立一家注册资本达5000万元人民币的全资子公司。这家新公司将扎根于江西省上栗县这片充满活力的工业热土,展开一系列高规格的投资项目,总投资额高达4亿元人民币,标志着广和通在产业升级和区域经济协同发展方面迈出重要步伐。 此次投资将采用双轨并行的策略:一方面,公...
23:14
2025年11月28日,备受瞩目的工业自动化领军企业东方精工正式发布重大战略举措,宣布计划以现金方式出售旗下Fosber集团等三家全资子公司的100%股权。根据相关公告,此次资产剥离交易预计将构成重大资产重组,标志着东方精工在产业布局上迈出关键性调整步伐。 此次出售决策主要源于公司对资产结构的深度优化考量,旨在通过战略收缩进一步聚焦核心业务领域,强化在精密传...
23:14
2025年11月28日晚间,美团公司在第三季度电话会议中发布了备受关注的市场数据,揭示了其业务发展的最新动态。数据显示,近期美团餐饮外卖订单市场份额呈现稳步回升的良好态势,展现出平台在激烈市场竞争中的稳健表现。特别是在中高价订单市场,美团凭借卓越的品牌影响力和用户粘性,持续巩固其行业领先地位,GTV(Gross Transaction Value,总交易额)...
23:14
2025年11月18日,备受期待的《生化危机:生存小队》震撼登陆全球市场,其惊人的传播力在短短10天内便创下下载量突破200万的辉煌纪录。这款由Aniplex与Joycity强强联手联合开发,并得到卡普空官方授权与深度协作的移动端衍生作品,凭借其独特的策略玩法核心,迅速吸引了全球玩家的目光。游戏以一座阴森诡异的神秘医院为故事起点,玩家将化身为被保护伞公司秘密...
23:13
2025年11月28日,大唐重庆江津燃机项目传来喜讯,成功实现全容量投产发电,标志着国内“F”级改进型单轴重型燃机技术取得重大突破,填补了该领域的空白。这一里程碑事件不仅彰显了中国能源装备制造的实力,更为西部地区的能源结构优化注入强劲动力。 该项目坐落于重庆江津区,总投资额高达26亿元人民币。工程精心规划,建设了两台54.68万千瓦燃气-蒸汽联合循环机组,总...
23:13
2025年11月28日,日本知名家电巨头松下公司正式发布声明,宣布将对其生产的30至40种钽电容产品实施价格上调,涨幅区间在15%至30%之间。此次价格调整主要受原材料与生产成本持续上涨的双重压力影响。值得注意的是,这些被提价的钽聚合物电容在当前高科技领域具有广泛的应用价值,特别是在AI服务器等前沿设备中扮演着关键角色。 尽管日元近期汇率走弱对松下的出口业务...
22:40
2025年11月28日,德国知名媒体报道了一则引人关注的消息。据《法兰克福汇报》最新披露,德国领先的在线外卖服务平台Lieferando宣布对其组织架构进行重大调整,计划裁员1500人。这一数字虽然较先前宣布的2000人目标有所减少,但依然意味着公司将在人员配置上做出显著优化。 此次裁员的核心目标在于优化运营结构,提升企业长期经营效率。根据Liefera...
22:40
2025年11月28日,国际商业机器公司(IBM)宣布一项重大战略决策,计划在加拿大大幅提升其芯片制造能力。根据最新消息,IBM将对其位于加拿大的自有半导体制造设施进行全面的升级改造,并同步扩大生产规模。这一系列扩产举措旨在积极应对全球芯片市场持续升温的需求态势,显著增强IBM在高性能计算芯片领域的供应链稳定性和供应效率。 此次扩产计划的核心目标在于强化IB...
22:39
2025年黑色星期五线上消费预计将突破117亿美元大关,创下历史新高,同比增长8.3%。这一惊人数字不仅彰显了美国消费者对线上购物的热情,更凸显了电子商务在假日季中的主导地位。Adobe最新发布的预测显示,“网购星期一”销售额有望达到142亿美元,较去年增长6.3%,再次刷新销售纪录。两大购物节销售额的持续攀升,不仅反映了消费者线上购物需求的强劲,也揭示了电...
22:39
2025年11月28日,生态环境部在一场备受关注的新闻发布会上正式宣布,我国正全面启动“四机一脑”等退役装备的规范拆解与循环利用计划。这一重要举措旨在推动资源高效回收,促进绿色可持续发展。生态环境部强调,将严厉打击非法处置废弃机电产品的行为,并将其纳入全国范围的专项整治行动中。 为鼓励合规企业积极参与,相关部门创新性地推出了“以奖代补”的政策措施,通过资...
22:39
2025年11月,澳大利亚气象局(BOM)正式推出全新官方网站,这场耗资高达9650万澳元的改版工程却引发了一场前所未有的风波。令人咋舌的是,实际支出远超预算近20倍,这一惊人的数字迅速点燃了公众的质疑。新版网站上线后,其糟糕的用户体验和功能缺失问题如雪球般发酵,迅速在用户群体中掀起轩然大波。尤其是降雨雷达混乱的配色方案,以及无法通过GPS坐标精准查询天气等...
22:39
11月28日下午4时20分,印尼北马鲁古省的伊布火山突然爆发,引发广泛关注。根据印尼火山地质减灾中心的权威监测数据,此次火山喷发持续时间长达74秒,喷发出的火山灰柱直冲高空,最高可达约800米,场面十分壮观。这一突发性火山活动已引起相关部门的高度重视,他们已紧急启动应急预案,加强了对火山的实时监测力度,并第一时间向附近居民发布安全预警,提醒大家做好防范措施。...