新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月28日

14:33
微新创想:2026年2月28日,赛诺菲宣布达必妥®(度普利尤单抗)获国家药品监督管理局(NMPA)批准新增两项适应症 此次批准标志着达必妥®在治疗领域迈出了重要一步 一是用于治疗成人大疱性类天疱疮(BP)二是用于6岁及以上儿童哮喘的维持治疗 这一重要进展是基于多项III期临床研究数据得出的结论 研究结果证实了达必妥®在两类疾病中的显著疗效和良好安全性 这使得...
14:33
微新创想:2026年2月28日,资生堂中国与国内高端美容连锁品牌美丽田园正式达成战略合作。合作聚焦资生堂旗下专为亚洲肌肤研发的科技美肤品牌RQ PYOLOGY律曜,将通过美丽田园全国数百家门店落地专业护肤服务与产品体验。 此次合作旨在强化高端科技护肤在亚洲市场的本土化渗透,提升消费者对成分功效与定制化美肤方案的认知。双方将联合开展培训、会员联动及场景化营销,...
14:33
微新创想:2026年2月,美国患者倡导平台Baba Care宣布完成超650万美元种子轮融资。本轮融资由General Catalyst领投,Genius Ventures、Soma Capital等多家机构跟投。此次融资标志着Baba Care在医疗健康领域的重要进展,也为公司进一步拓展服务奠定了坚实基础。 Baba Care专注于医疗保险及Medicar...
14:33
微新创想:2026年2月28日,特灵科技旗下品牌特灵正式发布HSAG风冷磁悬浮离心式冷水机组。该产品面向亚太地区数据中心市场,旨在应对日益增长的高效制冷需求。随着全球数据中心数量的持续增加,对节能环保的制冷设备需求也愈发迫切。HSAG系列的推出正是基于这一市场趋势,为客户提供更加可持续的冷却方案。 机组采用先进的磁悬浮压缩技术,实现了无油运行、高能效与低振动...
14:33
微新创想:2026年2月28日,美国生物技术公司IDEAYA Biosciences宣布其在研B7H3/PTK7双特异性TOP1抗体偶联药物(ADC)IDE034在美国完成I期剂量递增与扩展临床试验的首例患者给药。这一里程碑标志着该药物进入人体试验的关键阶段。 微新创想:该临床试验的主要目标是评估IDE034在晚期实体瘤患者中的安全性、耐受性以及初步疗效。通...
14:32
微新创想:2026年2月28日,OpenAI与亚马逊宣布升级多年期战略合作伙伴关系。双方将在现有380亿美元协议基础上,未来8年内追加合作至1000亿美元。亚马逊将向OpenAI投资500亿美元,首期150亿美元,后续按条件分批投入350亿美元。 合作内容涵盖共建由OpenAI模型驱动的‘有状态运行时环境’。这一环境将通过Amazon Bedrock向客户开...
14:32
微新创想:2026年2月27日 谷歌Chrome团队宣布启用新型默克尔树证书(MTCs)这一重要技术更新。该证书系统集成了ML-DSA等抗量子算法,标志着在网络安全领域迈出了关键一步。此次更新不仅提升了TLS证书的安全性,还显著优化了证书的存储与传输效率。 微新创想:传统的RSA和ECC证书在面对量子计算的潜在威胁时显得不够安全。秀尔算法的出现使得这些加密方...
14:32
微新创想:2026年2月28日,智能建筑技术提供商Sensera宣布完成2700万美元B轮融资。本轮融资由10 Atlantic Group领投,Egis Capital Partners与MUUS Asset Management跟投。Sensera总部位于美国,专注于为建筑承包商和开发商提供现场智能技术解决方案。这些解决方案涵盖软件平台、AI摄像头、移动...
14:32
微新创想:2026年2月,北京术理创新科技有限公司宣布完成数亿元人民币C轮融资。本轮融资由道禾资本、东方恒信、新鼎资本等多家机构及老股东联合投资。此次融资标志着公司在人工智能多模态脑机接口领域迈出了重要一步。 公司专注于人工智能多模态脑机接口系统研发,致力于脑功能探索与再生。通过先进的技术手段,微新创想不断推动神经科学与人工智能的深度融合,为脑科学研究和临床...
14:32
微新创想:2026年2月,江苏南京的博恒材料科技有限公司完成A++轮融资,由江苏高科技投资集团独家投资。此次融资为公司的发展注入了新的动力,助力其在复合集流体用超薄增强膜领域持续深耕。 博恒材料专注于复合集流体用超薄增强膜的研发与产业化,产品主要应用于新能源电池领域。随着新能源产业的快速发展,高性能电池材料的需求日益增长,公司凭借先进的技术和优质的产品,赢得...
14:32
微新创想 这起案例值得引起警惕,尤其是喜欢找人一块喝酒的朋友。在共同饮酒过程中,如何确保彼此的安全,是每个人都需要重视的问题。 据裁判文书网显示,去年4月9日晚,陈某与张某共同饮酒后,陈某曾口头提醒张某不要开车,并建议叫代驾。随后,陈某独自离开。几分钟后,张某在严重醉酒状态下驾车,血液酒精含量达到177mg/100ml,发生交通事故,导致当场身亡,同时造...
14:32
微新创想 比亚迪新款车载充放电枪正式上线 市场价599元新品价459元可通过比亚迪App商城入手 这款充放电枪实现一枪双能 充电模式下可适配家庭普通10A/220V标准插座 摆脱充电桩的束缚最大充电功率达1.76kW 5米线长带来更灵活的补能空间 放电模式下车辆秒变移动电站 最大放电功率6kW 搭配2个10A和1个16A插孔 可满足露营办公等多种户外...