新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月09日

23:54
微新创想:微软近日确认Windows 11任务栏日历弹出功能不会被取消,而是正在积极优化其底层体验以确保整体质量。这项功能原本计划在2025年12月启动预览测试,但因技术调整和稳定性问题,最终被推迟。目前微软表示,将在未来几个月内向Windows预览体验成员开放测试,以便收集更多反馈并进行改进。 该功能的回归将为用户提供极大的便利,使他们无需打开特定应用程序...
23:21
微新创想:2026年3月9日 博主@数码闲聊站爆料称 某国产头部厂商母系旗舰正评估1.5K分辨率+165Hz超高刷新率显示屏 结合其过往爆料风格及一加已量产多款165Hz机型 如一加15、Ace 6、Ace 6T、Turbo 6 业界普遍指向OPPO体系 一加中国区总裁李杰此前确认 一加15搭载的第三代东方屏为行业首块1.5K+165Hz屏幕 并已适配《三角...
23:21
微新创想:3月9日,日本软银集团旗下电子支付平台PayPay在美国启动首次公开募股(IPO)获得数倍超额认购。此次IPO由高盛、摩根士丹利等国际知名金融机构牵头承销,计划募集资金约20亿美元。该笔资金将主要用于拓展北美及东南亚市场,进一步推动PayPay的全球化进程。 PayPay自2018年在日本正式运营以来,迅速积累了庞大的用户基础,目前服务用户已超过4...
23:21
微新创想:3月9日,江苏泽景汽车电子股份有限公司正式通过港交所上市聆讯。这一重要进展标志着公司在资本市场的发展迈出了关键一步。公司总部位于江苏省,专注于汽车电子产品的研发与制造,凭借多年的技术积累和市场拓展,已在行业内占据了一定的市场份额。 此次IPO计划募集资金将主要用于产能扩建、技术研发以及补充流动资金。通过扩大生产规模,公司有望进一步提升市场竞争力;加...
22:13
微新创想:大众与众汽车正式公布08车型内饰官图 3月9日,大众与众汽车正式公布08车型内饰官图 该车定位为中大型智能电动SUV 轴距达3030mm,为车内空间提供了充足保障 配备双14.96英寸超高清智能联屏 以及1.74㎡智能调光天幕 紫外线隔绝率达99.9% 有效提升驾乘舒适度与安全性 内饰配置丰富,包含14向电动调节副驾座椅 并配有腿托功能 进一步提升...
22:13
微新创想:OPPO于2026年3月9日上午宣布,全新折叠旗舰手机Find N6将于3月17日19时全球首发。这款手机在设计和技术上进行了多项创新,旨在为用户提供更优质的折叠屏体验。 Find N6搭载了最新的骁龙8 Elite Gen5处理器,性能表现将更加出色。主屏幕采用8.12英寸2K LTPO技术,不仅显示效果细腻,还具备出色的功耗控制能力。副屏则为6...
21:43
微新创想 宁德时代今日公布2025年财报数据显示全年营收达到4237.02亿元同比增长17.04%净利润为722.01亿元同比增长42.28% 微新创想 2025年宁德时代动力电池销量达到541GWh同比增长41.85%全球市占率再创新高根据SNE Research统计2025年宁德时代全球动力电池使用量市占率提升1.2个百分点至39.2%连续第九年保持...
21:43
微新创想:苹果上周以极具竞争力的定价推出了全新MacBook Neo系列笔记本电脑 这一举动不仅吸引了众多消费者的关注 更引发了业界对苹果未来产品命名策略的广泛讨论 苹果有意将Neo拓展为全新的产品系列命名 未来可能逐步取代现有的SE(Special Edition 特殊版本)代号 这一变化意味着苹果正在重新思考其产品线的命名方式 以更好地传达品牌理念和产品...
21:43
微新创想:苹果正在积极推进3D打印铝制设备外壳技术的研发 据知名爆料人马克古尔曼最新透露,苹果公司正在探索3D打印铝制外壳的制造工艺。这项技术不仅能够提升材料利用率,还能有效降低生产成本并加快生产效率。苹果一直以来都在致力于可持续制造和高效生产,此次新工艺的引入正是其在这一方向上的又一重要进展。 这项技术是苹果在3D打印钛金属工艺基础上的延伸 苹果此前已在A...
21:42
微新创想:2026年3月9日,微软正式推出Copilot Cowork与Agent 365等AI智能体新产品,作为Microsoft 365 Copilot第三波浪潮的核心。此次发布标志着微软在企业级AI服务领域迈出了重要一步。 Copilot Cowork基于Anthropic Claude模型,具备强大的多步骤任务自动化能力。该产品运行于企业云端,能够深...
21:42
微新创想:微软宣布全新Microsoft 365 E7前沿工作者套件将于2026年5月1日正式上市 该套件专为一线员工打造,旨在满足他们在非传统办公环境中的工作需求 Microsoft 365 E7定价为每用户每月99美元,为各类行业提供更具性价比的解决方案 微软此举意在加强制造业、零售业和医疗行业等非办公桌场景工作者的数字化能力 通过提供增强的安全性,微软...
21:42
微新创想:宁德时代在2025年报业绩解读会上透露了江西宜春锂矿的重要进展 宁德时代于3月9日召开的2025年报业绩解读会上披露了江西宜春锂矿的最新动态 江西宜春锂矿已于2025年底取得采矿许可证 正在积极推进复产审批工作 四川斯诺威锂矿项目已经完成了安全评估和环境影响评价等前期工作 虽然审批流程较长 但该项目具备较高的资源品位和良好的成本优势 宁德时代表示将...