新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月28日

20:53
微新创想:3月28日晚,江淮汽车正式推出瑞风RF8悦享系列MPV,共三款车型:悦享Pro、Max、Ultra,市场指导价19.99万—25.99万元,限时抢购价17.69万—22.69万元。新车采用龙鳞格栅、虎啸LED大灯与凤羽尾灯,提供三款外观及三款内饰配色。配置含AR-HUD、零重力二排座椅、双侧电滑门、双向AEB等。搭载1.5TGDI+3DHT混动系统...
20:53
微新创想:3月27日,瑞典超跑制造商柯尼赛格宣布,其2020年发布的四座超级跑车Gemera正式进入量产阶段。这一消息标志着该品牌在高性能汽车领域迈出了重要的一步。Gemera作为柯尼赛格首款真正意义上的四座车型,打破了传统超级跑车仅限于两座的限制,为追求极致性能同时又希望兼顾家庭出行的消费者提供了全新的选择。 位于瑞典恩厄尔霍姆的工厂已完成生产线扩建,Ge...
20:21
微新创想:亿纬锂能发布2025年年报,展现出强劲的增长势头。数据显示,公司全年实现营业收入614.70亿元,同比增长26.44%。归母净利润达到41.34亿元,同比增长1.44%。若剔除股权激励的影响,归母净利润更是攀升至50.02亿元,同比增长24.76%。这一成绩反映了公司在新能源领域的持续深耕与市场拓展能力。 第四季度的表现尤为亮眼,单季归母净利润为1...
20:21
微新创想:2026年3月28日,北京石景山具身智能实训场三期项目在2026中国科幻大会上正式揭牌。该项目标志着全国最大的人形机器人训练基地正式建成,为具身智能领域的发展提供了坚实的实践平台。 微新创想:实训场聚焦于精密操作与触觉感知技术,致力于提升人形机器人在复杂环境中的适应能力与执行效率。通过一、二、三期项目的全周期布局,形成完整的训练体系,推动相关技术的...
19:50
微新创想:3月27日,五菱全新一代微型纯电车缤果Pro在珠海全球首发。新车以“新复古主义美学”为设计核心,配备飞环流光大灯、流影曲面车身及红宝石质感尾灯,整体造型融合经典与现代元素,展现出独特的视觉魅力。 微新创想:推出赫本绿、漫游银、松弛灰、放空白四款八涂层工艺车色,每一款色彩都经过精心调配,不仅提升了整车的质感,也满足了不同消费者的审美需求。无论是追求个...
18:47
微新创想:2026年1月至3月,我国创新药对外授权交易总额达600亿美元,接近2025年全年总额的一半。这一数据充分体现了我国在生物医药领域日益增强的国际影响力和竞争力。 截至3月27日,国家药监局已批准2026年首批10款创新药,其中国产8款、进口2款。这一批创新药涵盖了多个治疗领域,包括肿瘤、免疫性疾病和罕见病等,显示出我国在多个关键医疗需求上的研发实力...
18:47
微新创想:苏宁易购宣布全面升级旧手机绿色回收通道 3月28日苏宁易购正式推出全新旧手机回收服务 苏宁易购近日宣布对旧手机回收服务进行全面升级,旨在更好地满足消费者需求并推动环保理念 此次升级的服务覆盖全国范围,包括线上线下多个渠道 消费者可以通过苏宁易购享受一站式收旧换新服务,更加便捷高效 线下回收方面,苏宁易购在门店设有3C顾问,现场验机并提供专业评估 线...
18:14
微新创想:3月27日,爆料账号PlayStation Game Size在X平台透露,《星空》PS5标准版下载体积为123.347GB,4月5日开启预载,4月7日23时(北京时间)正式解锁。游戏售价49.99美元(约合345.9元人民币)。 ‘破碎空间’DLC体积12.502GB,‘地球舰队’DLC为4.017GB。这两个扩展内容为玩家提供了更多剧情和玩法选...
17:42
微新创想:2026年3月27日,微软正式宣布将从3月31日起停用SwiftKey在iOS和Android平台的原有账户体系,并全面迁移至微软账户。这一变动意味着所有依赖云同步功能的用户将受到影响,若未能在规定时间内完成账户绑定,将导致自定义词典、个性化输入模型等云端数据永久丢失。 微新创想:为了确保数据安全与服务的持续性,微软建议用户尽快完成账户迁移。迁移完...
17:42
微新创想:2026年3月28日,微信鸿蒙版App启动8.0.16.40版本内测,正式接入ClawBot官方插件。此次更新为用户带来了全新的功能体验,使他们能够通过微信轻松连接OpenClaw设备。用户只需使用扫码功能,即可一键完成设备接入,无需复杂的设置流程。 该插件不仅支持基础的扫码操作,还实现了照片、视频、语音和文件的收发功能。用户可以通过微信直接与Op...
17:12
微新创想:2026年3月28日,由上海交通大学承担的国家重大科技基础设施——深远海全天候驻留浮式研究设施(“远海浮动岛”)在上海全面启动建设。这一项目标志着我国在深海科研领域迈出了重要一步。 微新创想:该设施为世界首创的超大型海上科研平台,采用先进的半潜式双船体设计,能够适应各种复杂海况,实现长时间、全天候的海上科研驻留。其具备万米全海深科研试验能力,可满足...
17:12
微新创想:2026年3月28日,东风奕派007闪现版正式上市,定位为“年轻人的梦想猎装轿跑”。新车官方指导价为14.49万元,限时闪现价为13.19万元,为消费者带来更具吸引力的购车选择。前1000名下单用户还可享受多重购车福利,包括2000元抵5000元购车款、5000元购置税补贴以及5000元置换补贴,进一步降低购车门槛。 新车外观采用电御紫新色与棱光设...