新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月11日

18:41
微新创想:2026年3月11日,美银证券发布研报,维持华润啤酒(HK00291)“买入”评级,目标价35.6港元。报告指出,公司近期盈警消除了市场对其商誉减值的担忧。核心啤酒业务稳健,预计2025年收入及股东应占纯利分别增长低单位数及超10%。2026年初至今为国内三大啤酒商中唯一销量正增长者。 非现金减值不影响股息,2025年派息率有望高于2024年的52...
18:41
微新创想:2026年3月11日 国家超算互联网面向全体OpenClaw用户推出限时福利 国家超算互联网在2026年3月11日宣布推出一项针对OpenClaw用户的特别活动 每位用户均可免费领取1000万Tokens 该福利有效期为两周 此次发放Tokens的举措旨在降低AI智能体的使用门槛 缓解个人开发者及小微企业在Token消耗激增情况下所面临的算力成本压...
18:41
微新创想:美国NASA监察长办公室3月10日发布报告指出,SpaceX“星舰”月球着陆器面临轨上加注燃料等重大技术挑战,原定2028年载人登月任务存在进一步延期风险。关键设计评审已推迟至8月,而首次在轨燃料加注试验尚未完成。报告强调,若测试中发生事故或技术延误,将直接影响登月时间表。 NASA正推进2027年地轨对接测试以降低风险,但暂无宇航员月面应急救援能...
18:41
微新创想:宝马(中国)汽车贸易有限公司近日宣布将启动一项大规模召回行动,涉及部分进口宝马2系、4系、5系等车型。此次召回自2026年3月16日开始,涵盖2020年7月31日至2022年12月22日期间生产的车辆,总计147830辆。召回原因与车辆的起动机生产缺陷有关,该缺陷可能导致在多次启动后起动机异常磨损,进而引发启动困难的问题。 在极端情况下,这种异常磨...
18:41
微新创想:2026年3月17日起,浙江豪情汽车制造有限公司将启动一项重要召回行动。此次召回涉及两批次的smart品牌车型,分别是2022年8月12日至2023年10月19日生产的smart精灵#1共计16072辆,以及2022年10月19日至2023年8月7日生产的精灵#3共计2145辆,总计召回车辆18217辆。 此次召回的主要原因是部分车辆的高压动力电池...
18:41
微新创想:2026年3月11日,美国自主抽血设备开发商Vitestro宣布完成7000万美元B轮融资。本轮融资由LabCorp Venture Fund、Mayo Clinic、Sutter Health等多家医疗健康机构及风投机构联合领投。此次融资标志着Vitestro在医疗科技领域获得了重要认可。 公司研发的AI驱动超声引导3D重建+机器人针头插入系统,...
18:41
微新创想:3月11日,美的集团在2026全屋智能战略发布会上宣布,未来三年将投入超600亿元,重点布局AI与具身智能领域。此举旨在加速业务全面AI化转型,并发布全屋智能“三个一”战略及自进化家居智能体MevoX。此前五年,美的研发投入已超600亿元。公司表示,新阶段投入将聚焦核心技术突破、智能产品升级与生态协同建设,强化全球智能家居领导地位。
18:41
微新创想:3月10日 希捷科技首席商务官郑万成表示 AI爆发正推动存储行业进入新“超级周期” DRAM价格或长期上涨 TrendForce预计2026年Q1服务器DRAM价格将上涨约90% 主因是AI数据中心对GPU及配套内存需求激增 随着人工智能技术的快速发展 数据中心的建设规模不断扩大 这直接带动了对高性能计算硬件的需求 特别是GPU和相关内存产品的使用...
18:41
微新创想:2026年3月,广州方邦电子股份有限公司宣布拟以自有资金2000万元收购功率器件与模组研发企业中科四合1.06859%股权。此次收购发生于广东,交易主体为方邦股份与中科四合。 中科四合专注先进封装工艺及高密度功率器件/模组设计制造,服务消费电子、工控、汽车电子及通信/服务器等领域。公司凭借其在功率半导体领域的深厚积累,成为行业内的佼佼者。 方邦股份...
18:41
微新创想:3月11日,AWE2026展会即将拉开帷幕,众多科技品牌将齐聚上海,带来一系列前沿新品。科沃斯、石头科技、格力、TCL雷鸟、阿里、韶音、BleeqUp、海尔智家、特斯拉及追觅等企业将集中首发具身智能机器人、AI眼镜等创新产品。 微新创想:本次展会重点聚焦AI硬件的落地应用以及全场景智能生态的构建。参展品牌涵盖了家电、智能硬件、人工智能等多个领域,展...
18:41
微新创想:3月11日,北京京东金航贸易有限公司正式成立,注册地位于北京,法定代表人为江键东,注册资本为10万元人民币。该公司由北京京东世纪贸易有限公司100%持股,属于京东体系内新设的贸易主体。此次新设公司或旨在进一步拓展供应链贸易服务,提升整体业务的协同能力。目前公司已办理工商登记手续,但尚未公布具体经营范围及开业时间。
18:41
微新创想:2026年3月11日,Resonance Consultancy发布《欧洲最佳城市报告》年度排名。伦敦位列第一,巴黎、柏林、罗马等紧随其后,前十城市涵盖西欧与北欧主要首都及旅游重镇。 报告指出,本地居民旅游消费增长显著,正驱动欧洲城市旅游业持续扩张。随着越来越多的欧洲人选择在假期前往本国其他城市旅游,各城市正面临前所未有的客流压力。 为了应对这一趋...