新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月10日

18:14
微新创想:2026年3月10日,360集团创始人周鸿祎宣布,公司将推出OpenClaw(“龙虾”)一键安装简化版。该产品面向普通用户,旨在降低AI模型本地部署门槛,实现开箱即用。 此举发生于OpenClaw开源热度持续攀升之际。周鸿祎表示,简化版将集成环境配置、依赖管理和硬件适配等功能,使用户无需具备专业的技术背景即可轻松使用。 项目目标是推动AI大模型普惠...
18:14
微新创想:2026年3月,美国生物技术公司CytoDyn宣布获得1750万美元融资。此次融资为公司带来了新的发展契机,有助于其在多个医学领域推进重要研究。CytoDyn总部位于美国华盛顿州,一直致力于创新药物的研发,尤其在单克隆抗体药物领域取得了显著进展。 微新创想:该公司正在开发的Leronlimab是一种靶向CCR5受体的拮抗剂。CCR5受体在多种疾病中...
18:14
微新创想:3月9日,杭州联川生物技术股份有限公司披露了北交所第二轮审核问询函的回复。公司计划在北交所上市,其保荐机构为国金证券。根据披露的财务数据,2022年至2024年公司营业收入分别为2.35亿元、2.87亿元和3.67亿元,呈现出持续增长的趋势。同时,净利润也实现了逐年提升,显示出良好的盈利能力。 问询函主要关注了公司在供应链方面对10X Genomi...
18:14
微新创想:3月9日,征和工业(SZ003033)发布2025年年报。公司全年实现营收19.32亿元,同比增长5.3%;归母净利润1.75亿元,同比增长33.72%。董事会审议通过利润分配预案:以8175万股为基数,向全体股东每10股派发现金红利5元(含税)。 公司专注链传动系统研发制造,产品广泛应用于车辆、农业及工业等多个领域。凭借卓越的技术实力和稳定的品质...
18:14
微新创想:据UBI Research数据显示,三星电子在2025年的全球OLED电视出货量达到了200万台,相比2023年的100万台实现了翻倍增长。这一显著提升不仅反映了市场需求的扩大,也体现了三星在OLED技术上的持续投入和创新。2024年的出货量为140万台,显示出强劲的增长势头。 三星将OLED电视作为其4K产品线中的高端系列进行推广。在性能方面,该...
18:14
微新创想:2026年3月10日,科利耳公司正式推出新一代Nucleus™ 8声音处理器。该设备面向全球人工耳蜗用户,主打智能化听觉体验。其搭载SmartSound iQ 2与SCAN 2技术,可实时识别环境场景并自动优化声音处理参数,实现无需手动干预的自适应调节。 此举标志着听觉辅助设备从“人适应设备”转向“设备主动服务人”。Nucleus™ 8通过先进的技...
18:14
微新创想:3月10日,北京中关村科学城成果转化创业投资基金合伙企业(有限合伙)正式成立。该基金注册于北京市海淀区,执行事务合伙人为北京中关村科学城科技投资管理有限公司,认缴出资额20亿元人民币。基金的设立标志着中关村科学城在科技创新与成果转化领域迈出了重要一步。 微新创想:基金的经营范围涵盖私募股权及创业投资基金管理服务,致力于为科技创新企业提供全方位的金融...
18:14
微新创想:联发科技于2026年3月10日公布了2026年2月的合并营收数据。数据显示,2026年2月合并营收为389.54亿新台币,约合86.05亿元人民币。与去年同期相比,营收下滑了15.63%,环比上月也出现了17.08%的下降。1至2月累计营收达到859.31亿新台币,约合189.82亿元人民币,同比下滑11.70%。 此次营收下滑主要受到全球智能手机...
18:14
微新创想:3月10日前,四川省能发油气资源股权投资引导基金正式通过中国证券投资基金业协会备案。该基金为四川省首只油气资源领域股权投资引导基金,首期规模达到10亿元,由四川能源发展集团旗下川投航信私募基金管理有限公司负责管理。 微新创想:作为四川省资源能源投资引导基金的首支子基金,该基金的设立标志着四川省在推动能源产业发展方面迈出了重要一步。基金将重点关注省内...
18:14
微新创想:2026年3月,花旗发布研报指出,中兴通讯在2025财年的营收达到1339亿元,但净利润仅为56亿元,低于市场预期。报告指出,净利润下滑的主要原因是毛利率下降至30.3%。在第四季度,中兴通讯的净利润为2.96亿元,同比出现下滑,毛利率也环比下降了1.3个百分点。 微新创想:尽管营运商业务面临一定压力,但政企及消费者业务的毛利率在下半年有所回升。同...
18:14
微新创想:3月9日,美国高通公司与机器人企业NEURA Robotics宣布建立长期战略合作。双方将联合开发面向物理AI的机器人参考架构,聚焦“脑+神经系统”,旨在实现人机安全高效协同。 此次合作基于NEURA平台战略与高通端到端机器人架构,推动可扩展智能机器人实际部署。通过整合双方的技术优势,合作将加速机器人技术在工业、服务等领域的应用落地。 双方将制定标...
17:55
微新创想:3 月 10 日,A 股光通信板块午后突发异动,长飞光纤(601869.SH)股价拔地而起触及涨停,烽火通信、亨通光电、中天科技等行业巨头集体跟涨。这波行情的背后,是 AI 浪潮对底层基础设施——光纤价格的暴力拉升。 微新创想:现货报价“跳涨”:G.652.D 较元旦翻了数倍据行业最新监测数据显示,光纤市场正经历一场前所未有的价格重塑。受数据中心和...