新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月23日

22:03
2026年1月23日,华硕正式发布面向企业用户的ExpertBook B3 G2笔记本,提供14英寸和16英寸两种版本,屏幕支持180°开合。该机最高搭载AMD锐龙AI 9 HX处理器,集成GPU与55 TOPS算力NPU,支持Wi-Fi 7、双BIOS恢复、TPM 2.0及NIST SP 800-193安全认证。内存最高96GB DDR5,存储最高3TB...
22:03
2026年江西省低空经济产教融合发展研讨会于1月22日在江西航空职业技术学院隆重举行,同期举行了北航迅龙联合工业设计中心的揭牌仪式。这一创新合作平台由北京航空航天大学与江西迅龙航空科技有限公司共同打造,将致力于推动低空飞行器工业设计、智能装备研发以及科技成果转化等关键领域的发展。 省科协、省工信厅、抚州市政府等相关部门领导,以及来自多所高校和企业的200...
21:31
1月23日,奇瑞汽车与一嗨出行在安徽芜湖隆重举行战略合作签约仪式,并同步完成5000台新车的盛大交付这一历史性时刻。此次交付规模创下奇瑞汽车迄今为止单次集中交付的最高纪录,涵盖瑞虎8、瑞虎7、捷途旅行者、X70及艾瑞泽5等多款备受市场青睐的SUV与轿车产品,充分展现了奇瑞汽车强大的产品矩阵与市场竞争力。 此次战略合作不仅标志着双方在汽车出行领域的深度协同迈入...
21:31
1月26日,飞傲将在淘宝正式发售M33 R2R便携式Hi-Fi播放器,定价3999元。该机搭载高通骁龙680处理器,配备8GB RAM与128GB存储,重258克,内置4400mAh电池,标称续航约14小时。正面为5.5英寸1080P屏幕,首发提供深蓝、黑、金三色。音频系统采用自研全差分R2R电阻网络与TI多级放大架构,支持LDAC蓝牙、USB声卡及SPD...
21:01
2026年1月23日,富国银行大幅上调闪迪和西部数据的目标股价。闪迪目标价从230美元上调至380美元,西部数据从180美元上调至260美元。此次调整反映了存储市场需求回暖及两家公司盈利能力改善的预期。机构认为,随着数据中心扩张和消费电子复苏,NAND闪存市场前景向好,推动评级上调。
21:01
1月23日,上海证券交易所向明阳智慧能源集团股份公司发出问询函,就其发行股份及支付现金购买资产预案的信息披露事项提出监管问询。问询涉及标的资产权属、交易作价合理性、业绩承诺可实现性及风险揭示充分性等内容。此举系上交所履行持续监管职责,督促上市公司提高重组信息披露质量与透明度。明阳智能需在规定期限内予以书面回复并补充披露。
21:01
2026年1月23日,海口市住房和城乡建设局正式发布一项重要通告,面向中心城区及海南自由贸易港重点产业园区,公开征集2020年以来新建但尚未售出的普通商品住房,将其改造为保障性租赁住房。此次征集活动截止时间为1月28日,旨在优化城市住房资源配置,缓解重点产业人才住房压力。 本次征集的房源需满足多项硬性条件:首先,地理位置要求交通便利,周边配套设施完善,能够满...
21:01
1月23日,泰伯智库在WIF2025创新先行者论坛上发布“2025中国商业航天企业百强”榜单。北京以47%占比居首,沪粤苏为第二梯队,四川位列第五。卫星制造类企业估值同比大增102%,卫星互联网、遥感、火箭发射、导航类分别增长36.4%、30.7%、28.3%和23.5%。榜单新增太空服务赛道,反映产业版图持续拓展。
21:01
1月23日,中国科学院院士王建宇在WIF2025创新先行者论坛上指出,未来十年是我国商业航天规模化爆发的黄金期。他强调,产业将从聚焦航天技术转向构建航天经济,逐步成为支撑千行百业的新型基础设施。通过技术突破、生态优化与应用深化,我国有望实现从航天追赶者到并行者乃至领跑者的跨越,并形成世界级商业航天产业集群。
21:01
自1月19日起,受强冷空气影响,辽宁省电力负荷持续攀升,连续三天突破历史峰值。面对严峻的保供形势,国网辽宁电力第一时间启动应急响应机制,在1月23日前迅速部署了一系列关键措施。通过强化"电力+气象"联合会商机制,优化跨省电力资源调度,并提前部署应急抢修力量,确保电网运行安全。同时,针对省内14个地市制定了差异化的"一市一案"精准保电方案,将居民取暖、医疗机构...
20:30
2026年1月23日,北汽蓝谷子公司北汽新能源召开董事会,审议通过享界超级工厂高端平台车型产业化及产线数智化提升项目。项目选址北京,总投资19.91亿元,旨在升级冲压、焊接、涂装、总装等关键工艺,并推进数智化改造,以支持BE22 3.0高端平台车型量产。改造后工厂将具备柔性化、高效率、高质量和智能化生产能力,更好满足新能源车型迭代及个性化定制需求。该项目无...
20:30
近日,关于特斯拉完全自动驾驶系统(FSD)在中国可能获批的消息引发广泛关注。然而,据可靠消息源证实,这一传闻并不属实。特斯拉CEO埃隆·马斯克在达沃斯世界经济论坛上公开表示,他期待特斯拉能够先后在欧洲和中国获得FSD的监管批准,并暗示两者获批的时间可能相近。 目前,特斯拉在欧洲的FSD发展正面临严峻挑战。由于当地安全法规极为严格,该系统的推进进程相对缓慢。荷...