新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月24日

17:07
1月24日,北京中国风能新春茶话会上,CWEA秘书长秦海岩指出,算力与绿电融合加速推进。预计2025年中国数据中心达900万架,2030年超3300万架;未来5年新增用电量逾3800亿千瓦时,相当于175GW风电装机年发电量。该需求凸显风电规模化开发与源网荷协同的紧迫性。
17:07
1月23日晚,四川省在自贡国际恐龙灯会现场启动迎春文旅促消费系列活动。活动覆盖全省,将持续至春节期间,期间将举办超2400场文旅商体融合活动,并推出十大精品项目。投入总额超4000万元,含文旅消费券2000万元、电影消费券1600万元及10万张免费景区门票。此举旨在激发假日消费活力,促进文旅市场复苏。
17:07
截至2025年底,中国风电机组的累计出口装机容量已强势突破2800万千瓦大关,其全球化足迹更已广泛覆盖超过60个国家和地区。这一令人瞩目的成就由中国可再生能源学会风能专委会秘书长秦海岩于2026年1月24日正式对外公布。近年来,中国风电产业的出口增长势头迅猛,这主要得益于其产业链在全球范围内的深度布局。目前,中国风电企业已在超过20个国家成功设立了生产基地、...
17:07
2026年1月23日,彭博社独家披露了一则备受瞩目的商业动态:全球知名投资机构美国黑石集团正积极寻求出售其手中徕卡相机(Leica Camera AG)的控股权,交易估值高达10亿欧元,折合人民币约82.09亿元。这一决定标志着黑石集团将正式退出其在徕卡长达十五年的投资旅程,自2011年最初入股以来,黑石持有的约45%股份如今即将迎来新的主人。 值得注意的是...
17:07
1月24日,猎芯网携手粤港澳大湾区国家技术创新中心与广州泊沧数据技术有限公司,在广东正式签署战略合作协议,共同开启工业基础数据与元器件创新服务生态建设新篇章。此次合作将深度融合国家级创新资源、专业数据运营能力及产业级供应链数字服务能力,打造半导体及电子元器件领域数字化协同新标杆。 合作三方将重点聚焦高质量数据即取即用、研发设计与供应链采购的无缝协同两大核心目...
17:07
1月24日前,抖音平台核查确认“孙涛直播力挺闫学晶”等多条关于演员孙涛的信息系谣言。事件起因系部分营销账号恶意炒作。抖音已下架相关视频超8000条,封禁首发账号,并在话题页、搜索结果中置顶澄清;同步清理违规评论及弹幕17万余条,处罚7个违规账号。自1月7日起,平台已对孙涛账号启动网络暴力防护机制。抖音呼吁用户理性辨识、不传谣。
17:07
2026年1月16日,备受瞩目的商业航天企业中科宇航正式迈入IPO辅导验收阶段,标志着其向资本市场迈出了关键一步。此次辅导工作由实力雄厚的国泰海通证券担任机构,将为中科宇航的上市之路提供全方位的专业支持。作为中国科学院力学研究所的杰出成果转化项目,中科宇航自成立以来始终致力于推动航天技术的创新发展,其主营业务涵盖中大型运载火箭研发、亚轨道科学试验以及太空旅游...
17:07
2026年1月24日,技嘉官网正式上线新款GO27Q24G显示器。该产品采用27英寸LG Display MLA+镜面抗反射WOLED面板,分辨率为2560×1440,刷新率达240Hz。全屏亮度275nits,峰值亮度1300nits,对比度150万:1,支持VESA DisplayHDR True Black 400与ClearMR 13000认证,G...
16:36
1月19日,雷蛇CEO陈民亮在The Verge《Decoder》播客中回应游戏圈“反AI”现象。他指出,玩家不满的是生成式AI产出的低质内容,如角色建模错误、剧情粗糙等,而非AI本身。雷蛇已投入约6亿美元研发AI技术,聚焦辅助开发者提升游戏质量,如Bug检测、拼写修正等。公司计划招聘150名AI工程师,推动品牌特色AI功能落地。陈民亮强调,AI应服务于沉...
16:36
1月24日,百度正式宣布一项重大组织架构调整,将百度文库与百度网盘两大核心业务整合,组建全新的个人超级智能事业群组(PSIG)。此次重组标志着百度在AI化转型道路上迈出关键一步,旨在通过资源整合与协同创新,加速推出前沿AI应用,为业务发展开辟新的增长空间。根据官方公告,PSIG将由集团副总裁王颖出任负责人,直接向集团CEO李彦宏汇报工作,彰显其在百度战略布局...
16:36
2026年1月24日至2月28日,特斯拉在中国市场震撼推出Model 3限时购车盛宴,为消费者带来多重惊喜优惠。凡订购后轮驱动版、长续航后轮驱动版或长续航全轮驱动版,即可尊享8000元保险补贴,有效降低用车成本。此外,购车者还可选择7年超低息金融方案,首付仅需7.99万元起,首月月供低至1759元,让高品质出行更加轻松无忧。 为回馈忠实车主,特斯拉特别推出8...
16:36
2026年1月24日,OpenAI首席执行官山姆·奥尔特曼在X平台正式官宣,未来一个月内将陆续推出一系列基于Codex技术的创新产品,其中首款产品预计将于下周率先上线。Codex作为一套集成了先进模型、实用工具与高效工作流的AI编程辅助系统,其核心定位是打造新一代的"AI软件工程师",旨在通过智能化手段显著提升软件开发效率与质量。 奥尔特曼在公告中特别强调了...