新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2025年12月25日

19:46
12月25日,备受瞩目的中金河钢(河北)发展股权投资基金成立大会在河钢研发中心隆重举行。这一标志性事件标志着河钢集团与中金资本在产融结合领域的深度合作迈入新阶段。基金总规模高达320亿元人民币,运营期限设定为15年,近日已顺利完成备案程序,正式进入实质性运作阶段。 作为河北省重点产业发展的战略支撑平台,该基金将聚焦先进制造、新材料、绿色低碳等战略性新兴产业,...
19:46
2025年12月25日,金融监管总局发布《银行保险机构资产管理产品信息披露管理办法》,明确产品管理人原则上不得调整业绩比较基准。确需调整的,须履行内部审批程序,并在定期报告及更新的产品说明书中披露历次调整情况。考虑到部分存量产品周期较长,历史业绩基准参考价值有限,机构可仅披露办法施行后的调整记录。此举旨在提升信息披露透明度,保障投资者权益,增强产品业绩的可...
19:46
2023年12月23日,上海微创微航机器人有限公司自主研发的独道®UniPath®电子支气管镜手术导航系统获国家药品监督管理局(NMPA)上市批准。该系统具备全肺可达、全程可视、精准对准和稳定操作能力,融合柔性导管导航、智能路径规划与呼吸运动补偿技术,可实现对肺部深层小病灶的高精度抵达与干预。其超细蛇形导管外径约4.0mm,支持最小直径小于1mm的解剖结构...
19:46
铠侠本月重磅推出两款备受期待的M.2 2280规格PCIe 5.0×4 NVMe固态硬盘——EXCERIA PRO G2(VE10)与EXCERIA G3(VC10),为用户带来极致的存储性能体验。这两款新品均采用先进的M.2接口设计,完美适配现主流台式机与笔记本电脑主板,为用户带来无缝的安装体验与卓越的性能表现。 EXCERIA PRO G2(VE10)作...
19:46
2025年12月25日,雷神科技正式官宣将在CES 2026上亮相的多款重磅新品,引发业界高度关注。此次发布的全新产品线不仅展现了雷神在AI计算领域的持续深耕,更彰显了其在高性能硬件领域的创新实力。其中,备受瞩目的THUNDEROBOT STATION迷你主机将成为焦点,该产品将搭载最新一代AMD锐龙AI Max+ 395处理器,凭借其强大的算力性能与卓越的...
19:46
杭衢高铁即将于12月26日正式开通运营,这条全新的高速铁路将杭州与衢州紧密相连,线路全长131公里,设计时速高达350公里,为两地居民带来前所未有的便捷出行体验。杭衢高铁沿途设有建德站、建德南站、龙游北站、衢州西站以及江山站共5个站点,其中建德站和江山站均进行了全面的改扩建工程,以提升旅客的乘车舒适度和站内服务效率。 杭衢高铁的开通将极大缩短杭州与衢州之间的...
19:46
近日,备受瞩目的医疗器械创新企业英捷信医疗正式宣布成功完成数千万元人民币的A+轮融资。此次融资由知名投资机构毅达资本独家领投,浩悦资本担任全程财务顾问,为公司的快速发展注入强劲动力。据悉,所获资金将重点用于全球产能体系的战略扩建以及营销团队的全面升级,旨在进一步提升产品市场占有率与国际竞争力。 作为国内领先的医疗器械研发制造商,英捷信医疗成立于2021年9月...
19:46
瑞晟智能近日传来振奋人心的消息,公司正式确认收到山东现代大数据科技发出的《成交通知书》,成功中标国产算力设备及配套服务采购项目(二期),成交金额高达1.52亿元人民币(含税)。这一重大突破不仅标志着瑞晟智能在算力设备领域的市场竞争力得到充分认可,更彰显了公司在技术创新与服务拓展方面的坚定步伐 此次中标项目内容丰富,不仅涵盖先进算力设备的供应,还包含全方位的配...
19:46
2025年12月25日,宁波力显智能科技有限公司正式宣布成功完成Pre-A轮融资,此次融资由上海产业知识产权基金独家领投。该笔资金将专项用于生物医学高端光学成像平台的搭建,并加速推动公司自主研发的超高分辨率显微成像仪器的研发进程与市场布局。作为一家致力于显微成像技术创新的高科技企业,力显智能自2020年成立以来,始终扎根于余姚中意产业园,依托复旦大学与香港科...
19:46
近日,汕头航空有限公司完成了一项重要的工商变更,其注册资本实现了显著增长,从原有的2.8亿人民币大幅增至约15.04亿人民币,增幅高达近五倍。这一战略举措不仅彰显了公司的发展雄心,也为其在激烈的市场竞争中注入了强劲动力。 汕头航空有限公司成立于1993年7月,至今已走过近三十年的辉煌历程。作为一家专注于国内航空客货运输业务的企业,该公司始终致力于为旅客提供安...
19:46
近日,通光线缆传来喜讯,其全资子公司通光强能和通光光缆成功参与国家电网2025年第八十八批、第八十九批采购项目,并双双预中标,预中标金额合计高达1.39亿元。其中,通光强能凭借卓越实力斩获节能导线和常规导线项目,而通光光缆则凭借精湛工艺中标OPGW光缆及附件项目。这一系列亮眼成绩,不仅彰显了通光线缆在行业内的领先地位,更将为公司未来的经营业绩注入强劲动力。 ...
19:46
2025年12月18日,华鼎股份宣布为全资子公司江西集好提供1.1亿元连带责任保证担保,期限两年。本次担保在年度授权额度内,无需另行审议。截至公告日,公司对控股子公司实际担保余额为2.25亿元,占2024年末经审计净资产的5.93%,无逾期担保。江西集好2024年净亏损2681.57万元,2025年前三季度实现净利润21.75万元。