TinyLlama：550MB高效AI模型90天3万亿token训练突破 - 微新创想

2023-09-10 09:50:03 互联网 135 次阅读

新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型，这款模型以其惊人的小巧体积和强大的性能能力，在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间，却具备出色的智能处理能力，使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术，并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源，使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案，满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及，对内存和计算能力有限制的设备来说，小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用，还能协助解码更大的模型，正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成，其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔，他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低，而且具备广泛的应用潜力，特别是在需要受限计算和内存占用的场景中，如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动，团队使用了16个A100-40G GPU进行加速，计划在90天内完成整个训练过程。截至目前，团队已成功完成了1050亿token的训练任务。模型的构建者表示，TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”，这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder，这是一个代码生成模型，其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成，TinyLlama将加入众多小型语言模型的行列，这些模型正被开发者用于构建各种创新应用。与此同时，EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展，共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

2026年01月12日

05:23

AI21否认与英伟达收购传闻双方无并购磋商

2026年1月12日，以色列人工智能领域的领军企业AI21发布官方声明，明确否认与全球知名的图形处理器巨头英伟达之间存在任何形式的收购谈判。该公司在声明中特别强调，目前双方并未就任何并购事宜展开磋商，此前流传于市场中的英伟达有意收购AI21的传闻纯属无稽之谈。作为一家专注于大语言模型研发的顶尖初创企业，AI21近年来凭借其前沿的技术实力和突破性成果，在人工智...

03:48

U23国足1-0胜澳大利亚小组头名战泰国出线形势解析

2026年1月12日，U23亚洲杯D组第二轮比赛落下帷幕，中国U23队凭借一场1-0的胜利，以4分优势暂时领跑小组积分榜。这场关键战役不仅展现了国青队的竞技实力，更将小组出线悬念推向高潮。末轮对阵泰国队，中国U23队肩负着锁定小组头名的重任。若能全取三分，球队将直接以小组第一的身份晋级下一阶段；若战平，则需依赖伊拉克队与澳大利亚队的比赛结果——只要伊拉克未能...

02:47

IDEAYA计划2026年启动四项临床试验加速肿瘤药物研发

2026年，IDEAYA Biosciences将全面启动四项关键性的注册性临床试验，标志着公司研发战略迈入全新阶段。这些临床试验将在全球范围内多个中心同步开展，重点聚焦于公司核心在研药物IDE849和darovasertib的疗效与安全性评估。作为全球生物科技领域的创新力量，IDEAYA Biosciences此次多中心临床试验的推进，旨在显著加速两款药物...

01:46

黑龙江出入境旅客激增9.1万人次边境旅游持续升温

2026年1月1日至9日，黑龙江省口岸出入境旅客数量突破9.1万人次，同比增长率高达43.8%，这一亮眼数据充分展现了边境旅游与跨境往来的蓬勃态势。黑龙江出入境边防检查总站最新发布的数据显示，随着通关便利化措施的持续优化以及冬季冰雪旅游热潮的兴起，边境地区的客流量呈现显著增长。其中，绥芬河、黑河、抚远等主要陆路口岸的客流增长尤为突出，反映出冬季冰雪旅游的强大...

00:44

美三颗系外行星研究卫星成功发射探索宇宙生命新希望

2026年1月11日21时45分，北京时间，美国航天局成功发射三颗专项研究系外行星的先进卫星，搭乘“猎鹰9”号火箭，从加利福尼亚州范登堡太空军基地腾空而起。火箭点火过程精准无误，卫星顺利分离，助推器更以卓越性能成功回收，标志着此次任务圆满开局。 “潘多拉”卫星作为此次发射的核心，将搭载可见光与近红外光谱仪，通过精准分析行星大气信号，有效区分恒星与行星的化学成...

00:44

沃尔玛谷歌联手推AI购物新体验个性化推荐更高效

2026年1月11日，全球零售巨头沃尔玛与科技巨头谷歌母公司Alphabet正式宣布达成战略合作，将在谷歌的Gemini人工智能平台上推出创新性购物功能。这一合作标志着零售行业与前沿AI技术的深度融合，将彻底改变用户的在线购物体验。该AI驱动的购物功能将基于Gemini平台的强大智能算法，通过深度学习用户购物习惯和偏好，为每一位消费者提供高度个性化的商品推...

00:44

博杰股份N客户设备上半年将批量交付 AI测试设备市场拓展

2026年1月11日，博杰股份正式宣布与N客户达成合作，为其提供机柜内PCBA主板测试服务。据悉，相关测试设备预计将在2026年上半年完成批量交付，标志着公司在该领域的产能与技术实力获得市场高度认可。根据公司财报显示，该业务已于2025年成功切入量产产线，预计今年设备需求量将突破小四位数，展现出强劲的市场增长潜力。此类产品主要应用于客户在线生产环节，若客户产...

2026年01月11日

23:42

马斯克预言三年后机器人外科手术超越顶尖医生

2026年1月11日，特斯拉CEO埃隆·马斯克在播客访谈中释放出惊人言论：Optimus人形机器人将在短短三年内实现重大突破，不仅将超越全球最顶尖的外科医生，更将开启规模化应用的新时代。马斯克指出，传统医生培养周期漫长且知识更新速度难以跟上医疗技术革新的步伐，而机器人则能完美克服这些局限，以稳定性和持续学习能力成为医疗领域的革命性力量。值得注意的是，特斯拉已...

23:42

数字人民币App上线碳普惠小程序绿色出行获积分兑换

2026年1月8日，数字人民币App在上海地区迎来重大创新，率先上线“碳普惠”小程序，为绿色出行行为赋予全新的价值。这一举措标志着我国在推动绿色消费和碳减排方面迈出了坚实一步。用户只需开通该小程序，日常低碳出行行为如乘坐地铁、骑行共享单车等，均可被精准量化为碳积分，并自动归集至个人数字人民币账户中。每1250克碳积分可兑换0.01元数字人民币，兑换过程需通过...

23:12

超微智能店内零售方案发布提升效率优化体验

2026年1月11日，超微公司（SMCI）正式宣布携手多家行业领军企业，共同推出具有革命性意义的智能店内零售解决方案。这一创新方案深度融合了尖端AI计算技术与先进的边缘设备，致力于全面优化零售门店的运营效率，同时显著提升顾客的购物体验。此次战略合作覆盖了硬件设备、软件系统及数据分析三大核心领域，通过引入实时库存管理系统、智能监控摄像头以及自动化结账系统，为零...

23:12

电影《匿杀》票房冲破3亿创佳绩

1月11日21时12分，电影《匿杀》的票房成绩再创新高，成功突破3亿元大关，累计观影人次也达到了令人瞩目的817万。这部近期上映的影片凭借其扣人心弦的剧情和精良的制作水准，迅速赢得了观众的广泛青睐。这一亮眼的数据成果源自票务平台的实时统计，清晰地反映出《匿杀》在市场上的热度正持续攀升，势头强劲。尽管影片目前仍处于热映阶段，但其在观众中的口碑和票房表现已展现出...

23:12

广东汕头突发山火正全力扑救

1月11日下午，广东汕头市濠江区礐石街道突发山火。火情发生后，当地立即组织森林防火力量赶赴现场扑救。截至目前，暂无人员伤亡报告。扑救工作正在全力进行中，相关部门已对周边区域加强监测和疏散准备。