新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月11日

00:00
2026年1月10日,中国在全球鱼子酱产业中实现了历史性突破,正式超越其他国家,成为全球最大的鱼子酱生产国和出口国,其产量已占据全球总量的60%。鱼子酱这一奢华食材,源自对生存环境有着严苛要求的鲟鱼,它们需要在水质纯净、水温维持在5℃至25℃的亚冷水域中生长。近年来,中国浙江省千岛湖凭借其得天独厚的优良水质,成功打造出世界级的鲟鱼养殖基地,为全球鱼子酱市场提...
00:00
2026年1月10日,印尼北苏拉威西省附近海域突发7.1级强烈地震,引发广泛关注。印尼气象、气候和地球物理局紧急发布监测报告,确认震中位于北苏拉威西省沿海区域,震源深度仅为10公里左右,属于浅源地震。由于震级较高且震源较浅,监测系统未立即启动海啸预警机制,但已对周边海域进行严密监控。 截至目前,暂未收到人员伤亡及财产损失的初步报告,但考虑到地震波及范围较广,...
00:00
2026年1月7日至9日,上海国际投资集团有限公司党委书记、董事长袁国华率领代表团赴香港进行深度考察交流,旨在探索科技创新成果转化、跨境资本合作以及创新生态共建的新路径。此次访问期间,代表团与香港多所顶尖高校、知名金融机构进行了深入座谈,共同探讨合作机遇与挑战。此外,代表团还实地调研了孚腾国际,深入了解其在科技创新领域的最新动态与发展规划。 通过此次交流,双...
00:00
华硕ROG Xbox Ally X掌机在Linux系统运行时遭遇音频爆音与掉音的困扰,这一技术难题的根源在于TAS2781音频编解码器无法正确解析UEFI校准数据。面对这一挑战,开发者团队迅速响应,成功研发出临时性补丁方案。该补丁通过巧妙地绕过UEFI数据校准环节,转而采用DSP固件校准方式,从而有效恢复了掌机的扬声器功能,确保了音频输出的稳定性与流畅性。 ...
00:00
2026年1月10日,知名数码博主@i冰宇宙在社交平台上发布了一则重磅消息,揭示了三星Galaxy S26 Ultra将搭载一项令人期待的相机新功能——新增2400万像素拍摄模式。这一创新模式虽然不会直接出现在相机主界面的显眼位置,但用户可以通过深入探索相机助手中的高级分辨率选项来开启使用。值得注意的是,该模式不仅支持标准照片拍摄,还能与备受青睐的人像模式无...

2026年01月10日

23:29
SpaceX宣布,停靠在国际空间站的“龙”飞船将于1月14日脱离空间站,1月15日携Crew-11任务四名宇航员返回地球。此次撤离因一名宇航员出现健康问题,NASA局长决定实施可控医疗撤离,确保其获得更好治疗。宇航员包括NASA的泽娜・卡德曼、迈克・芬克,日本的油井龟美也和俄罗斯的奥列格・普拉托诺夫。飞船预计于美东时间1月15日凌晨3:40(北京时间1月1...
23:29
2026款奇瑞冰淇淋和小蚂蚁纯电小车于今晚正式上市。奇瑞冰淇淋推出4款车型,指导价4.39万元起,限时增购价4.09万元起;小蚂蚁推出2款车型,指导价5.49万元起,限时增购价5.19万元起。新车在配置、续航和充电性能方面均有升级。其中,冰淇淋配备9英寸中控屏与22千瓦快充,最高续航220公里;小蚂蚁搭载36千瓦电机,匹配25千瓦时电池,续航达271公里,...
23:29
2026年1月22日,微软将举办Xbox直面会,官方确认展示《神鬼寓言》《极限竞速:地平线6》《轮回之狱》。此前微软在X平台回应玩家时称“今年是带‘6’游戏的大年”,引发网友对《上古卷轴6》亮相的猜测。尽管部分玩家认为这是官方暗示,但B社CEO此前表示该作开发仍需较长时间。微软随后关闭相关帖文评论,未进一步回应。目前来看,《上古卷轴6》亮相可能性较低。
22:58
2026年1月10日,消息称尼康Z9 II旗舰相机发布可能延期。原计划于2025年末或2026年初公布,因关键零部件供货延迟及公司严格的测试流程,正式发布时间或延至2026年第四季度。该机型可能错过美加墨世界杯,但部分原型机或现身赛事供专业摄影师测试使用。尼康曾采用类似策略,在东京奥运会期间提供Z9初代测试机。
22:28
2026年1月10日,我国光伏产业迎来历史性突破,首个沙地柔性支架光伏项目在内蒙古巴彦淖尔市乌拉特前旗正式并网发电。这一里程碑意义的工程总装机规模高达200万千瓦,其中30万千瓦采用了创新的柔性支架光伏支撑系统,实现了沙地环境中大规模应用的首次成功。作为国家第三批大型风电光伏基地的重点项目,该工程由中国电建负责设计参建,不仅展现了我国在沙地光伏技术领域的领先...
22:28
2026年,小鹏汽车将加快海外生产制造布局。1月9日,董事长何小鹏表示,公司将在2026至2030年间全力推进全球化战略,覆盖智能汽车、Robotaxi、机器人及低空飞行汽车等核心产品线。目前,小鹏已在全球设立9大研发中心、3个海外本地化生产项目,业务落地60个国家和地区,充电网络覆盖31国,接入超266万桩。
22:27
2026年1月10日,EA旗下工作室Maxis发布声明,回应玩家对沙特财团收购EA后游戏内容可能变动的担忧。Maxis强调,《模拟人生》系列的核心价值观——包容、选择、创造力与社区——不会改变,创作权仍由团队掌握。官方重申,游戏将继续秉持“按照你的方式去生活”的理念。目前,团队正开发多个新项目,包括覆盖PC、主机和移动端的全新家族游戏,同时仍将坚持推出单人...