新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月24日

14:16
微新创想:2026年2月,江苏无锡——国家级高新技术企业、江苏省专精特新企业无锡微准科技近日宣布完成A轮融资,投资方为上海昶钰投资。此次融资标志着公司在AI与机器视觉领域的发展迈上新台阶,进一步巩固了其在智能制造行业的领先地位。 无锡微准科技专注于AI+机器视觉智能装备的研发与生产,核心能力涵盖深度学习与机器人控制技术。公司致力于为工业制造提供高效、精准的表...
14:16
微新创想:2026年2月,英国天然气和电力市场办公室(Ofgem)披露,约140个拟建数据中心项目申请电力达50吉瓦,超出该国当前用电峰值5吉瓦。这一数字的显著增长主要归因于人工智能技术的广泛应用。随着AI在各行各业的深入发展,对计算能力和数据存储的需求持续攀升,推动了数据中心建设的热潮。 人工智能应用扩张成为数据中心建设激增的主要驱动力。特别是在2024年...
14:16
微新创想:2026年2月24日,适马正式发布两款全新镜头产品,分别是全画幅定焦镜头35mm F1.4 DG II | Art和APS-C画幅广角镜头15mm F1.4 DC | Contemporary。这两款镜头在设计上均注重轻量化与便携性,同时提升了整体的操控体验和光学表现。 全画幅定焦镜头35mm F1.4 DG II | Art采用L卡口设计,重量为...
14:16
微新创想:日辰股份(SH603755)于2月23日发布了2025年度业绩快报。数据显示,公司全年实现营业总收入4.68亿元,同比增长15.70%。这一增长反映了公司在市场拓展方面的持续努力以及业务结构的优化。同时,公司归母净利润达到8421.04万元,同比增长31.87%。扣非净利润为8375.78万元,同比增长51.26%。这表明公司在主营业务上的盈利能力...
14:16
微新创想:2026年2月24日13时,电影《飞驰人生3》国内票房正式突破30亿元。该片由韩寒执导,沈腾主演,于2026年春节档(2月10日)全国上映。影片以赛车题材结合喜剧与励志元素,凭借高口碑和强排片持续领跑春节档。截至当日,累计观影人次超6800万,场均上座率居同期第一。片方表示,后续将推出IMAX重映版以满足观众需求。
14:16
微新创想:2月24日12时37分,台湾宜兰县发生4.7级地震 此次地震的震中位于北纬24.70度、东经121.81度,震源深度为8千米。根据中国地震台网的正式测定,地震的震级为4.7级。初步研判显示,这是一次浅源地震,其能量释放较为集中,对地表的影响相对明显。 由于震源较浅,地震波传播较快,因此地震的震感在周边地区较为强烈。不过,目前尚未有海啸预警的发布,说...
14:16
微新创想:2026年春节假期期间,全国民航系统展现出强劲的运输能力和高效的运营效率。根据民航局发布的数据,2月15日至23日的9天假期里,全国民航累计运输旅客达到2205万人次,日均运输量为245万人次。相比2025年春运同期,日均旅客运输量增长了7.7%,显示出春节出行需求的持续上升。 在航班保障方面,2026年春运期间全国共保障航班17.1万班,日均运行...
14:16
微新创想:2026年2月24日,外设品牌瓦尔基里(Valkyrie)预热推出VK87 V2机械键盘和VK-M3人体工学鼠标。这两款新品的发布引发了广泛关注,标志着瓦尔基里在高端外设市场的进一步布局。 VK87 V2机械键盘采用87键TKL布局,为追求简洁与便携的用户提供了理想选择。其独特的右侧旋钮设计,不仅提升了操作的便捷性,还增强了整体的视觉辨识度。MAX...
14:16
微新创想:2026年2月,深圳赛博格机器人公司宣布完成A轮融资,由奋达科技、中芯聚源联合投资。此次融资标志着公司在具身智能机器人领域迈出了重要一步,为后续技术突破和市场拓展提供了坚实的资金支持。 该公司专注全场景具身智能机器人研发,主攻工业制造、仓储物流及应急救援等高风险、高负载领域。通过智能化技术的深度应用,赛博格机器人致力于解决传统行业中的复杂作业难题,...
14:16
微新创想:2026年2月24日,汽车媒体CarScoops发布奥迪A2 e-tron路测图。该车被定位为奥迪旗下最小的纯电SUV车型。奥迪A2 e-tron基于大众MEB 400V平台打造,其设计和定位均低于Q4 e-tron。这款车型将作为燃油版A1与Q2的替代产品,满足市场对小型电动车的需求。 外观方面,奥迪A2 e-tron延续了1999年经典A2的设...
14:16
微新创想:2月22日,在湖北襄阳发生了一桩引人瞩目的预订趣事。马年团年饭的余温还未完全散去,一位罗女士便迅速行动,抢先预订了2027年2月5日羊年除夕的年夜饭,成为了全网最早预订羊年除夕宴的人。罗女士透露,往年她总是等到“十一”黄金周期间才开始预订年夜饭,但往往发现大桌和大包厢已经非常紧张,有时甚至只能将一大家子人分成两桌就餐。 为了避免这种情况再次发生,罗...
14:16
微新创想:近日,在湖北恩施的一场家庭聚会上,发生了一幕令人瞠目结舌的场景。一位平日里看似并不擅长饮酒的堂嫂,竟在酒桌上展现出惊人的酒量,独自将家中的姑父、表哥、堂哥、妹夫以及侄子五人全部“喝倒”。这一幕让在场的所有人都感到意外和惊讶。 这五位男性亲属在酒后纷纷选择去休息,而堂嫂却依然神采奕奕,面带微笑地坐在门口,悠闲地嗑着瓜子,仿佛刚刚的“激战”与她无关。她...