新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月29日

03:10
微新创想:3月29日凌晨2时38分,印尼西南群岛附近海域发生6.1级左右地震。根据中国地震台网的自动测定,此次地震的震中位于南纬7.75度、东经127.93度。目前震源深度尚未公布,但地震发生地为海域,距离主要人口聚居区较远。因此,初步判断此次地震对当地居民的影响较小。截至目前,尚未收到任何人员伤亡或灾情报告。此外,地震发生后也未发布海啸预警。中国地震台网表...
02:08
微新创想:3月28日(周六)雀巢公司披露了一起严重的货运盗窃事件。一辆装载着12吨新系列KitKat巧克力棒的货运卡车在意大利中部启运后,遭到不明身份人员的盗抢。据初步了解,该车原本计划将货物配送至欧洲多个国家,但目前车辆及全部货物均下落不明。 此次事件不仅给雀巢公司带来了巨大的经济损失,也对其全球供应链的稳定性造成了严重影响。作为全球知名的食品品牌,雀巢近...
00:35
微新创想:2026年3月28日,xAI联合创始人罗斯·诺迪恩正式宣布离职,这一举动标志着马斯克旗下AI公司初创团队“11罗汉”成员全部离任。诺迪恩在公司中担任重要职务,曾直接向马斯克汇报,负责协调各项关键工作与公司优先事项。 此次离职潮的起点可以追溯到2月初,当时xAI与SpaceX完成了合并。随着合并的推进,多名核心创始人陆续选择离开。这一系列变动引发了外...
00:04
微新创想:3月25日 谷歌研究院发布了一项名为TurboQuant的极端压缩算法 这一算法在数据压缩领域引起了广泛关注 微新创想:3月27日22时 RaBitQ算法的第一作者高健扬指出该论文存在三处严重误述 第一是在方法论上回避了JL变换的相似性 第二是没有依据地声称RaBitQ理论是“次优”的 第三是实验设置不公平 因为RaBitQ使用的是单核CPU 而T...

2026年03月28日

23:31
微新创想:3月27日,美国宾夕法尼亚大学沃顿商学院发布了一项引人深思的研究报告。该研究指出,人类在使用ChatGPT等生成式AI进行决策时,正面临“认知投降”的风险。研究结果显示,约有80%的受试者在面对AI提供的错误答案时,直接接受并未进行核查。 研究团队通过对近1300名参与者的实验进行分析,发现依赖AI进行决策的人群,其自信心平均比不依赖AI的人高出1...
23:00
微新创想:宝马美国经销商正推动推出一款尺寸超X7的全尺寸SUV,暂称X9。这款新车预计将成为宝马品牌在高端SUV市场的重要布局。 该车将主要面向美国市场,预计市场占比将超过80%。同时,宝马也在考虑将其引入中东、中国、韩国及部分欧洲市场,以扩大其全球影响力。 宝马品牌与产品管理高级副总裁伯恩德·科尔伯确认了这款新车在核心市场的潜力。他表示,这款SUV将满足特...
22:29
微新创想:2026年3月28日,中关村论坛披露了一项重大成果。中科院部署的三颗试验卫星中,有一颗成功在地月远距离逆行轨道(DRO)稳定驻留两年。这一突破性的进展为我国深空探索奠定了坚实基础。 该卫星所处的轨道位置特殊,位于地月空间之中。其主要功能是构建一个具备自主导航与中转能力的“太空港口”。这一设施的建立,为未来的深空航天器提供了重要的支持平台。 “太空港...
21:57
微新创想:3月28日,位于四川眉山天府新区视高街道的环天星座卫星地面接收站(眉山站)正式投入运行。该站是西南地区首个商业化运营的遥感卫星测运控站,具备S/X双频段全自动数据接收与实时传输能力,下行码速率最高可达2000Mbps。 微新创想:自2026年1月试运行以来,该站已成功接收112轨卫星数据,数据总量超过3TB,接收成功率超过97%。这一成绩标志着该接...
21:57
微新创想:2026年3月28日,美国田纳西州纳什维尔市迎来了一项备受关注的基础设施建设计划。马斯克旗下的“无聊公司”正在推进“音乐城环线”地下隧道项目,该项目旨在通过建设一条长约32公里的地下隧道,连接市中心与纳什维尔国际机场,预计通行时间将缩短至约10分钟。这一项目不仅将极大提升城市交通效率,还可能成为未来智能交通网络的重要组成部分。 微新创想:该隧道项目...
21:57
微新创想:2026年3月28日,据知情人士消息,沙特阿拉伯当前原油出口量约为500万桶每天,石油产品出口量则在70万至90万桶之间。这一数据反映出沙特在全球能源市场中的重要地位及其持续增长的出口能力。 沙特阿拉伯正在不断优化其能源基础设施,以确保在全球能源供应中保持稳定和高效。其中,一项重要的战略举措是其横贯东西的输油管道——Petroline。该管道的输油...
21:57
微新创想:美国企业家埃隆马斯克的母亲梅耶马斯克近日在社交平台分享了自己游览中国长城的视频动态。此次她到访八达岭长城,全程精神矍铄步履轻盈丝毫看不出已是年过七旬。她还特意在“不到长城非好汉”石碑前驻足合影留念。 梅耶马斯克在发帖中直言这次长城之行体验极佳宏伟的城墙工事错落的烽火台与关隘景致都让她深感震撼赞叹不已。随动态附上的旅行视频里还出现了她手持长城文创雪糕...
21:57
微新创想:近日,印度班加罗尔发生了一起引发广泛关注的校园争议事件。一名50岁的医学院助理教授在课堂上公开向一名女学生求婚,这一举动迅速引起了学生们的强烈反应。视频中,教授情绪激动地表示,自己无法抗拒同学们给予的深厚爱意,并称想要向班级中最重要的女生表达心意。 微新创想:在表达完求婚意愿后,教授还承诺如果成功,将为全班同学分发巧克力。随后,他当众说出“我爱你”...