新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月19日

23:32
微新创想:三星电子宣布将于2026年5月关闭位于斯洛伐克加兰塔的电视生产工厂 这一决定标志着该工厂自2002年成立以来长达24年的运营历史正式结束 三星电子表示 关闭加兰塔工厂的主要目的是为了提升全球运营效率 以应对当前电视市场面临的多重挑战 包括长期低增长 竞争日益激烈 以及当地能源价格高企和零部件成本不断上升等因素 该工厂长期以来是三星在欧洲市场的重要生...
23:32
微新创想:2026年3月19日 杭州觅熵科技有限公司发布声明 指出X平台存在持续冒用其名义的虚假账号 杭州觅熵科技有限公司在2026年3月19日发布正式声明 明确表示X平台上有多个账号长期使用其公司名称进行虚假宣传 该公司强调 这些账号与觅熵科技没有任何关系 所发布的内容也不代表公司的官方立场 觅熵科技自2021年成立以来 一直专注于遥感大数据与地理情报服务...
23:32
微新创想:3月11日至13日,国星宇航与上海交通大学太空计算联合实验室成功利用开源智能体OpenClaw,在轨卫星‘星算’01组上完成了全球首次太空算力远程操控地面人形机器人的试验。此次试验中,操作者通过自然语言,包括语音指令的方式,向太空计算中心发送指令。指令随后被传输至在轨的大模型系统,完成人工智能推理后,决策结果返回地面并驱动机器人执行相应动作。 微新...
23:32
微新创想:2026年3月19日,Epic Games商城开启本周免费游戏领取活动,限时赠送《电工模拟器》与《战舰世界》Epic周年纪念橘号礼包。活动面向所有Epic账号用户,领取截止时间未明确,但按惯例持续至下周四同一时段。 《电工模拟器》是一款沉浸式职业模拟游戏,玩家可以体验真实的电工工作内容,包括电路安装、设备维修等任务。游戏不仅提供丰富的操作细节,还让...
23:30
微新创想:3月19日消息在今天的新品发布会上小米笔记本Pro 14正式亮相共带来了四款配色。四款配色分别为白色雅灰柔光粉柔雾蓝雷军在发布会上还开玩笑表示特别推荐柔光粉男生用也很不错大家说这种叫猛男粉 小米笔记本Pro 14作为时隔四年回归之作定位为旗舰高性能轻薄本整机厚度仅为14.95mm重量仅1.08kg。这一重量远小于常见的14英寸笔记本产品比14英寸M...
23:30
微新创想 近日,小米在AI领域持续发力,引发广泛关注。雷军在接受采访时分享了团队在AI赛道上的布局思路,强调小米在硬核科技方面一直保持低调,但实际推进速度远超外界预期。他透露,小米的AI团队专注于核心技术突破,不追求短期曝光,而是致力于打造真正有价值的产品与技术。 微新创想 不久前,小米团队在全球最大的大模型API聚合平台OpenRouter上匿名上线了自研...
23:29
微新创想 今晚新一代小米SU7春季新品发布会如期举行 在发布会接近尾声时小米创办人雷军重点分享了关于AI领域的最新思考与技术突破 雷军表示我们已经步入了一个全新的时代 近期全民养龙虾的热潮引发了广泛关注 两周前小米发布了相关的龙虾产品其核心支撑正是XiaomiMiMo-V2-Pro大模型 该模型是面向Agent时代的旗舰级基座模型拥有万亿级参数和百万级上下文...
23:29
微新创想 小米汽车今日晚间举办新一代 SU7-小米春季新品发布会。雷军介绍新一代SU7的车门把手百分百符合新国标。虽然新国标2027年才开始生效,但我们提前满足。新国标对汽车把手的要求包括非全隐藏、碰撞或热失控后机械释放。车内配备机械内把手,断电后也能机械释放。布置位置、标志、说明文字及尺寸都有明确要求。 雷军介绍新一代小米SU7车外支持机械拉手。同时车...
23:29
微新创想 3月19日晚新一代小米SU7正式亮相 这款新车首发搭载了小米蛟龙底盘 小米创办人雷军在发布会上指出 该底盘的核心特质在于精准、稳定与安全 官方将小米蛟龙底盘定义为一套软件与硬件深度融合的高性能智能底盘系统 它通过底层架构的全面革新 旨在为驾驶者带来更极致的操控感 同时确保在各种复杂路况下的行驶稳定性 在底盘硬件配置上 新一代SU7展现出了极高的...
23:29
微新创想:今晚小米新一代SU7正式发布 全系搭载高强度被动安全系统 新车在车身结构上全面升级 配备由2200MPa超强钢打造的内嵌式防滚架 其中一根长达2.56米的2200MPa热气胀管从A柱贯穿至C柱 大幅强化了车体刚性 该设计旨在有效降低碰撞中A柱形变或断裂的风险 提升整体车身安全性 全车四门均配备2200MPa防撞梁 相比传统1500MPa车门防撞梁 ...
23:29
微新创想:小米汽车今日晚间举办新一代 SU7-小米春季新品发布会。此次发布会聚焦于新一代小米SU7的全面升级,尤其是动力系统的显著提升。雷军在发布会上表示,新一代小米SU7全系动力系统实现大升级,搭载了V6s plus超级电机,最高转速提升至22000转,峰值功率高达392匹。这一升级不仅提升了车辆的性能表现,也带来了更高效的能量转换。 新一代SU7的电机采...
22:56
微新创想:3月19日,宁德时代旗下时代电服在杭州西湖区西园一路站举行巧克力换电30站开业暨1500辆换电车集中交付仪式。广汽埃安、长安欧尚等合作车企参与交付,标志着杭州‘车—站—生态’一体化换电运营正式启动。 此次开业不仅展示了时代电服在换电基础设施建设上的快速推进,也体现了与多家车企的深度合作。目前,杭州已建成30座换电站,预计年底将扩展至近70座,全面覆...