新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月23日

23:51
微新创想:2026年2月23日,谷歌联合教育组织ISTE与ASCD宣布启动一项全国性AI教育计划。该计划将为美国600万名在职教师免费提供Gemini及NotebookLM使用培训。旨在提升教师AI素养,并指导其在课堂中安全有效地引导7400万名学生应用AI工具。 课程设计注重实用性,包含具体教学案例,帮助教师更好地理解和运用AI技术。预计未来数月内开放报名...
23:18
微新创想:2026年2月23日,空中客车公司发布了其2025年全年财报。财报显示,公司在过去一年中实现了734亿欧元的合并收入,同比增长6%。这一成绩反映了公司在全球航空市场中的持续竞争力和稳健发展。 在民用飞机领域,空客全年交付了793架飞机,获得净订单889架,显示出强劲的市场需求和客户信心。同时,民用飞机的储备订单数量也达到了历史性的8754架,表明未...
23:18
微新创想:本田汽车近日宣布将在英国召回2017年至2021年款的思域车型共计46152辆 此次召回涉及的部分车辆选装了铝合金轮毂。经调查发现这些车辆的车轮螺母未充分紧固。在行驶过程中螺母有可能松动。在极端情况下存在车轮脱落的风险 为确保用户安全本田汽车将向相关车主寄送一封包含二维码的召回通知信件车主可以通过扫描二维码上传轮毂照片以确认自己的车辆是否在召回范围...
23:18
微新创想:北京时间2026年2月23日23:00,Steam新品节2026年2月版正式开启,将持续至3月2日23:00。此次活动为全球Steam用户带来了一场充满期待的游戏盛宴,期间将有多款尚未正式发售的游戏开放体验版。玩家可以在不花费任何费用的情况下,提前感受这些新作的魅力。 活动涵盖的动作、冒险、独立等多种游戏类型,为不同喜好的玩家提供了丰富的选择。无论...
23:18
微新创想:2026年3月5日至8日,森养光学将在日本横滨举办的CP+ 2026摄影展上展示四款全新E卡口及L卡口镜头原型。这四款镜头包括20-50mm f/2.0 FE、200mm f/1.8 FE、400mm f/4.0 FE以及28-85mm“高速”变焦镜头。所有展品均为3D打印模型,不具备实际拍摄功能,主要目的是收集用户反馈,以便为后续量产提供更精准的...
23:18
微新创想:2月23日清晨,美国东北部地区遭遇了一场罕见的暴风雪袭击,导致大面积的交通瘫痪和电力中断。截至东部时间6时30分,近40万用户家中断电,这场突如其来的极端天气给当地居民的生活带来了极大的不便。 强风与湿重的积雪共同作用,使得电线倒塌、设备故障频发。电力供应的中断不仅影响了日常用电,还对紧急服务和通讯系统造成了严重冲击。电力公司迅速启动了应急抢修机制...
22:38
微新创想:2026年2月23日,为纪念《新世纪福音战士》播出30周年,官方在主题庆典「EVANGELION:30+」收官环节宣布完全新作系列正式制作启动 该系列由横尾太郎担任系列构成与剧本,鶴巻和哉、谷田部透湖联合执导,冈部启一负责音乐,凯乐工作室与CloverWorks共同制作 原作自1995年首播以来,一直是日本动画史上最具影响力的作品之一。故事以201...
22:38
微新创想:2026年2月23日 索尼向美国专利商标局提交了一项名为“软暂停”的技术专利 这项专利提出了一种全新的游戏暂停机制 它允许玩家在按下暂停键后 游戏仍然保持运行状态 但会自动调整游戏难度 启用子弹时间 或者降低音量等手段 来缓解玩家的操作压力 这种功能的触发方式多种多样 可以通过按键 消息通知 或者特定的游戏事件来实现 专利内容特别指出 该技术非常适...
22:38
微新创想:2026年2月19日,美国电动汽车制造商Rivian正式推出Apple Watch专属应用程序。这款应用的推出标志着Rivian在智能车载生态领域迈出了重要一步。通过该应用,车主可以摆脱手机的依赖,直接使用Apple Watch完成一系列车辆控制操作。 微新创想:应用支持的功能包括车门锁解、车窗调节、警报触发、电量设定以及空调温度控制,极大地提升了...
22:38
微新创想:2026年2月23日,策略RTS游戏《奇点灰烬II》Steam免费Demo正式开放 玩家可体验人类与后人类联盟两大阵营 支持AI遭遇战及最多八人联机对战 含三张地图、极地/沙漠环境及昼夜系统 Demo聚焦大规模战术对抗 弱化APM要求 单人战役等内容留待正式版推出 最低配置需i5-8500或Ryzen 5 2400G RTX 1660/RX 580...
22:04
微新创想:2026年4月起,《火箭联盟》将在Steam和Epic平台版本中上线Easy Anti-Cheat(EAC)反作弊系统,以应对作弊、机器人及DDoS攻击。这一举措旨在提升游戏的整体公平性与安全性,为玩家提供更优质的竞技体验。 EAC非强制启用:玩家可以选择开启或关闭该系统。开启状态下,将禁用MOD,确保在线对战与创意工坊地图的正常运行。关闭状态下则...
22:04
微新创想:2026年2月23日,越南电动汽车制造商VinFast中东分公司在阿联酋与本地充电基础设施企业PlusX Electric签署谅解备忘录 双方将合作优化电动汽车充电网络布局与服务响应机制 旨在提升阿联酋境内VinFast车主的补能便利性与用户体验 合作涵盖快充站联合建设、智能预约系统接入及用户支持体系升级等内容 此举是VinFast加速拓展中东市场...