新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月13日

17:05
微新创想:截至2026年3月31日,达美乐中国门店总数达1462家,覆盖72座城市。较2025年底净增147家,新进入12座城市。这一增长不仅标志着达美乐在中国市场的持续扩张,也反映出其对下沉市场的重视与投入。 新开、在建及已签约门店合计完成2026年全年开店目标的65%。这一进度表明达美乐在门店拓展方面取得了显著成效,为全年目标的实现奠定了坚实基础。通过不...
17:05
微新创想:据台媒《电子时报》4月13日报道 苹果首款折叠屏手机iPhone Ultra 又称iPhone Fold 量产时间由原定2026年6月延后至8月初 该机目前处于EVT工程验证测试阶段 进度滞后 后续还需完成DVT与PVT测试 尽管量产延迟 苹果仍维持今年秋季发布计划 预计首发库存偏低 初期交付周期延长 但全年出货目标维持1500万部不变 苹果在智能...
17:05
微新创想:2026年4月13日,大众交通宣布拟以1.15亿元现金收购大众万祥汽车有限公司100%股权。此次交易标志着大众交通在拓展汽车后市场领域迈出重要一步。大众万祥汽车有限公司是一家专注于小型车辆维修、燃气汽车改装以及汽车配件销售的企业,其注册地为上海。公司凭借专业的技术和服务,在行业内积累了良好的口碑和市场份额。 此次收购的核心目标在于整合大众交通集团内...
17:05
微新创想:2026年4月13日,瑞士运动品牌On昂跑在中国北京与广州同步开启On Squad Race全球团速赛首站。此次赛事面向广大跑步爱好者,以团队竞速为核心体验,鼓励跑者以小组形式参与,增强互动性与竞技乐趣。活动不仅为参与者提供了沉浸式的运动氛围,更展现了On昂跑对团队协作与运动精神的重视。 现场特别设置了Cloudmonster 3全系列跑鞋的试穿体...
17:05
微新创想:4月13日,交通运输部印发通知,要求网络货运平台建立油价与运价协同调整机制。该通知明确指出,干线及同城货运平台需要以月为周期,根据汽柴油最高零售价的变动情况来调整运价。运价调整范围包括建议价、起步价和交易价等多个方面。 微新创想:调整机制以油价月度累计变化为基础,同时综合考虑运输成本构成,其中油费占比暂定为30%。此外,还需结合合理的利润空间进行定...
17:05
微新创想:微软宣布自2025年12月31日起全面停止Windows 10/11及Office的电话激活服务 该调整已于2026年1月正式实施 用户拨打激活热线将仅收到语音提示 并被引导至线上门户aka.ms/aoh进行激活操作 微软表示此次调整是为提升整体系统的安全性 可靠性与易用性 新的数字化激活流程不仅支持联网设备 还能适用于离线环境 为了进一步增强反欺...
17:05
微新创想:Refugium Games近日宣布,其备受期待的精神续作《阿吉菲尔德高中:震撼校园》将于2026年第三季度正式登陆Steam平台。这款游戏以美国高中生活为背景,为玩家带来一段沉浸式的校园体验。玩家将扮演一名高中生,在充满挑战与机遇的校园环境中展开自己的旅程。 游戏的核心玩法围绕完成各类课程任务展开,包括32项主线任务和15项支线任务。这些任务涵盖...
17:05
微新创想:今天网络上流传着一则关于科大讯飞员工中奖的消息,称有员工中得1500万元大奖,迅速引发了广大网友的关注和热议。不少网友对这位幸运的员工表示祝贺,同时也对科大讯飞的反应充满好奇。消息一经发布,便成为社交媒体上的热门话题,人们纷纷猜测公司是否会对此事做出回应。 科大讯飞在官方平台发布声明,明确表示已注意到网上关于员工中奖的相关信息。公司对这一事件表达了...
17:05
微新创想 OPPO今日正式官宣口袋哈苏Find X9 Ultra 三款全新配色设计灵感均源于地球极境之景 向每一位探索大地的影像创作者致敬 与此同时 OPPO联合哈苏推出OPPO Find X9 Ultra哈苏大地探索家大师套装 让每一份对影像的热爱 都兼具典藏级仪式感与独一无二的尊贵感 OPPO高级副总裁、首席产品官刘作虎强调 Find X9 Ul...
17:05
微新创想:小鹏汽车官方今日宣布小鹏MONA M03累计交付突破25万台 并且平均每5位车主里就有1位是00后 小鹏MONA M03作为品牌入门级家轿车型 在市场中表现尤为亮眼 其凭借智能辅助驾驶 动力续航 配置以及外观设计等多方面的优势 成为了同级车型中的佼佼者 在智能辅助驾驶方面 小鹏MONA M03搭载了先进的智能系统 为用户提供了更加便捷和安全的驾驶体...
17:05
微新创想:Meta 公司正在全力研发一款人工智能版的马克・扎克伯格,旨在让这位创始人与员工进行实时互动。这一举措是 Meta 在向 AI 领域转型的重要一步,预计将会产生深远的影响。 根据内部知情人士透露,Meta 正在开发一种高度逼真的 3D 数字人,该数字人不仅外观真实,而且能够实时进行对话。这一项目已被列为公司优先级的工作之一。扎克伯格本人积极参与这一...
17:05
微新创想:荣耀在近日的发布会上正式推出了其自主研发的终端侧“龙虾”AI智能体——YOYO Claw。这一全新技术不仅代表了荣耀在人工智能领域的又一突破,也预示着其在智能硬件生态构建上的重要进展。 YOYO Claw 将首次搭载于荣耀 MagicBook 系列轻薄笔记本中。通过这一技术的引入,荣耀希望为用户带来更加高效、智能的使用体验。作为一款面向终端侧的AI...