新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月03日

16:01
近日,一家名为 Ex-Human 的人工智能创业公司在美国对苹果公司提起诉讼,指控其在未提供具体证据的情况下,错误地下架了其应用,并拖欠约 50 万美元的收入。Ex-Human 的旗下应用 BotifyAI 和 PhotifyAI 曾在苹果 App Store 上架,但目前仍可在 Google 应用商店下载。Ex-Human 曾因其服务涉嫌引发争议,包括未成...
16:01
微新创想:4月3日凌晨,Google DeepMind 正式发布新一代开源模型系列 Gemma4。此次更新距离上一代产品发布整整一年,谷歌不仅在性能上实现了“代际跨越”,更在开源诚意上放出了大招:将许可证由自有协议彻底更换为全球通用的 Apache2.0,这意味着开发者可以更自由地进行商用与二次开发。 微新创想:规格全覆盖:从手机端到工作站的“四剑客”Gem...
16:00
微新创想:近日,千问AI眼镜接入蚂蚁GPASS,上线共享单车骑行与停车缴费等一系列“AI办事”功能。基于GPASS底层能力,用户佩戴千问AI眼镜后,只需语音唤醒,即可完成多项高频生活服务。 在出行场景中,用户只需说“你好千问,我要骑车”,按照提示注视车辆二维码即可完成核验开锁。抵达目的地后,用户只需说“你好千问,我要还车”,即可自动还车并结算费用。全流程无需...
16:00
微新创想:谷歌近期对其 Gemini API 的计费结构进行了更新,旨在更好地满足用户的推理使用需求。这次更新带来了多种新的服务档位,包括标准、弹性、优先、批量和缓存版。用户可以根据自身的实际需求选择最合适的档位。 标准档位提供了基础的推理服务,用户可以根据自己的使用情况进行选择。该档位适用于一般的推理任务,能够为用户提供稳定的服务体验,同时保持合理的成本控...
15:59
微新创想:2026年4月2日,卡普空在Steam平台上线了《生化危机》初代、二代及三代游戏。这一举动迅速引发了玩家群体的广泛批评,主要集中在三款游戏均强制搭载了Enigma DRM加密技术上。 Enigma DRM技术的使用导致了玩家在游戏体验上的明显问题。许多玩家反馈,该技术会导致游戏帧率不稳定,并且整体性能下降约20%。此外,Enigma DRM完全不支...
15:59
微新创想:4月2日,Android Authority报道称,安卓17 Beta 3中出现“通知规则”新功能。该功能允许用户针对特定应用或联系人,设定静音、屏蔽、静音并打包、高亮、高亮并提醒五种通知处理方式。用户可通过搜索与批量选择快速配置,适用于精准管控来电或消息等场景。 代码已出现在三星One UI 9泄露版本中,表明其将面向安卓全生态推广,非Pixel...
15:59
微新创想:4月3日至4月12日14:29,单人农机竞速游戏《Tractor Racers》在Epic国区开启开发者自主限免活动。该游戏原价31元,玩家可免费领取。作品由Yash Future Tech Solutions开发,主打拖拉机竞速玩法,含12个渐进式关卡,覆盖乡村与越野场景。 游戏以真实的拖拉机驾驶体验为核心,为玩家带来独特的竞速乐趣。玩家可以自由...
15:59
微新创想:2026年4月3日,谷歌Chrome 145版本正式上线后,迅速引发了用户的广泛讨论。其中,分屏视图功能成为主要争议点。该功能原本设计为提升多任务处理效率,但其选项被放置在右键菜单的第二位,导致许多用户在无意中启用了它。此外,拖拽边缘的触发机制过于敏感,进一步加剧了误操作的情况。 问题集中爆发于Reddit和Chromium等技术社区。大量用户反馈...
15:59
微新创想:2026年4月2日,索尼互动娱乐(SIE)宣布收购英国AI公司Cinemersive Labs。此次收购标志着索尼在人工智能领域迈出重要一步。Cinemersive Labs是一家成立于2022年的高科技企业,专注于计算机视觉与机器学习技术的研发与应用。公司凭借其在图像处理和智能算法方面的创新成果,赢得了业界的高度关注。 收购完成后,Cinemer...
15:59
微新创想:4月3日,顺丰宣布基于HarmonyOS SDK在顺丰速运App上线AR高精度测量功能。这一创新功能让用户在寄件时能够更加便捷地获取物品的准确尺寸信息。用户只需点击“试试拍照识别”,使用手机摄像头对物品进行环绕拍摄,系统便会自动构建三维轮廓并提取长宽高数据。通过这一过程,App还能精准计算物品的体积。 该功能的推出打破了传统测量方式对专业设备的依赖...
15:54
微新创想:4月2日,浙江一所高中的课堂上,上演了一场惊心动魄又无比暖心的戏码,这一场景被监控完整记录下来后,在网络上引发了热烈讨论。当天,一位老师正像往常一样在讲台上认真授课,教室里坐满了聚精会神听讲的学生。突然,意外发生了,原本好好悬挂在墙上的黑板,毫无征兆地整体脱落,径直朝着讲台砸了下来。 这突如其来的状况,让在场的所有人都惊呆了。就在这千钧一发之际,坐...
15:29
微新创想:通义实验室近日推出了全新升级的视频创作工具 Wan2.7-Video 该工具专注于提升创作者在视频制作过程中的自由度与灵活性 Wan2.7-Video 针对当前 AI 视频创作领域中普遍存在的两个问题 —— 内容生成不够专业以及视频修改过程繁琐 提供了多项创新功能 以满足用户更高效 更精细的创作需求 在内容生成方面 Wan2.7-Video 采用了...