新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月16日

09:26
2026年3月,小鹏汇天宣布完成近2亿美元新一轮股权融资,投资方包括高瓴创投、红杉中国等。本轮融资后,公司历史股权融资总额约10亿美元,为亚洲载人低空飞行领域最高。小鹏汇天成立于2020年,专注城市空中出行(UAM)与智能电动飞行汽车研发。其全球首个现代化飞行器量产工厂已于2025年9月建成并投入试产,支撑‘陆地航母’等产品交付。
09:26
微新创想:3月13日,Spotify联席CEO Gustav Söderström在美国西南偏南音乐节宣布“音乐品味档案”功能进入测试阶段。这项新功能率先向新西兰的Premium用户开放,用户不仅可以查看自己的音乐、播客及有声书收听数据,还能对这些数据进行编辑。这一举措标志着Spotify在个性化推荐领域迈出了重要一步。 用户可以通过自然语言指令微调推荐偏好...
09:26
微新创想:2026年3月16日,英国布里斯托大学校友马修·皮登与托马斯·皮登共同研发的机器人,在45.3秒内成功完成四阶魔方复原,获得了吉尼斯世界纪录的认证。这一成就不仅标志着他们在机器人技术领域的卓越能力,也证明了现代科技在解决复杂问题上的巨大潜力。 该机器人采用3D打印技术制造机械结构,并结合了定制化的控制系统,使其具备高度的灵活性和精确度。其核心设计包...
09:26
微新创想:2026年3月,华擎(ASRock)推出H610M COMBO II主板。这款主板采用Micro-ATX规格,尺寸为220×203mm,专为入门级用户打造。它支持DDR5双通道1DPC与DDR4单通道1DPC内存共存,为用户提供了灵活的内存升级选择。 主板搭载6+1+1相供电设计,确保稳定供电与良好的系统性能表现。同时配备PCIe Gen5×16插...
09:26
微新创想:《红色沙漠》将于3月20日北京时间6:00正式发售 游戏开发商Pearl Abyss在3月18日6:00开放了PC版的预载功能,让玩家提前准备好迎接这款全新作品。此次发售的版本为纯单人游戏,不支持多人联机模式,玩家将独自体验完整的故事与挑战。 首次启动游戏时需要联网验证,同时安装首日补丁。完成这些步骤后,玩家可以完全离线运行游戏,享受流畅的单人体验...
09:25
微新创想:3月15日这天,一位博主在网上吐槽自家外婆的“囤货”习惯,结果一下子火了。原来这位博主在外婆家翻出了不少“古董级”的物品,像2000年的肥皂、2012年的小苏打、2016年的巧克力,还有2018年的蜂蜜,真是让人大开眼界。 博主想帮外婆扔掉这些过期的东西,可外婆却总有理由留着,还淡定地说:“放冰箱里有什么要紧的。”这博主也是哭笑不得,直接在网上调侃...
09:25
微新创想 3月16日消息 马克古尔曼透露 苹果首款折叠屏手机iPhone Fold将同步搭载iOS 27操作系统 针对折叠屏进行了多项优化 带来介于普通iPhone与iPad之间的大屏使用体验 核心亮点之一就是首次为iPhone带来分屏功能 不过短期内只有iPhone Fold专享 用户可在展开状态下同时运行两个应用 例如一边浏览网页一边回复消息 分屏查...
09:25
微新创想:在 AI 编程的军备竞赛中,Anthropic 正式宣布其 100 万 Token 上下文窗口全面上线。这一突破性的更新不仅是一个简单的数字提升,更标志着 AI 拥有了真正意义上的“超长工作记忆”。对于开发者而言,这意味着他们可以处理更复杂的任务,无需再为代码库的大小而烦恼。 100 万 Token 是什么概念?它相当于一次性读完 750 万个英文...
09:24
微新创想:根据 Techradar 的最新研究报告,一种利用 AI 深度伪造语音的新型诈骗正在全球范围内迅速蔓延。这项研究覆盖了美国、英国、加拿大、法国、德国和西班牙六国,调查对象超过 1.2 万名消费者。结果显示,模拟熟人声音的来电已成为影响公众安全的重要社会问题。 调查显示,约四分之一的美国受访者在过去一年内曾接到过此类 AI 伪造的来电。更令人担忧的是...
09:24
微新创想:企业微信宣布其接入OpenClaw能力实现重大版本进化 企业微信近期推出了一系列重要更新,通过上线“扫码即接入”与“文档自动化操作”两大核心功能,将企业AI智能体的应用门槛降至新低。此次升级不仅提升了企业微信的智能化水平,更标志着其从基础的智能对话枢纽,正式演进为深度衔接企业业务流的人机协同办公平台。 在接入效率方面,企业微信管理员现在可以通过腾讯...
09:24
微新创想:3月15日,阅文集团旗下专业网文创作工具“作家助手”正式宣布,其全新AI应用“作家助手Claw”开启内测,标志着“全民养虾”技术浪潮首次深度部署于国内网文创作生态。该项目目前已启动内测报名,作家用户通过一键安装部署,即可领养并喂养专属的AI智能体,解锁深度贴合网文创作场景的垂直领域技能。 技术架构方面,Claw建立在阅文于2023年发布的国内首个网...
09:24
微新创想:在网文创作这个极其“卷”脑力的赛道上,作家们终于迎来了自己的专属赛博外挂。3 月 15 日,阅文集团旗下的作家助手正式官宣:专属 AI 创作工具 Claw 开启内测。这款工具的出现,标志着网文创作正在从“单打独斗”步入“人机共创”的新阶段。 与市面上那些只会写公文的通用 AI 不同,Claw 是完全为了网文作家的“痛点”量身定制的。目前内测版已经内...