新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月25日

16:35
微新创想:2月25日,极兔速运全国转运中心已实现100%复工 春节假期结束后,快递物流行业迎来首波发货高峰 目前其全国网点营业率与人员复工率均超95% 此次复工覆盖华东、华南、华北等全部区域 旨在保障电商订单高效履约 极兔表示将通过智能分拣系统和运力动态调度 提升节后首周处理能力 支撑平台大促及日常寄递需求
16:35
微新创想:2026年2月25日,瑞典开发商Resolution Games正式上线街机模拟器游戏《Retrocade》(中文名:复古游戏)该游戏仅限Apple Arcade订阅用户游玩 《Retrocade》是一款专为怀旧玩家打造的街机模拟器游戏,它将玩家带回了上世纪80年代的街机时代。游戏不仅复刻了经典街机游戏的玩法,还通过先进的技术手段,为玩家提供了前所...
16:35
微新创想:2026年2月24日 微信官方宣布上线两项新功能 微信官方在2026年2月24日发布了一项重要更新 为用户带来更加便捷和安全的文件共享体验 第一项功能是面对面收照片和文件 用户可以通过生成专属二维码的方式 实现跨系统免流量接收照片及视频 这一功能打破了传统文件传输方式的限制 使得用户在没有网络连接的情况下也能轻松分享重要资料 第二项功能是查看该图片...
16:35
微新创想:vivo将在2026年3月的新品发布会上推出X300 Ultra旗舰手机。这款手机由vivo自主研发,标志着其在影像技术领域的又一重大突破。X300 Ultra将首发支持两支光学增距镜,其中一支为现有成熟型号,另一支则是独家400mm定焦“巨炮”镜头,为用户带来前所未有的拍摄体验。 同时,该机还将搭载200mm加400mm的双长焦组合,用户可以在单...
16:35
微新创想:2026年2月25日,TikTok面向TikTok Shop卖家推出多项新工具。这些更新旨在进一步提升卖家在平台上的运营效率与市场竞争力。 新功能包括全面开放AI驱动的Seller Assistant(卖家助手)。该工具已集成至卖家中心,帮助商家更高效地处理日常运营事务。通过智能化的辅助功能,Seller Assistant能够优化订单管理、数据分...
16:35
微新创想:Square Enix于2026年2月25日正式在Steam和GOG平台推出《最终幻想7》新版 此次推出的《最终幻想7》新版面向全球玩家开放购买。对于Steam国区的玩家而言,游戏定价为40元人民币,相较于以往版本更具吸引力。此外,已购买2013年原版的玩家可以免费升级至新版,而旧版游戏已于市场中停售,因此新版将成为主要的游玩版本。 新版游戏在玩法...
16:35
微新创想:2026年2月,德国知名硬件厂商Sharkoon正式发布了SKILLER SGM25W游戏鼠标。这款鼠标以其对称式右手设计而备受关注,能够满足不同玩家的握持习惯,无论是抓握还是指握都能获得良好的体验。同时,它支持USB有线和2.4GHz无线双模连接,为用户提供了灵活的使用方式。 SKILLER SGM25W配备了高性能的原相PAW3311光学传感器...
16:35
微新创想:2月23日,在海南三亚,春节长达9天的假期刚刚结束,不少游客还沉浸在假期的余韵中。一位游客来到沙滩上,或许是假期结束要回归工作的落差感让他心绪难平,便蹲下身在沙滩上写下了“不想上班”四个大字,以此抒发内心的感受。 大自然的“回应”总是出人意料。就在他写完不久,一个浪花涌来,冲刷过沙滩,原本写下的“不想上班”瞬间被“改写”,只留下了部分文字“小心一点...
16:35
微新创想:2月24日消息 在四川内江发生了一件令人惊喜的暖心事 过年期间 刘女士和兄妹们回到父母的老房子 一同整理菜地时 意外挖出了一个金戒指 仔细辨认后发现 这竟是已过世母亲2年多前丢失的那枚 这枚金戒指有着30多年的历史 是当年她特意买黄金为父母打造的 当时价格是80元一克 虽然不记得具体克数 但印象中“挺重的” 2年前 母亲生病时曾想把戒指给她 刘女士...
16:35
微新创想:中国大模型领域的“独角兽”纪录再次被刷新。2026年2月25日据企查查援引腾讯科技消息Kimi的母公司北京月之暗面科技有限公司Moonshot AI近期完成了总额超过7亿美元的新一轮融资本轮融资由阿里腾讯等互联网巨头领投融资完成后月之暗面的估值已飙升至100亿至120亿美元之间 核心亮点:模型爆发带动营收“奇迹”相比于单纯的融资数据月之暗面近期的商...
16:35
微新创想:随着企业对增长效率的追求达到新高度,AI 智能体正迅速成为销售领域的“标配”。根据 Salesforce 最新发布的《2026 年销售现状报告》,全球销售行业正经历一场由 AI 驱动的职业变革,九成销售团队已经或计划在未来两年内启用 AI 智能体。报告通过对全球 22 个国家、超过 4000 名销售专业人士的调研发现,AI 智能体已不再是锦上添花的...
16:35
微新创想:OpenAI今日宣布任命Arvind KC为首席人力资源官(CHRO)KC曾先后在Roblox、Google及Meta等公司担任要职拥有深厚的工程技术背景与大规模组织管理经验 OpenAI应用首席执行官菲吉·西莫表示KC将负责确保公司的人员政策与雄心勃勃的技术愿景相匹配在快速扩张的同时保留核心创新文化 随着AI深度重塑全球职场KC的核心使命包括组织...