新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月14日

10:37
微新创想 今天是情人节,微信临时提升单个红包额度上限,由原来的200元上调至520元,方便用户表达爱意。由于520”谐音我爱你”,因此成为不少情侣传递心意的数字。这一调整延续了微信在特殊节日中提升红包额度的传统,例如往年在5月20日、七夕等节日,微信也会进行类似操作,但红包额度提升通常仅限当天24小时。 微新创想 值得注意的是,微信近期派发文提醒用户注意网络...
10:37
微新创想:中国科学院工程热物理研究所联合国内企业研制的国际首套零碳复温天然气压差发电系统近日在山东曲阜正式投入运行。该系统的成功投运标志着我国在天然气高效利用领域迈出了重要一步。 该系统的核心装备和工艺实现了100%的自主化,具备高度的技术可控性。其最大发电功率达到500kW,每年可稳定发电超过330万度。这一成果不仅提升了能源利用效率,也为实现绿色低碳发展...
10:37
微新创想 2025年9月16日苹果正式推送iOS 26更新版本 适配第二代iPhone SE及后续所有机型 苹果近日首次公布iOS 26的系统升级率 数据显示 新系统的安装率相较iOS 18略有下降 截至2月12日 在过去四年发布的iPhone机型中 iOS 26的安装率达到74% 仍有20%的用户继续使用iOS 18版本 所有iPhone设备的整体...
10:37
微新创想:近日一段视频在网络上引发热议打破了外界对iPhone电池容量的固有认知 The Fix团队成功将一款发布近七年的iPhone 11 Pro升级至12000mAh电池容量 这一操作直接推翻了苹果受限于机身空间无法配备更大容量电池的普遍说法 也让网友开始质疑苹果或许是有意给iPhone配备小容量电池 据悉目前最新款iPhone的电池容量正逐步提升 其中...
10:37
微新创想 亚马逊股价正经历近20年来最长的连跌周期。受投资者对其巨额投资计划的担忧影响,该股在最近的交易日中持续下跌。截至周五收盘,亚马逊股价下跌0.8%,已连续九个交易日收跌,累计跌幅达到18%,市值蒸发约4700亿美元。这一趋势引发了市场的广泛关注,也反映出科技行业当前面临的挑战和不确定性。 微新创想 本轮股价下跌的导火索是亚马逊此前宣布的2026年资本...
10:36
微新创想 2月14日消息 近日 字节跳动旗下新一代视频生成大模型Seedance 2.0正式发布 引爆国内外科技圈 Seedance 2.0被部分用户誉为地表最强的视频生成工具 也有海外网友评价其效果媲美好莱坞大片 全球首富马斯克也发文惊叹 这个模型发展速度太快了 而缔造这一现象级AI产品的 是字节跳动重金打造的Seed团队 Seed成立于2023年 是字节...
10:36
微新创想:苹果App Store国区近日推出充值加赠活动,为用户提供额外奖励。此次活动旨在回馈用户支持,提升消费体验。根据官方规则,用户在单笔充值金额达到5元至1000元之间时,即可参与此次优惠活动。 具体来看,充值100元可额外获得10元奖励,充值300元则可获得30元,充值1000元则可获得100元。整体加赠比例为10%,为用户带来实际的消费优惠。此次活...
10:36
微新创想 针对网友广泛关注的新一代小米SU7电压相关问题 小米汽车在答网友问中给出了详细解答 解开了752V电压与行业800V主流宣传之间的疑惑 小米汽车表示 行业一直以来确实有着较多对800V的宣传 一些用户会认为所有800V平台的电压都是800V 实际上800V平台泛指一个较宽的区间值 正因为此 小米汽车在对大家宣传新一代SU7的电压平台时 没有...
09:50
微新创想:2026年春节假期(2月1日—2月7日)期间,全国多地掀起“接父母进城过年”的热潮。越来越多的子女选择将年迈的父母接到城市中共同度过春节,这一趋势在多个大城市尤为明显。 北京、上海、成都、广州、深圳成为50岁以上旅客最热门的飞行目的地。数据显示,飞往北京的60岁以上旅客数量同比大幅增长,增幅高达1.6倍。这表明,北京作为全国政治、文化中心,依然保持...
09:50
微新创想:2026年2月12日,暴雪正式宣布《暗黑破坏神2重制版》推出全新DLC“术士君临”。这是自游戏初代发布以来,时隔25年首次新增第八职业“术士”,该职业拥有混沌、邪术、恶魔三大能力体系,为玩家带来全新的战斗体验和策略选择。 此次DLC的推出不仅丰富了游戏内容,也标志着《暗黑破坏神2重制版》在角色多样性上的重大突破。术士作为全新的职业,其独特的技能组合...
09:50
微新创想:2026年2月14日,美团在港交所发布盈利预警。公司预计2025财年(截至2025年12月31日)净亏损233亿至243亿元人民币,而2024财年为净利润358.08亿元。 此次盈利预警反映出美团在2025财年面临较大的财务压力。公司表示,亏损主要源于加大核心本地商业及新业务的投入力度。随着市场竞争加剧,美团持续在本地生活服务领域进行资源倾斜,以巩...
09:50
微新创想:2026年2月9日 杭州热联集团股份有限公司正式向港交所提交上市申请 中金公司为独家保荐人 该公司成立于2001年3月 主营黑色金属 化工 有色金属及橡胶等285余种大宗商品贸易 按2024年贸易量计 其为中国第五大大宗商品服务商 第二大钢材出口服务商 2023至2025年前10个月营收分别为2521.32亿 2706.30亿及2302.73亿元;...