新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月21日

07:13
2026年1月20日,OpenAI正式在ChatGPT消费版中推出创新性的"年龄预测"功能,这一举措旨在为未成年人用户提供更全面的安全保护机制。系统通过深度分析用户账户的存续时长、活跃时间段以及独特的交互模式等行为特征,能够精准判断用户的实际年龄。一旦系统识别出用户未满18周岁,将自动激活专为青少年设计的适龄安全设置,确保他们在使用过程中免受不良信息的侵害。...
07:13
2026年1月21日,美国国际贸易委员会(ITC)正式宣布对具备跌倒检测功能的智能手表发起专利侵权调查,涉及包括Apple Watch、三星、谷歌、佳明等在内的多家知名品牌产品。此次调查的起因是德州公司UnaliWear向ITC提起诉讼,指控上述品牌产品侵犯了其持有的第10,051,410号和10,687,193号美国专利权。UnaliWear在诉讼中强烈要...
07:13
2026年1月20日,Netflix正式向监管机构提交文件,宣布对其潜在收购对象华纳兄弟探索公司(Warner Bros. Discovery)的收购方案进行重大调整。尽管收购总价维持在827亿美元的规模不变,但支付方式由原先的"现金+股票"组合改为全现金支付,每股作价27.75美元。这一策略调整的核心目的在于提升报价的综合吸引力,从而在激烈的市场竞争中有效...
06:42
2026年1月21日凌晨,北京时间,中国U23男足在U23亚洲杯半决赛中上演了一场酣畅淋漓的胜利,以3:0的比分完胜越南队,历史性地挺进决赛。这场胜利不仅是中国足球的里程碑时刻,更是年轻球员们用汗水和拼搏铸就的辉煌篇章。彭啸、向余望、王钰栋三位小将各施绝技,分别打入精彩进球,为球队锁定胜局。值得一提的是,中国队在本届赛事中表现堪称完美,五场比赛保持零失球,展...
06:42
2026年1月21日,全球领先的半导体巨头美国超威半导体公司(AMD)正式宣布一项重要人事任命,前埃森哲(Accenture)首席财务官罗伯特“罗布”麦克劳尔(Robert “Rob” L. M. McLaughlin)将加入其董事会,并即刻生效。此举被视为AMD为强化全球战略规划、优化财务治理体系以及加速企业数字化转型而采取的关键布局。 麦克劳尔先生的履历...
06:42
2026年1月21日,矿业巨头力拓集团正式发布了其第四季度的产量报告,数据显示其铝土矿产量高达1540万吨,不仅成功超越市场此前预测的1440万吨,更展现出强劲的生产实力。在氧化铝方面,力拓实现了197万吨的产量,这一数字也超过了分析师预期的190万吨,进一步巩固了其在氧化铝市场的领先地位。而在铝产量方面,公司交出了85.2万吨的亮眼成绩单,略高于市场预估的...
04:11
2026年1月21日,OpenAI正式宣布在ChatGPT平台推出创新性年龄预测功能,旨在为全球用户提供更安全的AI交互体验。这一智能系统通过深度分析用户在平台上的交互行为模式,能够科学评估账户持有人是否可能未满18周岁。作为全球领先的AI服务提供商,OpenAI此举充分体现了对未成年人保护的坚定承诺,确保平台运营严格遵守各国对青少年使用AI服务的监管政策与...
03:10
2026年1月21日,全球知名的图形处理器巨头英伟达正式宣布对人工智能推理领域的先锋企业Baseten完成了一笔高达1.5亿美元的战略投资,这一重磅消息迅速引发行业震动。随着此次融资的注入,Baseten的估值已强势突破50亿美元大关,跻身AI推理赛道头部企业行列。据悉,这笔关键投资落地于美国硅谷核心地带,双方均未对外公开披露具体的交易条款与细节,但市场普遍...
03:10
1月21日凌晨1时58分,新疆和田地区和田县突发3.9级地震,震中坐标锁定在北纬35.65度、东经78.38度,震源深度仅为12千米。作为浅源地震,此次震动虽让部分居民感受到明显晃动,但幸运的是未造成任何人员伤亡和重大财产损失。地震发生时正值深夜,尽管部分居民被惊醒,但当地社会秩序保持稳定,未出现恐慌现象。 当地应急管理部门已迅速启动一级响应机制,第一时间组...
03:10
2026年1月21日,卡塔尔的足球赛场见证了历史性的一刻中国U23男足在U23亚洲杯半决赛中以3:0的绝对优势战胜越南队,首次挺进决赛舞台这一胜利不仅是中国足球的里程碑,更是整个亚洲足球的骄傲 比赛过程精彩纷呈,中国队凭借出色的战术执行和球员个人能力,牢牢掌控了场上节奏彭啸、向余望、王钰栋三位年轻前锋分别打入精彩进球,展现了极高的竞技状态和团队协作精神这...
02:10
2026年1月21日,全球知名药企辉瑞公司首席执行官在一场重要的公开演讲中透露了一项重大市场策略调整:其在美国市场的部分处方药平均销售价格正逐步下降。这一举措被视为辉瑞积极应对日益严峻的监管环境与医保谈判压力的主动回应,涉及降脂药、抗感染药等多款已进入成熟期的核心产品。值得注意的是,此次降价并非简单粗暴的统一调低标价,而是通过更加灵活多元的方式实现,包括提供...
01:39
2026年1月21日,亚洲U23足球锦标赛半决赛在沙特阿拉伯利雅得的费萨尔王子体育场激烈上演,中国U23男足坐镇主场迎战越南U23队。经过一番激烈角逐,上半场双方球员展现出极高的防守水平,最终比分定格在0:0平。在这场关键战役中,中国队的门将李昊表现堪称神勇,多次做出关键扑救动作力保城门不失,甚至凭借一记精彩判罚向对手黄牌示警,展现出强大的心理素质和竞技状态...