新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月18日

20:50
微新创想:2026年3月18日晚,奇瑞汽车在“2026奇瑞汽车电池之夜”上宣布正式布局可控核聚变技术。公司称将投身“人造太阳”研发,目标是利用海水中氘资源实现长期能源自由。这一决定标志着奇瑞在新能源领域迈出了重要一步。 奇瑞表示,该战略旨在推动能源技术跨界融合与长期可持续发展。随着全球对清洁能源需求的不断增长,核聚变技术因其巨大的潜力而备受关注。可控核聚变以...
20:50
微新创想:3月18日晚,智己汽车正式发布IM Ultra Agent超级智能体,这款全新的智能系统将作为核心亮点,首次搭载于即将推出的全新SUV车型LS8。新车计划于3月26日正式开启预售,标志着智己在智能汽车领域的又一重大突破。 LS8被定位为“跨时代科技旗舰SUV”,旨在重新定义未来出行体验。该车采用了先进的线控底盘技术,结合L4级辅助驾驶大模型IM A...
20:50
微新创想:3月18日,腾讯总裁刘炽平在2025年业绩沟通会上回应了关于微信 微信Agent的进展。他表示,腾讯已经在微信内部持续测试多项AI功能 旨在为微信Agent的落地进行前期演练。这些功能涵盖了用户日常使用 微信时可能涉及的多个方面,包括但不限于信息处理、内容生成以及 交互体验的优化。 依托微信高频的用户触达能力和丰富的生态系统 微信Agent具备强大...
20:50
微新创想:3月18日,腾讯总裁刘炽平在财报媒体沟通会上回应投资者关切。他表示,AI领域资本开支与股东回报并非互斥。去年由于设备采购受限,股份回购力度较大。今年若AI投入进展顺利,将适度减少被动回购。腾讯拥有充足资源,可兼顾业务发展与均衡、持续的股东回报。刘炽平强调,公司在AI领域的战略性投入,未来必将转化为显著价值回报。
20:17
微新创想:3月18日 广州市市场监督管理局就袋鼠妈妈集团化妆品营销中存在不当表述问题 对其开展约谈批评 此次核查源于媒体相关线索 市监局当日成立专项小组并赴企业现场检查 核查确认其生产行为合规 近三年38批次抽检均符合《化妆品安全技术规范》 约谈要求企业立即整改营销宣传内容 切实履行主体责任
20:17
微新创想:2026年3月18日 奇瑞汽车在安徽芜湖举办电池之夜活动 奇瑞汽车在安徽芜湖举办了一场备受瞩目的电池之夜活动。此次活动标志着奇瑞在新能源电池技术领域迈出了重要一步。作为中国自主品牌的重要代表 奇瑞汽车展示了其自主研发的全固态电池技术成果 奇瑞宣布其自研全固态电池已实现1500公里以上续航能力 这一突破性进展为电动汽车的长续航需求提供了新的解决方案。...
20:17
微新创想:2026年3月18日,阿里云、百度智能云等头部厂商因全球AI需求激增、Token调用量上升,对部分AI相关产品实施价格上调。这一举措标志着AI行业正经历快速发展阶段,市场需求持续扩大,推动了相关服务的价格变化。 当前AI应用商业化落地尚处早期,但机构普遍预计未来3至6个月,推理端应用密集落地与训练端模型持续迭代将共同驱动算力需求进一步攀升。随着越来...
20:17
微新创想:3月18日晚 奇瑞汽车在2026电池之夜正式发布犀牛电池与“迅龙秒充”超充技术 此次发布的技术不仅代表了奇瑞在新能源汽车领域的重要突破 更是其在电池研发与充电效率方面持续深耕的成果体现 犀牛电池具备1200kW的最大充电功率 可实现8分钟补能500km的快速充电能力 这一性能指标显著提升了用户的出行效率 为长途驾驶提供了强有力的支持 同时该电池拥有...
20:17
微新创想:3月18日,同济大学附属东方医院周彩存教授牵头开展的Ⅱ期临床研究公布结果:EGFR×HER3双抗ADC(iza-bren)联合斯鲁利单抗一线治疗初治广泛期小细胞肺癌(ES-SCLC)取得显著疗效 研究采用iza-bren 2.5 mg/kg(D1、D8,每3周重复)联合斯鲁利单抗方案,中位无进展生存期(PFS)达8.2个月,1年总生存率(OS)达8...
19:46
微新创想:2026年3月18日,钉钉与猛犸(昊一源科技)联合推进的直播相机硬件项目已暂停。该项目原计划面向大型会议、培训等B端直播场景,旨在为用户提供更专业的直播设备解决方案。然而,在实际推进过程中,猛犸的设备更倾向于服务于小型专业直播团队,这与钉钉在大型会议和培训场景中的需求存在一定的应用场景错位。 微新创想:尽管项目暂时搁置,但钉钉与猛犸双方目前仍在进行...
19:46
微新创想:印度政府近日宣布,过去两周内全国新增12万个管道天然气用户。这一进展主要集中在德里国家首都辖区、哈里亚纳邦和马哈拉施特拉邦等重点推广地区。政府希望通过这一举措逐步替代液化石油气和传统燃料,进一步推广清洁能源的使用。 此次用户接入工作由印度燃气公司(GAIL)以及多个城市燃气分销商共同执行。不仅完成了用户的接入,还同步推进了配套管网的扩建和安全验收流...
19:46
微新创想:3月18日 北京市石景山区宣布 人形机器人数据训练中心三期项目将于2026年3月底建成投用 该中心位于石景山区 由区政府推动建设 旨在加速具身智能核心技术突破与产业生态扩容 项目聚焦触觉及多模态感知数据训练 通过真实场景数据驱动模型迭代 支撑机器人在工业生产 农业加工 酒店服务 家庭清洁 智能管家及医疗操作等多领域落地应用 此举标志着石景山区具身智...