新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月04日

16:00
微新创想:4月4日,TikTok Shop与Tokopedia联合开展的“Ramadan Extra Exciting 2026”活动数据显示,斋月期间每日封斋前高峰时段,平台交易量同比激增15倍。这一显著增长体现了消费者在斋月期间对线上购物的高度热情。 活动在印度尼西亚举行,由TikTok Shop主导、Tokopedia协同运营。作为全球最大的伊斯兰人口...
16:00
微新创想:4月3日,游戏媒体mp1st报道称,暴雪正在开发一款未公开的AAA级开放世界射击游戏。该项目打破了暴雪长期以来依赖自研引擎的习惯,首次采用了Unreal Engine。这一技术选择不仅表明了游戏在画面表现和性能优化上的高标准,也预示着项目在规模和技术复杂度上的大幅提升。 招聘要求显示,应聘者需要具备15年以上的专业游戏设计经验,这进一步凸显了项目的...
16:00
微新创想:4月3日,阿里千问App正式上线万相2.7视频生成模型。该模型面向公众提供视频编辑、视频续写与动作模仿三大功能。用户可通过自然语言指令修改画面元素、切换风格或调整运镜。 支持将2秒视频续写至最长15秒,并保持结构连贯。用户在创作过程中能够更加自由地表达创意,同时确保视频内容的流畅性与逻辑性。 还可基于参考视频精准复刻人物动作、运镜及特效节奏...
16:00
微新创想:2026年4月4日,美国亚利桑那州立大学团队宣布成功研制新型气动人工肌肉。这项突破性技术由博士生埃里克·韦斯曼领衔研发,其核心在于采用了一种名为HARP的致动器。HARP致动器能够模仿生物肌肉的收缩机制,从而实现高效的机械运动。 微新创想:与传统电机驱动系统相比,这种新型气动人工肌肉具有显著优势。它不仅具备高度的柔性和轻量化特性,还能够在极低气压条...
15:29
微新创想:4月3日,美国宇航局在阿耳忒弥斯2号载人绕月任务中成功部署O2O激光通信系统。该系统实现了从月球到地球的4K视频实时传输,传输速率高达260 Mbps。这是NASA专门为本次任务研制的先进通信技术,能够支持飞行计划等关键数据的高效回传。 微新创想:O2O全称Orion Artemis II Optical Communications,标志着深空通...
15:29
微新创想:2026年4月3日,哈啰顺风车正式上线MCP(Mobility Control Protocol)服务,成为互联网出行领域首款面向大语言模型与AI智能体开放的标准化出行接口。这一创新举措标志着出行服务在智能化和自动化方面迈出了重要一步。 MCP服务覆盖了供需匹配、路线规划、价格计算以及差异化筛选等多个关键环节。例如,用户可以选择宠物友好的车型或豪华...
15:29
微新创想:截至4月4日8时,铁路12306平台累计发售清明假期车票6125万张。这一数据反映了清明假期期间全国铁路运输的繁忙程度,也显示出旅客对假期出行的高涨热情。 热门出发地主要集中在一线城市,如北京、广州、上海等,这些城市作为人口密集的交通枢纽,吸引了大量旅客前往周边地区或外地探亲、旅游。同时,热门到达地也呈现出相似的特征,包括北京、成都、广州等,显示出...
15:29
微新创想:4月3日,全国农产品批发市场猪肉均价跌至15.15元/公斤,较上周五下降3.7%。本周均价15.34元/公斤,环比降3.2%。 当前猪料比价处于低位,压栏缺乏经济性。集团场已主动降低平均体重以去库存。然而散户仍存在压栏心态,导致整体出栏均重虽略有下降,但仍维持在较高水平,去库存速度偏慢。 预计三季度标猪理论供应量将维持高位,供应压力持续延长。仔猪养...
15:29
微新创想:2026年4月,广西海事局在广西境内西江航运干线启动船舶水污染物“零排放”专项行动。此次行动覆盖南宁至梧州、柳州至桂平约800公里航段,涉及近万艘船舶。行动方案明确指出,将在年底前全面推行“船上储存、交岸处置”模式,彻底杜绝污染物直接排放入江。这一举措不仅有助于提升船舶污染防治水平,也为广西生态环境保护提供了有力支撑。 微新创想:行动的开展旨在全面...
15:29
微新创想:2026年4月4日,深圳市发改委联合市科技创新局印发《深圳市推动细胞与基因领域高质量发展工作方案》,推出“细胞十条”。该方案旨在加快细胞与基因技术的创新与应用,推动深圳成为全国乃至全球细胞与基因治疗产业的重要高地。 方案明确到2028年,全市细胞与基因领域产业规模将达到200亿元,IIT项目数量超过50项,建成2个以上CRO/CDMO平台,服务企业...
15:29
微新创想:截至2026年4月3日,全国已有25个省份及新疆生产建设兵团陆续启动春灌工作。截至目前,累计供水量已达到142亿立方米,覆盖灌溉面积超过1.5亿亩。这一系列举措标志着春耕生产的全面展开,为即将到来的夏粮丰收提供了坚实的水源保障。 当前正值冬小麦生长的关键阶段,各地农民正抢抓农时,积极推进春耕春播工作。春灌的顺利实施不仅有助于提高土壤墒情,还能有效促...
15:29
微新创想:梅赛德斯-AMG近日确认其纯电GT四门版车型已在北欧地区完成冬季测试,标志着该车型即将进入量产阶段。此次测试不仅验证了车辆在严寒环境下的性能表现,也为后续的市场投放提供了坚实的数据支持。 新车搭载了三台轴向磁通电机,这一配置在动力输出和能效方面具有显著优势。该车型支持后驱和四驱模式,能够满足不同驾驶场景的需求。同时,它配备了Response、Agi...