新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2025年12月29日

09:44
2023年12月20日,知名游戏制作人小岛秀夫在接受《Wired Japan》杂志专访时,分享了他对未来游戏开发的独特见解。他明确表示,自己并不打算被现有的游戏类型所束缚,而是致力于开创全新的游戏品类,为玩家带来前所未有的体验。小岛秀夫强调,其作品的核心价值在于“链接”这一概念,而非传统的游戏分类。他认为,真正的创新应该打破界限,通过深层次的互动和情感连接来...
09:44
2025年12月29日,豆神教育正式发布旗下首款学伴机器人,这款备受瞩目的智能教育设备以1999元的价格面向市场,迅速引发热烈反响。在首发当天,首批500台机器人全部在1小时内被抢购一空,充分展现了其强大的市场吸引力。 这款学伴机器人以“陪伴式智能教育”为核心理念,深度聚焦学生日常作业场景,旨在提供全方位的学习支持。从作业陪伴、实时辅导、精准校正到个性化...
09:44
2025年12月29日,甘肃省省委正式发布《“十五五”发展规划建议》,其中一项重要内容是明确提出加快构建房地产发展新模式,以推动行业健康可持续发展。这一规划建议在兰州举行发布会,标志着甘肃省在住房领域改革迈出关键一步。 规划建议的核心目标是完善商品房开发、融资、销售等全链条基础制度体系。通过健全土地供应、建设管理、金融支持等多维度机制,构建规范有序的市场环境...
09:44
2025年12月29日,铜箔基板行业的领军企业建滔宣布实施价格上调策略,这一决策主要源于原材料成本的持续攀升。受铜价显著上涨及玻璃布供应紧张等多重因素影响,建滔已难以有效消化当前的成本压力,因此决定向下游客户正式发出涨价通知。根据最新公告,新接订单的材料价格将全面上调10%,这一调整幅度反映出行业成本结构的深刻变化。 此次价格调整的背后,是上游原材料市场持续...
09:44
2025年12月26日,杭州普昂医疗科技股份有限公司传来喜讯,成功在北交所顺利过会,其保荐机构为国金证券。作为一家深耕医疗器械领域的创新企业,普昂医疗专注于糖尿病护理、通用给药输注以及微创介入类医疗器械的研发与生产,其核心产品胰岛素笔针在市场上享有良好口碑。近年来,公司业绩表现亮眼,2022年至2024年营收规模从2.42亿元稳步增长至3.18亿元,归母净利...
09:44
2024年12月26日,浙江新恒泰新材料股份有限公司传来喜讯,成功通过北京证券交易所的IPO审核,标志着公司迈向资本市场迈出了关键一步。此次IPO的保荐机构为浙商证券,将为公司未来的发展注入强劲动力。 浙江新恒泰新材料股份有限公司专注于功能性高分子发泡材料的研发与销售,凭借其卓越的技术实力和市场竞争力,实现了业绩的稳步增长。数据显示,公司2022年至2024...
09:44
三星SDI正式宣布一项重大战略转型计划,计划在2027年前完成其位于美国印第安纳州电动汽车电池生产线的全面升级,将其转变为专业化的储能系统电池生产基地。据悉,该公司已成功斩获一份价值超过2万亿韩元的美国政府合同,将作为首批供应商向市场推出第二代方形磷酸铁锂储能电芯。这一创新电池产品采用先进的铝壳封装技术,并融合了三星自主研发的热失控防护系统,显著提升了电池的...
09:43
2025年12月29日,深圳市正式发布《“十五五”规划建议》,为未来五年城市高质量发展擘画蓝图。规划明确提出要加快构建人工智能全域全时应用的基础设施体系,为智慧城市建设奠定坚实根基。具体而言,将重点建设适应未来产业发展的无人驾驶测试场、智慧交通管控中心、低空飞行运营平台等关键设施,同时积极推进国家级数据基础设施及跨境数据流通平台建设,为数字经济发展注入新动能...
09:43
12月28日,备受瞩目的南水北调中线观音寺调蓄工程建设动员大会在河南新郑市隆重举行。这一重大水利工程位于新郑市西南部的观音寺镇,地处南水北调中线总干渠河南段的核心区域,是国家规划中的150项重大水利工程之一。作为一项兼具民生与生态双重意义的工程,观音寺调蓄项目对于保障郑州都市圈的水资源安全具有不可替代的重要作用。 该项目整体规划由三个关键部分构成:沂水河退水...
09:43
华硕ROG品牌于昨日正式官宣,即将于2026年1月6日推出备受期待的全新“NEO”系列主板产品。这一创新系列将主要面向当前主流的AMD AM5平台,其产品型号均以“NEO”作为后缀,全面覆盖ROG、ROG STRIX、ProArt以及TUF GAMING四大核心产品线,旨在满足不同用户群体的需求。 值得关注的是,部分NEO系列主板特别配备了专用的POGO P...
09:43
2025年,新疆油田二氧化碳捕集封存与利用项目全年注入二氧化碳超100万吨,成为我国首个实现年注碳百万吨级的油田。该项目位于准噶尔盆地,依托高耗能产业聚集优势,通过捕集工业排放的二氧化碳并注入油藏,实现“增油”与“封碳”协同。自2019年开展先导试验以来,已形成可推广的CCUS技术模式,标志我国二氧化碳规模化应用取得重要进展。
09:43
NVIDIA 的人工智能研究团队近日推出了 NitroGen,这是一款针对通用游戏代理的开放视觉行动基础模型。NitroGen 能够从网络视频中直接学习如何通过游戏画面和手柄操作来玩商业游戏,整个模型经过40,000小时的游戏体验训练,覆盖了超过1,000款游戏,同时还提供了开放数据集、通用模拟器和预训练策略。NitroGen 的构建流程始于公开的游戏视频,...