新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月27日

11:08
微新创想:2026年2月27日,千问宣布将在西班牙巴塞罗那举行的MWC 2026上首发AI眼镜,并于3月2日开启全渠道预约。这款AI眼镜将集成千问APP的外卖、打车等服务功能,为用户提供更加便捷的智能体验。据阿里内部人士透露,年内还将推出AI指环、AI耳机等新品,进一步拓展AI终端硬件的产品线。这些新产品将面向全球市场发售,展现千问在人工智能领域的持续创新与...
11:08
微新创想:2026年3月中旬,我国第二艘国产大型邮轮“爱达·花城号”将在上海外高桥造船厂完成主体建造并出坞,转入码头系泊调试阶段。这标志着中国在高端邮轮制造领域迈出了坚实一步。 该邮轮总吨位达到14.19万吨,舱房数量为2130间,可满载游客5232人,相较于首艘“爱达·魔都号”更具规模和先进性。其设计理念融合了现代科技与人文关怀,为乘客提供更加舒适和多元的...
11:08
微新创想:2026年2月27日,eBay发布2025财年业绩报告 全年营收达到111亿美元,同比增长8%;商品交易总额(GMV)为796亿美元,同比增长7%。第四季度营收29.65亿美元,GMV 212亿美元,分别同比增长15%和10%。GAAP净利润为19.96亿美元,Non-GAAP净利润为25.84亿美元,后者相比去年同期增长6% 业绩增长主要得益于核...
11:08
微新创想:2026年2月26日晚,理想汽车产品线负责人汤靖发文解释理想ONE采用1.2T三缸增程器的原因。他提到在2017年立项时,作为一家新势力车企,理想汽车尚未具备自研发动机的能力。而当时市场上并没有成熟的1.5T四缸增程器可供选择,因此东安1.2T三缸成为了唯一的匹配方案。 尽管1.2T三缸增程器在NVH表现上存在不足,但理想团队通过结构优化和多层声包...
11:08
微新创想:2026年2月27日,Pulsar与VAXEE联合打造的eS FS-1电竞鼠标正式登陆中国市场,售价1199元。这款鼠标专为追求极致操控体验的玩家设计,采用左右对称中尺寸低背收腰模具,兼顾掌握式与抓握式握持方式,满足不同玩家的使用习惯。其重量仅为56克,轻盈便携,有助于提升游戏中的灵活性和反应速度。 微新创想:eS FS-1搭载了高性能的32000...
11:08
微新创想:2026年2月27日,Supermicro与VAST Data宣布合作推出全集成AI数据平台CNode-X。该方案融合了VAST AI操作系统,其中包括InsightEngine与DataBase两大核心组件,同时整合了NVIDIA开源模型及微服务架构。平台还搭载了Supermicro的高性能GPU与存储服务器,为企业客户提供了一站式的AI解决方案...
11:08
微新创想:2026年2月27日,瑞芯微电子股份有限公司就其开源媒体框架MPP因违反LGPL许可证条款导致GitHub仓库被冻结一事公开致歉。公司表示,此次事件源于部分员工在使用FFmpeg相关LGPL授权代码时,误将其更改为Apache许可证,并且未保留原始的许可声明。这一行为违反了开源协议的合规要求,引发了GitHub平台的审查与冻结。 事发后,瑞芯微电子...
11:08
微新创想:2026年2月26日,微软发布Agility SDK 1.619。该版本全面引入着色器模型6.9(SM 6.9)和DirectX光线追踪1.2(DXR 1.2),并优化D3D12核心功能。这一更新为开发者提供了更强大的图形处理能力,使游戏和应用在视觉表现与性能优化方面实现突破。 SM 6.9新增了千元级长向量支持,显著提升了着色器的计算效率。同时,...
11:08
微新创想:2026年2月,豫园股份(600655.SH)发布了2025年年度业绩预告,预计归属于母公司股东的净利润将出现约48亿元的亏损。这一重大亏损主要受到房地产行业整体下行以及消费市场结构性变化的影响。公司表示,部分房地产项目的市场表现不佳,加上商誉减值等因素,导致了整体业绩的下滑。 与此同时,复星集团在持续出售资产的同时,却反向增持了舍得酒业(6007...
11:08
微新创想:问界汽车近日正式公布了全新M6车型的配色方案,共推出七种颜色,包括紫、青、白、橙、银、蓝和黑,色彩选择丰富多样,充分体现了年轻化的设计理念。这些配色不仅满足了不同消费者的审美需求,也展现了M6在外观上的独特魅力。 微新创想:从官方公布的海报来看,M6在灯光设计上也颇具亮点。前大灯采用了星耀造型,内部带有类似尊界S800的碎钻效果,视觉冲击力十足。大...
11:08
微新创想:Anthropic正在加速补齐其在 AI 智能体(Agent)领域的最后一块短板。2026年2月26日,据报道,Anthropic已正式完成对西雅图 AI 初创公司 Vercept 的收购。这次收购的核心目标非常明确:通过 Vercept 顶级的视觉理解技术,让Claude能够像人类一样,真正“看懂”屏幕并精准操控各类软件。 核心亮点:视觉优先,精...
11:08
微新创想:阿里巴巴旗下个人AI助手“千问”正式宣布进军AI硬件领域,计划于今年面向全球市场推出包括AI眼镜、AI指环及AI耳机在内的多款硬件产品。作为该战略的开局之作,千问首款同名AI眼镜将在西班牙巴塞罗那举行的2026年世界移动通信大会(MWC)上揭晓,并定于3月2日开启全渠道预约。此举标志着阿里正加速构建“软硬一体”的AI生态体系。 微新创想:通过脱离手...