新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2025年10月29日

18:11
松智达机器人近日传来振奋人心的消息,成功完成500万元天使轮融资,领投方为中楝投资。这家专注于智能制造与柔性物流系统领域的高新技术企业,正以惊人的速度崛起,成为自动化解决方案领域的佼佼者。 松智达的核心竞争力在于其自主研发的复合机器人技术,该技术巧妙融合了激光SLAM、视觉识别、物联网以及边缘计算等多项尖端科技。通过这些技术的协同作用,松智达能够提供从移动底...
18:11
日本电气公司近日正式宣布达成一项重大战略交易,将以28.9亿美元的价格全面收购全球领先的通信支撑解决方案供应商CSGS公司。此次收购不仅标志着日本电气在通信服务领域的重大布局升级,更将为其全球业务协同发展注入强劲动力。 CSGS作为通信行业解决方案的佼佼者,长期致力于为客户提供全方位的增值服务。其核心业务涵盖精准互动解决方案的研发与应用,通过创新的互动技术帮...
18:11
中微公司近日发布2025年第三季度财务报告,交出亮眼业绩单。公司实现营业收入80.63亿元,同比增长46.40%,展现出强劲的增长势头。其中,刻蚀设备收入贡献突出,达到61.01亿元,成为公司业绩的重要支柱。薄膜设备业务更是实现爆发式增长,收入同比激增1332.69%,彰显出该业务板块的巨大潜力。报告显示,公司净利润为12.11亿元,同比增长32.66%,盈...
18:11
恒誉环保近日传来振奋人心的消息,成功与欧洲某知名客户达成战略合作,双方正式签署了新销售合同。根据协议,恒誉环保将为其位于欧洲的示范项目提供一套"全新一代•大型工业连续化智能废轮胎裂解生产线",合同总金额高达1400万美元,折合人民币约9970万元(含税)。这一重大合作不仅标志着双方在欧洲市场的第四度携手,更充分展现了客户对恒誉环保技术创新实力和项目实施能力的...
18:11
2025年10月31日,备受市场瞩目的泰金新能科创板IPO申请将正式提交上交所审议。这家由陕西省财政厅通过西北院控股的优质企业,专注于电解铜箔用钛阳极的研发与生产,其产品在国内市场占据领先地位,市占率表现尤为亮眼。近年来,泰金新能展现出强劲的增长势头,2022年至2024年营收从10.05亿元稳步提升至21.94亿元,三年间实现翻倍增长,净利润同步增长一倍,...
18:11
2025年10月29日,苏宁易购正式发布一款专为中老年群体量身打造的AI原生生活服务APP——朝夕相伴。这款应用以领先的人工智能技术为核心,深度融合“灵思”大模型与智能体技术,打造出一位亲切贴心的AI助手“夕夕”,为老年用户带来全方位的适老化服务体验。朝夕相伴APP集成了健康管理、生活服务与智能购物三大核心功能,旨在解决老年群体在日常生活中可能遇到的各类问题...
18:11
2025年10月29日,一则备受瞩目的消息传来:美国食品药品监督管理局(FDA)正酝酿推出一系列创新举措,旨在显著加速部分仿制药的审批进程。这一系列变革的核心目标在于提升全球药品的可及性,同时有效降低患者的用药经济负担。据悉,FDA正积极优化其审评机制,预计通过引入更高效的评估标准和简化审批流程,大幅缩短仿制药从研发到上市的等待时间。这一重大政策调整预计将对...
18:11
2025年10月29日,西部黄金正式宣布其全资子公司新疆美盛将开展一项重要业务操作,计划向关联方五鑫铜业销售约3000吨金精矿,预计交易总额高达1.90亿元人民币。这一战略举措的核心目标在于显著提升公司的整体经营效益,同时加速资金周转效率,为企业注入强劲的现金流动力。 西部黄金方面特别强调,此次与关联方的交易安排已经经过审慎评估,不会对公司当前及未来的财务状...
18:11
翔鹭钨业近日正式发布其2025年第三季度财务报告,数据显示公司经营状况呈现强劲增长态势。报告期内,公司实现总营收16.16亿元,较去年同期增长24.00%,这一成绩充分展现了企业稳健的发展步伐。尤为亮眼的是净利润表现,达到5177.33万元,同比增长幅度高达259.65%,彰显出公司盈利能力的显著提升。 从季度维度来看,第三季度的业绩尤为突出。公司当季营收达...
18:04
谷歌近期为 Gemini 应用推出了一项令人瞩目的创新功能 —— 用户现在能够通过简单的文本指令或文件上传,轻松实现幻灯片演示文稿的自动化生成。这项功能已率先向 Workspace 用户开放,为职场人士和学术界用户带来了前所未有的便捷体验。只需在 Gemini 应用中输入演示主题或上传相关资料,AI 将迅速构建出包含专业主题设计和高清配图的演示文稿。更值得一...
18:04
腾讯混元近日重磅推出国内首款交互式AI播客,以革命性的方式重塑了传统播客的收听模式。这一创新产品彻底打破了单向收听的局限,让听众能够通过语音或文字实时与主持人和嘉宾互动,即时获取所需信息,显著提升了播客的互动性和信息效率。 在传统播客中,听众往往只能被动收听,遇到疑问时只能等待播客结束后再自行寻找答案。而腾讯混元交互式AI播客的问世,让用户可以在播放过程中随...
17:37
2025年10月28日,浙江仙通迎来重大战略动向,其第二大股东李起富与七腾机器人正式签署增资协议,计划以1.3亿元人民币认缴七腾机器人新增注册资本。这一合作标志着浙江仙通在机器人领域的初步布局,也预示着双方未来可能展开深度产业协同。 根据协议具体条款,李起富将在增资完成后7个月内,全面协助浙江仙通建立首期年产超1000台防爆机器人的生产能力。这一产能目标不仅...