新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2025年11月26日

19:45
2025年11月26日,沙特阿美正式宣布选定全球领先的投资银行花旗集团作为其石油仓储终端股权出售项目的独家财务顾问。此次交易的核心内容涉及将沙特阿美旗下部分具有战略价值的石油仓储资产进行股权转让,旨在通过优化基础设施投资组合,进一步提升资本配置效率。作为此次交易的独家财务顾问,花旗集团将全面负责提供专业的财务咨询服务,涵盖市场分析、交易结构设计、谈判支持以及...
19:45
2025年11月18日,一起罕见的无人机事故在美国德克萨斯州韦科市发生,引发广泛关注。当时一架亚马逊Prime Air MK30无人机在完成配送任务准备升空时,其旋翼意外缠绕上地面网络线缆,导致关键部件断裂。幸运的是,无人机随即启动了预设的应急着陆程序,最终安全降落在预定区域,未造成任何人员伤亡或周边大规模网络中断。 美国联邦航空管理局(FAA)已迅速介入,...
19:45
2025年11月26日,江苏省消费者权益保护委员会(消保委)针对日益突出的机票锁座问题,正式展开线上约谈行动,涉及东方航空、南方航空等全国性骨干航空公司在内的10家主要航司。此次约谈旨在推动行业规范,维护消费者公平交易权,回应社会关切。据消保委最新发布的市场调研报告显示,当前国内航空市场存在严重的不公平现象,10家被约谈航司中,经济舱座位平均锁定比例高达38...
19:45
2025年11月26日,住房和城乡建设部正式发布权威数据,揭示了“十四五”期间我国城市生活垃圾无害化处理能力的显著突破。统计显示,全国无害化处理能力已达到惊人的117.9万吨/日,较“十三五”末期实现了22.4个百分点的跨越式增长。这一成就不仅彰显了我国在环保领域的持续投入,更体现了城市精细化管理水平的全面提升。 全国范围内新增的无害化处理能力高达21.6万...
19:45
2025年11月26日,金迪克正式宣布本年度生产季圆满收官。根据最新财报显示,公司全年累计获得约156万支四价流感病毒裂解疫苗的批签发证明,这一数字标志着公司疫苗研发与生产能力的显著提升。值得注意的是,由于批签发证明数量已达到年度上限,金迪克将在年内不再新增任何批签发申请。 在销售渠道方面,金迪克的产品主要供应给国内各地的疾控中心。然而,受流感季节周期性波动...
19:45
2025年第三季度,海底捞国际业务旗舰特海国际交出亮眼业绩,总收入达到2.14亿美元,同比增长7.8%,展现出强劲的增长势头。尽管经营溢利为1260万美元,同比微跌15.4%,但环比增幅高达240.5%,显示出业务运营效率的显著提升。这一季度,特海国际年内新开设10家门店,全球运营网络扩展至126家,与上一季度规模保持稳定。整体业绩数据反映出海外市场正在加速...
19:45
2025年11月10日至16日,我国流感疫情迎来快速升温期,全国多数省份已进入中度流行水平。中国疾控中心最新监测数据显示,这一周的流感样病例占门急诊病例比例创下近四年来同期新高,北方哨点医院达到7.0%,南方哨点医院为6.7%。值得注意的是,当周全国共报告955起流感样病例暴发疫情,其中高达741起由甲型H3N2病毒引发,显示出该病毒株已成为当前流感季的主要...
19:45
2026年米兰-科尔蒂纳冬奥会圣火采集仪式于当地时间11月26日在希腊奥林匹亚考古博物馆隆重举行,这一历史性时刻标志着全球瞩目的冰雪盛会正式拉开序幕。仪式现场播放了最高女祭司于11月24日在古奥林匹亚赫拉神庙前采集火种并点燃采火火炬的震撼画面,画面中熊熊燃烧的火焰象征着奥林匹克精神的传承与延续,也预示着米兰冬奥会的激情即将点燃。 此次火种采集仪式采用转播...
19:45
2025年11月26日,实达集团正式就近期网络流传的与阿里云合作传闻作出官方回应。该公司通过官方渠道发布声明,明确表示目前并未与阿里云开展任何形式的业务合作。此前,有网络平台突然传出双方可能建立合作关系的信息,迅速引发市场的高度关注和热议。面对这一情况,实达集团高度重视并立即采取行动,以澄清事实真相。公司方面在声明中特别强调,所有关于公司经营状况和业务发展的...
19:45
2025年11月26日,大悦城控股传来重要消息,其子公司大悦城地产有限公司通过协议安排方式成功回购所有流通股份,并正式向香港联合交易所提交撤销上市地位的申请。这一战略性举措标志着大悦城地产将彻底告别公众上市公司身份,转型为大悦城集团的全资附属企业。此次私有化行动的核心目标在于优化公司资本结构,通过整合资源提升整体运营效率,为未来的可持续发展奠定坚实基础。作为...
19:45
2025年11月24日,备受瞩目的字节跳动奖学金颁奖典礼在北京隆重举行,20位在学术领域表现卓越的博士生荣膺殊荣。此次颁奖仪式不仅是对获奖者科研成就的肯定,更是字节跳动对科技创新人才培养的持续投入与坚定承诺。据悉,该奖学金的资助额度实现历史性突破,从之前的10万元大幅提升至20万元,其中包含10万元现金奖励和10万元专项学术资源补贴,旨在全方位支持博士生的科...
19:15
2025年11月26日,上海成功举办了一场聚焦高水平人才高地建设的行业论坛。在此次盛会中,宇树科技创始人王兴兴就“机器人为什么不干活”这一热点话题发表了独到见解。他明确指出,尽管人工智能与机器人技术已取得长足进步,但目前仍存在“一点火候”的差距,尚未完全成熟。 王兴兴透露,尽管公司已投入大量时间与资源训练机器人执行各类任务,但现阶段的应用场景主要集中在科普展...