新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2025年12月30日

10:44
微新创想12月30日重磅报道,近日一位名为李江清丶的UP主凭借惊艳的AI技术创作了《武林外传》第82回,在B站掀起现象级热议。这部承载几代人青春记忆的经典剧集,通过前沿AI技术实现创新性重生,让无数观众重温同福客栈的温暖治愈瞬间。当温馨场景与熟悉的背景音乐交织,许多网友纷纷留言"仿佛穿越回当年追更的时光",直呼感动不已。 UP主更以高超技术还原了剧中角色的独...
10:44
微新创想12月30日专稿,近日纽约地铁上演惊险一幕,一名疑似试图逃票的女子遭遇新式自动闸机意外,被门缝卡住脖子动弹不得。现场视频画面触目惊心,女子颈部被闸机夹持,表情痛苦,而站务人员正紧急尝试徒手施救。据技术人员透露,该闸机为最新投入测试阶段的设备,若要安全解救被困者,必须立即切断电源,再通过手动方式撬开闸门。 这一事件引发社会热议,部分网友戏称新闸机堪比"...
10:44
声明:本文源自微信公众号全天候科技,作者柴旭晨,经站长之家授权转载发布。豆包助手刚登陆手机,钉钉又携“D计划”将AI赋能未来的图景呈现在大众眼前。近日,钉钉推出面向企业组织的专属硬件Ding Talk Real,并发布一套AI系统Agent OS。CEO陈航表示,“未来钉钉上所有AI Agent都将基于Agent OS构建和运行,实现AI直连物理世界。”钉钉...
10:17
2025年12月30日,工业和信息化部正式发布指导意见,旨在全面加速国家新型互联网交换中心的创新发展进程。这一重要文件不仅明确了未来网络建设的发展方向,更提出了一系列创新举措,以推动我国互联网基础设施迈向更高水平。 指导意见明确指出,将重点推动人工智能、400G/800G光传送、无损以太、隐私计算、量子通信等前沿技术在交换中心的深度部署与应用。这些技术的引入...
10:17
2025年12月30日,备受瞩目的机器人企业墨奇智能正式宣布成功斩获9亿元人民币天使轮融资,这笔巨资由国内知名科技巨头领投,彰显了资本市场对该公司创新实力的高度认可。据悉,该笔资金将全部投入到具身智能机器人的研发与量产项目中,旨在通过技术革新推动服务机器人从实验室走向市场,最终实现进入家庭场景的愿景。墨奇智能作为通用服务机器人领域的先行者,始终以打造智能化、...
10:17
12月28日,广东恒翼能科技股份有限公司正式在深圳证券交易所创业板递交IPO申请,标志着这家国家级专精特新"小巨人"企业迈向资本市场的重要一步。此次IPO由申万宏源证券担任保荐机构,容诚会计师事务所和北京市中伦律师事务所分别提供审计和法律服务,为公司的上市之路提供了坚实保障。 恒翼能作为锂电池后处理设备及整体解决方案的领先企业,凭借其技术创新和行业深耕,在新...
10:17
2025年12月30日,强一股份正式登陆科创板,这一里程碑事件不仅意味着科创板迎来了第600家上市公司,更标志着中国资本市场在支持科技创新方面迈出了坚实一步。随着强一股份的加入,科创板总市值成功突破10万亿元大关,进一步巩固了其作为高新技术产业重要融资平台的地位。 作为科创板的核心板块之一,该市场始终聚焦于科技创新企业的发展需求。数据显示,目前已有389家科...
10:17
2025年12月29日,一项突破性研究揭示了意大利文艺复兴巨匠列奥纳多·达·芬奇早在1503至1505年间便已记录下类似日本传统“烧杉板”的木材防腐工艺,这一发现将该技术的最早记载时间提前了整整百年。联合国教科文组织专家团队通过对达·芬奇《马德里手稿II》第87r页的精密分析,证实其手稿中描述的技术与现代烧杉板工艺高度吻合——即通过高温烧灼去皮木材,从而实现...
10:17
2025年12月30日,粤港澳大湾区首个空铁联运服务中心在广州白云站正式启用。该中心设于车站东广场负一层,旅客不出高铁站即可办理航空值机、行李安检与托运等手续。通过刷身份证,最快5分钟可完成全流程操作。此举首次将“城市航站楼”功能引入大型铁路枢纽,旨在提升空铁换乘效率,便利跨区域出行。
10:17
2025年12月30日,工业和信息化部正式发布《关于加快推进国家新型互联网交换中心创新发展的指导意见》全文及深度解读。这份具有里程碑意义的文件为我国互联网交换中心的建设与发展指明了方向,提出了四大核心任务,旨在全面提升网络基础设施的互联互通水平。 《指导意见》首先强调要引导增值电信企业充分利用国家新型互联网交换中心实现高效互联,通过构建开放共享的交换网络平台...
10:17
2025年12月30日,创新科技品牌UnifyDrive正式发布了专为专业创意工作者打造的全新NAS设备——UP6,这款产品被誉为“全球首款AI移动NAS”,凭借其卓越的性能配置和前瞻性设计,迅速吸引了行业目光。作为一款面向高端用户的存储解决方案,UP6不仅突破了传统NAS的局限,更将移动性与智能化提升到了全新高度。 UP6搭载了英特尔酷睿Ultra 5 1...
10:17
熵基科技近日发布公告,正式宣布一项重要的办公场地租赁计划。公司拟租赁董事长兼实际控制人车全宏在北京海淀区的一处房产,该房产面积达396.64平方米,租赁期限为三年,预计含税租金总额为200.09万元。这一关联交易已经获得公司董事会的审议通过,旨在进一步优化公司的办公环境,满足日益增长的经营发展需求。 此次租赁决策充分体现了熵基科技对办公场地战略布局的重视。车...