新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月17日

02:02
2026年初,备受瞩目的免疫治疗新药Ianalumab即将迎来关键里程碑——诺华公司计划正式启动该药物的全球上市申请。这款由诺华自主研发的创新药物,专注于治疗特定免疫相关疾病,有望为众多患者带来新的治疗选择。此次全球同步申请涵盖了多个国家和地区,包括欧美主流市场以及亚洲重要医药市场,这一战略布局旨在加速药物的审批进程,让患者能够更早地受益于这一突破性疗法。 ...
02:02
自1月19日起,港澳两地正式实施通关便利化新举措,永久性居民使用对方自助过关通道的适用年龄已从11岁大幅下调至7岁,为更多家庭往来提供便利。与此同时,年满18岁的合资格非永久性居民可通过当地自助服务机完成预先登记,约3小时后即可享受使用对方自助通道的便利,进一步简化通关流程。 此次优化由澳门治安警察局、身份证明局、保安部队事务局与香港入境事务处联合推动,体现...
01:02
2026年1月16日,国际知名投资银行摩根士丹利正式发布研报,将长电科技的股票评级上调至"平配",同时给出48.50元的目标价。这一重要市场动作不仅体现了机构投资者对长电科技当前经营状况的高度认可,更彰显了对其未来发展潜力的坚定信心。分析认为,此次评级上调有望显著提振市场情绪,为长电科技股价的持续上涨注入强劲动力。 作为全球半导体封测行业的领军企业,长电科技...
01:01
2026年1月17日,中国科学院化学研究所的汪铭团队在顶级学术期刊《细胞》上发表了突破性研究成果,成功构建了一种创新性的超分子靶向嵌合体。这一技术实现了在活体动物模型中可编程、时空可控的蛋白质精准降解,标志着生物医学领域在调控蛋白质稳态和治疗相关疾病方面取得了重大进展。该研究成果不仅为疾病治疗提供了全新的策略,更展现了广阔的临床应用前景,有望为多种蛋白质相关...
00:00
2026年1月16日,科技界与餐饮界再起波澜,知名网红罗永浩与西贝莜面村创始人贾国龙的微博账号双双被平台限制发言。这场风波的导火索,源于双方围绕“预制菜争议”的激烈交锋。罗永浩在社交媒体上公开质疑西贝存在使用预制菜的行为,直指其产品与宣传不符,引发广泛关注。对此,贾国龙迅速作出回应,指控罗永浩的言论构成诽谤,并正式提出道歉及赔偿要求。 面对指控,罗永浩于当日...
00:00
2026年1月16日,华硕董事长施崇棠在备受瞩目的“AI领航”晚会上正式宣布了一项重大战略调整——公司未来将不再推出全新的手机产品线,但会继续为现有手机用户提供完善的售后服务与技术支持。这一决策背后,是华硕对自身研发资源的深度优化,更是将战略重心向PC及实体AI设备领域倾斜的明确信号。 施崇棠在演讲中特别强调,华硕正在全面实施“All in AI”的宏伟战略...
00:00
2026年1月16日,华擎震撼发布全新Rock系列主板,凭借其全面的产品布局和卓越性能,迅速成为业界焦点。该系列精心涵盖了B850/B860两大核心型号,并分别适配M-ATX与ATX两种主流机箱规格,完美兼容英特尔与AMD最新一代处理器,为用户带来极致的硬件选择自由度。 此次推出的Rock系列主板在配置上实现了全面升级,标配Wi-Fi 7无线网络模块,提供前...
00:00
2026年1月16日,全球医药市场迎来重磅消息,丹麦制药巨头诺和诺德股价应声飙升,涨幅超过4.5%。这一显著波动背后,是英国监管机构传来的一则关键批准决定——其畅销减肥药物Wegovy(司美格鲁肽)7.2毫克高剂量版本正式获得授权,用于肥胖症的临床治疗。根据新规,该药物将面向两类患者群体:一是体重指数(BMI)达到或超过30的成年肥胖症患者;二是BMI介于2...
00:00
2026年1月16日,西贝餐饮集团董事长贾国龙公开透露,受市场环境变化及行业竞争加剧影响,公司预计在2025年9月至2026年3月期间将面临累计亏损,金额或将突破6亿元人民币大关。为有效缓解经营压力,实现可持续发展,西贝管理层已制定并宣布了一项重大战略调整——计划在一季度内关闭全国范围内102家门店,这一数字占公司现有门店总数的30%。此次门店优化举措的核心...
00:00
2026年1月16日,中国食品工业协会正式发布了《世界炒菜机器人产业发展报告》,这一权威数据揭示了我国炒菜机器人市场正迎来历史性转折点——从初步探索阶段全面迈入高速发展期。报告预测,2025年市场规模将首次突破37亿元大关,而到2030年,这一数字有望实现惊人的五倍增长,达到117亿元。这一跨越式发展背后,是智能化烹饪需求的持续升温与前沿技术的不断突破。随着...

2026年01月16日

23:29
2026年1月,微软正式宣布对其位于美国华盛顿州雷德蒙德总部的新闻与研究报告订阅服务进行逐步取消。自2025年11月起,这家科技巨头已停止续约包括SNS全球报告在内的多项出版服务,导致员工无法再访问《The Information》等知名数字媒体及商业书籍电子资源。这一重大调整不仅影响22万名员工,更是微软降本增效与AI战略转型战略的关键一环。 微软表示,此...
23:29
2026年1月16日,江苏连云港徐圩核能供热发电厂传来重大进展,1号机组核岛正式开始混凝土浇筑,标志着这一创新项目正式迈入主体工程建设阶段。作为全球首个将"华龙一号"与高温气冷堆技术相结合的示范工程,该项目不仅具备先进的发电能力,更拥有提供高品质工业蒸汽的独特优势,为能源利用开辟了全新路径。 该项目采用第三代核电技术与第四代核能技术有机耦合,通过热电联供模式...