新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月11日

20:28
微新创想:2026年4月11日,NASA宣布将阿波罗11号指令舱(科曼奇055)与登月舱(亮星099)的原始AGC软件代码正式开源并纳入公共领域。这一举动标志着人类航天史上的一项重要遗产得以向公众开放。 代码由Virtual AGC项目与MIT博物馆联合完成数字化整理。经过严谨的修复与归档,这些珍贵的历史资料现在可以被全球的开发者和历史爱好者自由获取。 用户...
19:26
微新创想:2026年4月,杭州宇树科技宣布其H1人形机器人在百米测试中实现10米/秒峰值奔跑速度,刷新世界纪录。这一速度远超此前的记录,标志着人形机器人在运动性能方面取得了重大突破。 该机器人身高约180厘米、重约47千克,相较于2025年8月所创下的3.3米/秒纪录,实现了显著提升。这一进步不仅展示了宇树科技在机器人技术上的深厚积累,也体现了其在动力系统与...
19:25
微新创想:华为Pura 90系列已官宣将于4月20日正式发布 作为华为主打影像美学的高端旗舰该系列不仅在硬件上迎来了跨越式升级在软件交互与工业设计上也带来了重磅惊喜 据行业人士爆料Pura 90系列将出厂搭载全新的鸿蒙6.1操作系统该版本系统在视觉交互层面进行了深度重构带来了极具未来感的沉浸光感设计语言 为了给用户更细腻的视觉反馈系统提供了强、均衡和弱三种不...
19:25
微新创想:特斯拉CEO马斯克在社交平台发文称特斯拉Model S和Model X的库存已经只剩最后几百台一个时代迎来感伤的落幕 这条动态是马斯克回复一位用户的换车分享有车主表示在Model S/X停产前用2020款Model S置换了全新的Plaid版Model X体验后对FSD完全自动驾驶功能赞不绝口称在洛杉矶过去一个月里95%的里程都是自动驾驶完成远超预...
19:25
微新创想:鸿蒙智行正式官宣问界M6自3月23日开启预售以来总预订量已经突破10万台 问界M6被定位为一款面向年轻家庭的五座SUV车型深受市场欢迎不少用户将其称为年轻人的第一辆鸿蒙SUV 预售期间增程版起售价为26.98万元纯电版起售价为28.98万元上市后迅速吸引大量用户下单 回顾预售数据问界M6开启预订仅24小时就突破6万台不到20天再冲至10万台热度持续...
19:25
微新创想:今天上午有媒体联系到成功拍下张雪冠军复刻赛车的网友 敌敌畏 他表示直到现在心情仍然激动不已 回顾整场竞拍过程不到一分钟 他仍感到不可思议 他提到起初并没有抱太大期望 只是随手点了几次出价 没想到竟然机缘巧合拍下了这辆赛车 整个过程快得超出预期 他表示自己是代表公司参与竞拍 并非个人行为 因为公司老板非常喜爱机车 同时也十分欣赏张雪 而且企业一直热心...
19:25
微新创想:北京时间4月11日08时07分,NASA的阿尔忒弥斯2号任务中,猎户座飞船在加利福尼亚州圣迭戈海岸附近的太平洋海域成功溅落。这一时刻标志着美国首次载人绕月任务圆满结束,为人类探索月球迈出了重要一步。 此次任务中,四名宇航员各携带了一台iPhone 17 Pro Max进入深空。整趟任务期间,这些设备均处于飞行模式,没有网络连接。但它们通过飞船的系统...
19:25
微新创想:谷歌Gemini AI近日推出全新升级功能,让用户通过简单的提示词即可生成交互式3D模型和实时模拟。这一创新极大地提升了AI在可视化教学与科研探索中的应用价值,使用户能够以更直观的方式理解复杂概念。 新功能支持多种互动操作,包括旋转模型、拖动滑块调整参数或直接输入数值以改变模拟结果。用户在使用过程中可以自由操控模型,从不同角度进行观察,从而获得更全...
19:25
微新创想:华为Pura系列新品发布会定档4月20日 华为终端BG董事长余承东透露这次Pura家族全系上新 也就是Pura 90、Pura X系列新机统一登场 据博主数码闲聊站透露 Pura X系列的新机将被命名为华为Pura X Max 这是行业首款横向扩折叠手机 相比于此前的Pura X尺寸更大 内屏是7.69英寸WQHD 外屏则是5.5英寸 内屏能够展示...
19:25
微新创想:近日一起因地铁挡水板引发的意外伤害案件引发关注。案件发生在2025年8月北京雨季期间,正值暴雨蓝色预警发布之时。当时,地铁运营公司为应对汛期,在直梯入口处设置了挡水板。周女士在搭乘直梯时,因右脚被挡水板绊倒导致左腓骨远端骨折,随后她以地铁公司未尽安全保障义务为由,向法院提起诉讼,要求赔偿27万余元。 微新创想:周女士在诉讼中指出,挡水板未设置明显警...
18:53
微新创想:2026年4月9日,New Blood Interactive创始人Dave Oshry在接受Twisted Voxel采访时表示,其游戏在Steam平台一周销量几乎等同于主机平台数月乃至数年总和。这一数据凸显了Steam作为全球最大游戏商店的影响力,也反映出PC平台在游戏市场中的独特地位。 Dave Oshry强调,Steam不仅是玩家获取游戏的...
18:21
微新创想:4月11日,武汉投资控股集团以32.9985亿元通过北京产权交易所,成功受让中国航天三江集团所持有的航天科工火箭技术有限公司29.5904%股权。此次交易由武投控牵头设立的武汉武创星航创业投资基金具体实施,标志着武投控在商业航天领域的战略布局迈出重要一步。 此次入股的主体航天科工火箭技术有限公司是我国商业航天领域的重要运载火箭研发与运营企业,总部设...