新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月11日

21:31
微新创想:2026年4月11日,电子游戏分析媒体数毛社发布《星空》PS5及PS5 Pro版本深度评测。评测指出,游戏虽保留太空探索氛围与基础可玩性,但在PS5上存在帧率波动(城市场景跌至30帧)、频繁崩溃等问题。 微新创想:PS5 Pro版启用PSSR技术后出现画面伪影,且24种画质组合过于复杂,易致玩家误配。HDR效果薄弱,未能展现太空场景应有的高动态范围...
21:31
微新创想:2026年4月9日,乌克兰硬件工程师Oleg Kutkov在X平台发布消息称,他通过USB转接线将3.5英寸软盘驱动器接入特斯拉手套箱USB口,成功播放软盘内MP3文件《Never Gonna Give You Up》 该方案依托车机Linux内核对软驱的兼容性,无需改装系统。软驱被USB转接线识别为标准U盘设备,但无法格式化为exFAT,故不支持...
21:00
微新创想:2026年4月11日,国防科技大学空天科学学院在长沙正式发布自主研制的航天任务设计工业软件ATK 4.0版。该软件面向运载火箭、卫星、飞船、空间站等航天任务,支持发射、返回、轨道运行及交会对接全流程设计与仿真。 ATK 4.0版采用先进的‘所见即所得’界面设计,结合数字地球与插件化可视化技术,能够快速构建太阳系至单星尺度的动态场景。用户可直观操作,...
21:00
微新创想:4月11日,网络威胁组织ShinyHunters宣称成功攻破Rockstar Games的后台数据系统。此次攻击并非针对《GTA6》本身,而是通过利用供应商Anodot的AI监控工具,获取了认证令牌。黑客借此非法访问了Rockstar Games部署在Snowflake平台上的遥测与分析数据。 Snowflake系统存储了大量玩家行为数据,包括游戏...
20:28
微新创想:2026年4月11日,NASA宣布将阿波罗11号指令舱(科曼奇055)与登月舱(亮星099)的原始AGC软件代码正式开源并纳入公共领域。这一举动标志着人类航天史上的一项重要遗产得以向公众开放。 代码由Virtual AGC项目与MIT博物馆联合完成数字化整理。经过严谨的修复与归档,这些珍贵的历史资料现在可以被全球的开发者和历史爱好者自由获取。 用户...
19:26
微新创想:2026年4月,杭州宇树科技宣布其H1人形机器人在百米测试中实现10米/秒峰值奔跑速度,刷新世界纪录。这一速度远超此前的记录,标志着人形机器人在运动性能方面取得了重大突破。 该机器人身高约180厘米、重约47千克,相较于2025年8月所创下的3.3米/秒纪录,实现了显著提升。这一进步不仅展示了宇树科技在机器人技术上的深厚积累,也体现了其在动力系统与...
19:25
微新创想:华为Pura 90系列已官宣将于4月20日正式发布 作为华为主打影像美学的高端旗舰该系列不仅在硬件上迎来了跨越式升级在软件交互与工业设计上也带来了重磅惊喜 据行业人士爆料Pura 90系列将出厂搭载全新的鸿蒙6.1操作系统该版本系统在视觉交互层面进行了深度重构带来了极具未来感的沉浸光感设计语言 为了给用户更细腻的视觉反馈系统提供了强、均衡和弱三种不...
19:25
微新创想:特斯拉CEO马斯克在社交平台发文称特斯拉Model S和Model X的库存已经只剩最后几百台一个时代迎来感伤的落幕 这条动态是马斯克回复一位用户的换车分享有车主表示在Model S/X停产前用2020款Model S置换了全新的Plaid版Model X体验后对FSD完全自动驾驶功能赞不绝口称在洛杉矶过去一个月里95%的里程都是自动驾驶完成远超预...
19:25
微新创想:鸿蒙智行正式官宣问界M6自3月23日开启预售以来总预订量已经突破10万台 问界M6被定位为一款面向年轻家庭的五座SUV车型深受市场欢迎不少用户将其称为年轻人的第一辆鸿蒙SUV 预售期间增程版起售价为26.98万元纯电版起售价为28.98万元上市后迅速吸引大量用户下单 回顾预售数据问界M6开启预订仅24小时就突破6万台不到20天再冲至10万台热度持续...
19:25
微新创想:今天上午有媒体联系到成功拍下张雪冠军复刻赛车的网友 敌敌畏 他表示直到现在心情仍然激动不已 回顾整场竞拍过程不到一分钟 他仍感到不可思议 他提到起初并没有抱太大期望 只是随手点了几次出价 没想到竟然机缘巧合拍下了这辆赛车 整个过程快得超出预期 他表示自己是代表公司参与竞拍 并非个人行为 因为公司老板非常喜爱机车 同时也十分欣赏张雪 而且企业一直热心...
19:25
微新创想:北京时间4月11日08时07分,NASA的阿尔忒弥斯2号任务中,猎户座飞船在加利福尼亚州圣迭戈海岸附近的太平洋海域成功溅落。这一时刻标志着美国首次载人绕月任务圆满结束,为人类探索月球迈出了重要一步。 此次任务中,四名宇航员各携带了一台iPhone 17 Pro Max进入深空。整趟任务期间,这些设备均处于飞行模式,没有网络连接。但它们通过飞船的系统...
19:25
微新创想:谷歌Gemini AI近日推出全新升级功能,让用户通过简单的提示词即可生成交互式3D模型和实时模拟。这一创新极大地提升了AI在可视化教学与科研探索中的应用价值,使用户能够以更直观的方式理解复杂概念。 新功能支持多种互动操作,包括旋转模型、拖动滑块调整参数或直接输入数值以改变模拟结果。用户在使用过程中可以自由操控模型,从不同角度进行观察,从而获得更全...