新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月21日

07:47
微新创想:2026年2月苹果研究团队推出轻量级多模态大语言模型Ferret-UI Lite 该模型参数量仅为30亿(3B)可在手机端本地运行 Ferret-UI Lite通过‘推理时裁剪’技术精准识别UI细节 依托自研合成数据系统训练显著提升界面理解与操作能力 测试显示其性能媲美甚至超越参数量24倍的服务器模型 尤其擅长短流程UI操作且全程离线保障隐私 目前...
07:15
微新创想:2026年2月21日华硕正式推出Dual RTX 5070 EVO系列显卡 该显卡专为小型主机设计,包括SFF和ITX等紧凑型机箱。其整体尺寸大幅缩减,仅为229×120×50mm,厚度控制在2.5槽以内,显著提升了空间利用率,满足了对体积有严格要求的用户需求。 产品在散热方面进行了多项优化。采用双轴向风扇设计,有效提升风量与散热效率。同时支持0d...
02:47
微新创想:2026年2月21日,谷歌正考虑将TPU(张量处理单元)部门重组为独立业务单元 以加速AI芯片商业化进程。此举旨在提升TPU对外供应能力与市场响应效率 目前尚无正式实施计划。同时 谷歌正洽谈向AI基础设施初创公司Fluidstack投资约1亿美元 意在借助其云分发能力扩大TPU生态影响力。重组若推进 或将强化谷歌在定制AI芯片领域的战略自主性。
01:45
微新创想:2月21日23时16分(当地时间)日本青森县以东海域发生5.0级地震 震源深度60公里 日本气象厅发布消息确认此次地震未引发海啸风险 为当地居民提供了安心保障 此次地震的震中位于青森县以东近海 地理位置处于太平洋板块俯冲带 这是该地区常见的地质活动区域 目前暂无人员伤亡及重大财产损失报告 地方政府和相关部门正在持续监测地震影响情况 当地交通与基础设...
00:02
微新创想:2026年2月18日,印度AI实验室Sarvam在班加罗尔举行的印度人工智能影响力峰会上发布了两款自主研发的MoE架构大语言模型。这两款模型的开源权重已经上传至Hugging Face平台,后续还将提供API接口与仪表盘功能,方便开发者和用户进行调用与管理。 两款模型分别针对不同的应用场景进行了优化。其中,小型号模型为30B-A1B,支持高达32K...

2026年02月20日

23:23
微新创想:2026年2月20日,美国地区最新游戏销售数据显示,《使命召唤:黑色行动7》成为2026年1月最畅销游戏。该作由动视暴雪开发、微软发行,在当月销量超越《NBA 2K26》《麦登橄榄球NFL 26》等热门作品。 榜单前五名多为美式偏好题材包括赛车、射击和体育类游戏。《最终幻想7:重制版》在单月内跃升216位,成功进入榜单第9名。这一成绩显示出该作在游...
23:23
微新创想:2026年2月20日,微软研究院与Salesforce联合研究证实,当前顶尖大语言模型在多轮对话中可靠性显著下降。研究涵盖GPT-4.1、Gemini 2.5 Pro等15款模型,分析超20万次模拟对话。 结果显示:单轮任务成功率约90%,拆分为多轮后降至约65%。核心能力仅降15%,但不可靠性飙升112%。研究指出,主要原因是模型在对话初期就生成...
23:23
微新创想:2026年2月20日,YouTube宣布其对话式AI工具已全面支持电脑、Android、iPhone和iPad平台。这一更新标志着YouTube在智能化视频内容交互方面迈出了重要一步。用户现在可以通过文字或语音的方式向AI提问,从而更深入地解析视频内容,获取个性化的信息和见解。 微新创想:该工具的推出不仅提升了用户体验,也拓宽了视频内容的可访问性。...
23:23
微新创想:2026年2月20日,Linux内核开发者已提交首批PCIe 7.0适配补丁。该工作由开发者Ionut Nechita主导,新增128 GT/s速率检测、带宽控制及散热管理相关寄存器定义。这一进展标志着Linux系统对下一代高速总线技术的积极应对和深入研究。 PCIe 7.0规范由PCI-SIG于2025年中发布,理论带宽达512GB/s(x16双...
23:23
微新创想:2月20日17时39分(当地时间),阿富汗北部兴都库什地区发生5.7级地震,震源深度约79公里。此次地震由德国地球科学研究中心测定,北京时间同日21时09分。阿富汗首都喀布尔震感强烈,居民普遍感受到明显的摇晃。目前暂无人员伤亡和财产损失的官方通报,但相关部门仍在持续监测灾情。 此次地震属于中源地震,发生于欧亚板块与印度板块的交界地带。该区域地质活动...
23:23
微新创想:2026年2月20日,美国纽约。摩根士丹利首次覆盖分拆上市的通用电气航空航天公司(GE AEROSPACE),给予“增持”评级,目标股价425美元。此举标志着该投行对该司独立运营后增长潜力与现金流韧性的认可。 分析指出,GE Aerospace在商用航空发动机领域占据全球领先地位,其技术实力和市场份额均处于行业顶端。随着全球航空业逐步复苏,公司迎来...