新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月20日

12:07
微新创想:2026年2月19日 三丽鸥公司宣布与美国IDW Publishing达成合作 共同构建全新‘Hello Kitty漫画宇宙’ 首部作品《Hello Kitty:你好世界》将于7月22日在圣地亚哥动漫展首发 该漫画由马里科·塔马基编剧 科迪·勒米厄绘制 以Hello Kitty及伙伴的世界巡旅为背景 融合冒险与解谜元素 IDW计划202...
12:07
微新创想:2026年2月19日0时54分,中国科学院院士、清华大学电子工程系教授周炳琨因病在北京逝世,享年90岁。周炳琨1936年出生于成都,1956年从清华大学无线电系毕业并留校任教,是我国激光及信息光电子学领域的重要奠基人之一。 周炳琨教授在学术研究方面成就卓著,1962年他创建了清华大学激光研究小组,这一举措为我国激光学科的发展奠定了坚实基础。在他的领...
12:07
微新创想:2026年2月19日,三星、SK海力士与美光三大存储芯片巨头加速扩大生产规模,以应对人工智能技术快速发展所带来的高带宽内存(HBM)需求激增。这一趋势标志着存储行业正迎来新一轮增长周期。 美光宣布将投资2000亿美元,在美国爱达荷州博伊西建设全球最大的洁净室园区。该项目不仅将显著提升其在该地区的生产能力,还将为未来几年的高增长需求奠定坚实基础。根据...
12:07
微新创想:2月20日,全国铁路预计发送旅客1500万人次,较前一日增加146.1万人次。这是春运返程高峰期间的一个重要数据,显示出铁路运输需求的持续增长。为应对这一高峰,国铁集团当日计划加开旅客列车1469列,确保旅客能够顺利出行。 截至当日早8时,春运期间车票累计预售达2.98亿张。这一数字不仅体现了广大旅客对铁路出行的信赖,也反映出春运期间铁路运输的紧张...
12:07
微新创想:2026年2月18日 台湾网友@sanetidaay在mobile01论坛发帖称 其技嘉RTX 5090 AORUS Master ICE显卡的12V-2x6电源接口发生熔毁事故 该卡已稳定运行近7个月 用户此前已将功耗限制在500W 以规避过热风险 事故中仅顶排针脚完全熔化烧焦 底排完好 显示电流分布异常 调查指向转接线接触不良致局部电阻升高 过...
12:07
微新创想:2026年2月20日途家民宿发布的数据显示,今年春节九天长假期间,民宿入住最高峰出现在大年初二。这一趋势反映出消费者在假期安排上的变化,越来越多的人倾向于分段式过年。 大年初一至初三的预订量占据了整个假期总量的约50%。这表明,人们更愿意在假期初期与家人团聚,随后再安排外出旅行。这种“分段过年”的模式逐渐成为主流,为旅游市场带来了新的活力。 随着这...
12:07
微新创想:2026年2月20日 数码博主@数码闲聊站透露春节后最受期待的旗舰新机为OPPO Find X9 Ultra和vivo X300 Ultra 两款手机均搭载了全新的外挂增距镜技术 工程机已验证2K直屏 IP68 IP69防水 3D超声波指纹等多项配置 OPPO Find X9 Ultra主打原生望远与均衡体验 搭载200MP超大底潜望长焦与7000...
11:29
微新创想:2026年2月,中国信息通信研究院正式发布《制造业数字化转型发展报告(2025年)》。该报告基于工信部制造业数字化转型综合信息服务平台的数据,全面分析了全国规模以上工业企业数字化转型的总体水平。 截至2025年12月,开展数字化改造的企业占比达到89.6%。数字化设备的普及率也显著提升,达到57.7%。这些数据表明,我国制造业的数字化转型已经取得了...
11:29
微新创想:2026年2月,网络安全公司ESET发现了一款在安卓平台上的新型恶意软件PromptSpy。这款恶意软件是首款在运行时集成生成式AI技术的恶意软件,标志着恶意软件攻击手段的又一次升级。PromptSpy于2月上传至VirusTotal,此前其雏形VNCSpy已在1月出现,显示出攻击者在技术上的持续探索与改进。 PromptSpy利用谷歌Gemini...
11:29
微新创想:微软宣布自2026年3月31日起将全面停用Outlook中的联系人屏蔽功能 微软近日发布官方通知,宣布将在桌面端、移动端以及Web端统一停止使用Outlook的“联系人屏蔽”功能。这一功能原本允许用户通过点击自动建议列表中联系人旁边的“X”号来隐藏特定联系人,从而减少不必要的信息干扰。然而,由于该操作不仅影响Outlook本身,还会同步作用于Tea...
11:29
微新创想:2月18日至19日(大年初二至初三)全国民航出行迎来节中高峰。同程旅行数据显示该时段民航出行热度较2025年春节同期提升38%。整个春节九天假期中乘坐民航2次及以上出行的旅客数量同比增幅超50%。数据显示出行需求呈现显著增长趋势。 微新创想:随着‘分段式过年’逐渐成为主流趋势,越来越多的旅客选择在假期中进行多段行程安排。这种出行方式不仅满足了探亲需...
11:29
微新创想:2026年2月20日,皮克斯正式发布《玩具总动员5》预告片。影片定于2026年6月19日在北美上映,暑期全球公映。故事聚焦智能平板Lilypad(由Greta Lee配音)入侵童年生活,胡迪、巴斯光年等经典玩具面临新挑战。该片探讨科技迭代下陪伴意义的变迁,延续系列情感内核。制作方未透露中国内地具体上映日期。