新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月10日

01:42
微新创想:2026年3月10日,苹果面向开发者推送iOS/iPadOS 26.4开发者预览版Beta 4(版本号23E5234a) 此次更新距离Beta 3发布仅隔7天,属于常规迭代节奏。苹果持续以高频次的方式推进系统优化,确保最终版本的稳定性和用户体验 该版本适用于iPhone和iPad设备,开发者需先注册苹果开发者计划,才能通过“设置→通用→软件更新”渠...
01:42
微新创想:2026年3月10日,苹果向注册开发者推送了macOS 26.4开发者预览版Beta 4(内部版本号25E5233c)。此次更新距离Beta 3的发布仅隔6天,属于常规迭代节奏。苹果在短时间内连续发布多个测试版本,显示出其对新系统的重视程度以及快速推进开发工作的策略。 升级该版本需要开发者登录苹果开发者账号,并通过系统设置中的“通用→软件更新”选项...
01:42
微新创想:2026年2月,空中客车公司全球交付飞机35架,当月净增订单28架。今年1至2月累计获得飞机订单77架。交付与订单均按计划推进,反映民航市场复苏态势持续。数据于3月10日由空客官方公布,覆盖全球各主要航司及租赁客户。
01:42
微新创想:2026年3月10日,AI语音技术公司ElevenLabs首席执行官宣布,公司拟在未来2至3年内完成首次公开募股(IPO)计划。这一消息标志着ElevenLabs在人工智能语音领域的发展迈入了新的阶段。 ElevenLabs总部位于英国伦敦,专注于生成式语音AI的研发与商业化应用。公司致力于通过先进的语音合成技术,为用户提供更加自然、高质量的语音体...
01:10
微新创想:2026年3月9日 地中海航运公司宣布 自3月16日起对北欧至红海航线实施紧急燃油附加费 标准集装箱收费85美元每箱 冷藏箱收费125美元每箱 该费用将适用于所有经此航线的订舱货物 此次调整是为应对近期红海地区航运风险上升及燃油成本波动所采取的措施 燃油附加费将在提单签发前由承运方收取 这一变动可能对货主的运输成本产生直接影响 地中海航运公司表示 ...

2026年03月09日

23:54
微新创想:微软近日确认Windows 11任务栏日历弹出功能不会被取消,而是正在积极优化其底层体验以确保整体质量。这项功能原本计划在2025年12月启动预览测试,但因技术调整和稳定性问题,最终被推迟。目前微软表示,将在未来几个月内向Windows预览体验成员开放测试,以便收集更多反馈并进行改进。 该功能的回归将为用户提供极大的便利,使他们无需打开特定应用程序...
23:21
微新创想:2026年3月9日 博主@数码闲聊站爆料称 某国产头部厂商母系旗舰正评估1.5K分辨率+165Hz超高刷新率显示屏 结合其过往爆料风格及一加已量产多款165Hz机型 如一加15、Ace 6、Ace 6T、Turbo 6 业界普遍指向OPPO体系 一加中国区总裁李杰此前确认 一加15搭载的第三代东方屏为行业首块1.5K+165Hz屏幕 并已适配《三角...
23:21
微新创想:3月9日,日本软银集团旗下电子支付平台PayPay在美国启动首次公开募股(IPO)获得数倍超额认购。此次IPO由高盛、摩根士丹利等国际知名金融机构牵头承销,计划募集资金约20亿美元。该笔资金将主要用于拓展北美及东南亚市场,进一步推动PayPay的全球化进程。 PayPay自2018年在日本正式运营以来,迅速积累了庞大的用户基础,目前服务用户已超过4...
23:21
微新创想:3月9日,江苏泽景汽车电子股份有限公司正式通过港交所上市聆讯。这一重要进展标志着公司在资本市场的发展迈出了关键一步。公司总部位于江苏省,专注于汽车电子产品的研发与制造,凭借多年的技术积累和市场拓展,已在行业内占据了一定的市场份额。 此次IPO计划募集资金将主要用于产能扩建、技术研发以及补充流动资金。通过扩大生产规模,公司有望进一步提升市场竞争力;加...
22:13
微新创想:大众与众汽车正式公布08车型内饰官图 3月9日,大众与众汽车正式公布08车型内饰官图 该车定位为中大型智能电动SUV 轴距达3030mm,为车内空间提供了充足保障 配备双14.96英寸超高清智能联屏 以及1.74㎡智能调光天幕 紫外线隔绝率达99.9% 有效提升驾乘舒适度与安全性 内饰配置丰富,包含14向电动调节副驾座椅 并配有腿托功能 进一步提升...
22:13
微新创想:OPPO于2026年3月9日上午宣布,全新折叠旗舰手机Find N6将于3月17日19时全球首发。这款手机在设计和技术上进行了多项创新,旨在为用户提供更优质的折叠屏体验。 Find N6搭载了最新的骁龙8 Elite Gen5处理器,性能表现将更加出色。主屏幕采用8.12英寸2K LTPO技术,不仅显示效果细腻,还具备出色的功耗控制能力。副屏则为6...
21:43
微新创想 宁德时代今日公布2025年财报数据显示全年营收达到4237.02亿元同比增长17.04%净利润为722.01亿元同比增长42.28% 微新创想 2025年宁德时代动力电池销量达到541GWh同比增长41.85%全球市占率再创新高根据SNE Research统计2025年宁德时代全球动力电池使用量市占率提升1.2个百分点至39.2%连续第九年保持...