新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月10日

03:23
微新创想:3月10日,据路孚特数据,美国自由港液化天然气(LNG)工厂在3月8日(周日)突发停产之后,目前已逐步恢复至满负荷运行。事件发生地位于得克萨斯州墨西哥湾沿岸的自由港终端,涉事方为自由港液化天然气公司。停产原因尚未公开披露,但未报告人员伤亡或重大安全事故。恢复过程持续约48小时,产能已全面回归。此次短暂停工对全球LNG短期供应影响有限,但引发市场对美...
03:23
微新创想:苹果公司近日宣布将推迟智能家用显示器的上市计划。原本计划近期发布的这款产品,现在将延后至新款AI功能开发完成后才推出。这一决定是在美国加州库比蒂诺的苹果总部由决策层做出的,并且涉及到全球市场的发售节奏调整。苹果方面表示,推迟是为了确保设备在首次发布时能够集成稳定且实用的AI交互能力,从而提升用户体验的一致性。目前,苹果尚未公布新的发布时间表,也未披...
03:23
微新创想:2026年3月10日,美国科技公司Meta Platforms宣布暂时关闭其位于以色列特拉维夫的办公室。此举涉及当地全部员工,具体关停时长未披露。 Meta称系基于当前区域安全形势评估后作出的临时性运营调整,旨在保障员工人身安全。关闭决定由公司全球设施与安全部门协同本地管理团队执行,办公职能已转移至其他区域中心。 目前无裁员计划,员工薪资与福利维持...
01:42
微新创想:2026年3月10日,苹果面向开发者推送iOS/iPadOS 26.4开发者预览版Beta 4(版本号23E5234a) 此次更新距离Beta 3发布仅隔7天,属于常规迭代节奏。苹果持续以高频次的方式推进系统优化,确保最终版本的稳定性和用户体验 该版本适用于iPhone和iPad设备,开发者需先注册苹果开发者计划,才能通过“设置→通用→软件更新”渠...
01:42
微新创想:2026年3月10日,苹果向注册开发者推送了macOS 26.4开发者预览版Beta 4(内部版本号25E5233c)。此次更新距离Beta 3的发布仅隔6天,属于常规迭代节奏。苹果在短时间内连续发布多个测试版本,显示出其对新系统的重视程度以及快速推进开发工作的策略。 升级该版本需要开发者登录苹果开发者账号,并通过系统设置中的“通用→软件更新”选项...
01:42
微新创想:2026年2月,空中客车公司全球交付飞机35架,当月净增订单28架。今年1至2月累计获得飞机订单77架。交付与订单均按计划推进,反映民航市场复苏态势持续。数据于3月10日由空客官方公布,覆盖全球各主要航司及租赁客户。
01:42
微新创想:2026年3月10日,AI语音技术公司ElevenLabs首席执行官宣布,公司拟在未来2至3年内完成首次公开募股(IPO)计划。这一消息标志着ElevenLabs在人工智能语音领域的发展迈入了新的阶段。 ElevenLabs总部位于英国伦敦,专注于生成式语音AI的研发与商业化应用。公司致力于通过先进的语音合成技术,为用户提供更加自然、高质量的语音体...
01:10
微新创想:2026年3月9日 地中海航运公司宣布 自3月16日起对北欧至红海航线实施紧急燃油附加费 标准集装箱收费85美元每箱 冷藏箱收费125美元每箱 该费用将适用于所有经此航线的订舱货物 此次调整是为应对近期红海地区航运风险上升及燃油成本波动所采取的措施 燃油附加费将在提单签发前由承运方收取 这一变动可能对货主的运输成本产生直接影响 地中海航运公司表示 ...

2026年03月09日

23:54
微新创想:微软近日确认Windows 11任务栏日历弹出功能不会被取消,而是正在积极优化其底层体验以确保整体质量。这项功能原本计划在2025年12月启动预览测试,但因技术调整和稳定性问题,最终被推迟。目前微软表示,将在未来几个月内向Windows预览体验成员开放测试,以便收集更多反馈并进行改进。 该功能的回归将为用户提供极大的便利,使他们无需打开特定应用程序...
23:21
微新创想:2026年3月9日 博主@数码闲聊站爆料称 某国产头部厂商母系旗舰正评估1.5K分辨率+165Hz超高刷新率显示屏 结合其过往爆料风格及一加已量产多款165Hz机型 如一加15、Ace 6、Ace 6T、Turbo 6 业界普遍指向OPPO体系 一加中国区总裁李杰此前确认 一加15搭载的第三代东方屏为行业首块1.5K+165Hz屏幕 并已适配《三角...
23:21
微新创想:3月9日,日本软银集团旗下电子支付平台PayPay在美国启动首次公开募股(IPO)获得数倍超额认购。此次IPO由高盛、摩根士丹利等国际知名金融机构牵头承销,计划募集资金约20亿美元。该笔资金将主要用于拓展北美及东南亚市场,进一步推动PayPay的全球化进程。 PayPay自2018年在日本正式运营以来,迅速积累了庞大的用户基础,目前服务用户已超过4...
23:21
微新创想:3月9日,江苏泽景汽车电子股份有限公司正式通过港交所上市聆讯。这一重要进展标志着公司在资本市场的发展迈出了关键一步。公司总部位于江苏省,专注于汽车电子产品的研发与制造,凭借多年的技术积累和市场拓展,已在行业内占据了一定的市场份额。 此次IPO计划募集资金将主要用于产能扩建、技术研发以及补充流动资金。通过扩大生产规模,公司有望进一步提升市场竞争力;加...