新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月02日

18:18
2026年1月2日14时58分,元旦档总票房突破5亿元。本次档期涵盖1月1日至3日,数据显示《疯狂动物城2》《阿凡达3》《匿杀》位列票房前三。影片表现强劲,推动节日期间观影热潮持续升温。
18:18
2025年12月29日,全球知名资产管理公司贝莱德通过香港交易所正式披露其持股变动信息,宣布对美的集团H股的持股比例由原先的7.03%大幅下调至5.16%。这一调整动作在金融市场上引发了广泛关注,具体涉及减持股份数量及交易金额等细节尚未对外公布。尽管相关数据未予明确,但市场分析人士普遍认为,贝莱德的此次减持行为可能与其整体投资组合的战略调整密切相关,旨在优化...
18:18
2026年1月2日,法拉利F1车队正式宣布与车手周冠宇的合约到期,双方合作关系就此画上句点。回顾这段旅程,周冠宇自2015年起便投身于法拉利青训体系,在2018年完成青训生涯后,凭借出色表现逐步晋升。2025赛季,他作为车队第三车手,代表法拉利在中国大奖赛亮相,为车队注入了新鲜活力。 值得一提的是,周冠宇在卡塔尔大奖赛期间,为索伯车队贡献了宝贵积分,这一成就...
18:18
2026年1月2日,美图公司正式宣布成功完成向阿里巴巴发行总额达2.5亿美元的可转股债券交割工作。这一重要融资举措不仅为美图未来的发展注入了强劲动力,也标志着双方战略合作关系的进一步深化。据悉,此次募集的资金将专项用于支持公司的一般商业运营,助力美图在竞争激烈的市场环境中持续创新与扩张。 此次合作并非偶然,双方早在2025年12月30日便已签署业务合作协议,...
18:18
2026年1月2日,中国海油传来振奋人心的消息,宣布其"深海一号"气田在2025年实现了年产油气量450万吨油当量的历史性突破,同时累计完成100船次的原油外输任务,这一成就标志着我国深海油气开发迈上了新台阶。作为国内规模最大的海上气田,"深海一号"气田拥有23口深水生产井,全面投产后的最高日产能高达1500万立方米,这一数据充分彰显了我国在深水油气勘探开发...
18:18
2026年1月1日,星链工程副总裁迈克尔·尼科尔斯正式宣布了一项重大太空计划:将在年内将约4400颗目前在550公里高度运行的卫星逐步降至480公里轨道。这一战略调整不仅体现了星链公司对空间安全的高度重视,更彰显了其推动航天可持续发展的决心。通过优化卫星运行轨道,该举措有望将故障卫星的自然脱轨时间从目前的四年以上大幅缩短至数月,显著降低太空垃圾风险。 近期太...
17:18
2026年1月2日,韩国青瓦台迎宾馆内庄重非凡,一场特殊的国家级颁奖仪式在此举行。韩国总统李在明亲自为英雄联盟传奇选手Faker(李相赫)授予象征电竞荣耀的国家级勋章——青龙章,以此表彰他在电竞领域所取得的非凡成就。 Faker此次获颁青龙章,主要为了表彰他在电竞领域的卓越贡献,尤其是带领T1战队勇夺S15全球总决赛冠军,成功实现S赛三连冠伟业,并达成个...
17:18
2025年12月30日,前R星技术总监奥比・费尔迈对外媒表示,《GTA4》虽在角色塑造上表现出色,尤其是主角Nico Bellic被视为系列最丰满角色,但游戏为追求现实主义叙事牺牲了玩法多样性。他指出,《GTA4》任务结构重复,局限于跟踪、清场等少数模式,缺乏《圣安地列斯》时期的创意与自由度。相比之下,《GTA5》回归娱乐化风格,任务设计更丰富,反映出R星...
17:18
2026年1月2日,米其林公司宣布将收购库利集团和特克斯泰克工业公司。此次收购旨在强化其在聚合物复合材料解决方案领域的业务能力。库利集团专注于高性能材料研发,而特克斯泰克工业公司在复合材料制造方面具有领先技术。通过整合两家公司的技术与资源,米其林计划提升其材料科学创新能力,以支持可持续出行领域的发展需求。交易具体金额未披露。
17:18
2026年1月2日,全球领先的IT解决方案提供商三星SDS正式宣布了一项雄心勃勃的投资计划,将投入高达4273亿韩元的巨额资金用于建设新一代人工智能数据中心。这一战略项目选址于韩国京畿道华城市,由三星SDS独立主导并全面负责实施。该投资旨在显著增强公司在人工智能与云计算领域的核心竞争力和基础设施实力,为未来智能技术的快速发展奠定坚实基础。 据悉,新数据中心将...
17:18
1月2日清晨,韩国济州岛国际机场发生一起罕见的安全事件。一架原计划执行济州至浦项航班的客机在起飞前突然出现冒烟现象,引发乘客和机组人员的紧急应对。据现场目击者描述,浓烟从飞机尾部散发,随即在机舱内弥漫开来,情况一度十分危急。 随着烟雾浓度不断加剧,机长果断启动应急预案,通过广播指挥120名乘客迅速有序地撤离飞机。乘客们在机组人员的引导下,通过紧急出口有序撤离...
16:48
2026年1月2日,备受瞩目的领克08 EM-P 230超长续航Ultra版正式登陆市场,官方指导价为20.58万元起,更推出限时优惠,仅需18.98万元起即可入手。新车在延续现款车型经典设计语言的基础上,融入了更多前沿科技元素,如璀璨星河LED大灯组与智能驾驶辅助的“小蓝灯”,不仅提升了夜间辨识度,更彰显了科技感。 车身尺寸方面,领克08 EM-P 230...