新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月28日

07:06
微新创想:2026年2月27日,苹果正式上线《Elevated》沉浸式旅行视频第三集,该内容专为Vision Pro设备打造。本集聚焦瑞士,通过180度8K 3D视频与空间音频技术,为用户带来前所未有的沉浸体验。视频内容涵盖马特洪峰、山顶城堡废墟以及峡谷铁路等标志性高空景观,时长约8分钟。 视频由瑞士演员卡拉·朱里担任引导,带领观众在虚拟世界中“云端漫步”。...
06:10
微新创想:2026年2月27日,美国航空航天局(NASA)在华盛顿宣布,将“阿耳忒弥斯3号”载人登月任务从原定2027年推迟至2028年 此次调整主要因太空发射系统(SLS)火箭、新型宇航服及人类着陆系统研发进度滞后,叠加安全审查与测试周期延长所致 任务仍由NASA主导,计划实现自1972年以来首次载人重返月球表面 推迟决定经内部评估后确认,不影响前期无人绕...
02:08
微新创想:2026年2月28日,德国联邦机动车运输管理局(KBA)宣布宝马启动全球召回。此次召回涉及2022年至2025年间生产的五款车型,包括i7、i5、5系、7系以及M5。受影响的车辆总数达到337,374辆,其中德国境内有29,441辆。 此次召回的主要原因是部分车辆的电子控制单元存在软件异常的潜在风险。这种异常可能在车辆行驶过程中导致动力系统突然中断...
00:55
微新创想:截至2月27日,美国2026年已报告麻疹病例至少1136例。这一数字远超往年同期水平,显示出麻疹疫情正在迅速蔓延。疫情已经波及全美多个州,主要集中在未接种疫苗的人群以及与国际旅行输入相关的地区。 疾控中心指出,仅在前八周内,病例数就已经达到了过去一年平均值的六倍。这一数据表明,免疫空白区域的扩大和跨境传播风险的增加是当前疫情失控的重要原因。专家分析...
00:23
微新创想:2026年2月27日,芬兰HMD Global正式推出新款智能手机Luma。这款手机在设计和功能上延续了HMD一贯的风格,同时在细节方面也进行了优化。Luma搭载了紫光展锐T615处理器,为用户带来稳定的性能体验。配备4GB运行内存和128GB或256GB存储空间,支持microSD卡扩展,满足不同用户的存储需求。 该机采用了一块6.67英寸的HD...

2026年02月27日

23:48
微新创想:2026年3月27日起,LPL赛区14支战队将展开电竞世界杯《英雄联盟》项目预选赛。此次赛事是通往全球总决赛的重要一步,吸引了众多顶尖战队参与。首阶段比赛时间为3月27日至29日,由种子排名第7至14的队伍进行单败淘汰赛。胜出的队伍将与排名前六的战队共同进入第二阶段。 第二阶段比赛从3月30日持续到4月28日,采用双败淘汰赛制。这种赛制不仅增加了比...
23:48
微新创想:2026年2月27日,宝可梦官方正式宣布了对战新作《宝可梦:冠军》的发布计划。该游戏将于4月登陆任天堂Switch平台,并在夏季推出Android和iOS的手游版本。这一消息让众多宝可梦粉丝感到振奋,因为《宝可梦:冠军》不仅延续了系列一贯的竞技对战特色,还带来了全新的玩法体验。 《宝可梦:冠军》主打竞技对战玩法,游戏内支持两种对战格式和三种战斗模式...
23:48
微新创想:2026年2月27日,美国国家航空航天局(NASA)宣布取消太空发射系统(SLS)火箭的升级计划,决定将重点转向简化设计和降低复杂性,以提高发射频率。这一决策标志着NASA在推进其深空探索战略上的重要调整。 此举旨在加速‘阿耳忒弥斯’登月计划的实施进程,确保未来任务能够更加高效地进行。NASA特别提到,将在宇航员登月之前增加一次航天器在轨对接测试任...
23:48
微新创想:2026年2月27日,碧桂园发布公告称,截至1月31日,公司合并范围内较2025年12月31日净新增违约债务38.61亿元。同期新增标的超5000万元的未决诉讼、仲裁案件14宗,涉案金额合计约32.68亿元。 上述债务违约及诉讼主要因流动性持续承压所致,涉及境内公开市场债券及非标融资。公司表示正积极推进债务重组与资产处置工作,以缓解当前面临的财务压...
23:48
微新创想:别克品牌宣布全新至境世家MPV纯电版将于2026年3月正式上市 这款全新车型在设计上采用了哑光灰双拼色车漆以及高定涂装工艺展现出独特的时尚感与高级质感 基于900V纯电架构打造该车不仅具备出色的能效表现还拥有更强的性能输出 新车搭载双电机四驱系统CLTC最大续航里程达到632公里满足长途出行需求 车身尺寸为5260×2023×1835mm轴距长达3...
23:48
微新创想:2026年2月27日,绿联在海外市场推出FineTrack Slim追踪器。这款产品专为iPhone用户打造,具备多项实用功能,包括支持苹果Find My网络、IP68防水防尘等级、100dB蜂鸣提醒以及远程定位等。这些功能让用户能够更便捷地追踪丢失的设备,提升日常使用的安全性与可靠性。 最大升级在于支持通用无线充电。这一改进让用户无需携带专用充电...
23:11
微新创想:一项发表于《Nature Medicine》的独立研究显示,OpenAI推出的ChatGPT Health功能在60个真实临床案例中,51.6%未能识别需立即就医的紧急状况,如哮喘危象、窒息等,反而建议居家观察或预约门诊 研究团队由伦敦大学学院等机构参与,共分析近1000条AI回复。研究结果表明,尽管ChatGPT Health旨在为用户提供医疗建...