新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月01日

15:40
微新创想:3月1日,京东航空在海南开通琼海—曼谷、曼谷—海口两条国际及海口—深圳一条国内全货机货运航线。此举使琼海博鳌国际机场首次具备国际货运功能,并实现与海口美兰国际机场的货运协同联动。新开航线旨在强化海南自贸港航空物流网络,提升跨境供应链效率,支撑区域跨境电商与生鲜冷链等高时效业务发展。
15:40
微新创想:2026年3月1日 特斯拉在阿联酋阿布扎比综合交通中心的监管下正式启动FSD道路测试 特斯拉在阿联酋阿布扎比综合交通中心的监管下正式开启了FSD道路测试 此次测试是在阿布扎比交通局的监督下进行的 标志着阿联酋成为首个设立FSD技术测试框架的国家 智能与自主系统委员会对这一举措给予了积极支持 并与内阁办公厅立法实验室紧密合作 推动测试工作的顺利开展 ...
15:40
微新创想:2026年3月1日,我国“天问一号”任务祝融号火星车在火星乌托邦平原南部着陆区,利用次表层探测雷达数据,首次于约15米深度识别出一层厚约7米的低损耗物质层。这一发现为科学家提供了新的研究视角。 研究确认该层为含岩石碎块的水冰混合物,即“脏冰”。这是目前在中低纬度地区首次获得的浅表水冰直接观测证据。这一成果不仅拓展了人类对火星水冰分布的认知,也为后续...
15:40
微新创想:3月1日,滴滴青桔在杭州滨江区、钱塘区启动共享单车维护保养专项行动。此次行动得到了杭州市轨道交通运行和公用事业保障中心以及两区综合行政执法局的指导,标志着滴滴青桔在城市绿色出行领域的持续投入与责任担当。 行动内容涵盖对共享单车的系统性检修、深度清洁、老化部件更换以及安全性能升级等多个方面。通过全面排查和细致维护,滴滴青桔致力于提升单车的整体质量与使...
15:40
微新创想:3月1日,中通冷链与新协航食品集团在青岛新协航集团总部正式签署战略合作协议。此次合作标志着双方在冷链物流与食品产业领域迈出了重要一步,共同致力于构建更加高效、安全和智能化的食品冷链供应链体系。 双方将围绕冷链物流的深度协同展开合作,通过资源整合与技术共享,提升整体运营效率。同时,也将推动食品产业供应链的全面升级,优化从生产到消费的各个环节,确保食品...
15:06
微新创想:3月1日,旧金山巨人队与Airwallex空中云汇宣布达成多年战略合作。空中云汇成为球队官方金融软件合作伙伴及官方合作伙伴,其品牌标识将于2026赛季起出现在巨人队全系列球衣上。这一合作标志着双方在体育与金融科技领域的深度融合。 合作旨在支持球队数字化运营与全球商业拓展,凸显Airwallex在跨境支付与企业金融服务领域的技术能力。通过此次合作,空...
15:06
微新创想:2026年2月28日,浙江吉利控股集团获国家人社部全国博士后管理委员会批准,取得独立招收博士后研究人员资格。这一荣誉标志着吉利在科技创新领域的实力得到了国家级的认可。 作为全国少数获此资格的民营企业,吉利在科研人才培养方面展现出卓越的领导力和前瞻性。自2006年设立博士后科研工作站以来,吉利已累计招收博士后研究人员138人,为企业的技术发展注入了强...
15:06
微新创想:2026年3月1日,沙特电力公司(SEC)宣布完成更名,正式启用“沙特能源公司”新名称及全新品牌标识。此次更名由沙特能源部主导,旨在反映公司业务从传统电力向综合能源服务的战略升级。综合能源服务涵盖可再生能源、储能、智能电网等多个领域,标志着沙特能源产业迈向多元化和可持续发展的重要一步。 微新创想:更名即日起生效,覆盖所有官方文件、数字平台及实体设施...
14:30
微新创想:网易旗下太空夺宝FPS游戏《无主星渊》于2026年2月28日官宣停运 定于4月30日15时正式终止运营 游戏自2月28日14时起关闭全平台下载 充值及新用户注册 同期官网也将下线 《无主星渊》于2025年9月24日上线国服 Steam国区售价为86元 停运后 未使用的游戏内收费星渊币将按1:1比例兑换为网易通用点数 玩家还可获得《梦幻西游》《第五人...
14:30
微新创想:理想汽车产品线负责人汤靖在2026年2月28日晚发文明确表示理想MEGA采用纯电专属架构不提供增程版本 理想MEGA的设计理念强调最大化内部空间为此车头仅保留必要的碰撞溃缩区域以确保乘客安全同时优化车内布局 加装增程器需要增加车头长度这将与MEGA的设计初衷相违背因此该车型不会推出增程版本 理想MEGA于2024年3月1日正式发布并在同年3月11日...
14:30
微新创想:2026年3月1日 中国移动旗下“和生活”便民服务应用发布公告 因产品运营策略调整 该服务将于2026年4月30日24:00正式下线并停止所有功能 该应用覆盖政务 医疗 交通 教育等多领域 支持全国300余城市本地化服务 用户届时将无法访问相关服务 客服咨询渠道仍可通过10086热线获取 中国移动表示对此造成的不便深表歉意 并建议用户提前做好相关服...
13:27
微新创想:3月1日,加密货币交易平台Coinbase宣布部分用户在交易过程中遇到了延迟或性能下降的问题。该事件影响范围广泛,覆盖全球多个地区,涉及现货交易和衍生品交易功能。尽管平台未公布具体受影响的用户比例和地域分布,但已明确表示此次问题并非由安全事件引发。 微新创想:Coinbase的技术团队已经启动紧急响应机制,正在积极排查系统瓶颈并优化负载分配策略。平...