新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月06日

01:33
微新创想:4月3日,阿布扎比国家石油公司(ADNOC)旗下哈布山综合设施发生事故,部分设施受损。事件发生在阿联酋阿布扎比酋长国,由ADNOC天然气部门确认。公司表示事故未造成人员伤亡,运营安全可控,客户天然气供应不受影响。目前正开展设施评估与修复工作。此次事故原因仍在调查中,初步判断与非核心生产环节有关。
00:00
微新创想:4月5日,国际乒联单打世界杯男单决赛在泰国曼谷打响,中国选手王楚钦以4-3的比分逆转战胜日本新锐选手松岛辉空,成功夺得个人首个世界杯单打冠军。这是王楚钦职业生涯中的重要突破,标志着他正式跻身世界顶尖乒乓球选手行列。 比赛过程中,王楚钦与松岛辉空展开了一场激烈的对决。双方在前两局中各胜一局,但王楚钦在不利局面下展现出强大的心理素质和出色的技战术水平。...
00:00
微新创想:EA宣布《植物大战僵尸 HD》(iOS版)将于2026年6月24日关闭在线服务并从App Store下架 EA近日正式公布消息 《植物大战僵尸 HD》(iOS版)将在2026年6月24日停止提供在线服务 并从App Store中移除 这一决定意味着所有已购买该游戏的玩家仍可以下载并离线游玩 但多人合作 内购以及排行榜等在线功能将不再可用 EA此举是...
00:00
微新创想:3月31日,中国航发燃气轮机有限公司与瀚辰精英海洋工程(江苏)有限公司在江苏南通正式签署协议,向其交付5台“太行7”燃气轮机。该批设备将用于马来西亚国家石油公司Sepat综合再开发项目中的浮式生产储卸油装置(FPSO)。此次合作不仅体现了国产高端装备的国际竞争力,也为我国海洋工程装备制造业迈向全球市场迈出了坚实一步。 “太行7”燃气轮机是我国首台拥...

2026年04月05日

22:55
微新创想:2026年4月5日,smart品牌正式公布其专为中国市场打造的首款豪华掀背轿车内饰手稿。新车计划于2026年北京车展上进行全球首秀,外观官图也已发布。这款车型是smart迄今为止推出的最大尺寸车型,车身长度达到4906毫米,宽度为1922毫米,高度为1508毫米,轴距更是长达2926毫米,展现出更加宽敞的内部空间和更舒适的乘坐体验。 微新创想:新车...
22:55
微新创想:2026年4月3日,北交所上市委审议通过临海市新睿电子科技股份有限公司首发申请。公司主营工业机器人控制系统及伺服系统研发销售,近年来业绩稳步增长。2023年至2025年,公司营业收入由2.04亿元增至3.18亿元,净利润由3096.6万元升至5904.82万元,展现出良好的发展势头。 微新创想:根据公司披露的财务数据,2026年预计营业收入将达到3...
22:55
微新创想:4月3日,杭州华方资本披露,成立于2024年10月的明视脑机已连续完成天使轮、天使+轮、天使++轮融资,累计金额1.5亿元。本轮融资由中科创星、领屹投资、海贝创投等多家机构联合参与。资金将重点投入视觉重建侵入式脑机接口产品研发,加速推进至临床验证及注册申报阶段。 公司创始人刘冰为中科院神经生物学博士,师从国际脑机接口领域权威专家。他凭借深厚的学术背...
22:55
微新创想:2026年4月5日,微星正式发布新款泰坦18 Max(Raider 18 Max HX)游戏本。这款产品是微星在高性能笔记本电脑领域的一次重要突破,专为追求极致游戏体验的用户打造。 该机搭载英特尔酷睿Ultra 9 290HX Plus处理器,性能强劲,能够轻松应对高负载的游戏和专业软件需求。同时配备英伟达RTX 5080笔记本GPU,带来更出色的...
22:21
微新创想:4月3日,上交所上市委审议通过珠海泰诺麦博制药股份有限公司首发申请,确认其符合科创板发行、上市及信息披露要求。该公司成立于2015年,专注于血液制品替代疗法领域,采用科创板第五套上市标准。该标准主要面向符合国家战略、突破关键核心技术、市场认可度高的科技创新企业,显示出公司所处行业的前沿性和技术含量。 审议过程中,上市委重点考察了公司与经销商之间的买...
22:21
微新创想:2026年4月24日,广汽传祺将在北京车展正式发布全新硬派越野SUV。这款车型在设计上展现出强烈的硬派风格,采用方正车身造型,搭配外挂备胎与侧开式尾门,不仅提升了整车的视觉冲击力,也增强了实用性与功能性。外观设计充分体现了对越野文化的尊重与传承,同时兼顾现代审美需求。 新车搭载插电混动系统,结合高效能动力与环保理念,为用户带来更强劲的性能表现与更低...
22:21
微新创想:2026年4月,国产高端品牌未来人类(TerransForce)正式发布移动工作站级笔记本X98W,并于当月开售。这款新品在性能与配置上实现了重大突破,成为市场关注的焦点。 该机搭载英特尔酷睿Ultra 9 290HX Plus处理器,结合英伟达GeForce RTX 5090笔记本GPU,为用户带来强大的计算与图形处理能力。无论是专业设计、视频剪...
22:21
微新创想:4月4日,一款尾号为8888888的手机号码在阿里拍卖平台正式开拍,该号码归属地为山东青岛。此次拍卖的起拍价为260万元,保证金为30万元,仅限本地过户,月租费用为18元。拍卖活动持续24小时,截止时间为4月5日10时。尽管吸引了7112人次围观,但整个拍卖过程中并未有任何竞拍者出价,最终以流拍告终。 在当前的手机号码市场中,稀缺靓号的热度表现并不...