新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月29日

00:31
三星公司于1月28日正式宣布,将推出一项具有里程碑意义的全新隐私保护功能,该功能将全面部署于Galaxy系列智能手机及平板电脑产品线。这项由三星完全自主研发的创新技术,将彻底改变用户数据处理的模式,通过强化本地数据处理能力和精细化权限管控,实现完全无需依赖云端分析的安全机制。这一重大举措正是为了积极回应全球用户日益增长的生物信息与应用行为数据安全关切,彰显了...
00:00
2026年1月下旬,美国好市多多家门店因RAM和GPU盗窃频发,已从展示整机中拆除内存模块。事件发生于多地仓储式卖场,涉事人员包括一名持Instacart配送员身份进入的窃贼。内存与显卡因二手溢价高、供需失衡,成为盗窃主要目标。此前好市多已将显卡移至柜台后保管,现进一步升级防盗措施。此举反映硬件零售端正面临严峻安全挑战。

2026年01月28日

23:30
1月28日,广东深圳水贝黄金市场迎来历史性时刻,黄金回收克价强势突破1100元大关,刷新近期高点。这一现象的背后,是国际金价持续走高的强力支撑,吸引了大量投资者和消费者集中出售黄金套现,导致市场回收量呈现爆发式增长。多家黄金回收机构纷纷反映,近期咨询量与成交额较去年同期实现了惊人的同比大幅增长,市场活跃度明显提升。 值得关注的是,部分二手交易平台敏锐捕捉到这...
23:30
1月28日,合肥酷芯微电子股份有限公司正式向香港交易所提交上市申请,拟主板挂牌。公司注册地为安徽合肥,主营业务为高性能AI边缘芯片研发与销售。本次上市由华泰国际独家保荐。此举旨在拓展国际融资渠道,加速全球化技术布局与产能建设。申请尚待港交所审核及后续聆讯程序。
23:30
2026年2月1日,保时捷设计团队迎来重要人事变动,46岁的Tobias Sühlmann将正式接任设计总监一职,开启品牌设计新篇章。这一交接时刻不仅标志着保时捷设计进入新阶段,更体现了公司管理层在代际传承上的精心布局。作为前任设计总监Michael Mauer长达21年的继任者,Sühlmann的任命恰逢新任CEO Michael Leitner推动公司管...
22:30
微新创想1月28日消息,今日,小米CEO雷军宣布,小米SU7 Ultra将于1月29日14:00正式入驻游戏《GT赛车7》,这是首台在《GT赛车》中上线的中国品牌车型。雷军表示,欢迎全球玩家到游戏里体验小米SU7 Ultra的精准操控和赛道上的稳定表现。2025年6月,小米与《GT赛车》游戏开发商Polyphony Digita...
22:30
微新创想1月28日消息,高德地图宣布,正式上线狂犬病暴露预防处置门诊地图,让救治更快速便捷。目前已经覆盖了北京、上海、广州、深圳、杭州、宁波、南京、苏州、无锡、成都、武汉、信阳、天津、西安、温州、亳州、郑州、济南、青岛、合肥等20个城市,共2353家门诊,其他城市会陆续上线。打开高德地图APP,搜索狂犬疫苗”关键词,即可快速进入...
22:30
微新创想1月28日重磅报道,小米旗下REDMI品牌正式揭开Turbo 5系列的神秘面纱。今日,REDMI产品经理胡馨心通过官方渠道发布了该机型的真机展示视频,并自豪地宣称这是"全网首看"。这一消息迅速点燃了科技爱好者的热情,让大家对这款备受期待的新机充满了无限好奇。 据了解,REDMI Turbo 5系列共推出三款时尚配色:祥云白、浅海青和暗影黑。整体设计语...
22:29
微新创想1月28日深度报道,近日一起惊险的高速公路事件引发社会广泛关注。据权威媒体报道,吉林高速公安局四平分局指挥中心紧急接警,在长太高速99公里处往太平川方向,一名行人竟在车流不息的高速公路上行走,其行为对自身及过往车辆均构成严重安全威胁。 经过警方初步调查发现,该男子与妻子带孩子从长春出发,计划返回家乡探亲。当日19时30分许,一家人在流水服务区休息时,...
22:29
微新创想1月28日消息,今天小米举办了2025年小米集团质量最高荣誉小米质量奖”的表彰大会,而卢伟冰本人也是回应了此事。为什么要设立一个质量奖呢?卢伟冰直言,用户会更用更高的标准,审视我们的每一款产品,每一项服务。这种高预期,既是压力,更是动力。站在小米发展的新起点,我们要保持战略定力,做好我们自己,用更高的标准要求自己。卢伟冰...
22:29
2026年1月28日,Apple大中华区董事总经理葛越宣布Apple Creator Studio订阅服务正式上线。该服务面向Mac、iPad及iPhone用户,整合Final Cut Pro、Logic Pro、Pixelmator Pro等专业创作工具,以及Keynote、Pages、Numbers等办公App的AI增强功能。标准订阅价为38元/月或3...
22:29
2026年1月28日,三星Galaxy S26、S26+及S26 Ultra三款机型已获美国联邦通信委员会(FCC)认证。认证机型面向美国市场,含运营商锁定版与原厂解锁版。全系搭载骁龙8 Elite Gen 5处理器,支持5G毫米波/Sub-6GHz、Wi-Fi 7、蓝牙LE、NFC、UWB及无线充电。关键升级为首次引入卫星通信功能,依托SCS监管框架与N...