新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月08日

01:49
2026年2月8日,记者观察发现,元宝APP春节红包口令已优化,通过在口令上方添加特殊符号,实现在微信内一键复制,用户可粘贴至元宝APP参与活动;而千问APP的同类型春节分享口令,目前仍无法在微信平台复制。此举系平台适配调整,旨在提升用户参与春节营销活动的便捷性。截至发稿,千问方面尚未公布修复时间表。
00:48
2月7日凌晨,山西朔州山阴县佳鹏生物科技有限公司一生产车间发生爆炸。事故造成7人遇难、1人失联,搜救工作持续进行。截至当日10时,首批发现5名遇难者;后续在废墟及周边新增发现2具遗体。救援人员正开展地毯式排查,并核查作业人员信息与企业实控情况,全力搜寻最后1名失联人员。

2026年02月07日

23:48
2026年2月6日(周四),世界首富埃隆·马斯克在X平台发帖称‘金钱买不到幸福’,该帖浏览量超1亿次。多位亿万富翁回应:阿克曼建议其重视助人价值与长期伴侣关系,库班指出金钱仅放大既有情绪状态。评论呈现两极,既有共鸣亦有批评,涉及财富分配、言行影响及个人生活争议。马斯克近期因SpaceX与xAI合并身家突破8000亿美元,并持续面临家庭事务与爱泼斯坦关联等舆...
23:18
2026年1月,上海洋山港国际干线集装箱船舶进出港达834艘次,同比增长4.38%、环比增长5.04%,首次突破800艘次,创历史新高;当月集装箱吞吐量261.5万标准箱。此次增长得益于春节前外贸备货高峰及航线加密等举措,实现新年航运生产‘开门红’。
23:18
2026年春节期间(2月1日—2月7日),国家电网预测新能源汽车单日充电量峰值超3400万千瓦时,同比增长17%;高速充电量峰值超1100万千瓦时,同比增长超23%。高峰集中在2月14—15日及21—23日。江苏、浙江、安徽三省高速充电量将破纪录,长深、沈海、沪昆高速充电桩最繁忙。国家电网已部署5567个重点保障站点,并于2月12—23日通过“e充电”Ap...
23:18
2026年2月7日,安全研究员保罗发现AMD Windows驱动自动更新程序存在高危安全漏洞。该程序在下载驱动包时使用未加密HTTP连接,攻击者可通过劫持ati.com域名实施中间人攻击,利用更新进程的管理员权限执行恶意代码。漏洞已提交AMD,但官方以“MITM不在修复范围内”为由暂不处理。保罗通过逆向分析确认,更新列表虽经HTTPS获取,但实际下载链接为...
22:17
2026年2月7日,印度塔塔钢铁公司宣布正制定新一轮成本削减计划。此举旨在应对全球钢铁市场需求疲软及原材料价格波动压力,提升运营效率与盈利水平。计划涵盖优化产能布局、推进自动化升级及精简管理架构等措施,预计将在未来12个月内分阶段实施。公司强调该计划不涉及大规模裁员,而是侧重结构性调整与技术赋能。
22:17
2026年2月7日,位于四川省达州市高新区的达州燃气电站二期工程4号机组完成168小时满负荷试运行,正式投入商业运营。该项目由中国能建西南电力设计院总承包,二期新建2台700兆瓦H级燃机机组,与一期联合运行后总装机达210万千瓦,成为四川最大天然气发电基地。项目采用全球领先H级技术,联合循环效率达63.72%,创国内同类型能效新标杆。投运后年减排二氧化碳约...
22:17
2月7日,国网青海省电力公司在海拔约5000米的青海玉树地区成功实施超高压等电位带电作业。此次作业由国家电网青海超高压公司执行,系中国首次、世界最高海拔的500千伏超高压线路等电位带电检修。作业克服了低气压、缺氧、强紫外线等极端环境挑战,验证了高海拔复杂条件下带电作业技术可行性与安全性,为青藏高原电网安全稳定运行提供关键技术支撑。
21:47
2026年2月7日,极氪8X高性能版正式进入工信部最新新车公告。该车由吉利旗下高端品牌极氪推出,定位高性能新能源SUV,外观采用全黑运动设计,配备碳纤维套件、315mm宽胎及电动大尾翼,最高时速230km/h,并搭载红外夜视系统。动力预计搭载三电机系统,综合功率约1400马力,基于900V高压架构,智能平台为千里浩瀚H9与浩瀚AI数字底盘。新车将对标宝马X...
21:47
据悉,英特尔Arrow Lake Refresh桌面处理器三款型号——酷睿Ultra 7 270K Plus、Ultra 5 250K及250KF,将于2026年3月23日22:00全球评测解禁。原计划四款SKU中,旗舰Ultra 9 290K Plus或已取消发布,主因市场需求疲软及竞品(如AMD锐龙9 9950X3D)竞争加剧。华硕等厂商已为800系主...
21:47
2026年2月7日,广汽传祺正式开启2026款M8 HEV预售,尊贵版预售价22.98万元、至尊版24.98万元。新车搭载行业首创串并联两挡双电机混动系统,匹配2.0TM混动专用发动机,实现一箱油续航1057km。预售权益包括1000元抵8000元购车金、置换补贴10000元起、国家以旧换新补贴12000元、0首付5年期金融方案及老友专属权益。新车尺寸与现...