新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月06日

16:01
微新创想:2026年4月6日,青岛市工信局等9个部门联合印发《青岛市汽车行业稳增长工作方案》。该方案旨在通过多项举措推动青岛市汽车行业的稳步增长,提升产业竞争力。 方案明确指出,2026年内将重点推动莱西市功能型无人车项目建成投产。此举不仅有助于完善青岛市智能交通体系,也将为本地制造业带来新的发展机遇。 同时,方案提出要修订无人驾驶道路测试实施细则,进一步规...
16:01
微新创想:4月6日至4月8日18:00,Vault Games开发的3D跑酷游戏《Evergreen Valley:The Parkour Game》在Epic Games Store中国区开启限时免费领取活动。此次限时免费活动由开发者自主发起,并非Epic官方限免。游戏以登高为主题,是一款结合平台跳跃与跑酷元素的动作游戏。玩家将在一个群山环绕的农场小镇中展...
16:01
微新创想:4月6日,模拟经营游戏《房产达人》在Steam国区开启限时免费领取活动,截止时间为4月7日凌晨1:00。该游戏由Frozen District开发,原价92元。此次限时免费活动让玩家有机会以零成本体验这款游戏。 玩家在游戏中可以化身单人装修队,通过清理、改造、装修等操作翻新旧房并出售获利。游戏提供了丰富的玩法内容,让玩家在经营过程中感受到真实的房产...
15:59
微新创想:微信支付近期宣布将进行服务整合,原有的“微信支付有优惠”小程序相关功能将统一迁移至“微信支付提现笔笔省”小程序。此次调整旨在优化用户体验并提升服务效率,用户可通过新小程序领取提现免费券,或参与其他活动获取更多权益。 此次调整涉及原有“微信支付有优惠”小程序的部分功能,包括金币领取与赠送等。自2026年5月11日0时起,这些功能将正式下线。但需要注意...
15:31
微新创想:4月6日,深圳市首个跨境电商“先查验后装运”监管场站——深国际龙华跨境物流智慧集拼中心正式启用。该场站位于深圳龙华区,由深圳国际控股有限公司运营,面向跨境电商出口企业。新模式下,拼箱货物以散件形式入场,完成全部海关查验后再集拼装运,解决传统模式中“一票中控、整柜滞留”问题,提升通关效率约40%。此举系深圳海关优化跨境物流监管的重要实践。 微新创...
15:30
微新创想:2026年8月起,宝马慕尼黑历史悠久的整车制造厂将启动i3纯电动轿车批量生产,标志着其新世代(Neue Klasse)车型全球量产正式开启。这一举措不仅代表着宝马在电动化道路上迈出的重要一步,也预示着传统制造模式向更加环保和高效方向的转变。 该厂计划于2027年彻底停止内燃机汽车的生产,全面转向纯电车型。这意味着宝马将加速其向可持续出行的转型步伐,...
15:30
微新创想:2026年4月6日,据产业链内部人士透露,富士康已开始试产苹果首款折叠屏iPhone。这款手机采用大折叠设计,预计将在2026年下半年正式面世。苹果早在2025年就已向其供应链发出出货目标指引,明确了该款折叠屏手机的量产计划和节奏。这标志着苹果正式踏入折叠屏手机市场,进一步完善其高端移动设备的产品形态布局。 目前该产品仍处于工程验证阶段,相关技术细...
15:30
微新创想:2026年4月6日,俄罗斯国家航天集团总经理巴卡诺夫表示,俄将分阶段研发保障宇航员健康安全的载人火星探测技术。此举旨在为未来火星载人任务奠定基础。 目前人类已具备近地天体飞行能力,完成载人登月,并实现火星自动探测器着陆与巡视。这些成就为后续的载人探索提供了宝贵的经验和技术积累。 俄方强调技术研发将注重生命保障、长期深空飞行适应性及返回安全性。这些关...
15:30
微新创想:4月2日,苏宁易购与TCL在全国范围内启动“春季超级购物节”。此次活动从4月2日持续至4月中旬,覆盖全国范围内的线上线下销售渠道。双方携手推出新一代AI家电产品,不仅带来前沿科技体验,更以沉浸式场景互动和实惠的价格让利,满足消费者对家庭改善型消费升级的需求。 此次合作聚焦于高品质、智能化和场景化家电的推广,旨在推动智能家居产品走进更多家庭。通过创新...
15:30
微新创想:2026年4月6日,美国投资人马克·库班指出,大型上市公司CEO正面临AI引发的结构性困境。他称传统企业陷入“创新者的AI困境”:要么主动转型为AI驱动模式,要么停滞不前。两种路径均易招致股东诉讼,导致股价下跌。 库班强调,CEO须主动运用AI工具探索转型,否则将严重落后。他预测未来企业将分化为“真正掌握AI的公司”与“其他所有公司”,后者生存堪忧...
15:30
微新创想:2026年4月6日(星期一)是清明假期最后一天,全国迎来返程客流高峰。当天,公路交通压力显著上升,预计路网总流量将达到5900万辆。午后时段,入城方向的车流尤为密集,粤港澳大湾区和长三角地区的高速公路出现严重拥堵现象。 微新创想:铁路运输方面,预计当日发送旅客人数为2080万人次,铁路部门将加开1369列列车以应对返程高峰。整个清明假期,全国铁路累...
15:30
微新创想:4月6日,京东物流宣布快运产品体系全面升级。此次升级以一体化供应链能力与运营底盘为支撑,推出重货特快、重货标快、重货特惠三大产品序列,并将快运首重门槛由20kg下调至15kg。升级旨在更好满足电商零售、产地生鲜等场景的次重货发运需求,提升时效性与服务覆盖广度。 此次快运产品体系的升级,标志着京东物流在重货运输领域迈出了重要一步。通过优化产品结构,京...