新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月14日

00:06
微新创想:2025年8月至今,哈曼集团积极配合广东警方成功破获四起制售假冒“JBL”“harman/kardon”商标案件,捣毁了4家制假工厂及多个仓库。此次行动中,执法部门查扣了包括琉璃四代、T720BT、FLIP7、GX328在内的大量假冒产品,总计数万台,涉及蓝牙音箱、耳机以及汽车音响等多个产品类别。 微新创想:案件中涉及的假冒产品不仅在外观上与正品高...
00:06
微新创想:2026年3月13日,奔驰全新入门级越野车(代号“小G”)在德国斯图加特周边再度现身路试。测试车伪装大幅减少,车身轮廓清晰,贴纸含酸绿色与浅灰色小写“g”字母,暗示命名或为“g-Class”。 微新创想:该车定位低于现款G-Class,造型更圆润可爱,配备高窗线、短车身、圆形大灯及夸张轮拱。整体设计风格更加现代化,同时保留了奔驰越野车的经典元素。 ...
00:06
微新创想:CD Projekt RED近日正式回应了玩家对于《赛博朋克2077》未来内容更新的疑问。在2026年3月13日,该公司明确表示目前没有为这款热门游戏开发新DLC或资料片的计划。这一消息是在玩家通过微软XGP平台体验游戏后,针对扩展内容的期待而作出的官方回应。 公司方面强调,如果未来有新的开发计划,将会第一时间向玩家公布。目前,《赛博朋克2077》...

2026年03月13日

22:59
微新创想:2026年3月12日,科技媒体Notebookcheck披露,驰为CoreBook Plus笔记本存在系统性CPU虚标行为。该机宣称搭载AMD锐龙5 7430U(Zen 3架构),实测为锐龙5 5500U(Zen 2架构)。BIOS、Windows系统、CPU-Z等工具均被篡改以伪装型号。 微新创想:拆机确认OPN编号100-000000375,与...
22:59
3月13日,上海市商务委员会印发《打响上海定制品牌 促进消费提质扩容总体方案》。方案明确建立“上海定制Shanghai Style”统一视觉标识体系,并配套实施服务认证评价制度。通过认证的市场主体或产品可获授权使用该标识,纳入官方推荐名录,实行定期复审和动态管理。此举旨在提升上海定制产业标准化、品牌化与国际化水平,增强消费供给质量与辨识度。
22:59
微新创想:2026年“3·15”晚会定于3月15日20时播出 主题为“放心消费 品质生活” 晚会由中央广播电视总台主办 将于北京录制并面向全国直播 本届重点监督食品安全、公共安全、金融安全及广告市场等领域侵害消费者权益的违法行为 通过曝光典型侵权案例 强化消费者权益保护 助力提振消费信心 推动品质升级 晚会延续一贯的调查揭秘风格 旨在促进监管协同与行业规范
22:59
微新创想:3月13日晚,吉利银河M7在杭州完成全球首次技术首秀 吉利银河M7作为银河M系列的首款中级电混SUV,正式亮相并展示了其领先的技术实力 新车计划于2024年4月正式上市,为消费者带来全新的出行体验 车身尺寸方面,银河M7达到了4770×1905×1685mm,轴距长达2785mm,展现出宽敞的内部空间和良好的通过性 搭载29.8kWh的神盾金砖电池...
22:59
微新创想:2026年3月13日,梅赛德斯-奔驰集团正与吉利控股就深化合作展开早期磋商,聚焦下一代电动汽车项目。此举旨在提升奔驰在华研发效率、缩短周期并降低成本。双方的合作或将依托吉利GEEA4.0电子电气架构,但目前并未涉及平台共享的具体讨论。 当前,梅赛德斯-奔驰在华的主要合资方仍为北汽集团。然而,吉利控股作为奔驰的重要股东,其在新能源汽车领域的布局和技术...
22:28
微新创想:2026年3月13日,小鹏汇天宣布完成近2亿美元新一轮股权融资,投资方包括高瓴创投、红杉中国等。至此,其历史融资总额达10亿美元,成为亚洲载人低空飞行领域融资最高的企业之一。 微新创想:位于广东的全球首个飞行汽车现代化量产工厂已于2025年9月建成并投入试产。该工厂建筑面积达12万平方米,具备高效的生产能力,满产情况下可实现每30分钟下线一台‘陆地...
21:51
微新创想:2026年3月13日 工信部发布第405批《道路机动车辆生产企业及产品公告》公示 悦达起亚全新一代赛图斯首次亮相 新车长4460mm 宽1830mm 高1640mm 轴距2690mm 采用分体式竖向大灯 隐藏门把手及贯穿式尾灯等设计 基于升级K3平台打造 提供1.5L(84.4kW)和1.5T(147kW)两种动力 配套自动变速箱 该车已于2025...
21:19
微新创想:3月13日,林清轩于港交所发布盈利预告。公司预计2025年经调整净利润为3.96亿至4.01亿元人民币,较2024年同期增长97.8%至100.3%。这一显著增长体现了公司在多个关键领域的战略成效。 品牌高端化战略的深化是推动业绩增长的重要因素之一。林清轩近年来不断加强品牌定位,提升产品附加值,成功吸引了更多高净值消费者。通过精准的市场定位和优质的...
21:19
微新创想:3月14日13时,中国女足将在女足亚洲杯1/4决赛中迎战中国台北女足。比赛将在澳大利亚举行,由中国足协统一组织参赛。这场对决不仅关乎中国队能否顺利晋级半决赛,还将直接决定其是否能够获得2027年巴西女足世界杯的参赛资格。 若中国女足在比赛中取得胜利,她们将晋级半决赛,对阵东道主澳大利亚队。这不仅是一次重要的晋级机会,更是向世界展示中国女足实力的重要...