新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月28日

00:58
微新创想:2026年3月,天岳先进(688234.SH)与四家合作方签署碳化硅产业链战略合作框架协议。此次合作旨在推动新能源汽车、半导体、先进制造及产业投资等关键领域的协同发展。各方将共同推进8英寸碳化硅芯片生产线项目的建设与实施,进一步强化在碳化硅材料领域的布局。 该协议属于框架性安排,不涉及具体交易金额,也不需要经过董事会或股东大会的审议程序。因此,预计...

2026年03月27日

23:49
微新创想:任天堂近期公布了多项重磅游戏计划,引发玩家广泛关注。据消息人士Nate the Hate在2026年3月27日透露,任天堂将在今年夏季推出全新3D动作游戏《星际火狐》。这款游戏将回归经典玩法,同时支持线上多人模式,为玩家带来更加丰富的互动体验。 任天堂还计划在同年假期档前后推出《塞尔达传说:时之笛》的重制版。这一版本将作为纪念该系列诞生40周年的特...
23:49
微新创想:2026年3月26日 微软向Windows 11推送了KB5079391预览更新 该更新旨在修复自2025年5月28日KB5058499版本起存在的WUSA路径错误问题 该问题主要影响企业环境 表现为管理员在通过网络共享安装多个.msu文件时 触发ERROR_BAD_PATHNAME错误 这一错误可能导致更新安装失败 从而影响系统的正常运行 微软此...
23:49
微新创想:俄罗斯国家航天集团副总裁谢尔盖·克里卡列夫于3月27日宣布,俄新一代载人飞船将在2028年实现首次飞行。这一消息标志着俄罗斯在载人航天领域迈出了重要一步。目前,该飞船已完成静态与动态测试,正在推进降落伞系统的飞行测试以及前往俄罗斯轨道服务站的相关准备。 新一代载人飞船的设计目标是承担地月等深空任务,而非取代现役的“联盟”飞船。这意味着俄罗斯将拓展其...
23:18
微新创想:苹果公司近日向使用iOS 13至iOS 17.2.1等旧版本系统的iPhone和iPad用户推送了一条关于锁屏安全的重要通知 该通知通过“设置”应用向用户发出,提醒他们注意潜在的安全威胁。苹果指出,黑客正在利用某些漏洞进行网页攻击,这些攻击可能造成用户数据被窃取的风险 苹果已于3月11日发布了多个系统更新,包括iOS 15.8.7和iOS 16.7...
23:18
微新创想:3月27日,智利国家铜业公司(Codelco)首席执行官在圣地亚哥举行的公开会议上表示,全球铜需求依然保持稳定,这将为铜价和市场提供有力支撑。此次表态聚焦于全球最大国有铜企对当前市场的看法,显示出公司对未来走势的积极预期。面对近期市场对铜供应过剩以及需求放缓的担忧,Codelco的发言被视作一种市场信心的传递。虽然公司并未公布具体的数据支持这一观点...
23:18
微新创想:2026年3月27日,广汽集团发布2025年年报。全年营业总收入达到965.42亿元,同比下降10.43%。归母净利润出现亏损,金额为87.84亿元,同比下滑1166.51%。公司表示,这一业绩变化主要受到国内汽车市场竞争加剧以及投资收益减少的影响。 与此同时,广汽集团在国际化方面取得了显著进展。自主品牌海外终端销量同比增长48%,业务覆盖国家数量...
23:18
微新创想:3月27日,亿纬锂能发布公告,宣布拟与惠州仲恺高新区管委会签署协议,投资约60亿元建设一个60GWh的储能(动力)电池生产项目。项目选址位于惠州,预计用地面积约为500亩。目前,该项目仍需提交至公司股东大会进行审议,且不构成关联交易或重大资产重组的情形。 此次投资计划的核心目标在于进一步扩大公司产能,优化现有产业结构,以增强在新能源领域的竞争力。随...
23:18
微新创想:3月27日,TCL科技发布2025年年度报告 公司全年营收达到1840.6亿元,同比增长11.7% 归母净利润为45.2亿元,同比增长188.8% 经营现金流为440.2亿元,同比增长49.1% 资产负债率降至64.2%,显示出公司财务结构的优化 现金及等价物达到505.7亿元,为公司稳健运营提供了坚实基础 旗下TCL华星实现营收1052.4亿元,...
23:18
微新创想:艾利和于3月27日正式推出AK Cradle扩展底座,这款新品专为SP4000、PD10、PD20等便携播放器设计,旨在提升用户的音频体验与设备使用便利性。AK Cradle不仅具备充电功能,还能够扩展音频系统,满足更多专业或高端音频需求。 该底座配备双Neutrik XLR输出接口,为用户提供了更稳定的信号传输方式,适用于监听耳机、专业音响设备等...
22:47
微新创想:2026年3月27日,三星电子正式推出高性能PCIe Gen5 QLC消费级固态硬盘BM9K1。这款固态硬盘专为个人AI计算场景设计,搭载先进的RISC-V指令集主控芯片,显著提升了数据处理效率。BM9K1的最高顺序读取速度达到了11.4GB/s,相比前代产品BM9C1a,能效提升了23%。这一突破性进展使得BM9K1在保持高性能的同时,也实现了更...
22:47
微新创想:卡普空于2026年3月27日宣布将为《生化危机:安魂曲》开发剧情扩展DLC 此次更新不仅带来了新的剧情内容,还同步上线了免费更新。新增的拍照模式让玩家能够更好地记录游戏中的精彩瞬间,增强了游戏的沉浸感和互动性 同时,此次更新还修复了多项已知问题,包括进度卡死、崩溃以及GPU画面异常等,提升了游戏的稳定性和流畅度。过场动画的表情也进行了优化,使角色表...