新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月20日

18:15
在人工智能领域,中国科技巨头正经历一场关键转型——从单纯的技术竞赛转向激烈的用户争夺战。这一变革的核心驱动力,是大模型技术向日常数字生活的快速渗透。最新市场数据显示,百度“文心一言”的月活跃用户数已成功突破2亿大关,成为国内首个跻身“两亿俱乐部”的国产大模型产品。这一里程碑不仅彰显了其技术实力,更揭示了AI应用普及的惊人速度。紧随其后的是阿里巴巴的“通义千问...
18:15
阶跃星辰近日震撼发布其最新开源多模态视觉语言模型——Step3-VL-10B,这一突破性成果标志着小参数量模型在智能表现上实现了跨越式飞跃。该模型仅以10B的参数规模,便在多项权威基准测试中展现出令人瞩目的跨级别竞技能力,成功攻克了小参数模型难以兼顾高智能水平的行业难题。 在核心性能测试中,Step3-VL-10B不仅稳居同规模模型的SOTA(State...
17:45
近日,有消息称,这家市值万亿美元的科技巨头在一项集体诉讼中被指控曾直接联系安娜档案馆(Anna's Archive),试图获取高达 500TB 的盗版电子书数据,以用于其大模型的训练。这一行为引发了书籍作者们的强烈反对,他们认为英伟达的举动不仅侵犯了版权,还显现出其在竞争压力下的极端手段。安娜档案馆是一个知名的盗版电子书资源库,尽管其曾多次发出警告,...
17:45
2026年1月20日,全球领先的VoIP服务提供商Zadarma重磅发布其创新AI语音智能体,为企业客户开启全天候、多语言、高拟真的智能电话应答与客户服务新纪元。这款革命性智能体不仅能够以自然流畅的语音自动接听来电,精准理解复杂用户意图,更基于企业专属知识库提供即时准确信息,并在必要时实现与人工客服的无缝衔接,从而大幅提升服务效率与客户满意度。 作为Zada...
17:33
2026年1月20日,显卡制造商映众在荷兰知名科技论坛Tweakers上发布了一份重要声明,揭示了其欧洲RMA中心过去三年多时间里处理过的RTX 4090/5090显卡因12V-2×6供电端子过热熔毁的售后案例仅有15起。这一数据引发了业界的广泛关注,也进一步印证了该系列显卡在供电系统方面的稳定性。据该中心透露,尽管存在供电接口故障的案例,但由用户使用不当导...
17:33
2026年1月20日,零刻发布SER10系列迷你主机,搭载AMD锐龙AI 9 HX 470处理器,基于Zen 5架构,具备12核24线程,加速频率达5.2GHz,并集成XDNA 2 NPU,提供55 TOPS AI算力。该机配备Radeon 890M核显,支持4K剪辑与3D渲染。分为Pro与Max两款型号,分别采用板载LPDDR5X内存和可扩展DDR5内存...
17:33
2026年1月,江苏中科可蓝宣布完成数千万元天使+轮融资。本轮融资由金桥基金、安徽丰原生物联合投资,老股东麟阁创投超额跟投。资金将用于全自然域降解塑料PDA的研发迭代、产能扩充及商业化落地。PDA是一种可在全自然环境下完全降解的生物聚酯材料,适用于包装、医疗、3D打印等多个领域,助力解决塑料污染问题。
17:33
2026年1月20日,大桥局控股宣布完成1200万元天使轮融资。本轮融资将用于深化北京、河南区域市场布局,拓展涵盖投资、商务、财税、供应链等全链条企业服务业务。作为一家多元化的综合企业管理服务提供商,大桥局控股已构建覆盖物业管理、珠宝销售、数字化运营及专业维保等核心板块的生态体系。此次融资标志着公司正式进入加速发展新阶段。
17:33
2026年1月20日,珠海机场开通首条跨境电商货运航线,由京东航空执飞。该航线使用波音738全货机,每周运营6班,从珠海飞往菲律宾克拉克,单次载货约18.5吨。此次开通的航线是珠海机场国际货运口岸启用以来的第二条定期货运航线,主要服务于希音、拼多多等电商平台的华南地区出口货物运输。在珠海市商务局、交通运输局及珠海交控集团推动下,新航线将提升跨境电商物流效率...
17:33
2026年1月20日,Rokid宣布其Rokid Ai Glasses Style正式上市销售。该产品此前在2026年国际消费电子展(CES)全球首发,标志着AI眼镜迈向主流应用的重要一步。新品重38.5克,起售价299美元,支持语音为核心的多模态交互,配备全天候舒适佩戴设计与处方镜片解决方案,续航达每日12小时使用、24小时待机。
17:33
2026年1月20日,蚂蚁阿福升级其PC端,面向医生群体推出DeepSearch(深度搜索)功能,旨在打造中国版“Open Evidence”。该功能免费向医生、医学生及基层医疗工作者开放,提供文献搜索、临床诊疗与科研支持等专业服务。通过健康咨询与DeepSearch两大能力,蚂蚁阿福助力医学从业者提升工作效率,减轻工作负担。此次升级标志着其在用户端与医生...
17:33
据科技媒体MacRumors近日报道,苹果预计将于2026年9月发布iPhone 18 Pro及Pro Max,两款机型将标配12GB LPDDR5内存,与现款iPhone 17 Pro系列保持一致。天风证券郭明錤与广发证券蒲得宇均对此作出预测。此外,iPhone 18标准版也有望升级至12GB内存,较当前8GB提升明显,但发布时间或推迟至2027年3月。...