新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月01日

02:14
2026年1月1日凌晨,鸿蒙智行正式公布了其2025年度交付数据,展现出强劲的增长势头。全年累计交付量高达589107台,同比增长32%,这一数字不仅印证了市场对鸿蒙智行的广泛认可,更彰显了其技术实力的持续提升。在月度交付表现上,12月单月交付量达到89611台,连续三个月创下历史新高,进一步巩固了鸿蒙智行在智能出行领域的领先地位。 与此同时,鸿蒙智行发布的...
02:14
2026年1月1日,全球规模最大的“华龙一号”核电基地——福建漳州核电2号机组正式开启商业运营。这一历史性时刻不仅标志着漳州核电一期工程两台核心机组的全面投产,更彰显了我国自主研发的第三代核电技术“华龙一号”在批量化建设方面取得的重大突破。 漳州核电基地作为我国核电发展的标杆项目,规划总建设6台“华龙一号”机组。随着2号机组的成功投运,一期工程的两台机组...
01:09
2026年1月1日,谷歌旗下的自动驾驶先锋企业Waymo正式宣布,已全面启动面向2027年在伦敦展开商业运营的筹备工作。这一历史性举措不仅标志着Waymo正式进军欧洲市场,更象征着全球自动驾驶技术版图的重要拓展。据悉,Waymo计划在伦敦大规模部署其尖端的全自动驾驶车队,为市民提供安全高效的无人驾驶出行服务。此次伦敦扩张战略的核心目标,一方面在于显著提升Wa...
01:09
2025年12月31日,旋极信息通过官方互动平台正式宣布,公司已持续多年为我国航天航空领域提供专业的测试验证工具与服务。旋极信息凭借其卓越的技术实力,深度参与了多项国家级重大工程,包括备受瞩目的载人航天工程以及国产大飞机C919的研发项目。凭借在相关领域的突出贡献,旋极信息已获得国家相关单位的高度认可与表彰。 旋极信息的服务内容涵盖了系统测试、仿真验证等多个...
00:08
近日有可靠消息透露,索尼将在2026年1月6日至2月3日期间,为PlayStation Plus会员提供一款备受期待的免费游戏——《极品飞车:不羁》。这一福利将惠及所有会员,无论其订阅级别是Essential、Extra还是Premium,均可参与领取。这款游戏由EA旗下知名工作室Criterion Games精心打造,作为该系列的正统续作,于2022年12...

2025年12月31日

23:37
2025年12月31日,科技界迎来重磅消息:全球知名的图形处理器巨头英伟达正式宣布战略投资布鲁克菲尔德人工智能基础设施基金。这一举措标志着两大行业领军者在人工智能领域达成深度合作,共同应对全球AI算力需求爆炸式增长所带来的基础设施挑战。据悉,布鲁克菲尔德人工智能基础设施基金专注于全球范围内建设支持超大规模AI模型高效运行的数据中心网络,通过构建先进的基础设施...
23:37
2026年元旦节票房预测再创新高 元旦当天或将突破2.33亿元大关。根据权威网络平台最新数据分析,当日票房榜单的冠军宝座极有可能由《疯狂动物城2》强势夺下。这一预测结果基于影片当前火爆的预售情况以及持续攀升的市场热度,数据涵盖全国所有院线票房表现。随着这部备受期待的电影正式上映,预计将点燃节日期间的观影热潮,为电影市场注入强劲动力,进一步提振行业整体表现。
23:37
2025年12月31日,随着空间站任务进入关键阶段,神舟二十一号航天员乘组的张陆、武飞与张洪章,在轨工作生活已满两个月。他们通过特别视频连线,向全国人民传递了诚挚的2026跨年祝福,并寄语航天同仁与航天爱好者:愿星河映照征途,新年皆坦途。这一温馨时刻不仅展现了航天员的良好精神风貌,也彰显了中国航天事业的蓬勃生机。 自2025年11月1日进驻空间站以来,乘组始...
22:35
2025年12月31日,七彩虹正式公布一项令人瞩目的硬件突破——其旗舰iGame X870E VULCAN OC主板成功将AMD锐龙7 9800X3D处理器超频至惊人的7335.48MHz,刷新了同类平台性能的新纪录。这款主板搭载了先进的18+2+2相110A DrMOS供电系统,配合高频内存支持,为极致性能提供了坚实保障。尤为亮眼的是,当搭配锐龙9 995...
22:35
2025年12月31日,阿里云智能集团资深副总裁刘伟光在行业峰会上发表重要预测,指出2026年初AI应用将迎来新一轮爆发式增长。刘伟光强调,模型快速迭代是推动AI应用落地的核心动力,当前大模型的升级周期已缩短至每周一次,技术迭代速度远超预期。这一趋势预示着AI技术正加速从实验室走向实际应用场景。 刘伟光进一步指出,未来几年企业对AI的投入规模预计将突破现有I...
22:35
2025年12月31日,备受瞩目的北京石头世纪科技股份有限公司正式向香港交易所主板递交了上市申请,标志着这家智能家居领域的领军企业迈出了国际化融资的关键一步。此次上市计划由全球顶级投资银行摩根大通与国内头部券商中信证券联合担任联席保荐人,展现了石头科技在资本市场的强大吸引力。作为国内智能清洁机器人行业的开拓者,石头科技此次进军港股市场,不仅旨在拓宽其多元化的...
22:35
2025年12月31日,布鲁克菲尔德宣布将启动自有云业务,旨在降低人工智能开发成本。该公司将利用其在基础设施与能源领域的长期投资,直接向开发商出租数据中心内的芯片,成为首家涉足该模式的大型投资公司。此项服务将与其新成立的100亿美元人工智能基金协同运作,挑战亚马逊等科技巨头的现有云服务格局。此举意在通过更高效的资源调配,推动AI技术发展并降低成本。