新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月13日

10:44
微新创想:2026年2月,电子专用材料研发企业泓恢电子宣布完成A+轮融资,投资方为甬科天使创投。此次融资将进一步推动公司在新型电子功能材料领域的创新步伐。 微新创想:本轮融资将用于加速新型电子功能材料的研发迭代、中试产线建设及核心团队扩充。泓恢电子致力于通过技术创新提升国产电子材料的竞争力,为关键领域提供高质量的替代方案。 微新创想:泓恢电子成立于2021年...
10:44
微新创想:2026年2月13日,深圳市地方金融管理局等10个部门联合发布黄金市场经营行为提示 该提示明确指出禁止个人组织或参与非法黄金预定价交易行为 同时禁止以黄金为名的非法集资及非法委托投资等活动 严禁开发、推广或使用非法黄金交易软件、APP及小程序 也不得提供相关技术支持 提示强调合规投资者应通过持牌机构参与黄金ETF、黄金期货等正规投资方式 或通过银行...
10:44
微新创想:美国时间2月12日,AI企业Anthropic宣布完成300亿美元的G轮融资,投后估值升至3800亿美元。此次融资由新加坡GIC和Coatue联合领投,显示出市场对公司技术实力和未来潜力的高度认可。 相较2025年9月F轮融资时1830亿美元的估值,此次融资使公司价值增长超过107%。这一显著增长不仅反映了Anthropic在人工智能领域的领先地位...
10:44
微新创想:2026年2月,厦门女娲农科完成数千万元融资,投资方为厦门国升基金。公司聚焦畜牧业智能化升级,以具身智能机器人切入养殖场景,提供“清洁+健康监测”一体化解决方案。本轮融资将用于核心技术研发、产品工程化升级及规模化落地。此举旨在提升养殖效率、优化人工结构,并强化生物安全防控能力,推动传统畜牧向自动化、数据化转型。
10:44
微新创想:2026年2月,北京人工智能企业中数睿智完成Pre-B轮融资,由清控金信投资。此次融资标志着公司在生成式AI领域的发展迈上新台阶,进一步夯实了其在智能技术应用方面的实力。 公司基于自研语思大模型智能体5件套,构建了从基础模型层到应用层的完整技术体系。这一系统不仅具备强大的模型训练与优化能力,还能够支持企业高效地进行生成式AI的开发、部署与管理,实现...
10:44
微新创想:2026年2月13日,字节跳动持续推进自研芯片战略,芯片研发团队规模已超1000人,其中AI芯片方向超500人,CPU团队约200人。此次调整源于算力需求激增,公司近期优化组织架构:原芯片负责人、Data-系统部技术总监王剑不再分管芯片业务;AI芯片与DPU团队负责人施云峰、CPU团队负责人余红斌转由火山引擎负责人杨震原直接管理。字节官方对此暂未回...
10:41
微新创想:2025年网易财报数据亮眼,总营收首次突破千亿达到1126亿元,经调整净利润为373亿元,平均每天净赚超过1亿元。净现金储备增加至1635亿元,再次展现了网易作为中国最赚钱的游戏公司之一的强大盈利能力。其股价在2025年上涨了62%,市值稳定在中国互联网公司前五。从这些数字来看,网易CEO丁磊应该能过个好年。但财报发布后,网易股价盘前一度跌超2%,...
10:41
微新创想:OpenAI 与芯片巨头 Cerebras 宣布达成深度合作 正式推出专为实时开发场景优化的最新模型 —— GPT-5.3-Codex-Spark 作为双方合作的首个公开成果 该模型旨在彻底解决 AI 编程中的“等待焦虑” Codex-Spark 的核心杀手锏 超高速推理 得益于 Cerebras Wafer-Scale Engine 晶圆级引擎的...
10:41
微新创想:针对近期网络上频发的 AI 技术滥用乱象 小红书薯管家昨日发布官方公告 正式要求创作者对站内的 AI 生成及合成内容进行主动标识 小红书在公告中提到 平台近期接到多起举报 涉及利用 AI 技术仿冒公众人物形象 制作虚假视频 这类内容不仅侵害了他人合法权益 且在未标注 AI 生成的情况下 极易误导观众 损害社区的信任基础 新规核心要求 强制标识 依据...
10:41
微新创想:国产大模型激烈的“价格战”正悄然转向 2026年2月12日,智谱连发两项重磅动作 新一代旗舰模型 GLM-5 率先登陆海外 同时发布价格调整函 对相关套餐实施结构性上调 这是2026年以来国产大模型首次大幅提价 释放出行业商业化逻辑生变的强烈信号 调价详情 海外涨幅远超国内 根据《科创板日报》的独家获悉 智谱此次调价呈现明显的“内外有别”特征 国内...
10:13
微新创想:2026年2月13日,上海交通大学李俊团队在《科学》在线发表论文,报道一种新型锂介导电合成氨体系。该体系在常温常压连续流条件下实现100 mA cm⁻²高电流密度与21%能量效率,法拉第效率达98%,稳定运行50小时。 微新创想:团队创新构建分层混合SEI结构(DDLA),大幅提升锂离子传输效率,突破界面稳定性瓶颈。这一突破不仅优化了反应动力学,还...
10:13
微新创想:2026年2月12日(周三),美国得克萨斯州东区联邦法院作出裁决,苹果公司在与Optis Wireless长达七年的专利诉讼中最终胜诉。此案自2019年起,Optis Wireless指控苹果侵犯其五项与LTE通信相关的专利。此前的两次审理中,Optis分别获得了5.06亿美元和3亿美元的赔偿判决。然而苹果公司并未接受这些结果,而是以违反FRAND...