新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月17日

10:21
微新创想1月17日最新消息,知名数码博主"数码闲聊站"独家爆料,小米18系列发布会时间表已基本确定,与今年发布节奏类似,呈现分阶段上市策略。据透露,小米18和小米18 Pro系列预计将于9月前后正式发布,而小米18 Ultra旗舰机型则计划在12月前后亮相。 回顾小米17系列的市场表现,其抢在国庆节前发布的策略取得了显著成功。数据显示,新品上市后迅速在国庆假...
10:21
微新创想1月17日电 一只会装死的小羊羔近日成为网络热点,引发广泛关注。来自宁夏平罗县宝丰镇中方村的养殖户金小林家,这只出生仅10天的小羊羔凭借其独特技能走红网络,成为人们津津乐道的焦点。 据悉,这只小羊羔有个神奇的习性:只要成年人伸手靠近或触碰它,就会立刻四脚朝天躺倒在地,双眼紧闭、身体僵直,一动不动地装死,任凭怎么呼唤都纹丝不动。然而,面对小朋友时,它...
10:21
微新创想1月16日重磅报道,小米手机部总裁卢伟冰在今晚正式官宣了备受期待的新品——REDMI Buds 8 Pro真无线耳机。这款旗舰级音频设备将带来前所未有的听觉盛宴,官方宣称其将重新定义"旗舰级听觉体验",并搭载更细腻的智能降噪技术,同时解锁更多智能互联新功能,为用户带来全方位的智能音频解决方案。 REDMI Buds 8 Pro将与备受瞩目的Turbo...
10:20
2026年1月17日,OpenAI正式宣布一项重要战略调整,计划在未来几周内在其免费版ChatGPT及ChatGPT Go平台中引入广告投放。这一举措的核心目标在于为通用人工智能(AGI)的持续研发提供关键资金支持,确保这一前沿科技项目的稳步推进。 据悉,这些广告将以独立模块的形式出现在AI回答内容的底部区域,设计上会进行清晰标注,确保广告内容与AI生成...
10:20
2025年12月,英特尔重磅推出第三代酷睿处理器——Wildcat Lake,为边缘计算等领域注入强劲动力。这款处理器凭借其创新的低功耗高性能设计,在业界备受瞩目。Wildcat Lake的TDP功耗范围控制在12至25W之间,使其在保持高效运行的同时,实现了出色的能效比,特别适合对能耗敏感的应用场景。 在内存支持方面,Wildcat Lake展现出卓越的扩...
10:20
近日,牛津大学研究团队在欧洲核子研究中心(CERN)取得一项重大科学突破,成功验证了核爆拦截小行星的全新机制。通过使用高能质子束模拟核爆环境,研究人员轰击了真实的铁陨石样本,首次在实验室条件下复现了类核爆环境下的天体材料反应过程。实验结果显示,铁陨石在核爆能量冲击下并未解体成碎片,反而发生了令人意外的"固化"现象,其物理强度非但没有降低,反而得到了显著提升。...
10:20
1月17日,零售巨头沃尔玛与小红书在深圳蛇口携手开启创新零售新篇章,联合打造全国首家中外合作的联名体验空间“玛薯店”。这一突破性合作将商品与购物场景深度融合,为消费者带来前所未有的沉浸式购物体验。首批联名商品“沃集鲜×小红书|宝藏新品”同步上线,涵盖多款备受瞩目的潮流单品,引发广泛关注。 此次合作标志着沃尔玛正式入驻小红书电商平台,成为首个实现全渠道布局的商...
09:49
2026年1月16日,一则震惊全球半导体行业的重大安全警报正式发布,研究人员揭露了AMD自2017年Zen 1架构至2024年Zen 5全系列产品中普遍存在的严重硬件漏洞——StackWarp(CVE-2025-29943)。这一高危漏洞利用了处理器内部堆栈引擎的同步缺陷,通过精准操控未公开的模型特定寄存器(MSR)控制位,能够造成堆栈指针发生高达640字节...
09:49
1月17日深夜,一则突发消息引爆了社交媒体圈:知名企业家贾国龙与罗永浩的微博账号双双被禁言。原本备受期待的公开交锋未能如期上演,双方账号均陷入沉寂。经多方确认,@罗永浩的十字路口 与 @西贝贾国龙 这两个备受关注的微博账号,均已无法发布新内容。这一事件迅速引发全网热议,网友们纷纷猜测背后的原因。 就在当晚10点这一关键时间点,贾国龙本计划就罗永浩近期对西贝的...
09:49
2026年1月17日,在备受瞩目的CES 2026展会期间,技嘉联席总经理林英宇带来了关于半导体行业的重要动态。他透露,英伟达公司正在重新调整其显卡产能分配策略,核心依据是"单位显存营收"这一关键指标。这一策略调整意味着,未来显卡市场的产品布局将更加注重盈利能力而非单纯的产品规格。 在具体的产品定价方面,林英宇指出,英伟达目前更倾向于生产8GB显存版本、定价...
09:49
2026年1月16日,微软正式确认Windows 11近期发布的安全更新KB5074109存在严重漏洞,该漏洞会引发使用POP协议的经典版Outlook桌面客户端出现假死状态,导致用户无法正常退出或重启应用程序。这一技术问题主要影响已升级至Windows 11 25H2和24H2版本的终端用户。 微软安全团队已紧急介入调查该技术缺陷,但截至目前尚未发布官方的...
09:49
2026年1月17日,OpenAI联合创始人格雷格·布罗克曼的一次内部讲话被媒体披露,其中他透露了马斯克在OpenAI初创时期的一个惊人要求——要求持有公司多数股权。这一细节的曝光,不仅揭示了两位科技巨头在OpenAI发展路径上的根本分歧,更成为解释马斯克最终选择离开并独立创办特斯拉AI及xAI团队的关键线索。值得注意的是,尽管OpenAI目前以非营利组织架...