新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月16日

08:34
微新创想:4月14日晚,格力市场总监朱磊在社交媒体上发文,质疑海信空调宣传的“真铜实料”缺乏实际依据。朱磊指出,海信在产品宣传中使用“真铜”一词,但未能提供充分的材料证明,涉嫌误导消费者。 次日,海信品牌总监杨祥玺转发朱磊的质疑,并反指格力“又当又立”,同时晒出格力曾参与铝材研究的申请表,试图质疑格力在铜材使用上的真实性。此举引发广泛关注,双方在社交媒体上的...
08:34
微新创想:2026年4月,苹果全球营销高级副总裁乔斯维亚克与硬件工程高级副总裁特努斯在接受Tom's Guide采访中,罕见就Apple Vision Pro未来走向表态。两人未回避产品上市两年来销量疲软、转化率低等质疑,强调Vision Pro是通向空间计算的必要探索,而非短期商业项目。 乔斯维亚克指出数字与物理世界融合具有必然性,但拒绝给出主流化时间表。...
08:34
微新创想:2026年4月16日,日产首席执行官伊万·埃斯皮诺萨公开承认,英菲尼迪近年来的销量下滑主要源于一系列战略失误。其中包括开发专属平台的决策,以及设定不切实际的800万辆年销目标,这些因素影响了品牌的市场表现。 目前,英菲尼迪正在积极进行品牌重建工作。公司决定不再坚持独立平台的开发模式,而是依托日产现有的平台资源,以更高效的方式推进产品开发。这一策略的...
08:34
微新创想:当地时间4月15日,美国皮尤研究中心发布的一项报告显示,44%的家长认为孩子在TikTok上花费了过多的时间,而持相同观点的青少年比例仅为28%。这项调查覆盖了13至17岁的美国青少年及其家长,主要聚焦于Snapchat、Instagram和TikTok这三个社交媒体平台。 调查显示,青少年使用这些平台的主要动机是娱乐,而关注政治议题则被认为是最不...
08:34
微新创想:近日湖南发生了一起令人揪心的事件,一名仅8个月大的女婴在家长短暂分神的瞬间,误食了花生米大小的锡箔纸,险些造成严重后果。当时,孩子母亲正在给宝宝喂维生素D,小宝宝趁机抓起一板带有锡箔纸包装的药片开始玩耍。不久之后,宝宝突然开始咳嗽,家长察觉异常,立即带孩子前往当地医院就诊。 经过初步检查,医生发现宝宝的喉咙中卡有异物。孩子随后出现了声音嘶哑、吸气性...
08:03
微新创想:4月15日,领英全球事务与法务负责人布莱克·洛维特在Semafor世界经济峰会上发表讲话,指出自2022年以来,领英平台的招聘规模下降了大约20%。这一变化的主要原因并非人工智能技术的广泛应用,而是由于全球利率上升带来的经济环境变化。 根据领英覆盖超过10亿用户的经济图谱分析,尽管人工智能在客服、行政、营销等岗位上展现出一定的替代潜力,但并未观察到...
08:03
微新创想:2026年4月15日,Adobe正式宣布推出Firefly AI Assistant。这款工具是一款具备自主决策能力的AI智能体,能够跨Photoshop、Premiere等Creative Cloud应用执行多步骤创意工作流。用户只需通过自然语言设定目标,助手即可自动规划、执行并同步结果。 微新创想:Firefly AI Assistant支持上...
08:03
微新创想:2026年4月15日,科技透明度项目(TTP)发布了一份具有广泛影响力的调查报告。报告指出,苹果App Store与谷歌Play Store虽然明文禁止“脱衣”类应用,但在搜索建议和付费广告方面却主动向用户推荐能够生成女性虚假裸照的AI工具。这一行为引发了公众对平台内容审核机制的广泛关注。 测试数据显示,苹果App Store中约有39.1%的敏感...
08:03
微新创想:4月14日,宝马中国宣布2026 BMW品牌之夜将于4月22日举行。活动将在北京举办,由宝马集团主办,聚焦新世代电动化与智能化技术。届时将全球首发新世代BMW iX3、新世代BMW i3长轴距版及全新BMW 7系/i7。 新车搭载HOJ驾控超级大脑、全景iDrive及第六代eDrive电驱系统,并首发全场景领航辅助功能。这些创新技术不仅提升了驾驶体...
08:03
微新创想:2026年4月15日,欧盟委员会就Meta限制第三方AI助手接入WhatsApp一事,发出补充异议声明。调查显示,尽管Meta于3月4日撤销禁令,但增设收费框架仍实质阻碍接入,涉嫌违反欧盟反垄断规则。 微新创想:欧盟初步认定该行为可能严重损害市场竞争,拟强制Meta按2025年10月15日前的无差别条件,立即恢复第三方通用AI助手对WhatsApp...
07:23
微新创想:2026年4月15日,谷歌正式推出Mac原生版Gemini应用。这款应用完全基于Swift语言开发,专为苹果设备优化,仅适用于macOS 15 Sequoia及以上版本。即日起,用户可以免费下载并体验该应用。 微新创想:用户可以通过Option+Space快捷键快速唤起迷你聊天窗口,实现更便捷的交互体验。该应用支持屏幕共享功能,允许用户在聊天过程中...
07:23
微新创想:微软于4月16日在美国推出了“Microsoft College Offer”学生促销活动,该活动将持续至6月30日或库存售罄。此次活动专为新用户提供,涵盖多个品牌的Windows 11笔记本电脑,包括联想IdeaPad Slim 3x、惠普OmniBook 3等。参与活动的笔记本电脑均附带12个月的Microsoft 365 Premium订阅服...