新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月26日

02:37
微新创想:2026年2月26日 据消息人士透露 乔什·库什纳旗下风投机构Thrive Capital近期以2850亿美元估值向OpenAI注资约10亿美元 资金来自其新设立基金 此次投资发生于美国 目的是为了加强OpenAI在人工智能前沿技术研发与商业化落地能力 Thrive Capital长期聚焦科技领域成长期企业 本次加码反映其对生成式AI长期价值的坚定...
00:53
微新创想:2026年2月25日,谷歌宣布在Gemini应用中正式启用聊天功能作为数据源。这一重要更新面向全球用户,由谷歌公司技术团队部署实施。谷歌表示,此次升级旨在提升模型对实时对话内容的理解与响应能力,使Gemini能够更准确地调用和整合用户的历史聊天信息。通过这一功能,Gemini可以更好地捕捉上下文,从而提供更加精准和个性化的服务。 此次更新采用应用内...
00:53
微新创想:2026年2月25日,摩根士丹利策略师Andrew Pauker等人指出,市场对AI颠覆的过度担忧导致板块错杀,为精选个股提供良机。团队建议关注具备AI既有优势、高增长及高质量特征的公司。其逻辑在于,AI普及正扩大企业软件可服务市场,强化龙头定价权与盈利韧性。微软、财捷集团、Atlassian等被列为具吸引力的入场标的。短期AI落地动能有望缓解长期...
00:53
微新创想:2026年2月26日,南开大学与上海空间电源研究所联合团队在锂电池电解液领域取得首创性突破。该技术通过重构电解液分子结构,显著提升离子传导效率,在同等体积与重量下实现续航能力成倍增长,并大幅改善-30℃低温工作性能。 微新创想:成果当日凌晨发表于国际顶级期刊《自然》。突破核心在于替代传统含氧溶剂体系,削弱锂盐过度溶剂化效应,从而提高能量密度与温度适...
00:53
微新创想:2026年3月1日至31日,江西庐山风景区将向所有海内外游客免费开放。此次免票政策覆盖了庐山核心景区,该景区为国家5A级旅游景点,同时还包括三叠泉、白鹿洞书院、观音桥、秀峰、碧龙潭、桃花源、石门涧等七大著名景点的入园门票。游客在这一期间可无需支付门票费用,即可畅游庐山自然与人文景观。 此次免票活动的推出,是庐山风景区为促进文化旅游消费、表达对游客长...
00:20
微新创想:2026年2月25日,多名用户反馈在Outlook免费版邮箱中出现了“低价Dota 2成品号”等游戏账号交易广告。这些广告通过微软广告网络进行投放,包括Microsoft Audience Network在内的多个渠道均涉及此类内容。广告链接引导用户前往第三方游戏账号交易平台,涉及的游戏包括《堡垒之夜》《使命召唤》《Roblox》等,部分账号标价甚...
00:20
微新创想:2026年2月25日,锦欣康养产业集团有限公司正式向香港交易所提交上市申请。公司注册地为中国内地,总部位于成都,主营业务为康养社区运营及医养结合服务。本次IPO联席保荐人为中金公司和广发证券。 申请旨在拓展融资渠道,加速全国康养网络布局,并提升智能化、标准化服务能力。目前公司已运营多个自有品牌康养项目,覆盖四川、江苏、陕西等地。 微新创想:锦欣康养...
00:20
微新创想:2026年2月25日,美国银行发布预测称,受工业需求回升与投资避险情绪增强推动,白银价格今年有望再度突破每盎司100美元。该行指出,光伏、电子等下游行业采购增加,叠加通胀预期反复及美元阶段性走弱,共同构成上行动能。 分析认为,若美联储降息节奏快于预期,或加速资金流入贵金属市场。目前伦敦现货白银报价约32美元/盎司,距目标位仍有显著空间。随着全球经济...

2026年02月25日

23:43
微新创想:2026年2月25日,伯特利(603596.SH)发布公告,宣布拟收购豫北转向50.9727%的股份。此次交易涉及多个股东,包括峻鸿实业、宁波奉元、合肥华芯及合肥产投等。通过此次收购,伯特利将获得豫北转向的控股权,进一步扩大其在汽车零部件行业的布局。 豫北转向是一家专注于汽车转向系统及关键零部件研发、生产与销售的企业。其产品广泛应用于各类整车制造领...
23:43
微新创想:2026年2月25日,华策影视就网传“解散电影部门”消息发布官方声明,称该信息纯属不实。公司明确表示,电影业务不仅未被裁撤,反而将在2026年全面升级。 此举系推进“内容+科技”战略的一部分,重点以人工智能驱动创作创新。升级方向聚焦提质增效,不再盲目扩产,严守收支平衡底线,优先修复现金流。 声明由公司相关负责人当晚发布,旨在澄清误传、稳定预期。华策...
23:43
微新创想:2026年2月24日,国际期刊《自然·遗传学》发表突破性成果:Juanma Vaquerizas团队利用新型Pico-C技术发现,果蝇受精卵在基因组激活前即已形成模块化、有序的三维DNA支架。该结构精准调控基因时空表达,保障正常发育。 微新创想:同期《自然·细胞生物学》姊妹研究证实,人类细胞中同类结构崩塌会误触发免疫反应,导致炎症与疾病。这一发现为...
23:43
微新创想:2026年2月24日,苹果向测试用户推送了iOS/iPadOS 26.4 Beta 2版本更新。此次更新首次在英国地区为iPhone引入强制年龄验证功能。该功能的推出是基于英国《在线安全法》的相关规定,要求用户在访问部分包含成人内容的应用时,必须通过“设置”进行身份确认。 苹果在此次更新中提供了两种验证方式。一种是系统自动判断,例如通过用户的账户注...