新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月22日

19:47
2026年1月22日,真我realme Neo8发布会现场传来重磅消息,真我手机正式宣布将在今年4月全面接入OPPO售后服务体系。这一战略举措标志着真我品牌在售后服务领域迈出重要一步,通过与OPPO服务网络的深度整合,为用户带来更加完善、便捷的售后体验。 据悉,届时全国近千家OPPO维修中心将全面承接真我手机的维修服务。用户只需简单寄修,即可享受全程可视化的...
19:47
2026年1月22日,宇树科技正式发布官方声明,对近期网络上流传的2025年销量不实信息进行权威澄清。该公司在声明中明确指出,2025年全年人形机器人实际出货量已成功突破5500台大关,而本体量产下线数量更是达到超6500台。值得注意的是,这些数据均严格限定为纯人形机器人的独立数量,并不包含双臂轮式等其他形态的机器人产品。宇树科技同时强调,此前公司从未主动对...
19:47
2026年1月22日,阿里云PolarDB开发者大会隆重召开,阿里云智能集团资深副总裁李飞飞在会上发表了重要演讲。她指出,内存价格预计将迎来爆发式增长,未来可能上涨两到三倍,这一趋势将对AI技术发展产生深远影响。李飞飞强调,AI原生数据库已成为技术发展的必然方向,因为大模型在实时推理过程中高度依赖热数据的快速访问。她进一步解释,通过模型算子化技术,可以有效打...
19:47
2026年1月22日,莱茵金属首席执行官表示,公司预计今年潜在订单额将达到800亿欧元。为支持业务扩展,公司将建造并运营42颗卫星。此举旨在提升其在全球防务与航天领域的竞争力。目前相关项目已进入规划阶段。
19:47
2026年1月22日,中国领先的磁性材料与新能源企业横店东磁正式宣布,成功参与算力科技企业BCI的A轮关键股权融资。此次投资由横店东磁股权投资基金牵头,联合关联方及东阳市英洛华基金共同领投,三方合计出资6亿元人民币,战略投资山西秦能及山西秦云企业管理有限公司(统称"BCI")。作为新一代算力基础设施垂直一体化运营商,BCI凭借其创新的技术架构和前瞻性的产业布...
19:46
2026年1月22日,最新央行数据显示,我国住户短期消费贷款余额已降至94900.77亿元,较上年末锐减7061.91亿元,降幅达6.93%。这一数据揭示了消费信贷市场的显著变化。自2025年3月短暂突破10万亿元大关后,该余额便呈现持续下滑态势,连续9个月负增长。特别是2025年12月,余额首次跌破9.5万亿元,创下2023年以来的新低。这一系列变化清晰地...
19:46
2026年1月22日,小米集团在香港交易所正式宣布启动一项规模高达25亿港元的自动股份回购计划,并明确表示将注销所有回购的股份。这一举措标志着小米在强化资本结构方面迈出重要一步,同时也向市场传递出强烈的信心信号。据最新数据显示,今年以来小米累计回购金额已接近50亿港元,这一数字相当于2025年全年回购总额的80%,充分展现了公司对股东回报的坚定承诺。 此次回...
19:46
2025年2月,OpenAI在旧金山悄然启动了一项备受瞩目的新计划——秘密组建人形机器人实验室。这一创新项目旨在通过尖端技术探索机器人与人类生活的深度融合。据最新消息,该实验室目前已成功招募超过百名数据采集员,他们将成为推动这一革命性技术发展的重要力量。 实验室的核心技术依托于GELLO控制器,这是一种先进的远程操控系统,能够精准指挥机械臂完成各种复杂任务。...
19:46
1月22日,元气森林就市场关于其拟赴港股上市的传闻回应称,目前没有上市计划。该公司未透露具体时间表或相关筹备动作,亦未说明未来是否将启动上市进程。消息源于当日市场传闻,公司强调现阶段聚焦主业运营与产品创新。该回应由元气森林向媒体书面确认,态度明确、口径统一。
19:46
2026年1月22日,备受瞩目的饮料行业巨头东鹏饮料正式宣布了一项重大战略布局——计划斥资11亿元人民币在成都打造全新生产基地。这一具有里程碑意义的投资项目已确定落户成都市温江区,标志着东鹏饮料在西南市场版图上的又一重要落子。 据悉,该项目将由东鹏饮料新设立的全资子公司——成都东鹏维他命饮料有限公司全面负责实施,公司为此划定了1亿元人民币的注册资本。新生产基...
19:46
2026年1月,剑桥大学团队推出名为“复音”的可穿戴AI颈环,可帮助中风后构音障碍患者恢复语言功能。该设备通过捕捉咽喉微振动与心率变化,结合双AI系统解码词汇与情绪线索,实现自然流畅的语音还原。测试显示,单词识别错误率仅4.2%,用户满意度提升55%。设备轻便、可水洗,无需脑植入手术,适用于日常使用。研究已发表于《自然·通讯》。未来或可拓展至帕金森病等神经...
19:46
2026年1月21日,BBC宣布与YouTube建立战略合作伙伴关系,将投资制作专为YouTube平台首播的定制节目。这些节目在英国境外播放时将展示广告,成为BBC新的收入来源;而英国境内用户因依赖电视许可费制度,观看时无广告。合作还包括推出面向英国未成年人的专属频道,涵盖纪录片与科普内容,并推广新闻品牌与创作者生态。双方还将支持英国政府创意产业计划,助力...