新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月10日

13:10
当地时间1月8日,《财富》杂志报道,美国犹他州已启动AI系统为患者开具重复药物处方的试点项目,无需医生实时介入。该系统可核查病历、提问并直接向药房发送续药处方,旨在降低成本、减少用药中断,并缓解偏远地区医疗压力。为保障安全,前250例每类药物需医生审核,后续10%的案例将随机抽检。尽管AI有望提升医疗效率,医生群体仍担忧缺乏人类监督可能带来临床风险。医学专...
13:10
2026年1月9日,科技媒体曝出One UI 8.5泄露截图,显示三星Bixby助手将获重大升级。此次更新核心在于深度集成Perplexity AI的大语言模型能力,使Bixby能基于网络信息生成事实性回答,并支持查看来源与跳转阅读。新引入的‘小悬浮窗’设计提升多任务体验,用户可在不离开当前应用的情况下完成操作。Bixby还将接入The Weather C...
13:10
2024年1月9日,OpenAI与软银集团宣布各自向SB Energy投资5亿美元,合计10亿美元,用于建设得克萨斯州米拉姆县的1.2GW数据中心。OpenAI将租用该设施,SB Energy则成为其重要客户,接入OpenAI API并部署ChatGPT。双方还将建立优先合作模式,结合OpenAI的设计能力与SB Energy的能源交付优势,推动定制化AI...
13:10
2026年1月10日,鑫方盛凭借卓越的综合实力与专业服务,成功中标粤采易阳光采购平台的年度供应商采购项目。粤采易作为广东省属企业采购规范化、阳光化、数字化、智慧化的核心平台,肩负着推动区域产业升级的重要使命。此次中标不仅彰显了鑫方盛在工业品供应链领域的领先地位,更标志着双方在数字化采购领域的深度合作迈入新阶段。 在此次合作中,鑫方盛将充分发挥其完善的供应链体...
12:40
微新创想1月10日消息,原小米中国区市场部总经理、REDMI品牌总经理王腾已经正式官宣创业,公司取名为今日宜休”,目标是通过研发睡眠健康相关的产品,让大家能拥有更好的精力状态。近日,王腾发布了招聘信息和相关问题的说明,有网友在微博下方评论:腾总红米没了你现在卖的好贵啊”。这条评论获得了王腾本人的回复:供应链成本大幅上涨,没办法”...
12:39
微新创想1月10日消息,iPhone Fold将成为首款采用三星COE OLED技术的苹果设备,这项技术可使屏幕更亮、更纤薄。据悉,在传统OLED屏幕中,面板上方会加装一层偏光片,用来减少反光、提升对比度。但该设计存在明显弊端,偏光片会吸收OLED屏幕自身发出的部分光线,进而降低屏幕亮度与发光效率。采用CoE技术后,苹果可移除偏...
12:09
微新创想1月9日消息,语不惊人死不休的马斯克又抛出了新论点!今日,他在Moonshots播客节目中明确表示:人类可以实现半永生,如果能改写设定的程序,就能活得更久。”他进一步解释了核心逻辑:你是被编程设定为会死亡的。程序就是这样设计的,身体的衰老过程是高度同步的没有人左臂衰老而右臂年轻,这说明存在一个生命时钟,让所有器官保持同步...
12:09
1月9日最新消息,一个意想不到的现象正在网络世界引发热议——马年吉祥物竟然意外成为爆款,而这一切都源于一个看似微小的瑕疵。据相关媒体报道,一位幸运的网友在网购马年主题公仔时,意外发现其嘴巴被缝反了,原本设计成开心表情的小马公仔,瞬间变成了表情委屈的"哭哭马"。这一发现迅速引起了网友们的关注,因为这只"哭哭马"的独特表情,恰如其分地反映了当代人复杂的心情。 据...
12:09
真我手机于1月9日发布重要消息,宣布将于1月12日14:30举办真我Neo8屏幕技术沟通会,为消费者带来一场关于屏幕技术的深度解析。据悉,真我Neo8将首发搭载三星1.5K 165Hz超高刷直屏,这标志着真我与三星在屏幕技术领域的再度合作,共同打造出第二块苍穹屏。 回顾双方之前的合作,真我GT7 Pro上搭载的Eco2苍穹屏曾全球首发非偏振自然光护眼技术,这...
12:08
1月9日消息,据媒体报道,全球顶尖翼装飞行员之一温斯坦在南非桌山飞行时遭遇惨烈事故身亡,该飞行员从桌山跃下,以约193公里时速飞行,不到10秒便撞上下方约300米处的岩石。报道称飞行员未能及时拉升高度,数十名徒步者听到喊叫声并目睹他撞击岩石瞬间,搜救组织一小时后发现飞行员的遗体,年仅32岁。此前,这位美国飞行员曾完成超过1600...
12:08
1月9日最新消息,多家媒体报道称,这个冬天,胖东来和山姆超市的羽绒服成为了消费者争相抢购的热门商品。这些超市销售的羽绒服价格区间主要集中在300-500元,不仅充绒量充足,而且保暖性能出色,完全能够满足消费者的冬季穿着需求。为何超市里三四百元的羽绒服能如此受欢迎?一位消费者在接受采访时分享了自己的购物体验:随着大牌羽绒服价格水涨船高,而廉价白牌产品又质量参差...
12:08
2026年1月9日,科技巨头Meta公司正式宣布达成一项历史性核能采购协议,总规模高达6吉瓦,一跃成为全球最大的核能电力买家。这一战略举措的核心目标是为其位于俄亥俄州和路易斯安那州的两座超大规模人工智能数据中心提供源源不断的清洁能源保障。根据规划,Meta将在今年启动1吉瓦的“普罗米修斯”项目,并计划于2028年投运规模达5吉瓦的“亥伯龙”项目,这两大项目将...