新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月31日

23:56
2026年1月30日,卡色(Kase)通过微信公众号发布新品预热海报。该镜头为150mm f/5.6 REFLEX折返式设计,适配索尼E卡口,未来或拓展至尼康Z、富士X卡口,支持自动/手动对焦切换,滤镜口径67mm,覆盖全画幅像场。官方未公布具体上市时间,但强调其为目前体积最小的150mm镜头。折返结构虽在光学素质上略有妥协,但显著提升了便携性。
23:25
2026年1月31日,英国伦敦宽带服务商G.Network正式进入破产管理程序。该公司负债达3亿英镑(约28.64亿元人民币),仅服务2.5万名用户。原收购方Community Fibre因发现其生物降解材质光纤外皮遭大规模鼠咬、且电缆多铺设于道路中央导致修复成本极高而放弃交易。鼠类偏好含大豆/玉米成分的电缆皮,啃噬后引发大面积断网。封路维修进一步加剧伦敦...
23:25
2026年1月31日,北京经济技术开发区管委会印发《关于进一步加快建设全域人工智能之城的实施方案(2026—2027年)》。方案明确将构建人工智能安全体系,重点突破深度伪造识别、生成内容合规检测等关键技术。此举旨在夯实智能原生基础能力,依托集成电路制造优势,推动“设计-制造-封测-算力”一体化发展,并加速认知模型向能动模型升级。同时支持国家级AI软硬件测试...
23:24
2026年1月31日,北京经济技术开发区管委会印发《关于进一步加快建设全域人工智能之城的实施方案(2026—2027年)》。方案提出强化“6G+AI”协同,支持建设6G人工智能实验室等重点机构,并搭建6G+AI融合测试验证平台。该平台将在具身智能、智慧工厂、智慧物流等场景开展技术验证。此举旨在推动前沿技术与人工智能双向赋能,加快构建新一代信息基础设施。实施...
23:24
2026年1月31日,北京经济技术开发区正式发布《关于进一步加快建设全域人工智能之城的实施方案(2026—2027年)》,标志着智能网联领航行动全面启动。该方案以人工智能在智能网联汽车领域的深度应用为核心,依托国家人工智能汽车制造中试基地,构建了"云、网、边、端、用"五位一体的安全运营底座,并同步建设了智算服务、可信数据空间、具身训练三大共性平台。通过重点攻...
22:59
微新创想1月31日消息,荣耀将在巴塞罗那MWC大会上正式推出全新一代折叠屏旗舰荣耀Magic V6,其主打超大电池和轻薄机身。据悉,荣耀Magic V6折叠屏内部代号Phenom,备案配色有雪域白、绒黑色、旭日金、赤兔红等,该机有多项行业首发。首先是电池容量,目前荣耀Magic V6电池已经获得3C认证,其典型值在7150mAh...
22:59
1月31日消息,据媒体报道,一对夫妻带娃回家过年的趣闻引发关注,两人开车出发上了高速后才发现孩子并未同行。随后二人又折返回家,妈妈因为着急还摔了一脚,回到家发现娃还在熟睡后才把心放下。网友在评论区表示:真是粗心的爹、大意的妈。一年一度的春运将至,路上尤其是高速公路车流将明显增多,路上一定要看好孩子和行李,高速公路行车要按照交通标...
22:59
微新创想1月31日深度报道 一则令人意想不到的喜讯近日传来 据权威媒体报道 2017年遭遇手机被盗的马女士 在九年后的2026年1月 竟意外收到了1100元的退赔金 这起尘封多年的案件终于迎来圆满解决 据悉 马女士近日意外收到了法院的正式通知 警方经过不懈努力成功破案 法院判决生效 被告人当场向马女士退还了1100元赔偿金 马女士激动地表示 由于年代久远已记...
22:59
1月31日消息,据媒体报道,福建一名17岁高中生夜里裹着被子,边用小太阳”电暖器取暖边熬夜刷剧,不久后突发偏头痛并伴有视力模糊,送医时已出现半身不遂,最终被确诊为急性枕叶脑梗。医生指出,小太阳”这类取暖设备会加快人体水分蒸发,加上患者追剧入神未及时补水,身体很可能已处于轻度脱水状态,从而导致血液黏稠度升高、血栓形成风险增加。提醒...
22:59
微新创想1月31日消息,据供应链消息,苹果首款折叠屏手机iPhone Fold预计于2026年秋季与iPhone 18系列同步亮相,这将是苹果史上最高端的iPhone设备。有博主爆料,iPhone Fold配备5500mAh大电池,这是迄今为止电池容量最大的iPhone。相比之下,iPhone 17 Pro Max国行版电池容量...
22:59
微新创想1月31日消息,近日,有网友晒出王自如现身公司年会发奖的画面,豪气操作直接刷屏。相关画面显示,王自如这次不画饼、不搞套路,直接宣布全员年终奖按原标准多发1.5倍,而且全程现金发放,一摞摞现金超吸睛。现场氛围直接拉满,王自如亲手给员工发钱,还搞了各种趣味互动,金句频出,没有一点老板的架子,和员工玩得特别尽兴。有意思的是,不...
22:59
1月31日消息,据媒体报道,浙江某医院收治了一名女孩小花,她连续两天发高烧,体温39.3C。经检查,女孩左脚脚跟处贴着一张创可贴,揭开后皮肤下面已经形成脓肿。医生了解到,女孩的新鞋磨脚,家长便用创可贴对她的脚后跟进行包扎,好几天没换了,最终导致身体感染。医生介绍,如果只是轻微的表皮擦伤,大可不必使用创可贴,只要涂碘酒或酒精消毒,...