新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月09日

21:16
微新创想4月9日消息,腾讯云今天正式上线QClaw V2大版本(版本号V0.2.5),聚焦解决AI在实际工作中记不住、乱回复、难联动、不安全”等核心痛点,带来三大核心能力升级。新版本亮点之一是多Agent并行处理机制。用户可同时拉起最多3个Agent并行工作,将复杂长任务拆解、消化,各司其职、同步开工、互不干扰,大幅缩短工期耗时...
21:16
2026年4月,谷歌联合美国航空与Flightkeys开展AI航班路径优化研究。该系统基于卫星数据与气象预测,实时估算凝结尾迹生成概率,并以CO₂e量化气候影响;当原航线易产生尾迹时,自动推荐替代航线。试验在跨大西洋航线上进行,采纳AI建议的航班尾迹减少62%,整体平均降幅11.6%,且不增加燃油消耗。但因调度负荷与空域限制,仅7.8%航班最终执行推荐航线...
21:16
2026年4月9日,长三角生态绿色一体化发展示范区执委会宣布,年内将在“一厅三片”重点区域实施163个重大项目。项目覆盖互联互通、生态环保、产业创新、民生服务四大领域,旨在推动示范区由形象开发向功能培育跃升。此举是落实长三角一体化发展战略的关键举措,涉及上海青浦、江苏吴江、浙江嘉善三地协同推进。
21:16
咱平常都说猫贪玩,可贵州这只小猫的“贪玩”经历,那可真是让人又惊又笑。近日,在贵州,一只小猫不知道咋想的,居然掉进了一个大酒缸里。这酒缸可不简单,里面盛着足足一百多斤的美酒呢!小猫掉进去之后,那叫一个慌啊,一边“喵喵喵”地大声呼救,一边还不小心灌进去了不少酒。可这酒缸实在是太高了,小猫自己根本爬不出来。主人听到小猫的叫声赶过来,...
21:16
2026年4月9日,上海市商务委印发《2026年上海市扩消费行动方案》。方案明确大力发展免退税经济,推广“即买即退”服务,增加离境退税智能终端布设,扩大“掌上办”线上平台试运行范围;支持国产优质品牌进入免税销售渠道,并加快推进上海港国际客运中心口岸进境免税店建设;同步打造陆家嘴、南京东路等入境友好型商圈,优化“入境通EasyGo”平台及外卡受理服务。旨在提...
21:16
声明:本文来自于微信公众号 硅星人Pro,作者:李楠,授权站长之家转载发布。不久前有博主指出,自己的形象被AI短剧《桃花簪》擅自使用,其中一位还被设定成反派角色。这让很多人气愤。AI短剧侵权有了扩大化的迹象,普通人也难逃一劫。在这种形势下,有必要仔细审视AI短剧侵权的问题了。事实上,平台方已经迅速做出应对。红果短剧最近连续发布两...
21:16
2026年4月9日,上海市商务委员会印发《2026年上海市扩消费行动方案》,明确提升商圈建设能级。方案提出结合城市更新,推进南京东路等重点商圈项目升级改造;创新地下商业空间开发运营模式;建设体育与商业融合示范项目;打造上海动物园等消费新场景;推进第三批“一刻钟便民生活圈”先行区试点;持续开展绿色商场、绿色餐厅创建。旨在激发消费活力,优化商业空间布局与功能品...
21:16
微新创想4月9日消息,近日,一只8个月大的戴眼镜小狗引发网友热议。据小狗主人介绍,因视力问题,小狗走路时常撞到家具、认错主人,甚至连吃饭都要趴在地上找大半天。带去宠物医院检查发现,这只小狗患有高度近视,决定为其花800元定制眼镜。戴上眼镜后,小狗从一开始的歪头迷茫到逐渐适应,最终能清晰地看到周围世界,兴奋地摇着尾巴。主人表示虽然...
21:16
微新创想4月9日消息,日前,荣耀官方正式宣布,成为张雪机车在世界超级摩托车锦标赛(WSBK)的首席战略合作品牌。这也是中国首个和张雪机车达成合作的手机品牌。消息公布后,一石激起千层浪。荣耀全球首席营销官关海涛谈及张雪机车未来是否还能夺冠”的话题时,坦言无论如何,都是中国荣耀。官宣后,很多人都替我们担心张雪的下一站,到底还能不能夺...
21:16
4月9日消息,微博话题35岁孕妇吃冰箱剩菜后去世”登上热搜,引发了广泛关注与讨论。据媒体报道,一名孕妇在食用冰箱里的剩菜后,不幸感染了李斯特菌,家人悲痛地表示,她离开的那天,距离她刚过完35岁生日仅仅才两天。医生提醒,剩菜和生冷食物是李斯特菌滋生的重灾区。免疫力低下的人群更容易受到攻击,而孕妇感染这种病菌的风险比常人高出许多,这...
21:16
声明:本文来自于微信公众号 新莓,作者:司晓柏,授权站长之家转载发布。腾讯AI刚打完一手明牌。元宝、龙虾特工队、养虾全景图,产品矩阵铺到桌面上,生态布局画得清清楚楚。但明牌底下还压着一张暗牌。3月27日,腾讯云上海峰会。MiniMax的Agent首席架构师阿岛讲了一个训练困境——大模型的强化学习撞上了沙箱瓶颈,十万级并发环境在K...
21:16
微新创想: 抖音又跑出一个增长迅猛的白牌。今年1月,三资堂登顶抖音彩妆榜单第一,单月销售额破亿。而据有关报道,2025年,它已在主流电商渠道积累了超15亿元的销售额。仔细观察,可以看到三资堂一不靠大主播,二是通过切入小众细分赛道打爆单品。其背后仍是“厦门帮”的打法。但白牌都想“转正”,三资堂也不例外,尤其是在抖音升级推流机制和内容合规的当下,白牌面临着更严峻...