新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月03日

10:32
2026年1月3日凌晨,微星在北京时间正式发布预热信息,全球首款宣称具备AI功能的电竞显示器MEG X即将问世。这款尚未上市的显示器采用革命性的新一代QD-OLED技术,将重新定义电竞显示器的性能标准。从曝光的渲染图中可以清晰看到,MEG X采用了极具视觉冲击力的超宽屏设计,其长宽比明显超越传统16:9规格,为玩家带来更加沉浸的游戏体验。 作为微星高端MEG...
10:32
2025年12月30日,华硕ROG在社交平台发布预热视频,宣布BFGD(大尺寸游戏显示器)概念将再度回归,此次将以新型XR智能眼镜形式呈现。该产品无需传统大屏面板,不占用桌面空间,实现沉浸式大屏体验。XR厂商XREAL已回应互动,双方或将联手推出这款ROG史上最大的‘显示器’。此举标志着大屏游戏显示技术向轻便化、虚拟化迈进。
10:32
2026年1月3日,东方嘉盛深圳前海“湾区壹号”智慧仓库迎来历史性时刻——主体结构正式封顶。这座现代化物流地标坐落于前海综合保税区核心地带,总建筑面积高达8万平方米,是区域内规模领先的仓储项目。经过18个月的精雕细琢,项目主体建设圆满完成,现已迈入运营筹备的关键阶段,预示着大湾区物流格局将迎来新篇章。 作为集仓储管理、智能分拣与全球配送于一体的全流程服务平台...
10:32
2026年1月3日,微软正式向全球Win11用户推出备受期待的“Copilot共享”功能更新KB5072033。此次升级无需配备AI PC硬件,即可让所有用户轻松体验智能辅助新境界。用户只需将鼠标光标轻轻悬停在任务栏上的应用图标上,便会自动弹出“与Copilot共享”的智能按钮,开启人机协作的便捷之旅。 该功能的核心优势在于其强大的云端AI分析能力。系统能够...
10:32
2026年1月2日,部分iPhone用户在语言学习应用“多邻国”中遭遇了令人意外的广告推送。这款应用通过苹果的灵动岛和锁屏实时活动功能,向用户实时展示“Super Offer”付费订阅广告,试图吸引用户购买增值服务。然而这一行为涉嫌违反了苹果官方的明确规定,苹果官方曾明确禁止任何应用在灵动岛和锁屏实时活动中展示任何形式的广告或促销内容。 根据Reddit上的...
10:32
2026年1月3日至4日,长江中下游地区迎来短暂降水增多期,主要以小雨雪或雨夹雪形式出现,为该区域带来一定的湿润气息。目前,中东部地区正处于冷空气的间歇期,气温呈现逐步回升的态势。然而,从1月4日起,我国将迎来三波冷空气的相继影响,分别集中在4日至5日、7日至8日以及9日至10日。尽管这三股冷空气的整体强度不算特别强,主要影响范围集中在偏北及偏东地区,但它们...
10:32
1月3日,长三角铁路迎来元旦假期返程客流高峰,预计发送旅客340万人次。2026年元旦假期运输期为12月31日至1月2日,期间长三角铁路累计发送旅客983.1万人次,日均约327.7万人次,运输安全平稳有序。其中,1月1日发送旅客376.6万人次,创该地区元旦单日客发历史新高。铁路部门加大运力投入,应对集中出行需求。
09:45
微新创想1月2日讯 雷军因感冒推迟原定于12月31日的直播活动,新日期定于2026年1月3日晚7点举行。此次直播将聚焦于拆解一台小米YU7车型,满足广大米粉的好奇心。雷军预告称,将通过专业的拆解过程,深度解析小米汽车的技术细节,并展示其精良的用料品质。 小米集团董事长特别助理、战略市场部副总经理徐洁云近日在社交平台上分享了部分备用拆解工具,为即将到来的直播增...
09:45
近日,一则关于超市自助结账盗窃案的报道引发了广泛关注。在日常生活中,确实存在不少"羊毛党"群体,他们为了节省开支可谓费尽心思,但有时这种贪小便宜的行为却可能让自己陷入法律困境。 上月,在武汉光谷某超市发生了一起令人震惊的自助结账盗窃案。一名女子在结账时,第16次采用扫码后删除高价商品的方式盗窃。当日在自助结账区,她购买了价值1000余元的商品,却仅支付了50...
09:44
微新创想1月2日重磅消息,备受瞩目的iQOO Z11 Turbo旗舰机型即将在本月揭开神秘面纱,官方已确认其正式发布日期预计在元旦假期之后,届时将公布具体时间点。据iQOO产品经理刑程独家透露,iQOO Z11 Turbo将直接冲击同档期性能天花板,核心搭载全新第五代骁龙8旗舰芯片,与第五代骁龙8至尊版同宗同源,不仅性能实现革命性飞跃,更在功耗控制上达到全新...
09:44
微新创想1月2日重磅消息,备受期待的moto X70 Air Pro AI手机正式官宣,预计将在近期迎来震撼发布。知名数码博主“熊猫很秃然”今日率先爆料了该机详细配置参数,引发行业广泛关注。 该机正面采用一块6.78英寸OLED直屏,采用先进的1.5K分辨率与120Hz高刷技术,带来极致流畅的视觉体验。核心搭载第五代骁龙8移动平台,与同代旗舰Pro版采用相同...
09:01
2026年1月3日,业界传来重要消息,索尼或将迎来相机产品线的重大更新。据多方消息透露,这家影像巨头计划在年内推出多款备受关注的新品,进一步巩固其在高端影像市场的领先地位。其中,备受瞩目的FX3 II电影机预计将正式发布,更有消息称其将搭载革命性的全域快门传感器,为电影创作带来前所未有的画质提升和拍摄灵活性。 在高端全画幅相机领域,α7R VI的升级版本有望...