新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月18日

15:07
2026年2月,群联电子CEO潘健成警告,DRAM与NAND闪存结构性短缺远超预期,将持续至2030年甚至更久。晶圆厂占据绝对卖方地位,要求客户预付未来三年产能款。2025年底起,部分企业将因缺货停产;2026年下半年,低利润品牌将大规模退出,低端产品退市。英伟达Vera Rubin平台单一线路或消耗超20%全球NAND产能,加剧消费级市场挤压。AI驱动的...
15:07
2026年2月18日,微软宣布将在未来10年内向“全球南方”国家人工智能领域投资500亿美元。该计划旨在提升当地AI基础设施、人才培养与应用创新。投资覆盖非洲、拉丁美洲、东南亚及南亚等地区,涵盖云计算平台建设、本地化AI模型开发、数字技能培训及公私合作项目。此举意在缩小全球AI发展鸿沟,促进包容性技术增长。资金将分阶段拨付,首期投入预计于2026年内启动。
14:32
微新创想:2026年2月16日科技媒体Wccftech报道适用于微星RTX 5090 Lightning Z显卡的2500W XOC BIOS文件在网络泄露 部分玩家尝试将其刷入非微星RTX 5090显卡以突破默认约600W的功耗限制 但原厂16-pin供电接口在高电流下易过热熔毁而微星Lightning Z采用双12V-2x6接口设计具备更高供电冗余 社区...
13:54
微新创想:截至2026年2月18日,2026年春节档(含预售)总票房突破18亿元。该数据由猫眼专业版统计发布,覆盖全国院线。这一成绩标志着中国电影市场在节假日期间依然保持着强劲的活力和吸引力。 微新创想:《飞驰人生3》《惊蛰无声》《熊出没·年年有熊》位列票房前三。这三部影片凭借高质量的制作和贴近观众的题材,成功吸引了大量观众走进影院。其中,《飞驰人生3》延续...
13:54
微新创想:2026年2月18日,美国高通公司宣布将通过高通创投,向印度人工智能战略基金投资不超过1.5亿美元。这一重大举措标志着高通在印度市场进一步加大了投入力度。此次投资将重点扶持处于不同发展阶段的印度科技初创企业,涵盖多个关键领域。其中,汽车、物联网、机器人及移动领域的人工智能应用成为资金支持的核心方向。 微新创想:高通此举旨在深化其在印度的生态布局,推...
13:54
微新创想:2026年春节期间,市场监管总局部署全国各级市场监管部门加强价格监管,重点覆盖住宿、餐饮、景区、食品及生活服务等领域。行动自节前启动,持续至假期结束,旨在维护市场秩序、保障消费者权益。 各地强化价格监测预警,开展明码标价检查、提醒告诫和行政约谈,严查不按规定标价、价格欺诈、哄抬价格等违法行为,并已查办多起典型案件。 市场监管部门通过提前介入、动态监...
12:41
微新创想:2026年2月17日,谷歌披露Android XR官方设计文档。文档定义两类设备:基础AI眼镜(含麦克风、扬声器、摄像头)及Display AI眼镜(分单眼/双眼屏,屏幕可关闭)。所有设备须配备电源键、触控板和拍照键;带屏款镜腿设显示开关。 交互上,拍照键单击拍照、长按录像,触控板长按唤醒Gemini,下滑返回,双指调音量。UI采用锁屏式极简设计,...
12:41
微新创想:2026年2月18日,谷歌计划在安卓17中引入DeliQueue系统,这一创新举措将对安卓系统的内存管理机制进行重构 DeliQueue系统的核心在于采用无锁数据结构,从而减少线程之间的等待时间,提升整体的UI响应效率 通过这一技术,谷歌希望解决用户在使用安卓设备时常见的滑动卡顿和丢帧问题,进一步优化用户体验 实测数据显示,应用丢帧率降低了4%,系...
11:59
微新创想:2月18日9时15分(当地时间)印尼马鲁古省塔宁巴尔群岛西南方向167公里的海域发生了一次里氏5.7级地震。此次地震的震源深度达到112公里,表明其属于较深源地震。由于震源较深,地震波传播过程中能量有所衰减,因此对地表的影响相对较小。 印尼气象、气候和地球物理局在地震发生后迅速发布了相关通报,并确认此次地震并未引发海啸预警。该机构表示,目前没有迹象...
11:59
微新创想:2026年2月17日 南非射电天文台宣布利用MeerKAT射电望远镜在并合星系HATLAS J142935.3-002836中探测到距离地球超80亿光年的羟基巨脉泽 这一发现标志着人类在探索宇宙深处的天体信号方面取得了重要进展。羟基巨脉泽是一种由活跃星系核驱动的高能射电信号源,通常与星系合并过程密切相关。此次探测到的羟基巨脉泽位于一个遥远的并合星系...
11:59
微新创想:2026年2月17日,人工智能工具OpenClaw正式发布2026.2.17版本。此次更新由OpenClaw团队主导,面向全球用户推出,标志着该平台在技术迭代与功能拓展方面迈出了重要一步。 本次版本更新引入了多项重要功能,其中最引人注目的便是集成Sonnet4.6模型。这一模型的加入,使得OpenClaw在自然语言处理和生成能力上有了显著提升,能够...
11:59
微新创想:谷歌正开发代号为“Project Toscana”的新一代人脸识别系统 2026年2月17日,谷歌宣布正在研发一款名为“Project Toscana”的全新人脸识别技术 这项技术的目标是解决当前Pixel手机在低光环境下解锁困难的问题 据悉,该系统预计会首先搭载在Pixel 11设备上,并随后扩展至Chromebook产品线 目前,谷歌已在加州山...