新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月02日

14:08
4月1日,外设厂商八位堂(8BitDo)为纪念苹果公司成立五十周年,推出Retro 68三模机械键盘AP50限量版。该键盘采用20世纪70年代Apple II经典米咖配色,全铝合金外壳、键帽及功能键,68键Gasket结构设计,搭载凯华BOX冰淇淋Pro Max轴体,支持蓝牙/2.4GHz/USB-C三模连接,内置6500mAh电池,续航达300小时。全球...
14:08
4月2日,OPPO官宣Find X9s Pro将于4月21日19:00在OPPO x 哈苏联合发布会上亮相。该机将首发天马U9 Pro显示屏,配备6.32英寸1.5K LIPO极窄四等边直屏;影像系统采用哈苏调校的2亿像素大底主摄+2亿像素大底潜望长焦(2.8X,约65mm),实现全焦段自由裁切;处理器为天玑9500(+)平台。官方称其为同档唯一「双2亿」...
14:08
2026年4月1日,英国游戏工作室Build a Rocket Boy联席CEO马克·格哈德公开承认《心之眼》首发表现“毫无疑问是史上最差”。该作于2025年发售,因性能与内容问题广受批评,致工作室裁员至100人。格哈德指部分负面舆论系有组织的“企业间谍行为”所致,已向英美执法机构提交证据。目前游戏评价回升、销量周环比翻倍,官方正筹备含事件影射内容的DLC...
14:08
2026年4月1日,外媒曝光宝马X1燃油版中期改款原型车谍照。新车预计2027年全球亮相,2028年上市,起售价约4万英镑(36.6万元人民币)。基于现款车身与底盘,主要变化集中在前脸:采用更小双肾格栅及类似iX3的封闭式大灯,下部保留进气口;内饰全面更新,搭载Panoramic iDrive系统及贯穿式HUD。动力提供轻混、插混及300bhp四驱顶配版本...
14:08
2026年3月31日,微软宣布完成必应地图近年来最大规模地址数据升级。本次升级自2025年6月启动,历时9个月,全面接入基于Overture标准的TomTom Orbis地图数据。新数据融合开源地图、传感器观测及商业数据,显著提升全球地址覆盖率、定位精度与实时更新能力。微软采用分阶段部署策略,先在欧洲验证达标后推向全球。用户现可通过必应网页版、必应搜索及C...
14:08
2026年4月2日,四川成都金堂县成功培育出新型高脆度金针菇。该品种脆度值约700,为普通金针菇的2—3倍,色泽呈黄色,口感紧实清脆。由西南科技大学贺新生教授团队从本地野生标本分离选育,可在自然环境下传统栽培。其高脆度有助于促进消化与肠道蠕动,兼具食用与功能价值。目前正进行品种命名及专利申请,预计2026年内实现量产上市。
14:08
2026年4月2日,Chrome、Edge等基于Chromium的浏览器即将原生支持音视频懒加载功能。该功能由开发者Helmut Januschka提出,已完成底层开发,预计随Chrome 148稳定版上线。此前仅图片和iframe支持原生懒加载,音视频需依赖JavaScript实现,存在兼容性差、性能低等问题。新机制通过添加HTML属性即可启用,浏览器按...
14:07
微新创想4月2日消息,张雪机车凭借在WSBK葡萄牙站斩获双冠的亮眼成绩,迅速引爆国内摩托车消费市场。自3月21日开启新车预订后,短短10天内新增订单逼近万台,旗下820RR、500RR等车型供不应求,交付周期已排至6至7月,成为国产中排量仿赛车型的现象级爆款。火爆行情蔓延至二手平台,市场溢价频出。冠军车型820RR官方定价4.3...
14:07
微新创想:阿里千问今天正式发布新一代大语言模型Qwen3.6-Plus 这款模型标志着国产大模型在编程能力上的重大突破 Qwen3.6-Plus 是目前编程能力最强的国产大语言模型之一 在核心能力方面 它相较于上一代产品有了显著提升 在一系列编程能力的权威评测中 Qwen3.6 表现突出 超越了参数量达到其两到三倍的 GLM-5 和 Kimi-K2.5 等国...
14:07
微新创想:苹果公司迎来了成立50周年的里程碑时刻 在这个特殊节点 苹果CEO蒂姆库克接受了媒体采访 库克坦言 iPhone发布是他在苹果最喜欢的时刻 当被问及原因 他解释称 手机是苹果每个人每天都在使用的东西 旧时代的智能手机体验极差 而iPhone横空出世 其触控界面就像人的思维一样自然契合 彻底改变了人机交互方式 对于未来的产品规划 库克并未谈论过多 但...
14:07
微新创想:4月2日消息 小米创始人雷军将于今晚7点正式开启个人直播 这场直播预计时长将达到5小时左右 内容深度与精彩程度引发了科技圈与汽车圈的广泛期待 根据小米汽车发布的官方预告 今晚直播的核心看点是一场硬核的拆车挑战 小米团队将从零开始 现场完整拆解一台全新的新一代SU7 通过这种开诚布公的方式向外界展示车辆的内在品质 在长达5小时的直播过程中 雷军不仅会...
14:07
微新创想4月2日消息 智谱正式发布面向视觉编程打造的GLM-5V-Turbo多模态Coding基座模型 该模型从预训练阶段深度融合视觉与文本能力 打破了纯文本输入的编程局限 能看懂设计稿 截图 网页界面并生成可运行代码 真正实现了看得懂画面 写得出代码 GLM-5V-Turbo拥有三大核心特性 其一为原生多模态Coding基座 可原生理解图片 视频 设计稿等...