新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月04日

20:59
2026年3月4日,卡普空在最新财报中披露,其当前游戏总销量中约50%来自PC平台。由于Steam用户中96%使用Windows系统,且Proton对Linux的支持尚未改变主流格局,该PC销量实际主要集中于Windows生态。新作《生化危机:安魂曲》Steam首发峰值在线达34.4万人,创系列新高。公司本财年销量目标为5400万套,《怪物猎人:荒野》被列...
20:59
2026年3月4日,双欣环保(001369.SZ)宣布,其全资子公司鄂尔多斯市双欣化学工业有限责任公司拟投资5.42亿元,在内蒙古鄂尔多斯建设工业尾气综合利用二期项目。项目包括年产10万吨电子级碳酸二甲酯(DMC)及配套年产3万吨碳酸甲乙酯/碳酸二乙酯(EMC/DEC)。此举旨在优化产业布局,提升高附加值锂电溶剂产品规模与市场占有率。项目达产后预计将对公司...
20:59
吉利银河M7定于2026年4月在国内上市,该车已于2026年2月在意大利米兰完成全球首秀。作为一款紧凑型SUV,其搭载1.5升插电混动系统,CLTC纯电续航达225公里,满油满电综合续航1730公里。车身尺寸为4770×1905×1685毫米,轴距2785毫米;发动机最大功率82kW,匹配18.4kWh或29.8kWh磷酸铁锂电池。外观采用“飞檐虎视”设计...
20:59
2026年3月,抖音安全与信任中心官网(95152.douyin.com)上线“体验算法”板块。该板块以可交互动画形式,面向公众可视化解析视频推荐流程,涵盖召回(双塔模型、兴趣时钟)与排序(Wide&Deep模型)等核心环节,并演示打散、多样性调节等优化机制。用户可通过官网或抖音App搜索“看得懂的算法”进入体验。此举旨在提升算法透明度与可理解性,助力打破...
20:27
微新创想:2026年3月4日 外媒Phone Arena实测确认即将发布的三星Galaxy S26 Ultra采用UFS 4.0存储 非此前传闻的UFS 4.1 三星官方随后向该媒体证实此配置 此举延续了S26系列“配置低于预期”的趋势 同日早前消息亦显示S26标准版屏幕为8位色深 非传言的10位 UFS 4.1相较UFS 4.0在碎片整理 缓存管理及最高2...
20:27
微新创想:2026年3月,HMD Global在MWC 2026上宣布,未来数月将为旗下功能机集成AI助手、视频通话及数字钱包等智能功能。首批服务将于2026年上半年在印度市场推出。 公司已与印度Sarvam AI合作开发语音交互AI助手,支持拨号、设闹钟、问答等操作。这一AI助手的引入,标志着功能机在智能化道路上迈出重要一步。 同步推出具备设备级安全机制的...
19:48
微新创想:2026年3月初,墨西哥一家软件开发公司的一名开发者RatonVaquero发现其Google Gemini账户在短短48小时内产生了高达82,314.44美元的异常费用。这一金额远超该公司以往的月均消费水平,此前每月的Gemini使用费用仅为180美元左右。此次事件引发了广泛关注,不仅对该公司造成了严重的经济损失,也暴露了API密钥管理方面的安全...
19:48
微新创想:2026年4月23日,tobspr Games开发的工厂建造游戏《异形工厂2》将在Steam平台正式发布1.0版本,结束抢先体验阶段。此次更新标志着游戏进入完整发布阶段,玩家可以正式购买并体验完整内容。 游戏将全面支持创意工坊模组,为玩家提供更丰富的自定义选项和内容扩展。这一功能的加入,不仅增强了游戏的可玩性,也让社区创作成为游戏体验的重要组成部分...
19:48
微新创想:2026年3月4日,苹果国行iPhone 17e正式发布并上线eSIM快速转移功能 该机采用C1X调制解调器,支持单实体SIM卡加1张eSIM,或双eSIM同时激活 机身重170克,配备6.1英寸60Hz OLED屏幕,带来细腻的视觉体验 搭载48MP主摄,拍摄效果更加清晰,满足用户日常记录与创作需求 内置A19芯片,性能强劲,运行流畅,应对各种高...
19:48
微新创想:2026年3月4日,康辰药业(603590.SH)宣布收到国家药监局签发的临床试验批准通知书,同意开展KC1036联合PD-1/PD-L1抑制剂治疗复发或转移性晚期实体肿瘤的临床试验。这一消息标志着公司在肿瘤治疗领域的重要进展。 KC1036是康辰药业自主研发的化学药品1类创新药,具有广泛的靶点覆盖,包括VEGFR2、AXL等多激酶。该药物不仅具备...
19:48
微新创想:3月4日,国内废钢市场采购价格出现分化。截至当日发稿,全国18家钢厂上调废钢采购价,2家下调,调整幅度为10至60元/吨。调价主要集中在华东、华北地区,系钢厂为保障高炉生产原料供应、应对近期铁水成本上升所致。 此次调价未伴随大规模库存变动,属阶段性补库驱动。业内人士指出,短期废钢价格或延续窄幅偏强运行。随着市场需求的逐步释放,废钢价格有望在短期内保...
19:48
微新创想:3月4日晚,铭匠通过官方公众号宣布拍立得内测版首批开售,仅限受邀用户参与。此次发布的拍立得内测版专为摄影爱好者打造,强调机械美学与独特的使用仪式感。产品采用纯机械驱动的库克镜头结构,不仅提升了拍摄体验,还带来了更丰富的摄影效果。支持背景虚化与慢门长曝光功能,让用户能够捕捉更多艺术感十足的画面。 该拍立得内测版提供黑、酒红、橙、深蓝四种颜色供用户选择...