新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月13日

10:50
微新创想:2026年4月13日,电影《镖人:风起大漠》正式宣布全版本延长放映至5月20日。该片于2月17日在中国内地上映,恰逢大年初一,由知名导演袁和平执导,吴京、谢霆锋、于适三位实力派演员联袂主演。影片自上映以来,凭借精彩的剧情和高质量的制作,赢得了广泛的关注与好评。 截至当前,影片累计票房已突破14.39亿元,稳居中国影史武侠片票房冠军的位置。这一成绩不...
10:50
微新创想:4月11日,本田正式发布纯电微型车Super-N,率先登陆英国等部分海外市场。该车基于N-One打造,采用宽体复古设计,搭载电机,常规功率63马力,Boost模式下达94马力。WLTP续航约206公里,预计搭载约29kWh电池。新车通过模拟换挡与仿真声浪提升驾驶体验,具体音效方案尚未确认。
10:50
微新创想:2026年4月,微软Edge浏览器启动重大界面改版,全面转向Copilot设计语言。此次更新标志着Edge在视觉风格上的重要转变,融入了更多AI元素,以提升用户体验和界面一致性。 新版界面采用更大弧度的柔和圆角设计,整体风格更加现代和流畅。胶囊造型控件以及类似iOS的开关样式被广泛应用,不仅增强了视觉美感,也提升了操作的直观性。这些设计变化覆盖了右...
10:50
微新创想:2026年4月,天文学家利用霍比-埃伯利望远镜暗能量巡天(HETDEX)数据,在距今100亿至120亿年的早期宇宙中,新发现33000多个莱曼α星云。这些星云是围绕年轻星系的巨型氢气体晕,其存在为研究宇宙早期结构提供了重要线索。 该成果将已知的莱曼α星云数量提升了十倍,表明这类结构在早期宇宙中不仅普遍存在,而且形态各异。研究团队分析了约7万个最亮的...
10:50
微新创想:2026年4月10日,全球领先的半导体封装测试企业日月光(ASE)在台湾高雄仁武产业园区举行了新建厂房的动土典礼。此次项目由日月光与颖崴、竑腾共同投资,总投资金额超过1083亿新台币,约合233.06亿元人民币。该厂房建设标志着日月光在台湾地区的战略布局进一步深化,也体现了其在半导体产业链中的重要地位。 项目分两期建设,其中一期厂房预计于2027年...
10:50
微新创想:2026年4月,深圳智能派科技有限公司宣布完成新一轮融资。此次融资标志着公司在智能硬件与教育科技领域迈出了坚实一步。 该公司专注于消费级3D打印机、激光雕刻机及STEM教育套件的研发、生产与销售。凭借先进的技术实力和对市场需求的精准把握,智能派不断推出创新产品,满足不同用户群体的创作需求。 依托编程与3D打印技术,智能派为青少年、创客及教育机构等群...
10:49
微新创想:2026年4月13日,中科院自动化所孵化的人工智能企业中科闻歌正式向香港交易所递交招股说明书。此次上市标志着公司在人工智能领域的重要一步,也体现了其在技术创新与市场拓展方面的持续努力。 公司专注于复杂数据解析与AI辅助决策领域,自主研发了认知与决策智能基础平台DIOS,该平台拥有完全自主知识产权,为政企客户提供高效、智能的数据处理与决策支持服务。D...
10:49
微新创想:2026年4月13日,德赛西威正式向香港交易所递交首次公开发行(IPO)招股说明书。此次提交标志着公司在资本市场迈出重要一步,为未来的发展奠定了坚实基础。 微新创想:德赛西威是一家专注于智能汽车技术的高科技企业,其业务主要涵盖智能座舱、组合辅助驾驶以及网联服务三大核心领域。公司通过软硬件深度融合的技术路线,不断推动智能出行解决方案的创新与升级。 微...
10:49
微新创想:4月11日,微软高管拉杰什·贾在会议上提出,企业大规模部署的AI智能体应具备独立身份,包括登录账号、邮箱及软件使用席位。他强调,每个具备执行能力的智能体都应被视为一个‘新用户’,并需要单独购买许可。 这一观点引发了业界广泛关注。拉杰什·贾认为,如果一名员工配备多个AI智能体,企业所需的软件席位数量可能远远超过实际员工人数。这将为企业带来更大的软件收...
10:49
微新创想:2026年4月13日,永大化工股份有限公司(简称“永大股份”)正式通过北京证券交易所上市审核委员会审核。这一重要进展意味着公司即将迈入北交所注册阶段,为后续公开募股和上市交易奠定坚实基础。 微新创想:永大股份专注于A1/A2级压力容器的设计与制造,产品广泛应用于煤制甲醇、乙二醇、苯加氢、聚丙烯、环氧乙烷等多个化工领域。同时,公司设备也服务于炼油、医...
10:49
微新创想:2026年4月,个性化人偶玩具研发商方仔照相馆宣布完成新一轮融资,金额达数百万美元。本轮融资由线性资本领投,九坤创投、天际资本跟投,元一资本担任独家财务顾问;公司创始团队及Maker赛道头部公司创始人亦以个人身份参与跟投。 此次融资将进一步推动方仔照相馆在人工智能领域的布局。资金将重点投入积木生成大模型训练、AI Agent研发及海外市场拓展,持续...
10:49
微新创想:2026年4月13日,华付技术正式向香港交易所递交上市申请。这一重要时刻标志着公司在人工智能领域迈出了关键一步。华付技术以AI算法、算力及行业应用为核心,致力于提供涵盖AI智算、视觉感知、系统建设、应用软件及行业智能解决方案的综合服务。 微新创想:公司总部位于中国,专注于金融、政务、能源等多个垂直领域,凭借深厚的技术积累和丰富的行业经验,逐步建立起...