新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月23日

07:28
2026年1月23日,备受瞩目的Xbox开发者直面会为全球玩家带来了Game Freak倾力打造的全新动作RPG《轮回之兽》的震撼首曝。这款历经长达六年精心打磨的作品,将带领玩家踏上一场充满挑战与冒险的末世征途。游戏正式定档2026年夏季,将同步登陆Xbox、PlayStation及PC三大主流平台,并且Xbox玩家将享有优先体验的福利,作为首发游戏登陆Xb...
07:28
2026年1月23日,备受期待的《神鬼寓言》重启版迎来重大消息,在Xbox开发者直面会上正式揭晓了最新进展。这款由知名开发商Playground Games倾力打造的开放世界冒险游戏,预计将于2026年秋季同步登陆Xbox Series X/S、PC(涵盖Steam等主流平台)以及PlayStation 5三大平台。值得注意的是,作为Xbox Game St...
06:57
2026年1月23日,微软在备受瞩目的Xbox开发者直面会上正式揭晓了《极限竞速:地平线6》的全球发行计划。这款备受期待的游戏将于5月19日同步登陆全球市场,而Xbox高级版玩家则可提前两天,即5月15日率先体验游戏带来的无限激情。本次《极限竞速:地平线6》将首次将目光投向东方之珠——日本,精心还原东京五大行政区的独特风貌,游戏规模更是达到了前作的五倍,为玩...
06:57
2026年1月23日,全球半导体巨头英特尔公司正式发布了一份重要声明,揭示了当前存储芯片市场正面临的价格飙升危机。这一突发状况可能对全球个人电脑(PC)市场产生深远影响。英特尔在声明中明确指出,存储芯片成本的持续攀升已形成显著压力,并极有可能通过产业链传导至终端PC产品,最终导致整机价格上涨,进而抑制市场需求。这一风险事件不仅发生在英特尔总部所在地,更波及全...
06:57
2026年1月23日,英特尔公司首席执行官陈立武在公开场合透露,公司正与多家潜在客户保持密切沟通,积极推进14A先进制程技术的合作事宜。据陈立武预计,相关客户将在今年下半年就是否采用该技术达成最终决策。作为英特尔的核心技术节点,14A制程旨在通过突破性的工艺革新,显著提升芯片性能与能效比,从而进一步巩固其在全球半导体制造领域的领先地位。此次积极布局被视为英特...
06:57
2026年1月23日 纽约讯 摩根大通公司近日正式宣布对首席执行官杰米·戴蒙的薪酬进行调整,其2026财年基本年薪将提升10.3%,达到令人瞩目的4300万美元。这一决定由公司董事会薪酬委员会经过审慎评估后作出,主要基于公司近年来的卓越业绩表现、行业薪酬水平的市场对标以及CEO领导职责的进一步强化等多重因素综合考量。 作为摩根大通的灵魂人物,杰米·戴蒙自20...
06:57
亚马逊宣布将进行大规模组织调整,计划于2026年1月27日前后裁减数千个企业部门岗位。此次变革主要影响美国及部分海外办公室,重点集中在人力资源、财务、法务及企业服务等非技术职能领域。作为全球电商巨头,亚马逊此举旨在通过优化组织结构、提升运营效率,更好地应对当前复杂多变的宏观经济环境,同时加速业务重心向人工智能(AI)和云计算领域的战略倾斜。 值得注意的是,此...
03:22
1月23日,美国北达科他州遭遇罕见极端严寒天气,导致该州石油产量出现显著下滑,降幅高达11万至14万桶/日。这一减产事件主要集中在巴肯页岩产区,主要原因是低温天气引发井口冻结、设备故障停运以及运输系统受阻。据当地能源监管机构最新数据,多座油田已临时关停,部分关键管道流速更是下降了超过30%。此次减产预计将持续至寒潮天气缓解,若低温状况进一步延长,极有可能对全...
03:22
2026年1月23日,全球化工领军企业巴斯夫正式公布了其调整后的全年EBITDA初步数据,最终结果为66亿欧元。这一数字较市场普遍预期的68.5亿欧元略显逊色,反映出公司在当前复杂经济环境与行业竞争压力下,盈利能力未能完全达到外界预期。尽管面临宏观经济波动及行业周期性挑战,巴斯夫依然展现出稳健的运营表现,但数据也提示其需进一步优化成本结构与提升效率。值得注意...
03:22
近日,OpenAI传出一项重要战略调整,计划对其客户通过AI辅助研发项目(AI-Aided Discoveries)实现商业化成果时收取一定比例的分成。这一举措主要针对采用其高端研发工具的企业客户群体,但具体的分成比例及适用条件尚未正式公布。OpenAI方面表示,推出该模式的核心目标在于激励与客户的长期战略合作关系,同时有效分担在科研创新过程中的风险。此外,...
03:22
2026年1月23日,OpenAI创始人萨姆·奥尔特曼在美国旧金山总部公开宣布了一项令人瞩目的商业成就:公司API业务在上月实现了约10亿美元的年度经常性收入(ARR)增长。这一显著增长不仅标志着OpenAI商业化进程的加速,更凸显了其在人工智能领域的技术领先地位和市场需求的高度认可。据透露,此次增长主要由企业客户对GPT模型API调用量的激增所驱动,反映出...
00:51
2026年1月23日,鹏辉能源旗下核心储能产品生产线已实现满负荷运转,展现出强劲的生产能力。公司目前314Ah大容量电芯以及100Ah、50Ah小型电芯产线均已全面投产,为市场提供充足的优质产品。此外,衢州基地二期厂房建设已顺利完工,为未来产能扩张奠定坚实基础。根据公司规划,2026年将正式推出587Ah大容量电芯并实现量产,进一步丰富产品矩阵,满足市场多样...