新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月03日

18:19
微新创想:2026年3月3日,Aqara正式推出集悦妙控屏S1 Plus(Siri版) 这款产品是全球首款支持苹果Siri语音控制的智能家居中控屏,标志着Aqara在智能家庭领域迈出了重要一步 设备配备了一块6.9英寸的高清屏幕,为用户带来更加直观的交互体验。同时,内置的双扬声器和四麦克风阵列,确保了语音识别的精准性和稳定性 用户可以通过简单的“嘿,Siri...
18:19
微新创想:2026年3月3日,宏碁游戏董事长高树国在上市前业绩发布会上表示,公司作为PS5在中国台湾、香港及菲律宾、新加坡的代理商,目前未接到索尼关于主机价格调整的任何通知。 受内存成本上升影响,PC硬件价格波动明显,但游戏主机市场表现相对稳定。高树国指出,游戏主机的迭代周期较长,相较于PC产品,其更新换代频率较低,因此厂商在定价上更具掌控力。 此外,原厂在...
18:19
微新创想:2026年3月,美国税收抵免科技公司TaxNova宣布完成100万美元种子轮融资 本轮融资由Andreessen Horowitz(a16z)领投,Karaoke Club与S16VC Fund跟投 该公司专注于AI驱动的研发税收抵免自动化申报 通过数据建模与算法替代传统人工访谈流程 显著缩短申报周期 提升合规性及可申报金额 融资将用于技术研发 团...
18:19
微新创想:3月3日,中国开源智能体项目OpenClaw(代号“龙虾”)在GitHub平台的星标数突破25万,正式登顶平台星标榜,成为当前最受欢迎的开源软件项目。这一里程碑标志着OpenClaw在开发者社区中的影响力和认可度达到新的高度。 该项目由国内开发者社区主导,专注于轻量级AI智能体框架的研发。其设计理念强调高效性与易用性,旨在为开发者提供一个简洁、灵活...
18:19
微新创想:2026年3月3日,美国AI财务管理软件提供商Basis宣布完成1亿美元B轮融资。此次融资由知名投资机构Accel Partners领投,吸引了包括亚马逊、Box、OpenAI、Adobe、Stripe、GV、Khosla Ventures在内的十余家科技公司及投资机构参与。此外,高盛前CEO劳埃德·布兰克费恩也加入跟投行列。 Basis专注于为会...
18:19
微新创想:3月3日,准油股份(002207.SZ)发布异动风险提示公告。公司及全部子公司均未开展油气生产业务,亦无任何海外业务布局。当前收入主要来自国内油田技术服务,运营设备依赖汽柴油。成品油价格上涨将推高经营成本,给公司带来一定的财务压力。 受近期地缘冲突影响,国际原油及成品油价格波动加剧,市场不确定性显著上升。这种价格波动不仅影响全球能源供应链,也对依赖...
18:19
微新创想:近日,英国能源公司Harbour Energy正式完成对可再生能源服务商Wind Energy的收购。Wind Energy总部位于欧洲,专注于风电场建设、运营及风力发电业务。此次收购旨在强化Harbour Energy在低碳能源领域的布局,加速其可再生能源战略转型。 交易金额未披露,双方未公布具体交割日期,但确认已于2026年2月底前完成。收购后...
18:19
微新创想:近日有消息称,索尼正在开发《战神》系列的新作,预计将在2026年内正式公布相关信息,并于2027年上半年推出。据透露,新作的主角将不再是奎托斯,而是他的第二任妻子劳菲,同时也是阿特柔斯的母亲。这一设定标志着《战神》系列故事将首次从奎托斯的视角转向劳菲,为玩家带来全新的体验。 此次新作的游戏玩法将更加注重动作元素,与前两部作品相比会有明显的变化。这表...
18:19
微新创想:2026年3月,智能机器人系统企业大界机器人宣布完成数亿元D轮融资。本轮融资由博华资本管理的梁溪数字产业基金与中金资本旗下基金共同领投,北京顺义科创集团基金及后沙峪“中和润达”产业投资基金也积极参与跟投。此次融资标志着大界机器人在智能制造领域的重要进展,为其进一步拓展市场和技术研发提供了坚实的资金支持。 公司依托自主研发的工业软件平台RoBIM,专...
18:19
微新创想:近日,衢发瑞公司宣布聚焦新能源材料自主研发与产业化。该公司位于浙江衢州,专业从事锂电池负极材料的研发、生产与销售,并拓展新能源科技领域的技术开发、咨询、服务及转让。 衢发瑞公司自成立以来,始终将技术创新作为企业发展的核心动力。企业持续加大研发投入,不断优化生产工艺,提升产品质量,致力于打造具有国际竞争力的新能源材料品牌。 在自主知识产权体系建设方面...
18:19
微新创想:3月3日,京东工品汇启动开工季专项活动,推出平替商品推荐功能。该功能在搜索结果页与商品详情页标识‘选替换’按钮,并显示预估降本比例,助力企业采购降本增效。 微新创想:针对工业品物料繁杂、人工比价低效问题,平台同步上线AI清单识别与批量下单功能,实现BOM单秒级处理。此举旨在提升企业采购效率,优化供应链成本管理。 微新创想:京东工品汇通过技术创新,进...
18:19
微新创想:OPPO官网上线50W磁吸小涡轮2无线充电器 首发云雾白配色 OPPO近日在其官方网站正式上线了50W磁吸小涡轮2无线充电器。这款新品以独特的云雾白配色首次亮相,不仅延续了品牌一贯的简约风格,还带来了全新的充电体验。该无线充电器支持高达50W的无线快充功率,能够显著提升设备充电效率,满足用户对快速补能的需求。 产品具备充电、静音、散热三种模式,用户...