新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月12日

20:54
微新创想:2026年2月,保时捷正加速开发一款代号或为Taycan GT4 RS的高性能纯电新车。该车由Manthey Racing深度参与调校,在德国纽博格林及瑞典多地开展极限测试。新车采用双电机系统,功率预计超1019马力,强化空气动力学设计,取消后排座椅以减重。目标纽北赛道圈速突破7分钟(现Taycan Turbo GT为7分07.55秒)。预计202...
20:54
微新创想:2026年2月11日,美国运营商T-Mobile宣布推出Beta版实时语音翻译服务。这项创新技术直接集成于其蜂窝网络,无需用户额外安装应用程序即可使用。这意味着所有能够接入T-Mobile网络的手机设备,包括传统功能机和固定电话,都可以在通话过程中享受这项服务。 微新创想:该服务支持超过50种语言,能够实现几乎实时的双向语音翻译。无论用户身处何地,...
20:19
微新创想:2026年2月12日,初创公司TDM在Kickstarter平台发布了一款名为Neo的头戴式耳机产品。这款耳机以其独特的多功能设计吸引了众多关注,用户只需旋转耳罩即可一键切换为便携蓝牙音箱,满足了个人聆听与音乐共享的双重需求。 Neo耳机在音质表现上也颇具亮点。它配备了双40mm驱动单元和双功放系统,能够提供更加立体和清晰的音频体验。同时,该产品支...
20:19
微新创想:2026年2月12日 广汽集团宣布其自营充电站达2002座 覆盖全国31个省份、211个城市 截至目前 广汽能源累计建成充电桩24313根 其中直流桩18355根 总充电量达15.6亿度 核心城市实现1公里内必有站 1000V高压超充占比超95% 该网络支撑广汽能源三年发展规划 2026年目标销量27万台 并将落地机械臂自动充电、兆瓦级超充及V2G...
20:19
微新创想:2026年2月12日,深圳市工信局印发《深圳市“人工智能+”先进制造业行动计划(2026—2027年)》,正式启动智能网联汽车“车路云一体化”应用试点。该计划聚焦“智造+智驾”全产业链,通过AI赋能协同设计、生产制造、检验检测及封装验证四大环节。 微新创想:实现高精度仿真建模,有助于提升产品设计的准确性和效率,减少后期修改成本。资源智能调度则优化了...
20:19
微新创想:2026至2027年,深圳市将在“人工智能+”先进制造业领域建设国家人工智能应用中试基地,重点聚焦消费领域移动终端方向。这一重大举措由深圳市工业和信息化局于2026年2月12日正式印发实施,标志着深圳在推动人工智能与制造业深度融合方面迈出了坚实一步。 该计划旨在通过构建工业智能体创新中心,进一步提升人工智能技术在制造业中的应用水平。同时,深圳市将积...
20:19
微新创想:2026年2月12日 深圳市工信局印发《深圳市“人工智能+”先进制造业行动计划(2026—2027年)》 文件提出构建无人机自主能力演进体系 搭建智能仿真平台与低空数字孪生系统 融合AI技术提升感知 决策及任务执行能力 培育空中具身智能 同步建设“空中智慧道路系统” 实现空域智能设计 航道规划 全空域感知与多机协同管理 该体系将赋能巡检 物流 载人...
20:19
微新创想:2026年2月11日,MINI新任设计负责人霍尔格·汉普夫表示,品牌将延续圆形OLED中控屏(直径9.4英寸)为核心,强化数字界面与实体按键的结合。此举回应消费者对‘屏幕过载’的普遍不满,强调保留MINI特有的模拟质感与品牌个性。 汉普夫指出,过度数字化会削弱用户连接感,而当前界面已足够成熟,未来重点在于优化交互逻辑而非扩大屏幕尺寸。该策略体现宝马...
20:19
微新创想:2026年2月12日,国际复材(301526.SZ)就股票异常波动发布说明 公司位于中国,主营玻璃纤维及制品研发、生产与销售 电子级玻璃纤维系其产品体系组成部分,是印制电路板(PCB)关键基础原材料,应用于电子电气等领域 公司称生产经营正常,主营业务与经营模式未发生重大变化 此次澄清旨在回应近期市场对相关业务的讨论,强调将持续聚焦主业,推进技术创新...
20:19
微新创想:2026年2月12日,清华大学戴琼海院士团队宣布成功研发“计算全息光场(DISH)”三维打印技术。这项突破性成果标志着三维打印技术迈入了一个全新的阶段。该技术基于计算光学逆过程设计,能够实现亚秒级的体积打印,大幅提升了打印效率。在实际应用中,毫米尺寸的复杂结构仅需0.6秒即可完成曝光,速度较传统方法提升了数十倍。 微新创想:这项技术的一个显著优势是...
19:17
微新创想:2026年2月12日地平线机器人公司宣布HSD智能驾驶系统V1.5正式向奇瑞星途ET5用户推送 此次更新标志着HSD智能驾驶系统首次通过OTA方式进行升级 本次升级重点聚焦于行车拟人化与泊车安全性两个方面 在行车方面优化了车速和车距控制 提升了路口通行逻辑 掉头轨迹更加精准 并增强了对不规则障碍物的识别能力 在泊车功能上 新增了防溜车保护机制 为用...
19:17
微新创想:2026年2月27日起 东风汽车有限公司将召回2020年12月3日至2024年5月21日生产的全新一代奇骏汽车 共计29608辆 此次召回的主要原因是部分车辆在超高速或激烈驾驶条件下存在冷却散热不足的问题 导致发动机油温过高 轴瓦磨损 在极端情况下可能引发行驶中发动机突然熄火的安全隐患 东风汽车有限公司表示 本次召回覆盖全国范围 所有受影响的车主均...