新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月26日

12:49
微新创想:3月26日 上交所联合市场机构在上海及各地资本市场服务基地启动“沪市ETF财富管理基地行”系列活动 活动旨在落实公募基金高质量发展要求 服务居民财富管理需求 通过开展ETF与期权主题课程 涵盖资本市场概况 投资策略 风险管理及防非宣传等内容 依托基地辐射效应 整合场地与渠道资源 降低投资者教育推广成本 提升服务可及性与实效性 此次系列活动不仅为投资...
12:49
微新创想:3月25日至27日,国际半导体展览会(SEMICON China 2026)在上海举行。富士胶片(中国)投资有限公司携高温用PRESCALE 100/200压力测量胶片及PRESCALE STATION压力图像分析装置参展。这两项创新产品不仅展示了富士胶片在精密测量领域的技术实力,也体现了其对半导体及电子制造行业需求的深刻理解。 富士胶片推出的高温...
12:49
微新创想:2026年4月9日(北京时间下午),中国科学院与欧洲空间局联合研制的太阳风—磁层相互作用全景成像卫星(SMILE,“微笑卫星”)将在法属圭亚那库鲁航天发射中心,由Vega-C火箭发射升空。该任务是我国首次与ESA开展任务级深度合作的空间科学探测项目,也是中科院空间科学(二期)先导专项收官任务。卫星已完成星箭对接,正处最后倒计时阶段。其将首次采用软X...
12:49
微新创想:3月26日,博鳌亚洲论坛2026年年会期间,百度集团执行副总裁沈抖指出,具身智能在本体、数据、模型三方面仍存瓶颈。他强调,尽管当前技术发展面临诸多挑战,但中国在供应链、工程师队伍、成本控制以及应用场景等方面具备显著优势。这些优势为具身智能技术的进一步突破提供了坚实基础。 沈抖认为,依托中国完整的供应链体系,具身智能产品的制造成本有望大幅降低。同时,...
12:49
微新创想:3月26日,圆通速递正式在澳大利亚珀斯启动本地配送服务。此举标志着其在澳自营网络已覆盖悉尼、墨尔本、布里斯班及珀斯等东西海岸核心城市。圆通通过自建分拨中心与末端配送团队,为当地电商客户提供仓配一体化解决方案。业务拓展旨在响应中澳跨境电商业务增长需求,提升履约时效与服务稳定性。目前,珀斯区域订单可实现次日达或指定时段送达。
12:49
微新创想:3月25日,成都哈动网络科技有限公司在成都正式成立,法定代表人为吴传凡。该公司由哈啰出行旗下Hong Kong RideTech Limited全资控股,注册资本高达5000万美元。新公司的成立标志着哈啰出行在西南地区的战略布局迈出了重要一步。 微新创想:成都哈动网络科技有限公司的经营范围广泛,涵盖共享自行车服务、小微型客车租赁、物联网技术研发与应...
12:49
微新创想:2026年3月25日,谷歌宣布对安卓应用的侧载与验证机制进行了重要更新。根据新规,所有第三方应用在安装前都必须通过身份验证,或者用户需要触发多步的‘高级安装流程’。这一变化不仅影响了F-Droid、Galaxy Store等知名的非官方应用分发平台,也对一些特定领域的工具产生了深远影响。 此次调整主要针对那些不在官方应用商店中发布的应用。例如,复古...
12:49
微新创想:2026年3月,罗技G为其PRO X SUPERLIGHT 2 SE电竞鼠标新增粉色配色。该型号此前已推出黑白红三色版本,此次新增配色面向全球市场,进一步满足不同用户的审美需求。海外售价维持在139.99美元不变,保持了原有定价策略。 这款鼠标搭载了44000 DPI HERO 2传感器,提供精准的追踪性能和出色的灵敏度。LIGHTFORCE混合微...
12:49
3月26日,盛丰物流集团有限公司到访维天运通(路歌)合肥总部开展参观交流。双方在合肥总部实地考察数字化展厅,回顾十年合作历程,并就网络货运合规、运力数字化转型及行业发展趋势展开座谈。此次交流旨在深化协同,共推数字货运高质量发展。
12:49
微新创想:2026年3月26日,亚马逊宣布与FedEx达成合作,将超1500家FedEx直营网点纳入其美国退货网络。这一合作标志着亚马逊在完善其退货服务方面迈出了重要一步。 此次合作使全美退货点总数突破10000个,覆盖了多种零售渠道。其中包括FedEx网点、全食超市、The UPS Store、Kohl’s及Staples等。这些网点的加入,极大地扩展了亚...
12:49
微新创想:3月26日11时许,粤港澳大湾区核心工程狮子洋大桥东、西主塔成功封顶,正式转入上部结构施工阶段。这一重要节点标志着大桥建设迈入新阶段,为后续桥梁主体结构施工奠定了坚实基础。 该桥位于珠江口‘A’字形顶端,是连接广州南沙区与东莞沙田、虎门镇的关键通道。全长35公里的狮子洋大桥不仅地理位置重要,更在交通网络中扮演着枢纽角色,将有效提升区域通行效率,促进...
12:49
微新创想:2026年3月,卡巴斯基安全团队披露了一种新型网络攻击手段。黑客利用合法无代码AI建站平台Bubble生成并托管恶意登录页,专门针对微软账户进行凭证窃取。这种攻击方式极具隐蔽性,使得用户难以察觉。 攻击者通过技术手段将用户重定向至高度仿真的微软登录界面,部分页面甚至隐藏在Cloudflare验证之后。这种伪装程度极高,使得用户误以为自己正在访问官方...