新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月14日

18:46
微新创想:2026年4月13日晚,海底捞发布核查通报,称自4月10日起对全国1300多家门店2025年1月1日以来情况全面排查 截至4月13日,公司核实了四起强制员工自费购礼事件,涉及金额共计1237.9元。相关款项已于4月12日全额退还给员工 海底捞CEO表示将向涉事的四名员工直接致歉,以表达对事件的重视和对员工的关怀 公司承认此次问题的根源在于董事会对店...
18:45
微新创想:4月13日,义翘神州(SZ301047)发布2025年年度报告。公司全年实现营收7亿元,同比增长14.00%;归母净利润1.48亿元,同比增21.17%;扣非净利润7219.51万元,同比大增97.57%。 截至2025年末,在职员工1069人,较上年末增加48人。公司持续扩大人才储备,为业务发展提供坚实支撑。 总经理张杰,1973年生,北京大学医...
18:45
微新创想:4月13日,北交所第37次审议会议决定暂缓审议广西森合高新科技股份有限公司首发申请。会议重点质疑其销售收入真实性,要求说明前十大客户运输费用变动合理性,以及与丘北县拓岩矿业合作的商业实质。 该公司曾于2020年、2022年分别申报创业板和深交所主板IPO,均未成功。森合高科主营环保型贵金属选矿剂,近年来业务发展迅速,2023—2025年营收由3.4...
18:14
微新创想:2026年4月14日,上海运动训练机器人企业庞伯特宣布完成近2亿元A轮系列融资,由蓝驰创投、神骐资本、明势创投、锦秋基金和华创资本等联合投资。此次融资标志着公司在AI运动训练机器人领域迈出了重要一步,进一步巩固了其在智能体育科技行业的领先地位。 该公司成立于2019年,专注于AI运动训练机器人研发,致力于通过科技创新提升运动训练的效率与精准度。核心...
18:14
微新创想:OPPO Pad Mini 小平板定于2026年4月21日19:00全球首发 OPPO Pad Mini 小平板将在2026年4月21日19:00正式全球发布 这款新机主打轻薄便携的设计理念 配备8.8英寸2.5K OLED屏幕,拥有出色的显示效果 屏幕边框宽度仅为2.99毫米,整体厚度控制在5.39毫米以内 机身重量为279克,便于携带和使用 搭...
18:14
微新创想:2026年第一季度(1月至3月),宝马集团在全球共交付宝马、MINI和劳斯莱斯品牌汽车565,748辆,同比下降3.5%。这一数据反映出全球汽车市场在这一时期的总体趋势,但宝马集团仍保持了相对稳定的交付表现。 其中,宝马品牌交付496,050辆,同比下降4.6%。尽管面临一定的市场压力,宝马品牌依然在全球范围内维持了其品牌影响力和市场份额。MINI...
18:14
微新创想:4月14日,协创数据(300857.SZ)股价涨停,报收249.6元,总市值约为863.92亿元。这一显著的股价表现与公司近期公布的业绩预告密切相关。4月13日,协创数据发布了2026年第一季度业绩预告,预计归属于母公司股东的净利润将达到6.5亿至8.5亿元,同比增长284.14%至402.33%。业绩的大幅增长主要得益于公司智能算力产品及服务业务...
18:14
微新创想:2026年4月14日,AI创作平台哩布哩布AI就央视曝光其生成半裸女性跳舞视频一事发布声明。事件发生于近日,用户通过网购提示词在该平台数分钟内生成违规内容,平台未触发任何审核限制。 公司随即启动专项排查,确认个别复杂提示词组合下存在安全漏洞,并已第一时间完成技术修复与风险路径封堵。目前,平台正升级审核机制、加强攻防演练,并启动内部责任复盘。 哩布哩...
18:14
微新创想:2026年4月14日,富满微电子集团股份有限公司发布公告,宣布正筹划境外发行H股并申请在香港联交所上市。这一战略举措标志着公司在国际化道路上迈出重要一步,旨在通过资本市场进一步增强企业资本实力,提升国际品牌形象,并优化现有资本结构。 公司表示,目前正与相关中介机构就具体事宜进行深入探讨,相关方案仍在制定过程中,尚未最终确定。同时,公司强调此次境外上...
18:14
微新创想:近日Reddit用户CatchMeAtCrown在将iPhone 13升级至iOS 26.4后遭遇了一个意想不到的问题。系统更新移除了捷克语键盘中的抑扬符(ˇ),这一特殊字符是其密码的重要组成部分。由于密码中包含该符号,升级后手机无法正常解锁。 该用户发现,不仅密码失效,重启设备后USB调试功能也变得不可用。此外,相机的实时文本识别功能同样受到影响...
18:14
微新创想:2026年第一季度,全球非游戏移动应用市场下载量与收入均实现增长。TikTok月活跃用户(MAU)突破20亿,下载量环比增长7%。这一成绩不仅体现了用户对TikTok内容的持续关注,也反映了其在全球市场的广泛影响力。 3月TikTok与苹果达成重要合作,Apple Music订阅用户可在TikTok内直接播放完整歌曲。这一功能的上线极大提升了用户的...
18:14
微新创想:2026年4月,美国电动皮卡制造商Slate Auto完成6.5亿美元C轮融资,由TWG Global领投。此次融资标志着公司在新能源汽车领域迈出了重要一步,进一步巩固了其在电动皮卡市场的领先地位。 Slate Auto专注于研发多功能电动皮卡,其产品具备独特的双形态切换功能。用户可以根据实际需求,将车辆转换为五座SUV或快背式越野车模式,类似Je...