新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月21日

14:29
微新创想:2026年2月19日,微软对Copilot的设置进行了重要调整,默认启用了‘记忆’功能。这一功能允许Copilot从Edge浏览器、Bing搜索以及MSN等微软自有产品中提取用户的使用数据,从而提供更加个性化的响应。此次更新主要集中在Copilot设置页面的‘记忆’选项卡中,新增了一个名为‘微软使用数据’的开关,并且该开关处于默认开启状态。 微新创...
14:29
微新创想:2026年2月21日,维基百科创始人吉米·威尔士在印度新德里AI峰会期间发表讲话,表示他对马斯克旗下AI项目Grokipedia的出现并不感到担忧。他形容Grokipedia是对百科全书的一种“滑稽模仿”,认为其在知识准确性和深度方面存在明显不足。 吉米·威尔士强调,当前的人工智能技术仍然面临严重的“幻觉”问题。这意味着AI在生成内容时,有时会编造...
14:29
微新创想:2月18日,英国AI学者David Silver为其初创公司Ineffable Intelligence完成10亿美元种子轮融资,由红杉资本领投。该公司估值约40亿美元,若融资落地,将成为欧洲史上最大规模的种子轮融资。 Silver去年底自谷歌DeepMind离职后迅速引发资本竞逐,英伟达、谷歌、微软等亦有意参与。这一消息在科技界引起了广泛关注,显...
13:59
微新创想:适马计划于2026年2月26日在日本CP+摄影展上发布一款新型APS-C画幅变焦镜头 这款新镜头将是50-100mm f/1.8 DC HSM Art的继任者 但规格将有所调整 原镜头发布于单反时代 支持佳能EF 尼康F及适马SA卡口 等效焦距为75-150mm 新镜头将面向无反时代进行优化 具体卡口与光学参数尚未公布 此举延续了适马去年推出17-...
13:29
微新创想:2026年2月21日,微雪电子(Waveshare)正式发布7英寸圆形触摸显示面板。这款新产品是专为现代智能设备设计的创新解决方案,适用于多种应用场景。 微新创想:该显示面板具有出色的性能参数,包括1080×1080的高清分辨率,能够提供细腻逼真的视觉体验。其可视角度达到160度,确保用户在不同方位观看时都能获得清晰的画面。峰值亮度高达800尼特,...
13:29
微新创想:2月21日,黄河内蒙古段封冻河段开始开河,抵达三盛公枢纽,较常年偏早18天,标志着进入开河关键期。截至当日10时,累计开河长度已达128.8千米,剩余封冻河段还有587.5千米。受气温回升影响,自2月中旬以来,黄河内蒙古段日均开河长度约为9千米,整体开河过程平稳,未发生较大险情。 微新创想:水利部高度重视黄河开河期间的防凌工作,已要求各地落细落实各...
13:29
微新创想:2月20日至25日,正值春运返程客流高峰期间,国铁南宁局积极应对旅客集中出行需求,共加开动车组列车1380列。此次加开的列车不仅覆盖了广西区内多个热门线路,还延伸至周边省份,有效缓解了节后返程压力。加开车次主要集中在南宁、桂林、柳州、北海等重要枢纽站之间,同时也包括前往广州、长沙、贵阳等方向的线路,为旅客提供了更加便捷的出行选择。所有加开列车均依据...
13:29
微新创想:2月21日,智能航行集装箱船“智飞”号在山东港口青岛港顺利完成无人自主靠泊与全自动装卸作业。此次作业不仅展示了我国在智能航运领域的最新成果,也标志着智能技术在传统航运业中的深度应用。 该船配备了国产智能航行系统,能够灵活切换人工驾驶、远程遥控和无人自主航行三种模式。这种多模式操作设计,既保证了复杂环境下的安全性,又提升了运营效率,为未来智能航运的多...
13:29
微新创想:2026年2月21日,汽车媒体CarScoops发布大众新款高性能SUV途观R路测图。该车在德国等地进行公开测试,外观近乎无伪装,展现出接近量产的形态。从曝光的图片来看,新车采用了R系列专属的四出排气系统,搭配亮黑色后扩散器和单横条前格栅,整体设计更加激进,强化了车辆的散热性能和运动化识别度。 车辆在性能配置上也进行了全面升级,包括高性能制动系统和...
13:29
微新创想:2026年2月20日,兰博基尼在瑞典北极圈附近进行了一款高性能SUV的路测,这款车型被推测为Urus SE Performante。此次测试不仅展现了兰博基尼在高性能SUV领域的持续探索,也预示着这款车型可能将重新定义品牌在这一细分市场的标杆。 该车在外观设计上进行了多项强化,包括采用碳纤维材质的挡泥板,使车身更加轻盈且更具运动感。同时,加大尺寸的...
12:48
微新创想:2月20日,汽车媒体BMW Blog在美国加州圣地亚哥拍到2027款全新一代宝马X5(G65)路测车。该车伪装厚重,外观融合iX3纯电风格,但尾部排气结构证实为燃油车型。最显著变化是首次在量产车应用“小翼”式门把手,位于腰线处,设计源自Skytop等限量概念车。 动力分析显示其搭载六缸发动机,非V8亦无充电接口,大概率为X5 40 xDrive或后...
12:48
微新创想:2026年2月20日,Reddit用户u/Former-Airport-1099使用GPT-5.3 Codex编写了一个PowerShell脚本,旨在清理Python缓存文件。由于在脚本中错误地将反斜杠()当作PowerShell的转义符,而实际上应使用反引号(`),导致rmdir命令在解析路径时出现错误。 该脚本在调用CMD命令时,错误地将F盘根...