新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年04月11日

23:35
微新创想:2026年4月11日起,谷歌对YouTube Premium美国区订阅价格实施新一轮上涨。此次调整影响了多个订阅版本,包括个人版、家庭版、Lite版以及Music Premium。具体而言,个人版订阅价格上调至15.99美元每月,家庭版则涨至26.99美元每月。Lite版和Music Premium的月费分别调整为8.99美元和11.99美元。这一...
23:35
微新创想:据行业消息,佳能计划于2026年8月底发布全新PowerShot旗舰便携相机。这款产品将面向摄影爱好者及专业用户,搭载约1英寸BSI堆栈式CMOS传感器,带来更出色的画质表现。在高ISO性能和动态范围方面,新机相比前代均有显著提升,进一步增强其在低光环境下的拍摄能力。 微新创想:佳能此次推出的新款PowerShot相机,产品定位介于智能手机与无反相...
23:35
微新创想:4月11日,杭州宇树科技发布视频显示,其H1人形机器人实现10米/秒奔跑速度,打破当前人形机器人最快奔跑世界纪录。这一速度的突破引起了广泛关注,标志着人形机器人在运动性能方面迈出了重要一步。 该机器人腿长0.8米、体重约62公斤,采用了高动态运动控制与轻量化结构设计。这些技术的结合使得H1在保持稳定性和灵活性的同时,能够达到如此惊人的奔跑速度。 测...
23:35
微新创想:2026江苏省城市足球联赛于4月11日在常州奥体中心正式拉开帷幕。揭幕战由常州队主场对阵南通队,双方球员均代表各自地级市出战。比赛中,常州队展现出强劲的攻势,上半场便凭借两粒精彩进球取得领先。下半场南通队虽奋力反击,但未能改变比分,最终常州队通过一记点球锁定胜局,以3比0战胜对手,赢得新赛季的首场胜利。 此次赛事由江苏省足协主办,旨在进一步推动城市...
23:03
微新创想:2026年4月3日,国产独立游戏《哀鸿:城破十日记》正式发售。截至4月10日,首周销量达95,915份。这款游戏自发布以来便引发了广泛关注,凭借其独特的美术风格、精心制作的配音以及丰富的内容体量,获得了不少玩家的认可。 微新创想:然而,Steam平台上的玩家评价却呈现出“褒贬不一”的态势。部分玩家对游戏的叙事方式和情感表达表示赞赏,认为其深刻描绘了...
23:03
微新创想:2026年3月,谷歌推送稳定版系统更新后,Pixel 6至Pixel 10 Pro XL用户普遍遭遇设备变砖的问题。许多用户在更新后发现设备无法正常启动,出现无限重启的现象。部分用户设备卡在G Logo界面,无法继续进入系统。更严重的是,一些用户甚至无法进入恢复模式,导致设备彻底失去功能。 谷歌已经承认此次系统更新存在故障,并正在紧急调查原因。然而...
23:03
微新创想:2026年4月10日,亚马逊与苹果公司宣布,Apple TV 服务将于本月晚些时候正式接入美国区 Prime Video 应用。这一合作标志着两家科技巨头在流媒体领域的进一步融合。 Prime 会员可按月支付9.99美元(约合68.4元人民币)订阅该附加服务。这意味着用户无需额外下载或切换应用,就能在 Prime Video 内直接访问 Apple...
23:03
微新创想:2026年4月9日,玩家Jack W.尝试批量下载并启用火狐浏览器全部84235个官方扩展(总约49.3GB)。他通过Mozilla公开API分类抓取完成下载,发现其中仅0.7%扩展用户超1万,19%为无内容“空壳”。 在逐步启用测试中,启用6000个即严重卡顿,启用6万个时浏览器完全冻结。最终成功加载84194个,内存占用27–37GB,打开ab...
22:32
微新创想:2026年4月10日,迅雷旗下云存储产品“光鸭云盘”正式启动不删档公测招募。此次公测由迅雷全资孙公司深圳市光闪云科技有限公司负责运营,该公司成立于2025年,专注于云存储技术研发与服务创新。用户可通过网页端和安卓端参与测试,享受便捷的云存储体验。 用户在注册“光鸭云盘”后即可获得2TB的免费存储空间,满足日常文件存储需求。对于希望获得更多存储容量的...
22:01
微新创想:2026年4月11日,《红色沙漠》发布1.03.00版本更新。本次更新正式支持英特尔锐炫Arc GPU及XeSS 3.0超采样与帧生成技术。需要注意的是,A系列显卡在使用过程中可能会出现显示异常的问题。 此次更新还新增了对AMD Radeon Anti-Lag 2的支持,进一步优化了游戏的响应速度和操作体验。同时,修复了DLSS-RR技术中出现的噪...
22:01
微新创想:4月11日,黑客voices38发布《生化危机:安魂曲》Denuvo加密破解版,距离游戏正式发售仅43天。此次破解由团队KiriGiri完成,标志着游戏保护技术的一次重大突破。该破解版本首次实现了在不关闭Windows安全机制的情况下绕过HyperVisor保护,为玩家提供了更加便捷的体验。 此次破解不仅移除了D加密代码,还对游戏性能进行了显著优化...
22:01
微新创想:4月11日19时32分 我国在广东阳江附近海域使用捷龙三号运载火箭 成功将卫星互联网技术试验卫星送入预定轨道 本次发射由太原卫星发射中心组织实施 是捷龙三号运载火箭的第11次飞行任务 捷龙三号是一款四级固体运载火箭 具备零窗口发射能力 可实现全方位发射 且在72小时内即可完成全部发射准备工作 此次发射的试验卫星主要用于验证卫星互联网通信协议 组网技...