新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月28日

08:15
微新创想:2026年4月微软将对Windows 11和Windows 10系统进行重要更新,其中一项关键变化是强制启用AES-SHA1加密算法以替代RC4。这一调整旨在提升系统的整体安全性,特别是在网络身份验证方面,Kerberos协议将得到更有力的支持。微软此举表明其对数据保护和网络安全的持续投入,同时也反映出RC4算法在现代安全标准中的不足。 此次更新主...
08:15
微新创想:2026年3月28日,《星际公民》正式上线Alpha 4.7版本‘欢迎来到岩石’。此次更新由Cloud Imperium Games主导,带来了多项重要功能的改进与新增,进一步丰富了玩家的游戏体验。 本次更新的核心内容之一是全面重构库存系统。新版本引入了双面板布局,使玩家能够更高效地管理物品。同时,系统还加入了自动扫描功能,帮助玩家快速识别物品属性...
08:15
微新创想:2026年3月27日,国际民航组织(ICAO)正式通过并即刻生效新版锂电池充电宝携带限制措施。新规规定:每位国际航班乘客最多可随身携带两块移动电源,且飞行全程禁止充电。机组人员因运行需要仍可携带和使用。 该修订基于危险货物专家组建议,经空中航行委员会审议及理事会36国批准,纳入《危险物品安全航空运输技术细则》(Doc 9284)增编,面向全部193...
08:15
微新创想:苹果计划在2026年6月9日开幕的WWDC上发布iOS 27 全面升级Siri 苹果将在即将举行的WWDC大会上带来iOS 27的重大更新。其中最引人注目的变化是Siri的全面升级。新版本的Siri将基于谷歌Gemini定制模型,进一步提升其智能水平和交互能力 新Siri将支持多轮对话,让用户能够像与真人交谈一样自然地与设备互动。同时它还具备屏幕感...
08:15
微新创想:2026年3月28日,微软宣布组建全新产品团队,致力于为Windows 11开发100%原生应用。此举旨在取代当前广泛使用的网页套壳模式,如Clipchamp和Copilot等。微软希望通过这一举措,进一步提升系统的整体性能与用户体验。 合伙人架构师Rudy Huyn证实,新团队将严格杜绝网页技术封装,全部基于底层框架开发。这意味着未来的应用将不再...
07:43
微新创想:2026年3月28日,毕马威英国公司通知其审计业务部门约600名员工,相关岗位面临调整风险。此次人员优化涉及英国多地办公室,主因系客户需求变化、监管要求升级及自动化技术应用加速。公司表示将提供协商离职方案、再就业支持及内部转岗机会。 此举属全球审计行业结构性调整的一部分,旨在提升服务效率与合规能力。随着数字化转型的不断深入,审计行业正经历前所未有的...
07:43
微新创想:2026年3月27日,BBC联合苹果公司,在Apple TV应用上线时长约35分钟的沉浸式视频《BBC逍遥音乐节首秀》。该内容专为Vision Pro头显用户打造,记录奥地利钢琴家卢卡斯·斯特纳斯2025年在伦敦皇家阿尔伯特音乐厅的首演实况。其与BBC交响乐团合作演绎格里格《A小调钢琴协奏曲》。 借助Vision Pro的空间音频与沉浸式视频技术,...
07:12
微新创想:Meta公司计划于2026年4月第一周推出两款专为处方眼镜用户设计的雷朋智能眼镜新品。这两款产品将提供矩形与圆形两种镜框样式,满足不同用户的审美与佩戴需求。 产品已通过美国FCC认证,确保其在技术标准和安全性方面达到国际要求。此次发布的新品将主要通过传统处方眼镜渠道进行销售,便于视力矫正人群轻松获取。 这是Meta与依视路陆逊梯卡首次联合推出针对性...
07:12
微新创想:苹果公司近日宣布了一项重要的人事任命,正式聘请前谷歌购物产品副总裁Lilian Rincon担任AI产品营销副总裁。此次任命将直接向苹果全球产品营销高级副总裁Greg Joswiak汇报。Rincon在谷歌期间曾负责消费者购物体验及Google Assistant的开发工作,积累了丰富的AI产品营销经验。她还曾在微软和Skype等知名企业任职,对科...
03:36
微新创想:2026年3月28日 据多方消息 谷歌正接近达成协议 将为人工智能公司Anthropic的数据中心建设提供融资支持 事件发生于美国 涉事方为谷歌与Anthropic 此举旨在强化双方在AI基础设施领域的合作 提升大模型训练与推理所需的算力保障 融资将专项用于Anthropic新建或扩建数据中心 具体金额与条款尚未披露 该合作凸显科技巨头对AI底层硬...
02:05
微新创想:3月28日 教育部和国家语委正式发布了《机器合成普通话水平测评等级标准及测评大纲》以及《人工智能 语料库 基础术语》两项重要规范。这两项新标准的出台标志着我国在人工智能与语言文字标准化领域迈出了坚实的一步。 《机器合成普通话水平测评等级标准及测评大纲》明确了机器合成语音在普通话水平测评中的分级标准和具体测评方法。该标准不仅适用于语音合成技术的研发工...
00:58
微新创想:2026年3月,天岳先进(688234.SH)与四家合作方签署碳化硅产业链战略合作框架协议。此次合作旨在推动新能源汽车、半导体、先进制造及产业投资等关键领域的协同发展。各方将共同推进8英寸碳化硅芯片生产线项目的建设与实施,进一步强化在碳化硅材料领域的布局。 该协议属于框架性安排,不涉及具体交易金额,也不需要经过董事会或股东大会的审议程序。因此,预计...