新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年03月12日

20:25
微新创想:2026年3月12日,当贝科技正式发布OpenClaw中文版智能体平台Molili 1.0.7。该版本面向国内用户深度优化,支持一键部署与安装,集成DeepSeek、通义千问等主流国产大模型,强化中文指令理解能力。 微新创想:采用订阅制服务,实测使用成本较原版降低50%,并优化Token消耗逻辑。新增敏感权限精细化管控,支持微信、钉钉、飞书及苹果S...
19:53
微新创想:2026年下半年,大众ID.3电动掀背车将推出大幅改款版本,正式更名为ID.3 Neo。该车于2021年首发,是大众首款专属纯电车型。此次升级涵盖全新前脸设计、内饰材质提升、搭载最新一代软件(含旅行辅助、单踏板模式、V2L对外放电及数字钥匙功能)。 更名延续其研发代号“Neo”,同时保留ID.3标识以维系品牌认知。此举反映大众回归理性命名策略,逐步...
19:53
微新创想:2026年4月起 特斯拉将在得克萨斯州奥斯汀的得州超级工厂启动Cybercab自动驾驶汽车量产 该车型为无方向盘、无踏板的两座Robotaxi专用车 基于全新平台打造 搭载FSD系统 初期产能爬坡较缓 目标周产数百辆 最终或达年产量数百万辆 售价预计低于3万美元 将面向普通消费者销售 此举旨在支撑特斯拉自动驾驶出行网络建设
19:53
微新创想:近日有玩家在《生化危机:安魂曲》中发现了一个隐藏的彩蛋 3月9日,一位名为RacconSurvivor的网友在游戏《生化危机:安魂曲》的BSAA电脑屏幕代码中发现了一个网址“NEWDAWN-capcom.com”。这一发现迅速引起了玩家社区的关注 该域名被一名自称“Gabe Follower”的Valve粉丝注册,目前跳转至其个人等待页面。值得注意...
19:53
微新创想:2026年3月12日,印度从美国、挪威、阿尔及利亚和俄罗斯等国进口液化石油气(LPG)以满足国内能源需求。此举旨在增强能源供应多元化,降低对单一来源的依赖。印度作为全球主要的LPG进口国,近年来不断拓展供应渠道,以应对季节性需求波动和本土产能不足的问题。 进口方式覆盖海运交付,涉及长期合同与现货采购相结合。这种灵活的采购策略有助于印度在国际能源市场...
19:53
微新创想:2026年3月12日,欧盟反垄断负责人特蕾莎·里韦拉在柏林国际竞争大会上宣布,正全面审查人工智能技术栈的市场竞争状况。这一举措标志着欧盟在人工智能领域监管的进一步深化,旨在确保市场公平竞争并防止技术垄断。 审查对象包括英伟达在GPU市场的主导地位,其H100产品市占率已超过80%。英伟达作为全球领先的图形处理器制造商,其在人工智能计算领域的影响力不...
19:53
微新创想:2026年3月,存储器模组厂商全何推出新型1真条+1虚拟灯条的DDR5内存“1+1套条”方案。该产品面向搭载AMD X3D处理器的游戏PC用户,首发型号为16GB×1 Manta DDR5 XSky与24GB×1 Manta DDR5 XFinity,速率均为6400 MT/s。 这一创新方案通过引入虚拟灯条技术,有效降低了整体内存成本。在传统内存...
19:53
微新创想:2026年3月12日 真爱美家(003041.SZ)发布风险提示公告 回应市场关于“被借壳”“变更主业”等传闻 公司明确表示 主营业务仍为毛毯为主的家用纺织品研发 设计 生产与销售 未开展人工智能相关业务 控股股东亦无未来36个月内通过该公司实施借壳上市的计划 公告强调信息以法定披露为准 提醒投资者注意交易风险 理性投资
19:53
微新创想:2026年3月12日,步长制药发布公告披露,其全资子公司山东丹红拟与杭州鸿育医药签署《技术转让与科研合作合同》。根据协议内容,山东丹红将转让益气活血解郁颗粒的临床前研究技术,并与杭州鸿育医药共同开展新药联合开发工作。此次合作将覆盖山东与杭州两地,涉及技术转让及后续的研发协作。 此次合作标志着步长制药在中药新药研发领域迈出重要一步。益气活血解郁颗粒作...
19:53
微新创想:2026年3月12日,《城市轨道交通全自动运行系统通用技术条件》国家标准正式实施。该标准由国家标准化管理委员会发布,适用于全国城市轨道交通新建及改造线路。标准涵盖列车安全移动、乘客乘降监督、紧急情况处置、远程控制等九类核心功能,统一系统架构、功能定义与接口规范,旨在解决此前各线路技术标准不一、互操作性差的问题,为设计、开发、测试与维护提供权威依据。...
19:53
微新创想:AOC正式推出新款便携显示器16T20E2 3月12日,AOC正式推出新款便携显示器16T20E2 这款显示器采用15.6英寸1080p IPS屏幕,具备出色的色彩表现和清晰度,满足日常办公与娱乐需求 亮度达到250nits,确保在多种光照环境下都能保持良好的可视性 60Hz的刷新率带来流畅的画面体验,适合处理文档、视频会议及轻度游戏等场景 产品配...
19:13
微新创想:2026年3月12日,迅雷发布了截至2025年12月31日的全年及第四季度未经审计财务报告。数据显示,公司全年总营收达到4.624亿美元,同比增长了42.5%。在净利润方面,公司实现GAAP净利润10.476亿美元,显示出强劲的盈利能力。 第四季度的营收为1.433亿美元,同比增长70%。这一季度的表现尤为亮眼,不仅整体营收增长显著,海外业务营收占...