新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年02月19日

23:28
微新创想:任天堂于2026年2月19日宣布《异度神剑 X:终极版》Switch 2版本即日起上线eShop。实体版则定于4月16日发售。对于已购买Switch 1版的玩家,可以通过付费5美元(约合34.6元人民币)的方式进行版本升级。 新版本在画面表现上进行了全面优化,支持电视模式下的4K分辨率与60帧每秒的流畅体验。同时,掌机模式也升级至1080p分辨率与...
23:28
微新创想:2026年2月19日,贝塞斯达工作室总监陶德·霍华德证实,其团队多数成员正全力开发《上古卷轴6》,项目进展顺利,已进入可内部游玩阶段,即将达成关键里程碑。目前游戏尚无发售窗口。 霍华德在近期的采访中透露,除了《上古卷轴6》之外,贝塞斯达还正在推进多款《辐射》系列新作的开发。其中包括一款《辐射3》的重制版以及《辐射76》的后续内容。这些项目吸引了数百...
23:28
微新创想:2026年2月19日 消息人士HXL透露AMD即将发布的Zen6架构桌面处理器代号为Medusa Ridge。这一代产品将采用单CCD和双CCD两种设计形式 分别提供6至12核以及16至24核的配置。这种多样化的设计方案能够更好地满足不同用户群体的需求 从主流市场到高性能计算领域均有覆盖。 此举表明AMD正积极布局未来处理器市场 以应对日益激烈的市...
23:28
微新创想:2026年2月多家外媒报道指出,有关iPhone 18 Pro将弃用USB-C接口、改用类似MacBook Pro磁吸充电接口的传言并不属实。相关专家分析认为,若苹果公司采用磁吸充电接口,不仅会与现有的MagSafe和Qi2无线充电功能产生冲突,还可能违反欧盟对智能手机统一使用USB-C接口的强制性法规。因此,USB-C接口在iPhone 18 P...
23:28
微新创想:当地时间2026年2月17日,美国电子设计自动化与半导体IP领域的重要企业Cadence楷登电子公布了2025年第四季度及全年财务业绩。这一消息引起了全球半导体行业的广泛关注。全年总营收达到52.97亿美元,约合人民币366.19亿元,相比去年同期增长了14%。这一增长反映了公司在全球市场中的持续竞争力和业务拓展成果。 非GAAP营业利润率显著提升...
22:54
微新创想:2026年2月,美国巴诺书店(Barnes & Noble)在欧洲市场推出Nook Reading Tablet 8.7阅读器。这款设备实际上是联想Tab One平板的定制版本,仅在背部印有Nook品牌Logo。其设计紧凑,厚度仅为8.4毫米,重量约为320克,便于携带和使用。 该阅读器配备了一块8.7英寸720P IPS屏幕,提供清晰的视...
22:54
微新创想:2026年2月16日 特斯拉EMEA官方X账号宣布xAI开发的Grok人工智能服务将于近期上线欧洲市场特斯拉车辆 首批覆盖英国、爱尔兰、德国、瑞士、奥地利、意大利、法国、葡萄牙和西班牙 Grok可基于实时信息回答问题并支持导航目的地编辑旨在提升车载交互体验 此举意在提振特斯拉在欧洲疲软的销量 但当前Grok因生成不雅内容正面临全球舆论压力欧盟已对其...
22:22
微新创想:2025年底,AI搜索企业Perplexity宣布关闭已运营一年有余的广告业务。这一决定标志着该公司在商业模式上的重要转折。Perplexity总部位于美国,是首批在生成式AI产品中引入广告的初创企业之一。其初衷是通过广告收入支持平台的持续发展,同时为用户提供更丰富的搜索体验。 尽管Perplexity的广告标榜“与AI回复无关”,但用户仍对其结果...
22:22
微新创想:2026年2月19日,OpenAI CEO萨姆·奥尔特曼在印度AI峰会上发表讲话,指出一些企业正在利用AI技术作为借口,对员工进行裁员。他提到,虽然AI确实会取代某些岗位,但真正的替代效应可能在未来几年才会更加明显。奥尔特曼认为,AI不仅会带来挑战,同时也会创造新的职业机会,推动就业结构的演变。 他呼吁社会各界以更加理性的态度看待AI带来的技术变革...
22:22
微新创想:2026年2月17日 三星电子通知平泽P5施工方 将于2026年第二季度启动洁净室前期建设 比原计划提前半年 该厂位于韩国平泽园区 是三星关键下一代半导体设施 规划2028年投产 主产HBM等AI芯片 P5设3层共6个洁净室 规模超过园区现有晶圆厂 提速旨在增强产能爬坡灵活性 以更快响应市场变化
21:52
微新创想:据市场研究机构Omdia2026年2月19日发布数据全球Micro LED显示屏营收预计年内实现100%增长首次突破1亿美元(约合6.91亿元人民币) 当前该技术仍处商业化初期但制造工艺加速成熟XR领域LEDoS微显示器快速落地推动出货与收入双爆发 其核心应用覆盖超大超小尺寸车载高亮透明及可拉伸显示等场景 Omdia预测该市场2032年将达68亿美...
21:52
微新创想:2026年1月22日,Square Enix在Xbox Series X|S及Switch 2平台推出《最终幻想7重制版 Intergrade》 游戏在多个平台上同步发售,为玩家提供了更多选择。此次Switch 2版本采用了全新的“钥匙卡”形式来激活数字版游戏,而非传统的卡带方式 这一设计选择背后有着明确的技术考量。总监滨口直树表示,Switch ...