新加坡科技设计大学的研究团队近日推出了一款名为TinyLlama的AI模型,这款模型以其惊人的小巧体积和强大的性能能力,在人工智能领域引起了广泛关注。TinyLlama仅占用550MB的内存空间,却具备出色的智能处理能力,使其成为边缘设备应用的理想选择。

TinyLlama采用了先进的稳定扩散XL技术,并计划在90天内利用3万亿token的数据集进行深度训练。这一庞大的数据集将为模型提供丰富的学习资源,使其能够适应内存受限的边缘设备环境。该项目的主要目标是为这些设备提供高性能的人工智能解决方案,满足日益增长的开发者对小型AI模型的需求。

随着边缘设备的普及,对内存和计算能力有限制的设备来说,小型AI模型的优势愈发明显。这些模型不仅能够独立运行多种应用,还能协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所强调的。TinyLlama正是基于这一理念设计而成,其紧凑的架构使其能够高效运行在资源有限的设备上。

TinyLlama项目由新加坡科技设计大学的研究助理领衔,他们致力于在三万亿token的数据集上预训练一个11亿token的Llama模型。这个轻量级的模型不仅内存占用极低,而且具备广泛的应用潜力,特别是在需要受限计算和内存占用的场景中,如无需互联网连接的实时机器翻译等。

TinyLlama的训练工作于9月1日正式启动,团队使用了16个A100-40G GPU进行加速,计划在90天内完成整个训练过程。截至目前,团队已成功完成了1050亿token的训练任务。模型的构建者表示,TinyLlama采用了与Meta用于训练Llama2的“完全相同的架构和分词器”,这将使其能够轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集进行训练。这些数据集曾用于训练StarCoder,这是一个代码生成模型,其丰富的内容将为TinyLlama提供强大的学习基础。

一旦训练完成,TinyLlama将加入众多小型语言模型的行列,这些模型正被开发者用于构建各种创新应用。与此同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b等模型也在不断取得进展,共同推动着小型AI技术的发展。

项目网址:https://github.com/eivindbohler/tinyllama

最新快讯

2026年01月16日

00:04
2026年1月12日凌晨,北京穿越者公司试验团队启程前往试验场,其穿越者壹号(CYZ1)载人飞船全尺寸试验舱已就位,即将开展着陆缓冲综合验证试验。此次试验基于优化后的电磁阀算法,舱体推力均匀性显著提升,晃动角度由正负五度以上降至正负一度内,有效增强“云感着陆”体验。同时,试验舱完成飞控计算机、传感器等多台单机总测,系统响应迅捷,数据实时达标,接口匹配符合预...
00:04
2026年1月15日,小米汽车正式宣布对城市领航辅助功能的安全里程解锁标准进行优化调整。据悉,该功能此前需要用户累计达到1000公里的辅助驾驶安全里程才能解锁使用,这一门槛设置引发了广大用户的普遍质疑和反馈。经过小米团队深入的市场调研与用户沟通,以及对实际驾驶数据的综合评估,公司最终决定对安全里程解锁标准进行下调。这一重要调整预计将通过下一次OTA系统升级正...

2026年01月15日

23:33
2026年1月14日,欧洲研究人员将阿尔卑斯山冰芯样本存入南极康科迪亚站附近的地下冰穴,宣告全球首个高山冰芯冷库正式启用。该冰库位于雪堆下5米深处,常年温度约零下52摄氏度,首批冰芯来自法国勃朗峰和瑞士大孔班山,经50天海陆空运输抵达。项目名为“冰记忆”,由法、意、瑞等国机构联合运营,旨在保存濒危冰川的冰芯样本,供未来科研使用。冰芯含有历史气候与人类活动信...
23:33
2026年1月15日,ThiGames开发的逾千款游戏从PlayStation商店下架。此举疑为索尼整治PS5平台低质“换皮游戏”的延续。涉事游戏多以简单玩法和易解锁奖杯吸引玩家,如《跳跃的薯条》系列仅需重复跳跃即可达成成就。此前,索尼曾下架Randomspin公司游戏,理由类似。目前双方均未回应。已获奖杯仍保留在用户账户中。
23:03
动画电影《熊出没·年年有熊》于2026年1月15日官宣定档2026年春节上映。此次为系列时隔12年再度回归‘年’题材,主打首部中式奇幻冒险。影片讲述熊大因失去神力陷入危机,误入反派陷阱引发大灾变的故事。截至2025年1月底,《熊出没》系列电影累计票房已突破80亿元,延续其在春节档的稳定表现。
23:03
2026年1月15日,高盛亚洲(日本除外)股票资本市场联席主管王亚军在一场备受瞩目的媒体会上发表重要观点,明确指出中国人工智能领域目前不存在泡沫现象。这一表态在当前AI赛道持续升温的背景下显得尤为关键,为市场提供了重要的参考依据。王亚军强调,尽管AI领域的关注度与日俱增,但中国市场的投资依然拥有坚实的基本面支撑。他表示,企业在此领域的持续技术投入以及商业化进...
23:03
2026年1月15日,埃隆·马斯克在社交平台X表示,SpaceX的“星舰”重型火箭将在最多4年内实现每小时发射一次的高频运行。据估算,若达成该频率,星舰年发射次数近万次,凭借100吨载荷能力,年运力可达百万吨,约为人类航天史累计发射质量的20倍。马斯克强调,星舰将大规模量产,年产量或达1万枚。目前星舰仍处试验阶段,已验证基本技术框架,但要实现高频发射,还需...
23:03
2026年1月15日,海南铁路南港“二线口岸”海口货列查验区顺利完成首批海关管控货物的查验任务。在该查验区,载有监管货物的卡车通过智慧卡口系统,依次完成过磅、安检、查验及施封等流程,实现“无感通关”。此次操作标志着海南自贸港封关运作后铁路货运通关能力的成功验证,为后续高效物流运行奠定基础。
23:03
2026年1月15日,先导智能宣布已实现全固态电池整线解决方案的量产级交付。该方案核心设备覆盖电极制备、电解质膜制备、等静压致密化及后道检测等全工艺环节,均系公司完全自主研发。此举标志着其在固态电池装备领域完成关键技术布局,可为下游客户提供一站式整线交付服务,推动固态电池产业化进程。
23:03
2026年1月14日,时代长安动力电池有限公司与川渝高竹新区管委会签署协议,投资55亿元建设生产基地,将导入宁德时代最新一代动力电池技术。该公司由长安汽车、深蓝汽车与宁德时代合资成立,主营电池制造与销售,位于四川省宜宾市。此次扩产旨在强化新能源汽车产业链布局。目前,深蓝S05等车型已标配宁德时代电芯,续航达620km(CLTC)。
22:34
微新创想1月15日消息,小米董事长雷军今日晚间在直播中表示,小米YU7限时上线7年低息购车和新的权益政策。1月16日0点起至2月28日前下定,小米YU7可享7年低息购车政策,首付4.99万元起,月供低至2593元。同时,小米YU7限时全系赠送前排双零重力座椅。新用户锁单即可获赠;已锁单未交付的用户,可提前支付1000元尾款:原订...
22:33
微新创想1月15日重磅报道,小米米家冰箱全新力作——墨羽岩对开门冰箱正式登陆市场,以震撼首发价1899元(厂商建议零售价2999元)开启2026年家电盛宴。这款冰箱凭借其636L的超大容积和对开门的时尚设计,迅速成为消费者关注的焦点。 作为一款专为现代家庭打造的冰箱,墨羽岩内部精心划分了18个精细分区,无论是日常果蔬、生鲜肉类还是大容量包装食品,都能得到有序...