TildeOpen LLM开源欧洲语言大模型 支持多语种数据主权

2025年9月3日,来自拉脱维亚的语言技术公司Tilde正式发布了开源基础大语言模型TildeOpen LLM,这一创新举措为欧洲语言平等和数字主权建设注入了强劲动力。作为欧盟在语言领域的重要突破,TildeOpen LLM专注于支持欧洲多语种,尤其致力于提升那些代表性不足的国家和地区语言的使用效率。

TildeOpen LLM是一个拥有300亿参数的稠密解码器模型,采用业界通用的CC-BY-4.0宽松许可证,能够全面支持包括拉脱维亚语、立陶宛语、乌克兰语、土耳其语在内的多种欧洲语言。该模型的研发充分利用了欧洲顶尖计算资源——训练过程在芬兰LUMI超级计算机和JUPITER高性能平台上完成,共消耗欧盟委员会人工智能大奖挑战赛提供的200万GPU小时计算资源。

在技术架构方面,TildeOpen LLM借鉴了EleutherAI的GPT-NeoX训练框架,经过45万次参数更新,累计处理约2万亿个语言令牌。其独特的三阶段采样训练策略值得关注:首先在语言间实现均匀分布,接着针对高数据量语言进行分布增强,最后通过均匀扫查确保整体平衡。模型的核心配置包括60层神经网络、6144维嵌入维度、48个注意力头机制、8192-token上下文窗口,并采用SwiGLU激活函数、RoPE位置编码和RMSNorm层进行规范化处理。

与主流模型过度依赖英语等主要语言不同,TildeOpen LLM通过创新性的”公平的标记器”技术,实现了不同语言文本的均衡表示,显著减少了标记数量,大幅提升了小语种推理效率。在数据主权方面,该模型支持组织在本地数据中心或符合欧盟GDPR要求的安全云环境中自我托管,彻底解决了传统云服务可能引发的数据主权问题。

TildeOpen LLM开源欧洲语言大模型 支持多语种数据主权插图1

作为基础模型,TildeOpen LLM未来将衍生出更多专业版本,如经过指令调优的翻译模型等,进一步拓展应用场景。Tilde公司的这一壮举不仅有望帮助拉脱维亚在全球科技领域赢得更多认可,更彰显了保护语言多样性的坚定承诺。

huggingface:https://huggingface.co/TildeAI/TildeOpen-30b
技术:https://tilde.ai/lv/tildeopen-llm/

划重点:
🌍 TildeOpen LLM是首个全面支持欧洲多语种的开源大语言模型,特别关注小型国家语言的数字化需求
💻 模型训练依托欧洲超级计算资源,采用突破性的三阶段采样技术,实现语言间的公平表示
🔒 支持本地化部署,严格遵循GDPR等数据保护法规,为组织提供完整的数据主权解决方案

最新快讯

2026年03月05日

17:46
在英伟达统治的 AI 算力市场中,芯片设计巨头博通(Broadcom)正展现出惊人的增长野心。据媒体报道,博通 CEO 陈福阳(Hock Tan)在周三的财报电话会议上预测,到 2027 年,公司的人工智能芯片年收入将突破 1000 亿美元大关。这一激进的预期直接推动博通股价在盘后交易中上涨超过 4%。博通的底气来自科技巨头们疯狂的基建竞赛。Alphabet...
17:23
微新创想:在生成式AI(AIGC)重塑信息检索范式的今天,传统的SEO(搜索引擎优化)正加速向GEO(Generative Engine Optimization,生成式引擎优化)转型。随着AI技术的广泛应用,用户获取信息的方式发生了根本性变化,越来越多的人依赖AI助手直接获取产品推荐或解决方案。当潜在客户询问“哪款智能手表适合运动”或“最好的项目管理工具有...
17:23
声明:本文来自于微信公众号 卡思数据,作者:岳遥,授权站长之家转载发布。小红书“产出”女明星带货标杆的频率似乎正在加快。去年9月21日,演员吴千语在小红书开启直播带货首秀,最终斩获7000万元GMV,超过了董洁、章小蕙2023年的带货首秀成绩,成为小红书新的带货“一姐”。随后,12月7日,她正式开启第二场直播,开播一小时支付金额...
17:23
微新创想:近日,河北衡水一名9岁女孩在泰国曼谷旅游期间,因连续三天练习仰泳,皮肤被晒得如同酱油般黝黑。这一意外情况引发了网友的广泛关注和热议。 女孩的母亲表示,女儿对仰泳充满热情,每天坚持训练。由于她本身属于黄黑皮体质,平时晒太阳就容易变黑,但这次的晒黑程度却远超预期。即便是短短几天的户外活动,也让她肤色明显加深,令家长感到意外。 更令人忍俊不禁的是,女孩在...
17:23
微新创想:2026年3月5日,东南亚农业无人机标杆企业Aonic(前身为Poladrone Solutions)宣布完成1000万美元A轮融资,由Kairous Capital领投。此次融资标志着Aonic在农业科技领域的持续深耕与快速发展。 该公司总部位于东南亚,专注于农业与工业场景的应用。凭借自研的无人机硬件、全栈软件以及本地化服务生态,Aonic已建立...
17:23
微新创想:2026年3月5日,CORSAIR海盗船正式推出FRAME 5000D WORKSTATION机箱。这款机箱延续了FRAME 5000D的设计理念,专为高性能生产力系统打造。它不仅在外观上延续了系列产品的风格,更在内部结构和功能上进行了多项优化,以满足专业用户对稳定性和性能的双重需求。 该机箱兼容SSI-EEB规格主板,为用户提供了广泛的兼容性选择...
17:23
微新创想:2026年3月5日,自动驾驶公司Momenta已在香港秘密提交首次公开募股(IPO)申请。该公司正与中国国际金融股份有限公司及德意志银行合作推进上市,计划融资不少于10亿美元(约69.06亿元人民币)。此举旨在把握近期港股科技公司上市热潮。 Momenta成立于2016年,是一家专注于自动驾驶技术的创新企业。凭借在人工智能、计算机视觉和高精度地图等...
17:23
微新创想:徕卡即将推出SL系列平价机型SL3-P 徕卡近日宣布将推出一款全新的SL系列平价机型SL3-P 这款新机实际上是松下S1 RII的贴牌版本 SL3-P将搭载44.3MP背照式全画幅传感器以及L2影像技术 该机型预计于2026年5月正式上市 售价为6000欧元约合48163元人民币 尽管目前尚未公布SL3-P的具体外观设计 但根据市场推测其将采用更加...
17:23
微新创想:2026年3月5日,AI招聘自动化平台HireBound宣布完成200万美元种子轮融资。本轮融资由Kalaari Capital领投,Antler、Infinyte Club与CareerNet跟投。这一重要进展标志着HireBound在人工智能驱动的人力资源领域迈出了坚实的一步。 该公司专注于招聘执行层,致力于通过AI智能代理替代传统ATS记录功...
17:23
微新创想:宝马将于2026年3月18日在全球首发全新i3(代号NA0)这款车型作为新世代(Neue Klasse)平台的首款轿车定位为iX3的轿车版 新车将在2026年下半年于慕尼黑工厂正式投产初期仅推出i3 50 xDrive单一款型 该车型将搭载双电机四驱系统最大功率达到463马力峰值扭矩为645牛·米配备108千瓦时电池支持400千瓦的超快充电技术 在...
17:23
微新创想:3月5日凌晨,亚马逊对其机器人部门实施岗位裁减,这是其持续成本优化计划的最新动作。裁员事件发生于美国西雅图总部,由机器人业务副总裁斯科特·德雷瑟通报。虽然亚马逊表示此次裁员规模“相对较少”,但具体人数并未公开披露。公司方面强调,将为受影响的员工提供离职补偿、医疗保险以及再就业支持,以减轻员工在职业转型过程中的压力。 此次调整是亚马逊在整体战略方向上...
17:23
微新创想:3月5日,中国邮政集团浙江省分公司与华数数字电视传媒集团在杭州正式签署战略合作协议。此次合作标志着两家国有企业在数字化转型与融合发展道路上迈出坚实一步。 双方将围绕产业效率提升、民生服务优化、战略价值共创三大方向协同发力。通过深化合作,共同推进数字技术与实体经济的深度融合,赋能物流智能化发展,提升整体运营效率和服务水平。 合作还将聚焦于打通服务渠道...