TildeOpen LLM开源欧洲语言大模型 支持多语种数据主权

2025年9月3日,来自拉脱维亚的语言技术公司Tilde正式发布了开源基础大语言模型TildeOpen LLM,这一创新举措为欧洲语言平等和数字主权建设注入了强劲动力。作为欧盟在语言领域的重要突破,TildeOpen LLM专注于支持欧洲多语种,尤其致力于提升那些代表性不足的国家和地区语言的使用效率。

TildeOpen LLM是一个拥有300亿参数的稠密解码器模型,采用业界通用的CC-BY-4.0宽松许可证,能够全面支持包括拉脱维亚语、立陶宛语、乌克兰语、土耳其语在内的多种欧洲语言。该模型的研发充分利用了欧洲顶尖计算资源——训练过程在芬兰LUMI超级计算机和JUPITER高性能平台上完成,共消耗欧盟委员会人工智能大奖挑战赛提供的200万GPU小时计算资源。

在技术架构方面,TildeOpen LLM借鉴了EleutherAI的GPT-NeoX训练框架,经过45万次参数更新,累计处理约2万亿个语言令牌。其独特的三阶段采样训练策略值得关注:首先在语言间实现均匀分布,接着针对高数据量语言进行分布增强,最后通过均匀扫查确保整体平衡。模型的核心配置包括60层神经网络、6144维嵌入维度、48个注意力头机制、8192-token上下文窗口,并采用SwiGLU激活函数、RoPE位置编码和RMSNorm层进行规范化处理。

与主流模型过度依赖英语等主要语言不同,TildeOpen LLM通过创新性的”公平的标记器”技术,实现了不同语言文本的均衡表示,显著减少了标记数量,大幅提升了小语种推理效率。在数据主权方面,该模型支持组织在本地数据中心或符合欧盟GDPR要求的安全云环境中自我托管,彻底解决了传统云服务可能引发的数据主权问题。

TildeOpen LLM开源欧洲语言大模型 支持多语种数据主权插图1

作为基础模型,TildeOpen LLM未来将衍生出更多专业版本,如经过指令调优的翻译模型等,进一步拓展应用场景。Tilde公司的这一壮举不仅有望帮助拉脱维亚在全球科技领域赢得更多认可,更彰显了保护语言多样性的坚定承诺。

huggingface:https://huggingface.co/TildeAI/TildeOpen-30b
技术:https://tilde.ai/lv/tildeopen-llm/

划重点:
🌍 TildeOpen LLM是首个全面支持欧洲多语种的开源大语言模型,特别关注小型国家语言的数字化需求
💻 模型训练依托欧洲超级计算资源,采用突破性的三阶段采样技术,实现语言间的公平表示
🔒 支持本地化部署,严格遵循GDPR等数据保护法规,为组织提供完整的数据主权解决方案

最新快讯

2025年09月09日

06:28
2025年9月9日清晨5时26分,西藏那曲市双湖县突发4.0级地震,震中位于北纬34.04度、东经87.93度,震源深度达10千米。此次地震发生在凌晨时分,具体影响范围及破坏情况目前仍在紧急评估中。作为高原地区的重要地质监测点,双湖县地处青藏高原腹地,此次地震虽未造成人员伤亡报告,但周边居民已启动应急响应机制,相关部门正通过卫星遥感与地面监测相结合的方式,全...
06:28
澳新银行近期发布重要人事调整计划,预计在2026年9月前将迎来约3500名员工的离职潮。这一预测背后,是银行在业务结构优化与数字化转型战略下的深思熟虑。作为全球领先的金融机构之一,澳新银行此次的人力资源配置调整,旨在进一步提升运营效率与市场竞争力。值得注意的是,银行方面尚未公布具体的裁员比例,也未明确指出将涉及哪些业务部门。这一信息释放引发了市场的高度关注,...
06:28
8月以来,北交所市场迎来18家拟上市公司的动态更新,展现出资本市场改革深化下的活力与规范并行的趋势。其中,6家公司收到第二轮问询函,2家公司已进入第三轮问询环节。监管问询内容高度聚焦于业绩可持续性、募投项目合理性及收入真实性三大核心领域,这一举措不仅体现了监管层对上市公司质量的高度重视,更彰显了北交所强化源头监管、提升上市公司整体质量的长远导向。通过精准问询...
05:52
英特尔于北京时间2025年9月9日正式公布一系列关键高管人事调整,旨在进一步优化组织架构,强化业务增长动力。根据官方公告,数据中心集团将由Kevork Kechichian全面负责,这位资深高管此前在英特尔内部积累了丰富的技术管理经验,其领导将有助于推动数据中心业务的创新升级。与此同时,Jim Johnson被任命为客户计算集团主管,他将带领团队聚焦下一代计...
05:52
2025年9月9日,高盛集团首席执行官David Solomon在公开讲话中透露了公司未来的增长预期。他明确表示,高盛预计将在未来一段时间内维持个位数的稳健增长态势。这一预测并非空穴来风,而是基于对当前复杂市场环境的深度洞察以及公司长期稳健的业务发展策略。Solomon特别强调,高盛将继续深化资源配置的优化工作,通过技术创新和流程再造全面提升运营效率,为企业...
05:52
近日,微软公司与全球知名科技公司Nebius达成一项历史性合作协议,双方将共同投资194亿美元用于构建云计算基础设施。这一重大合作标志着微软在云服务领域的战略布局再上新台阶,同时也为Nebius在数据中心建设和人工智能基础设施领域的快速发展注入强劲动力。 根据协议内容,微软将向Nebius提供全方位的长期技术支持,涵盖云计算平台搭建、数据存储优化、网络安全防...
05:52
2025年9月9日,北京时间,美国食品药品管理局(FDA)高级官员Makary就孤独症(Autism)监管问题发表重要声明。Makary透露,FDA目前尚未发布关于孤独症的专项报告,但已启动相关评估工作,预计将在一个月内完成并形成正式文件。这一表态显示出FDA对孤独症群体健康问题的重视,以及其在食品药品监管领域持续探索的决心。 此次FDA的主动评估行动,标志...
05:52
2025年9月8日,人工智能(AI)板块整体表现强劲,赢家指数录得0.70%的稳步上涨,最终收于249.17点,展现出市场的积极信号。更为亮眼的是,作为AI软件领域的先行指标,先驱指数涨幅高达1.62%,报收129.56点,这一显著增长进一步印证了投资者对AI软件细分领域的浓厚兴趣与坚定信心。此次指数的双双攀升,不仅反映了市场对AI技术持续发展的乐观预期,也...
05:52
周一(9月8日)资本市场上演精彩纷呈的板块轮动,半导体板块表现尤为亮眼,全天强势上扬1.10%,强势领跑当日所有行业ETF,成为投资者关注的焦点。这一强劲表现不仅彰显了市场对半导体行业未来发展的乐观预期,也反映出该板块在当前科技周期中的核心地位。 与此同时,全球科技股指数ETF、科技行业ETF以及网络股指数ETF也紧随其后,分别录得0.97%、0.73%和0...
05:52
9月9日凌晨3时48分,随着太原卫星发射中心在山东日照附近海域的精准点火,捷龙三号运载火箭如利箭般直刺苍穹,成功将吉利星座05组卫星顺利送入预定轨道。此次发射任务不仅标志着我国航天技术的又一重大突破,更彰显了商业航天领域的蓬勃生机。 作为我国商业航天发展的重要里程碑,此次捷龙三号运载火箭的升空,不仅展现了我国航天技术的强大实力,更彰显了我国在商业航天领域的积...
05:52
2025年9月9日,一则重磅消息震惊了全球媒体界——默多克家族终于就备受瞩目的家族信托诉讼达成和解协议。这一协议不仅标志着福克斯和新闻集团控股权归属问题的尘埃落定,更预示着默多克家族内部长期存在的权力博弈走向终结。作为全球最具影响力的媒体帝国之一,此次和解的细节引发各界高度关注。 根据协议条款,现年58岁的拉克伦·默多克将正式接掌家族核心资产,包括福克斯电视...
05:19
戴尔公司近日正式宣布,其首席财务官Yvonne McGill即将离任这一重要职位。McGill在戴尔任职期间,全面负责公司的全球财务战略规划与执行,为公司的稳健运营和持续增长做出了卓越贡献。尽管公司方面尚未公开披露McGill离职的具体原因,但这一变动无疑将引发市场的高度关注。 据悉,戴尔公司已着手启动继任者的遴选程序,并计划尽快确定新的首席财务官人选。这一...