合合信息AI助力抢救古彝文发布首个编码数据库

2023-09-28 08:23:22 互联网 30 次阅读

微新创想（idea2003.com）9月27日消息：近日，合合信息携手上海大学与华南理工大学，共同发布了业内首部古彝文基础编码数据库。这一创新成果通过人工智能技术，对云贵地区流传的古彝文字符进行系统性数字化编码，成功构建了一个类似”大字典”的权威数据库，为相关研究人员和爱好者提供了便捷的古彝文读音与释义查询平台。图源备注：图片由AI生成，图片授权服务商Midjourney

据悉，古彝文作为民间流传的原生态彝文体系，拥有高达87046个字符，其数量远超现代汉字。其中，《西南彝志》作为目前发现的篇幅最长、内容最为丰富的古彝文典籍，承载着丰富的历史文化信息。然而，古彝文异体字种类繁多，一个字往往存在几十种不同的书写形式，这给古籍的数字化工作带来了巨大挑战。为攻克这一难题，项目团队创新性地采用了智能图像处理、文字识别等前沿人工智能技术，对超过7万6千个古彝文字符样本进行深度训练，最终成功建立了统一的古彝文数字编码体系。

该数据库的发布标志着古彝文研究迈入了一个全新的数字化时代。相关用户只需输入对应的数字编码，即可快速查询到相应字符的读音、释义等详细信息，极大地降低了阅读和理解古彝文古籍的门槛。合合信息在声明中表示，此次数据库的发布仅为基础性工作，其深远意义在于帮助更多人认识、研究古彝文，为语言文明的保护探索出一条创新路径。当前，数字化已成为文化传承的重要途径，这一数据库项目充分证明了人工智能在助力传统文化走向数字化方面具有不可替代的重要作用。