
微新创想:Google 近日在非洲正式推出名为 WAXAL 的全新语音数据集。该项目涵盖了阿乔利语、豪萨语、卢干达语、约鲁巴语等 21 种非洲语言,旨在解决长期以来非洲语言在 AI 系统中识别准确率低、错误频出的“生存性问题”。
WAXAL 数据集的核心突破在于数据主权归还。不同于以往由科技巨头掌控数据的模式,WAXAL 的所有权完全归属于参与建设的非洲本地机构,而非 Google 本身。这一举措不仅增强了非洲在人工智能领域的自主权,也体现了对本地数据资源的尊重与重视。
数据集规模庞大且专业。WAXAL 包含超过 1.1 万小时的语音和近 200 万条录音。其中包括约 1250 小时的转写语音,以及可用于文本转语音(TTS)的高保真音频。这些高质量的数据为 AI 模型的训练提供了坚实的基础,有助于提升语音识别的准确性和适用性。
该项目还通过宽松的许可方式开源,允许商业使用。目前,加纳大学等机构已开始利用这些数据推进孕产妇健康等本地化 AI 应用研究。这种开放共享的模式,为非洲的科研人员和开发者提供了宝贵资源,促进了本地技术生态的发展。
尽管面临语种复杂、缺乏声调符号等技术挑战,WAXAL 的发布仍然标志着非洲正从单纯的数据采集方转变为技术基础设施的拥有者。这一转变对于提升非洲在全球 AI 技术格局中的地位具有重要意义。
Google 计划未来将语种扩展至 27 种,进一步推动非洲 AI 话语权的提升。通过持续投入和本地合作,Google 正在帮助非洲构建更加完善和多元的人工智能技术体系。
