微新创想(idea2003.com)9月12日 消息:近日,全球知名IT企业微软公司携手非营利性数字图书馆项目古Project Gutenberg,通过尖端人工智能技术成功为该计划的电子书库制作了超过5000本高品质有声读物。这一创新合作项目不仅标志着AI技术在文化传承领域的重大突破,更将为全球读者带来前所未有的听书体验。
在此次技术攻关中,微软研究团队综合运用了机器学习、自动文本结构识别和自然语言处理等多项前沿AI技术,实现了从电子书自动转化为有声书的全流程智能化处理。项目团队首先开发出一种创新算法,能够精准分析电子书的文本结构,有效区分正文内容与页码、表格等非关键元素,为后续语音合成奠定基础。随后,团队采用WaveNet、Tacotron和FastSpeech等国际领先的文本转语音技术,生成高度逼真的真人朗读效果。特别值得一提的是,该系统还能智能识别书中的叙述者、对话及不同角色,并动态调整语音语调和表达方式,使故事情节的语音呈现更加生动立体。
据悉,此次合作项目已累计收集整理超过35000小时的有声书语音数据,内容涵盖经典文学、戏剧、传记等丰富门类。这些珍贵的语音资源将以完全开源的方式免费向公众提供,为全球知识传播贡献重要力量。用户甚至可以通过录制少量个人语音样本,就能生成用自己声音朗读整本书的定制化有声书,这种个性化的听书体验堪称行业首创。该项目不仅将极大丰富有声书的内容库,更为视障人士和阅读障碍者提供了前所未有的便捷阅读途径。
Project Gutenberg作为全球最大的免费数字图书馆,其网站常年提供超过7万本电子书的免费阅读和下载服务。此次与微软合作开发有声书项目,将使该平台的免费有声书数量实现跨越式增长,为广大读者开辟一条全新的知识获取通道。这一合作不仅推动了人工智能技术在文化领域的创新应用,更彰显了科技向善的企业社会责任,为构建更加包容、普惠的知识社会树立了典范。