大数据 (May 2024)

面向非平行语料的语音转换技术综述

  • 李鹏程, 张旭龙, 王健宗, 程宁, 肖京

DOI
https://doi.org/10.11959/j.issn.2096-0271.2024011
Journal volume & issue
Vol. 10, no. 3
pp. 65 – 81

Abstract

Read online

语音转换是语音及人工智能领域的一项研究课题,其目标是在保持源语音内容不变的情况下改变语音的音色,使其听上去像是由另一个目标说话人说出的,同时还需保证语音的质量和自然度。面向非平行语料的语音转换技术是当下的热门研究内容,其使用非平行的多说话人语音数据集进行模型训练,能完成多对多以及任意对任意的语音转换。对近年来面向非平行语料的语音转换进行了全面的总结和分析。首先概述了早期面向平行语料的语音转换及其缺陷,然后对当下面向非平行语料的语音转换的各类实现方法进行介绍和对比分析,最后对语音转换技术进行了总结和展望。

Keywords