大数据 (Sep 2024)

情感语音合成综述

  • 施昊翔, 张旭龙, 王健宗, 程宁, 肖京

DOI
https://doi.org/10.11959/j.issn.2096-0271.2024014
Journal volume & issue
Vol. 10, no. 5
pp. 56 – 73

Abstract

Read online

作为语音领域一个重要的研究方向,语音合成致力于将文本转化为语音。随着深度学习技术的快速发展,语音合成的目的早已不仅仅是合成一段“能听懂”的音频这么简单,情感的加入往往能使语音变得更加具有表现力。基于此,情感语音合成在语音中加入不同的情感并对情感进行调控,以生成灵活且准确的情感语音。从情感语音合成中的几个关键科学问题出发,分别对近几年来基于情感迁移、情感强度控制和情绪混合的发展进行了总结分析,并介绍了情感语音合成的相关数据集和评价指标,最后对情感语音合成进行了展望。

Keywords