情感语音转换技术研究取得新进展

23日从内蒙古大学计算机学院获悉，该院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所科研团队合作，在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理会刊》发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”的最新研究成果。

　　据介绍，情感语音转换（VC）旨在将中性语音转换为情感声音，同时保留语言信息和说话者的身份。科研团队注意到，将情感特征与其他语音信息（例如内容、说话者身份等）解耦是实现高质量转换效果的关键。由于情感语音中声学特征的解耦更加复杂，面向中性语音的特征解耦一直无法得到很好的处理。

　　科研团队针对情感语音转换的声学特征解耦问题开展研究，提出了一种基于“源—滤波器”模型的情感语音转换系统，具体来说，是为了解决情感语音转换的特征解耦问题而提出一种新颖的基于“源—滤波器”模型的情感VC模型（简称SFEVC），以从音色和音调特征中准确过滤说话人独立的情感线索。SFEVC模型由多通道编码器、情感独立编码器、预训练的说话人相关编码器和相应的解码器组成。所有编码器模块都采用信息瓶颈自动编码器。

　　为了进一步提高各种情绪的转化质量，研究团队还提出了基于二维VA（激活度—效价）空间的训练策略。实验结果表明，SFEVC模型以及VA训练策略的表现均优于所有基线系统，并基于非平行数据在说话人无关的情感VC场景下实现了最优性能。

情感语音转换技术研究取得新进展

相关推荐

国内首家国家级氢能检测机构投用

科技部举办2022年全国颠覆性技术创新大赛

人工智能与物联网的融合或是未来十年最大创新机遇

我国科学家在深海打造中微子望远镜

搭载智慧体系连通城市大脑

欢迎登录

选择您感兴趣的行业/领域，我们将推送相关信息

感兴趣的行业：

感兴趣的行业领域：

以下为推送内容

找回密码

欢迎注册

情感语音转换技术研究取得新进展

相关推荐

国内首家国家级氢能检测机构投用

科技部举办2022年全国颠覆性技术创新大赛

人工智能与物联网的融合 或是未来十年最大创新机遇

我国科学家在深海打造中微子望远镜

搭载智慧体系 连通城市大脑

人工智能与物联网的融合或是未来十年最大创新机遇

搭载智慧体系连通城市大脑