生成式对抗网络在语音增强方面的研究

时间:2022-03-19 07:36:18
作者:孙成立,王海武
关键字:人工智能,生成式对抗网络,生成器,判别器,语音增强
DOI:10.3969/j.issn.1673-629X.2019.02.032
查看次数:301

如需要完整文档点击下方 "点击下载文档" 按钮

伴随着人工智能的兴起,各种深度学习模型应运而生,生成式对抗网络(generative adversarial networks,GAN)作为其中的一种深度学习模型成为了研究热点。GAN 已成功应用在图像处理中,但将其应用在语音增强方面是需要研究的问题。GAN 应用在语音增强的研究方法与 GAN 的实质是一样的,是通过构造两个模型,即生成模型(generative model)和判别模型(discriminative model),也叫做生成器(generator)和判别器(discriminator)。两者通过互相竞争、对抗的形式来学习训练,GAN 最终要实现的目标是生成新的数据,即实现去噪。对 GAN 在语音增强方面的应用进行了研究,提出了使用传统的 GAN 数学模型用于语音增强进行建模,同时改进了 GAN 的数学模型并加入了稀疏因式,将 GAN 增强后的语音与其他传统的语音增强方法进行对比。实验结果表明,使用 GAN 增强后的语音的 segSNR 和 PESQ 的得分要比传统的语音增强方法的得分高,从而证明 GAN 比其他传统的语音增强方法更具优越性。

如需要完整文档点击下方 "点击下载文档" 按钮

生成式对抗网络在语音增强方面的研究
《生成式对抗网络在语音增强方面的研究》
完整文档 下载到本地,方便收藏和查阅
文件号:061994
生成式对抗网络在语音增强方面的研究
点击下载文档
生成式对抗网络在语音增强方面的研究

点击下载 文件号:061994(点击复制) 公众号(点击复制)

x