如需要完整文档点击下方 "点击下载文档" 按钮
伴随着人工智能的兴起,各种深度学习模型应运而生,生成式对抗网络(generative adversarial networks,GAN)作为其中的一种深度学习模型成为了研究热点。GAN 已成功应用在图像处理中,但将其应用在语音增强方面是需要研究的问题。GAN 应用在语音增强的研究方法与 GAN 的实质是一样的,是通过构造两个模型,即生成模型(generative model)和判别模型(discriminative model),也叫做生成器(generator)和判别器(discriminator)。两者通过互相竞争、对抗的形式来学习训练,GAN 最终要实现的目标是生成新的数据,即实现去噪。对 GAN 在语音增强方面的应用进行了研究,提出了使用传统的 GAN 数学模型用于语音增强进行建模,同时改进了 GAN 的数学模型并加入了稀疏因式,将 GAN 增强后的语音与其他传统的语音增强方法进行对比。实验结果表明,使用 GAN 增强后的语音的 segSNR 和 PESQ 的得分要比传统的语音增强方法的得分高,从而证明 GAN 比其他传统的语音增强方法更具优越性。