语音情感识别中面向小数据集的 CGRU 方法

时间:2023-03-03 07:13:07
作者:吴俊清,倪建成,魏媛媛
关键字:语音情感识别,卷积神经网络,门控循环单元,小数据集,谱图特征
DOI:10.3969/j.issn.1673-629X.2020.12.014
查看次数:754

如需要完整文档点击下方 "点击下载文档" 按钮

为增强人机交互的和谐,提升语音情感识别的精度,提出一种面向小数据集的 CGRU 深度学习方法。该方法将原始音频通过上移和下移操作进行语音增强,将增强后的语音信号映射到 Mel 尺度并生成 Mel 功率谱图,然后对其做旋转、切角、偏移等图像增强操作,并结合卷积神经网络(CNN)对频域特征的捕捉能力和门控循环单元(GRU)网络对时序信息的特性获取能力构成融合模型 CGRU,该模型通过自动学习深度谱特征进行情感识别。实验分别验证了利用谱图特征与手工特征在 Emo-DB 上的识别效果,并比较了 CLSTM 与 CGRU 的时间性能。 结果表明,利用谱图特征在 CGRU 方法上的情感识别精度达到 98. 39% ,超过传统手工特征 eGeMAPS 在该数据库上的识别效果,提出的方法在语音情感识别任务上获得有竞争力的表现。 另外,在相同的训练参数下,CGRU 要比 CLSTM 具有更加良好的时间性能。

如需要完整文档点击下方 "点击下载文档" 按钮

语音情感识别中面向小数据集的 CGRU 方法
《语音情感识别中面向小数据集的 CGRU 方法》
完整文档 下载到本地,方便收藏和查阅
文件号:061894
语音情感识别中面向小数据集的 CGRU 方法
点击下载文档
语音情感识别中面向小数据集的 CGRU 方法

点击下载 文件号:061894(点击复制) 公众号(点击复制)

x