如需要完整文档点击下方 "点击下载文档" 按钮
在语音情感识别的研究中发现,愤怒与开心之间通过语音信息较难区分,文中将结合文本信息对这两种情感进行区分,以提高其识别率.使用IEMOCAP与SAVEE数据集中语音数据提取声学特征,分别使用卷积神经网络与支持向量机训练分类器模型,对中性、愤怒、开心、悲伤四类情感进行识别,对情感之间误判情况以及识别准确率进行分析,验证了语音通道信息对于愤怒与开心容易产生误判的结论.为解决此问题,加入文本信息,训练文本识别模型,有效解决了愤怒与开心的误判情况.同时发现两通道信息对情感识别的不同影响,在声音中包含更多利于识别愤怒和悲伤情感的信息;在文本中包含更多利于识别中性与开心情感的信息.声音情感识别中,愤怒/开心之间易误判,愤怒/悲伤之间易区分.文本情感识别中,愤怒/开心之间易区分,愤怒/悲伤之间易误判.声学与文本特征融合后,情感识别准确率相比单一通道明显提高,两通道信息对于情感识别具有互补作用.
如需要完整文档点击下方 "点击下载文档" 按钮
《语音与文本情感识别中愤怒与开心误判分》
将 完整文档 下载到本地,方便收藏和查阅
文件号:062829
点击下载文档