结合主题信息聚类编码的文本摘要模型

时间:2022-03-16 14:56:38
作者:魏媛媛,倪建成,高 峰,吴俊清
关键字:序列到序列模型,生成式文本摘要,词向量聚类,主题编码,余弦相似度
DOI:10.3969/j.issn.1673-629X.2021.01.006
查看次数:702

如需要完整文档点击下方 "点击下载文档" 按钮

结合注意力机制的序列到序列模型在生成式文本摘要的研究中已取得了广泛应用, 但基于该模型的摘要生成技术依然存在信息编码不充分、生成的摘要偏离主题的问题,对此提出了一种结合主题信息聚类编码的文本摘要生成模型TICTS(theme information clustering coding text summarization)。 将传统的抽取式文本摘要方法与基于深度学习的生成式文本摘要方法相结合,使用基于词向量的聚类算法进行主题信息提取,利用余弦相似度计算输入文本与所提取关键信息的主题相关性, 将其作为主题编码的权重以修正注意力机制,在序列到序列模型的基础上结合主题信息与注意力机制生成摘要。 模型在 LCSTS 数据集上进行实验, 以 ROUGE 为评价标准,实验结果相对于基线模型在 ROUGE-1 的得分上提高了 1.1,ROUGE-2 提高了 1.3,ROUGE-L 提高了 1.1。 实验证明结合主题信息聚类编码的摘要模型生成的摘要更切合主题,摘要质量有所提高。

如需要完整文档点击下方 "点击下载文档" 按钮

结合主题信息聚类编码的文本摘要模型
《结合主题信息聚类编码的文本摘要模型》
完整文档 下载到本地,方便收藏和查阅
文件号:060593
结合主题信息聚类编码的文本摘要模型
点击下载文档
结合主题信息聚类编码的文本摘要模型

点击下载 文件号:060593(点击复制) 公众号(点击复制)

x