基于语义增强的改进混合特征选择的文本分类

时间:2023-05-04 05:24:18
作者:高洁云,赵逢禹,刘 亚
关键字:混合特征选择,语义分析,词向量,文本分类,LSTM
DOI:10.3969/j.issn.1673-629X.2021.01.005
查看次数:774

如需要完整文档点击下方 "点击下载文档" 按钮

如何从文本中抽取出能够体现文本特点的关键特征,抓取特征到类别之间的映射是文本分类核心问题之一。 传统的词袋模型的优点是将每个词视为一个特征,而缺点是计算成本会随特征数量和文本与特征之间的关系的增加而增加,并且没有考虑文本特征自身的语义关系,语义关系的优势是获取文本和特征之间的相关性。 针对这个问题,提出一种增强混合特征选择方法,该方法使用混合特征选择进行降维,然后再使用词向量对低频词进行语义增强。 为了验证增强的混合特征选择对文本分类的作用,构建了两个实验,使用 LSTM 算法进行分类模型训练与测试。 对爬取的 71 825 个新闻文本数据进行实验表明,基于语义的增强混合特征选择方法在文本分类时既提高了分类效率又能保证分类精度。

如需要完整文档点击下方 "点击下载文档" 按钮

基于语义增强的改进混合特征选择的文本分类
《基于语义增强的改进混合特征选择的文本分类》
完整文档 下载到本地,方便收藏和查阅
文件号:060592
基于语义增强的改进混合特征选择的文本分类
点击下载文档
基于语义增强的改进混合特征选择的文本分类

点击下载 文件号:060592(点击复制) 公众号(点击复制)

x