基于两阶段特征选择的医疗敏感文本分类

时间:2023-05-24 02:00:32
作者:陈春玲,姜慧敏,郭永安
关键字:医疗数据,隐私保护,特征选择,敏感数据,文本分类
DOI:10.3969/j.issn.1673-629X.2020.08.022
查看次数:525

如需要完整文档点击下方 "点击下载文档" 按钮

为完成对医疗数据的敏感性分类,采用文本分类技术从对医疗敏感数据的分类的角度对医疗信息隐私保护进行了研究。 在传统的医疗文本分类基础上,提出基于 LSI-TF-IDF 两阶段特征选择的文本分类方法对医疗文本数据进行敏感性分类。 分别采用基于 TF-IDF 的传统文本分类方法和基于 LSI-TF-IDF 的两阶段特征选择的文本分类方法对糖尿病文本数据进行敏感性分类,利用朴素贝叶斯、KNN、SVM 三个分类器进行实验比较,采用准确率、召回率和 F1值作为评价标准。 实验结果表明,基于 LSI-TF-IDF 两阶段特征选择的文本分类方法较之基于 TF-IDF 的传统文本分类方法在准确率、召回率和 F1值上均有所提升。 证明了该方法在医疗文本数据的敏感性分类上具有更好的分类效果。

如需要完整文档点击下方 "点击下载文档" 按钮

基于两阶段特征选择的医疗敏感文本分类
《基于两阶段特征选择的医疗敏感文本分类》
完整文档 下载到本地,方便收藏和查阅
文件号:061750
基于两阶段特征选择的医疗敏感文本分类
点击下载文档
基于两阶段特征选择的医疗敏感文本分类

点击下载 文件号:061750(点击复制) 公众号(点击复制)

x