基于特征约简的随机森林改进算法研究

时间:2022-04-15 23:05:47
作者:王 诚,高 蕊
关键字:随机森林,权重排序,特征约简,抽样方式,RW_RF算法
DOI:10.3969/j.issn.1673-629X.2020.03.008
查看次数:413

如需要完整文档点击下方 "点击下载文档" 按钮

随机森林(random forest,RF)算法虽应用广泛且分类准确度很高,但在面对特征维度高且不平衡的数据时,算法分 类性能被严重削弱。 高维数据通常包含大量的无关和冗余的特征,针对这个问题,结合权重排序和递归特征筛选的思想,提出了一种改进的随机森林算法RW_RF (ReliefF & wrapper random forest)。 首先引用ReliefF算法对数据集的所有特征按 正负类分类能力赋予不同的权值,再递归地删除冗余的低权值特征,得到分类性能最佳的特征子集来构造随机森林;同时 改进ReliefF的抽样方式,以减轻不平衡数据对分类模型的影响。 实验结果显示,在特征数目很多的数据集中,改进算法的 各评价指标均高于原算法,证明提出的RW_RF算法有效精简了特征子集,减轻了冗余特征对模型分类精度的影响,同时 也证明了改进算法对处理不平衡数据起到了一定的效果。

如需要完整文档点击下方 "点击下载文档" 按钮

基于特征约简的随机森林改进算法研究
《基于特征约简的随机森林改进算法研究》
完整文档 下载到本地,方便收藏和查阅
文件号:061532
基于特征约简的随机森林改进算法研究
点击下载文档
基于特征约简的随机森林改进算法研究

点击下载 文件号:061532(点击复制) 公众号(点击复制)

x