基于不平衡数据集的改进随机森林算法研究

时间:2023-06-30 20:34:03
作者:刘耀杰,刘独玉
关键字:不平衡数据集,随机森林,决策树,节点分裂,分类准确率
DOI:10.3969/j.issn.1673-629X.2019.06.021
查看次数:71

如需要完整文档点击下方 "点击下载文档" 按钮

随机森林算法在多种应用场景与数据集中都实现了良好的模型分类效果,但该算法在应用于不平衡二分类数据集时,受限于样本数据量本身的好坏比倾斜与决策子树叶节点投票机制,对样本量占相对少数的小类属样本不能很好地对分类进行表决。 对此,文中对原有随机森林算法的节点分类规则进行改进。 在模型训练过程中,综合考虑度量节点样本分类占比与节点深度,增加有利于少量类样本分类信息,从而提高了少数样本类的分类准确率。 通过在不同数据集上进行随机森林改进算法的效果测试,证明改进算法相对于传统算法在不平衡数据集上有更好的模型表现,大样本条件下少量类样本分类准确率有显著提升。

如需要完整文档点击下方 "点击下载文档" 按钮

基于不平衡数据集的改进随机森林算法研究
《基于不平衡数据集的改进随机森林算法研究》
完整文档 下载到本地,方便收藏和查阅
文件号:062150
基于不平衡数据集的改进随机森林算法研究
点击下载文档
基于不平衡数据集的改进随机森林算法研究

点击下载 文件号:062150(点击复制) 公众号(点击复制)

x