基于 C4. 5 决策树分类算法的改进与应用

时间:2023-07-09 20:50:31
作者:李春生,焦海涛,刘 澎,刘小刚
关键字:决策树,数据概率,信息增益率,时间效率,改进算法
DOI:10.3969/j.issn.1673-629X.2020.05.035
查看次数:112

如需要完整文档点击下方 "点击下载文档" 按钮

决策树算法是在已知具有不同特征的样本数据出现的概率基础上,构建决策树来进行数据分析的一种算法。 在数据分类算法中,决策树算法是一种经典的分类决策算法。 首先,将所有的数据特征看作是各个树的节点,遍历所有特征,其中每当遍历到其中某个特征时,对特征进行分割处理,并记录分割点的数据信息,作为划分子节点的纯度依据。 其次,比较记录的数据特征以及判定最优特征,寻找最优划分方式,对样本数据集进行分割操作。 最后,构建符合规则的决策树。 针对传统的决策树 C4.5 算法计算信息增益率时间过长的问题,提出了一种改进的 K-C4.5 算法,引用麦克劳林公式和泰勒公式的思想,将信息增益率计算公式从对数函数转化为非对数函数,从而降低运算的时间效率。 以实际数据集进行测试,验证了改进后的算法具有一定的效果。

如需要完整文档点击下方 "点击下载文档" 按钮

基于 C4. 5 决策树分类算法的改进与应用
《基于 C4. 5 决策树分类算法的改进与应用》
完整文档 下载到本地,方便收藏和查阅
文件号:061640
基于 C4. 5 决策树分类算法的改进与应用
点击下载文档
基于 C4. 5 决策树分类算法的改进与应用

点击下载 文件号:061640(点击复制) 公众号(点击复制)

x