如需要完整文档点击下方 "点击下载文档" 按钮
目前在识别钓鱼网站的研究中,对识别速度有着越来越高的需求,因此提出了一种基于混合特征选择模型的钓鱼网站快速识别方法。 混合特征选择模型包含初次特征选择、二次特征选择和分类三个主要部分,使用信息增益、卡方检验相结合以及基于随机森林的递归特征消除算法建立了混合特征选择模型,并在模型中使用分布函数与梯度,获取最佳截断阈值,得到最优数据集,从而提高钓鱼网站识别的效率。 实验数据表明,使用该混合特征选择模型进行特征筛选后的数据集,维度降低了 79. 2% ,在分类精确度几乎不损失的情况下,降低了 32% 的分类时间复杂度,有效地提高了分类效率。另外,使用 UCI 机器学习库中的大型钓鱼数据集对该模型进行评价,分类精确率虽然损失 1. 7% ,但数据集维度降低了70% ,分类时间复杂度降低了 41. 1% 。
如需要完整文档点击下方 "点击下载文档" 按钮
《基于特征选择模型的钓鱼网站快速识别方法》
将 完整文档 下载到本地,方便收藏和查阅
文件号:060921
点击下载文档