基于伽马内核与加权 K 近邻的流量分类算法

时间:2022-11-22 06:34:41
作者:徐 魁,海 洋,许艺凡,3,段靖海,孙炜策,3,陶 军,3
关键字:K 最近邻算法,Gamma 分布,自信息,距离函数,网络流量分类
DOI:10.3969/j.issn.1673-629X.2023.02.032
查看次数:729

如需要完整文档点击下方 "点击下载文档" 按钮

K 最近邻算法( KNN) 是一种简单有效的分类方式。 当数据集分布均衡,不同类别样本之间的差异显著时,KNN 的分类效果一般较好。 但实际中数据集通常不理想, 网络流量往往呈现倾斜分布,存在样本之间差异不显著等问题。 为了更好地权衡样本距离之间差异以及流量类别分布不均带来的模型准确率下降问题,提出了一种基于 Gamma 内核与加权KNN 的流量分类算法,综合考虑了距离和流量分布对分类结果的影响。 采用 Gamma 分布函数作为内核,对不同类别采用自信息进行加权。 最后得到 G-WKNN 模型,并将该模型应用于 CIC-IDS2017 数据集。 实验结果表明,在流量均衡的情况下,模型准确率稳定在 0. 91 左右。 在流量不均衡时,依旧具备良好的分类表现。 对比其余几种改良的 KNN 算法,其分类准确率较高且模型稳定性好,对 K 值相对不敏感。 同时 G-WKNN 模型对少数类别分类准确率的提升效果也较为显著。

如需要完整文档点击下方 "点击下载文档" 按钮

基于伽马内核与加权 K 近邻的流量分类算法
《基于伽马内核与加权 K 近邻的流量分类算法》
完整文档 下载到本地,方便收藏和查阅
文件号:057746
基于伽马内核与加权 K 近邻的流量分类算法
点击下载文档
基于伽马内核与加权 K 近邻的流量分类算法

点击下载 文件号:057746(点击复制) 公众号(点击复制)

x