不完整数据聚类算法研究

时间:2022-07-22 00:25:41
作者:冷泳林,孙晓红
关键字:电子政务,不完整数据,聚类,相似度,KNN,数据离散
DOI:10.3969/j.issn.1673-629X.2020.08.010
查看次数:314

如需要完整文档点击下方 "点击下载文档" 按钮

服务类电子政务通过单向或互动的方式向社会和公民提供诸如天气、统计数据、道路交通等信息。这些服务类信息在数据采集过程中,不可避免地会出现各种各样的数据质量问题,数据的不完整性就是其中一种。数据的不完整性对后续的信息统计、挖掘都会造成严重影响。 以不完整数据为研究对象,在分析了当前不完整数据聚类算法存在问题的基础上,提出一种基于 KNN 的不完整数据 AP 聚类算法。 算法首先给出了连续数值型和分类型数据的相似性度量方法,然后利用 AP 聚类算法对数据集中的完整数据进行聚类,最后利用 KNN 思想将完整数据集中的吸引度矩阵和归属度矩阵扩展至整个数据集,继续执行迭代,直至收敛。 实验将该算法同其他不完整数据聚类算法在聚类精度上进行比较,验证了提出的不完整数据聚类算法的有效性。

如需要完整文档点击下方 "点击下载文档" 按钮

不完整数据聚类算法研究
《不完整数据聚类算法研究》
完整文档 下载到本地,方便收藏和查阅
文件号:061739
不完整数据聚类算法研究
点击下载文档
不完整数据聚类算法研究

点击下载 文件号:061739(点击复制) 公众号(点击复制)

x