如需要完整文档点击下方 "点击下载文档" 按钮
为了弥补传统 K -means 算法聚类效果严重依赖于初始聚类中心这一不足,提出了 OICC K -means 算法。将不加权算术平均组对法(UPGMA)进行改进,通过该算法将密集区域的数据合并得到可以反映数据分布的若干数据点,再由最大最小距离算法从中选出彼此相距较远的点,作为传统 K -means 算法的初始聚类中心,从而使 K -means 算法有一个可以反映数据分布特征的输入。在典型数据集上进行的实验发现,相较于传统 K -means 算法,OICC K -means 算法拥有更强的聚类能力,在准确率、召回率和 F- 测量值方面均有明显提高。在 OICC K -means 算法的前两个阶段(即 UPGMA 算法和最大最小距离算法)产生了较理想的初始聚类中心,这些中心点选自于数据密集的区域,因此避免了噪声数据、边缘数据带来的不良影响,使得 K -means 算法没有陷入局部最优解而达到了整体良好的聚类效果,同时聚类中心的个数在算法中自动确定而不需要手动设置。
如需要完整文档点击下方 "点击下载文档" 按钮
《基于UPGMA 的优化初始中心 K-means 算法研究》
将 完整文档 下载到本地,方便收藏和查阅
文件号:062447
点击下载文档