基于改进的K-means算法在文本挖掘中的应用

时间:2022-06-09 02:21:30
作者:杨丹,朱世玲,卞正宇
关键字:K-means算法,聚类中心,文本聚类,文本距离,稀疏度
DOI:10.3969/j.issn.1673-629X.2019.04.014
查看次数:625

如需要完整文档点击下方 "点击下载文档" 按钮

K-means算法具有简单易于理解的特征,广泛运用于聚类过程中,但是其初始聚类中心是随机确定的,这样极容易导致聚类结果的稳定性很差。针对传统K-means算法对于初始聚类中心选择的敏感性及最大最小距离法容易选取离散点的不足,提出了一种新的聚类中心选择评判函数,依次考察每个点的函数值,选取当前函数值最大的点作为新的聚类中心,直到满足事先确定的聚类中心数。新聚类中心评判函数既可以保证新中心点周围是紧凑的,又可以保证远离其他中心点。最后将该算法运应用于文本聚类之中,根据准确率、召回率及F度量值来衡量算法的聚类质量。实验结果表明,该算法相对于传统算法和最大最小距离算法,准确率更高,聚类质量更好,较适合于文本聚类。

如需要完整文档点击下方 "点击下载文档" 按钮

基于改进的K-means算法在文本挖掘中的应用
《基于改进的K-means算法在文本挖掘中的应用》
完整文档 下载到本地,方便收藏和查阅
文件号:062062
基于改进的K-means算法在文本挖掘中的应用
点击下载文档
基于改进的K-means算法在文本挖掘中的应用

点击下载 文件号:062062(点击复制) 公众号(点击复制)

x