如需要完整文档点击下方 "点击下载文档" 按钮
数据挖掘技术在各行各业的决策支持活动中扮演着越来越重要的角色,频繁项集挖掘作为数据挖掘最活跃的研究领域之一,具有广泛的应用。近年来,随着信息采集技术和数据处理技术的快速发展,针对不确定数据的频繁项集挖掘引起广泛的关注。然而,面向不确定数据集的加权频繁项集挖掘,由于项目权重值的引入使得加权频繁项集不再满足向下闭包特性,无法对频繁项集的搜索空间进行压缩,时间效率较低。 因此,文中提出一种基于 Top-K 查询的不确定数据加权频繁项集挖掘算法(top-k frequent itemset mining,TK-FIM),以减少候选加权频繁项集的数量,缩小加权频繁项集的搜索空间,提高搜索效率。 最后,在真实数据集和合成数据集上的实验结果表明,TK-FIM 算法具有良好的时间性能。
如需要完整文档点击下方 "点击下载文档" 按钮
《一种基于 Top-K 查询的加权频繁项集挖掘算法》
将 完整文档 下载到本地,方便收藏和查阅
文件号:062180
点击下载文档