结合KNN和图标签传播的密度峰值聚类算法 |
吴辰文,蒋雨璠,马宁 |
兰州交通大学 电子与信息工程学院 |
|
摘要:
密度峰值聚类算法(DPC)是一种基于密度的高效聚类算法,该算法指定参数少、聚类速度快、能发现非球形簇状等优点,但传统DPC算法截断距离参数的选取需要人工干预,且剩余数据点的标签分配易受“多米诺”连锁效应影响。针对这些问题,提出了结合KNN和图标签传播的密度峰值聚类算法(DPCNNLP),该方法在KNN思想的基础上来计算各样本数据点的局部密度值,通过KNN算法形成的最近邻点构造局部密度主干区域,并运用基于密度的KNN图将标签分配给剩余的点以形成最终的簇。该算法考虑了各数据点间的相关性,可以有效地对各种形状和密度差异性较大的数据进行聚类。在多个数据集上进行了实验仿真,经过对比验证,该文提出的密度峰值聚类算法在多数情况下聚类效果要优于其他的算法。
|
关键词:
数据聚类;密度峰值;KNN算法;标签传播
|
发表年限: 2020年 |
发表期号: 第6期 |
|
|
|