本发明公开了一种基于K邻域相似性的数据聚类方法,基于待聚类数据点的K邻域最大半径即按密度对待聚类数据点进行排序,对升序排序后的数据点进行第一遍循环,以符合统计相似性的数据点并入到同个聚类中;根据聚类所需规模对聚类密度较小的数据点进行第二遍循环,找出所有噪声点以及将非噪声点合并到最近的大密度聚类中,从而实现数据聚类。利用本发明实施例提供的基于K邻域相似性的数据聚类方法进行数据聚类带有如下技术效果:无需预先设定聚类的个数,无需知道数据的概率分布;参数容易设置,且各个参数的设置都与数据的密度分布和距离尺度无关;聚类的形成是由高密度到低密度逐渐合并而成的,在产生聚类的同时给出了聚类之间的层次关系。