本发明公开了一种基于MapReduce架构的大规模图数据聚类算法,属于图数据处理技术领域,其包括如下步骤:①计算图数据的邻接矩阵A;②计算图的度对角矩阵D;③计算传递因子;④得到源节点传递一次信息后的高维表示;⑤传递次数小于T时,返回第四步,否则结束并输出结果。本发明在Hadoop平台下使用MVV算法进行图聚类,利用图的顶点信息映射为向量,从而实现顶点间的距离计算,利用大规模图数据在Hadoop平台上进行聚类,并根据聚类结果对度量的性能进行评价分析;弥补了传统的单机下的数据挖掘算法性能上的不足,实现社团发现等聚类目标。