本发明提供了一种基于doc2vec的地铁站点功能挖掘方法,属于数据挖掘技术领域。1)数据收集与预处理:本发明综合考虑了地铁站点客流数据、地铁站点POI数据等多种信息来源,以保证分析结果的权威性和普适性;2)数据集合并:合并重复名称站点的往返客流量;3)地铁站相似度计算:基于doc2vec算法进行地铁站相似度挖掘;4)站点功能聚类:本发明采用了数据挖掘领域先进的Affinity Propagation算法,既保证了计算效率又保证了分类结果的准确性;5)站点功能挖掘:根据算法聚类分析结果进行地铁站功能分类。以上海地铁为例进行的聚类实验表明,使用本发明可以高效、准确的完成地铁站点聚类工作。