联系人: 哈尔滨工程大学
所在地: 黑龙江哈尔滨市
摘要:本发明提供的是一种基于节点属性标签传播的网页聚类方法。依据网页的链接关系构造拓扑结构图模型;为图模型中每个节点构建属性特征向量;初始化网络中的节点标签;依据拓扑结构及节点属性迭代更新节点的标签;定义停止更新节点标签的条件。本发明无需了解网页分组的数量和规模等先验知识或者预先定义临界值等参数,只需提取互联网络的拓扑关系及标记网页特征的属性信息,就可以在近乎线性的时间内有效地、高质量地实现网页的聚类。由于该算法概念简单,易于理解及实现,具有较低的时间复杂度,且能够产生优质的网络聚类结果,因此适用于规模庞大的互联网络。