联系人: 武汉理工大学
所在地: 湖北武汉市
摘要:本发明公开了一种Hadoop环境中基于PageRank的网络论坛中意见领袖识别优化方法,该方法包括:根据帖子回复关系构建回复关系网络图,并将影响力初始化为1;根据所述回复关系网络图,计算任意两个节点之间距离相似度和两个帖子之间内容相似度;计算两个回帖的相似度;根据帖子相似度构建概率转移矩阵;计算每个节点UserRank值;重复上述步骤,直到每个节点UserRank趋于稳定,最大UserRank(j)的用户为意见领袖。本发明从用户的角度回复内容出发,计算内容相似度,提升了最后生成的意见领袖正确率,误报率降低了12%,漏报率降低了10%。