联系人:
所在地:
本项目成果受到国家自然科学基金、广西可信软件重点实验室研究课题等项目的支持。 近年来,以移动互联网、物联网等为代表的信息技术革命彻底改变了人们信息共享、互联互通的交互方式,各种各样的社交媒体应运而生,大大促进了信息时代向社会化媒体时代(以人的关系、信息及时流动、平台间的开放共享为核心)的转变。社会信息网络兼有信息网络和社会网络的特性,既是用户间社会关系的反映,也是用户间进行信息交互的载体。如何对其进行定性或定量分析和研究,探索其共性规律和本质特征,具有非常重要的理论意义和应用价值,成为近几年一个热门的研究领域。社区结构研究,对理解网络结构和功能、揭示网络中的隐含模式、分析及预测网络行为等具有非常重要的理论意义。同时,还可以应用在智能推荐、精准营销等诸多领域,具有广泛的应用价值。然而,社交网络的大规模性、动态性、多维性等特点对现有的工作提出了挑战。 本项目面向复杂社交网络数据,旨在从社交内容与社交关系这两个层面开展工作,针对社交网络的多维性,探索了主题社区的发现方法、社交媒体中网络流行语的自动发现与时空分析、社交媒体中用户社区与地理位置簇之间的关系、用户出行模式的时空分析、基于信息簇的区域影响分析;针对社交网络的动态性,从微观角度研究了社区的动态性,探索了微博中的流感监测与分析方法;围绕社交网络的大规模性,研究了重叠社区的快速发现方法,研发了基于Hadoop与Storm的微博数据的获取、管理与分析系统。 项目的创新点主要体现在以下四个方面:(1)融合社交对象和链接关系分析,首次提出一种面向主题的社区发现方法,相关研究成果已经被国内外学者引用107次(谷歌学术搜索结果,截至2018.3.22);(2)提出了基于N-Pat树的流行语发现方法,并对流行语的时空分布进行了研究,相关研究结果能够提升社区主题的准确性,使发现的主题社区更有意义;(3)提出了一种基于种子和半监督学习的快速重叠社区发现方法,并在真实数据集上进行了大量的对比分析,该方法具有很好的可扩展性,能够解决大规模社交网络的社区发现问题;(4)研发了基于Hadoop与Storm的社交媒体数据分布式获取、管理与分析系统,能够大大提高数据分析、处理、挖掘的效率,同时,为将来的成果产业化及推广奠定了良好的基础。 项目组在《Knowledge-Based Systems》、《Information Sciences》、《Journal of Intelligent & Fuzzy Systems》、《International Journal of Data Warehousing and Mining》、《International Journal of Machine Learning and Cybernetics》、《Journal of Combinatorial Optimization》、《Neurocomputing》、ICDM、DASFAA、PAKDD等具有国际重要影响力的期刊及会议上发表论文16篇,其中SCI检索9篇。已授权国内发明专利7件。 项目组所取得的上述研究成果具有很好的理论意义和应用价值,能够为政府的舆情监测与管控提供辅助决策,为电商领域的个性化推荐、个性化服务提供指导,有助于提升社会化与信息化服务水平。项目成果已经在广东省多家单位投入使用并得到了进一步地推广,大大提高了信息处理与分析的自动化、智能化水平,节省了大量的人力、物力、财力,取得了显著的经济与社会效益。