[00003290]基于社团发现的主题模型构建方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201710361414.0
交易方式:
完全转让
许可转让
技术入股
联系人:
许尔杰
进入空间
所在地:
江苏南京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开一种基于社团发现的主题模型构建的方法的技术方案,先后包括如下步骤基于短文本数据提取蕴含的关系网络;采用社团发现算法将关系网络划分成多个社团;将各社团中提取的短文本进行扩充以得到具有词共现关系的长文档,并将得到的多个长文档构成长文档集合;针对长文档集合进行主题挖掘,得到基于社团发现的TMCD主题模型。该方法从数据中内在蕴含的社团关系的角度出发,以社团发现算法为基础进行短文本的自扩展,解决了数据稀疏性问题。