X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到天长市科技大市场,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[00105351]基于公共衍生大数据分析的政府决策过程重构与评估方法研究

交易价格: 面议

所属行业: 智能交通

类型: 非专利

技术成熟度: 通过小试

交易方式:

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

  该项目为国家自然科学基金资助面上项目(项目批准号:71473143)。

  北邮项目组主要负责完成了该国家自然科学基金项目的第一部分研究内容,即公共衍生大数据的基础分析方法研究,同时协助清华大学研究团队完成了第二部分研究内容(即围绕公共议题的综合分析与知识挖掘研究)的部分内容。针对第一部分研究内容,基于概率主题建模的潜在狄利克雷分配模型(LDA),提出了从大规模公众反馈信息文本中提取政府或政策制定者可能关注的潜在主题及讨论热度时序分析的初步方法框架,其中基于困惑度(Perplexity)测算确定主题数量的探索具有开拓性。针对超大城市的"城市病",如何能从公众舆情中更快更好地理解百姓关切是政府决策面临的新挑战,研究基于 LDA 基础方法设计了一套以政府管理者为使用对象的语义搜索工具,试图将无监督学习的主题建模与使用者主观注意力需求识别有机结合,从而帮助政府管理者高效高质地了解某一特定问题的公众态度,实验检验已初步证明了该方法的有效性,基于此模型构建的搜索工具和决策辅助机制也开始在部分政府部门部署。此外,当应用主题建模进文本进行情感分析时,项目组也通过一系列综合实验研究来考察多因素组合效应,发现了 K-means聚类算法在平衡审阅数据集上具有明显的优势,而在考虑聚类精度的不平衡审阅数据集上表现较差;在平衡和不平衡数据集的情感聚类方面,新设计的加权模型均优于传统的加权模型;形容词和副词提取策略对聚类性能有明显改善,而词干提取和停用词干提取策略会对情感聚类产生负面影响。以上以概率主题建模为基础的测度设计、情感分析和实验比较逐步构建了本项目针对公共衍生大数据的分析框架和方法工具集合。针对第二部分研究内容,发现越来越多的政府网站、服务系统成为政府与民众互动的新途径,也记录了大量可供研究的公共服务数据。项目组与清华大学研究团队利用北京市朝阳区政民互动平台的公众反馈大数据,探寻公共服务效能与成本之间的关系。研究在文本大数据分析领域的潜在狄利克雷模型进行主题建模的基础上,通过测度函数表征行政事务成本要素,从而量化探究公共服务效能影响因素。

推荐服务:

Copyright  ©  2019    天长市科技大市场    版权所有

地址:滁州高新区经三路

皖ICP备2023004467