联系人:
所在地:
该课题为国家科技基础条件平台专项课题(课题编号:2017DDJ1ZZ17)。
该课题以微生物数据为例,以优化科技资源配置为研究目标,以数据调查与挖掘分析为 手段,以成果产出现状作为度量,采用机器学习中多种模型相结合,在当前国家科技投入十 分有限的情况下,探索建立一种科技资源统筹优化配置的有效机制。最终对最大限度地提高 科技资源配置效率和水平、提升依靠科技创新促进经济社会可持续发展提供数据与决策支持。
该课题利用了 TF-IDF 算法将所获取的信息特征化,方便后续的计算出现的频率及分析; 利用随机森林分类方法进行了菌种数量分布分析;利用时间序列分析模型对论文产出数量、不同菌种论文产出时间进行了分析;利用回归分析模型对菌种偏好等进行分析研究;利用复杂网络模型对菌种共现、保藏中心及国际合作关系进行分析;利用聚类模型对菌种地域、数量分布进行分析。主要研究内容如下:
1. 科技资源成果产出数据库的建立。
2. 科技资源/成果产出可视化分析。
3. 科技成果关系网络分析。
4. 科技资源与成果关系网络分析。
5. 国家(地区)科技成果差异性现象研究。
6. 资源布局的策略建议研究。
该课题面向科技资源(微生物)成果产出资源配置优化需求,应用数据挖掘、机器学习、复杂网络建模及数据可视化等技术,开展科技资源(微生物)成果产出数据整理与挖掘分析研究,探索需要增强的科技资源支撑方向,为优化科技资源配置管理提供数据支持。根据任务书要求,课题成果形成了科技资源成果产出数据整理与挖掘分析专题研究报告 1 份约 5.48万字。科技资源成果产出数据集 1 套,从 1969 年到 2017 年内 142808 条微生物相关论文数据,涉及菌种 75888 种。数据可视化展示形式 14 种,数据分析模型 7 种,政策建议 13 条。