联系人:
所在地:
“基于医用酶语义的文献数据检索挖掘算法的设计与实现”课题是山东省科技发展计划项目(项目号:2010G0020121)。由山东师范大学承担,项目计划的研究时间为2010年1月至2011年12月。经过两年多的研究和开发,已完成预定的任务,达到预期指标。所研制开发软件系统名称是“基于医用酶语义的文献检索平台”(简称为MERS)。 “基于医用酶语义的文献检索平台”(简称为MERS),是为提高相关领域研究人员的更加方便快速查找文献以及进行教学和科研而开发的一种工具软件。它是具有自主知识产权的文献检索系统,能够支持对领域知识的管理,并且提供更智能化的信息查询方式。 “基于医用酶语义的文献检索平台统”主要功能包括: (1)本体学习功能实现了基于人工蜂群算法的本体学习策略,首先选取种子概念构建领域词典,对领域文本集进行分词和词性标注。然后通过种子概念获得大量领域概念。再结合人工蜂群算法对整个领域文本空间进行搜索提取扩展概念。最后领域专家手工处理得到的候选领域概念集合。 (2)语义扩展功能在全文检索算法的基础上实现了一种新的语义扩展策略,首先用领域本体对检索词进行语义扩展,形成新的查询向量。然后计算原始查询向量与新的查询向量之间的语义相关度,可以提高检索的查全率。 (3)基于本体对文献进行查询的功能是由基于本体的全文检索算法实现的,结合语义扩展策略,更准确的把握用户查询请求,从而能提高全文检索的查全率和查准率。 本项研究的主要创新之处包括: (1)提出了基于蜂群算法的本体学习算法,首先通过种子概念提取复合概念,然后结合人工蜂群算法操作简单、鲁棒性强的优势提取扩展概念,组成候选概念集,最后由专家修正选择合适概念,加入领域本体。 (2)提出一种新的语义扩展策略,使检索范围扩大到领域本体中的上下位概念,在保证查准率的前提下,有效得提高检索的查全率。 (3)设计实现了一个基于医用酶语义的文献检索平台,实现了对文献智能检索等功能,提高了检索效率。