联系人: 湘潭大学
所在地: 湖南湘潭市
摘要:本发明针对互联网海量异构数据之间错综复杂的关系的公开了一种基于视觉特征和语义特征的跨媒体检索方法,主要包括以下几个步骤:第一步,使用二次开发的分布式网络爬虫对目标数据源的数据进行抓取;第二步,针对不同数据源,分别编写不同的模板,对网页进行基于模板的信息提取,对数据进行解析去噪,并存入数据库中;第三步,对图片提取特征值并建立索引,建立语义关联图;第四步,使用SVM支持向量机和已经训练过的模型,对内容进行分类;第五步,根据提取出的视觉特征和语义特征,计算不同类型数据之间的相似距离,分析不同类型数据之间的关联性。采用本方法,可以较有效地挖掘出不同类型数据之间的关联性。