联系人:
所在地:
1.课题来源与背景 课题来源于广州市科学技术局的财政拨款20万元。随着科技的发展以及互联网技术的普及,互联网上的各种多媒体数据(文本、图像、音频、视频等)呈现爆炸式增长,大数据时代带给我们的不仅是更“多”的数据, 而且是更“大”的数据。我们每天面临着各种信息检索、信息查询的需求,多媒体信息检索是其中最重要的内容之一。本项目正是基于此背景下开展的研究。 2.研究目的与意义 我们每天面临着各种信息检索、信息查询的需求,多媒体信息检索的核心在于数据挖掘技术的发展。数据挖掘是通过统计分析方法或者模式识别的方法,发现数据之间有意义的模式、特征、变化趋势的过程,它是现实生活中极其重要的研究话题。随着科技的发展以及互联网技术的普及,互联网上的各种多媒体数据(文本、图像、音频、视频等)呈现爆炸式增长。单以图像为例,社交网站脸书(Facebook)每天就有近二千万张图像被用户上载分享。对这些大规模数据的研究,给传统的多媒体研究、特别是图像的应用研究带了新的机遇和挑战。大数据时代带给我们的不仅是更“多”的数据, 而且是更“大”的数据。大数据具有“4V特点”,海量(Volume)、多样(Variety)、高速(Velocity)和价值(Variability)。近年随着硬件设备和移动终端的飞速发展,图像的分辨率越来越高。越来越大的高分辨率图像一方面给用户带来了更清晰生动的视觉体验,另一方面也给图像的存储、传输和分析处理带来了挑战。如何有效的挖掘这些大数据所包含的信息特征,利用其揭示的信息来更好的解决现实生活中所面临的网页过滤分类、多媒体信息检索、人机交互等问题,从而更好的服务社会,是目前的研究热点。对于多媒体数据而言,尽管文本数量、图像数量可以无限的增加,但是文本所包含的关键字,图像所包含的的物体的种类个数都是有限的。因而当文本数据库、图像数据库规模大到一定程度后,给定一个查询文本,通过有效的特征表示, 我们总是可以从中找出与查询文本相同的外文文本,以及包含相同语义的图像。 3.主要论点与论据 本项目针对多个信息检索数据库,采用最新的深度学习技巧,利用稀疏性理论,统计学的典型相关分析方法提出了多个不同算法来进行分析,具体如下:(1). 提出了基于注意力模型,弹性网格的深度手绘素描检索算法;(2). 提出了基于稀疏典型相关分析的信息检索算法;(3). 提出了基于稀疏广义典型相关分析的信息检索算法;(4). 提出了基于随机Kaczmarz算法的信息检索算法;(5). 提出了基于稀疏分数阶线性判别分析的信息检索算法;(6). 对鸽群优化算法进行分析研究;(7). 提出了改进灰狼算法,并应用于模糊聚类问题。所提出的算法均是基于实际情况中可能出现的问题有针对性的分析研究,每一种算法撰写了一篇学术论文,共计7篇学术论文(5篇SCI, 1篇EI,1篇ESCI),有部分论文发表在IEEE Transactions on Neural Networks and Learning Systems, Neural Networks, Neurocomputing, 中国科学等著名期刊。在多个文本数据集,图片数据集,人脸数据集以及手绘素描数据集上的实验证实了所提出算法的有效性。所提出的算法将促进相关行业技术手段的提升,具有较大的社会影响和经济效益。 4.创见与创新 我们提出了基于注意力,弹性网格,深度学习的手绘素描检索算法,基于稀疏典型相关分析,稀疏广义典型相关分析, 稀疏分数阶线性判别分析的多媒体信息检索算法, 基于随机Kaczmarz的典型相关分析信息检索算法。 5.社会经济效益,存在的问题 本项目属于应用技术研究,目前尚无社会经济效益。 6.历年获奖情况 无。