联系人:
所在地:
在视频中对特定目标物实施定位、跟踪,对于视频内容理解有着重要的作用。为此,围绕目标物的跟踪问题,在视频运动分割、视觉跟踪、目标轮廓检测等方面展开研究。本课题来源于(1)基于机器视觉的变速箱换油机软件研发(常州工学院校企合作项目);基于机器视觉的教室人数检测软件研发(常州工学院校企合作项目));(3)基于长短时样本记忆的视觉跟踪方法研究(国家自然科学青年基金项目),相关研究内容包括以下几个方面: 1)视频特定内容定位跟踪的基本前提条件是视频中存在所要定位的内容,视频段的分割本质上为视频帧在时序上的无监督分类问题。为此,设置了一个融合视频帧特征相似性与时序相邻性的自相关计算模型,通过模型求解出相关矩阵用以表征视频帧之间的相关性,在此基础上进一步的图切算法给出了视频段分类结果,由此可以获得关于内容的不同视频段,为后续视频内容定位跟踪提供了基础。 2)视频内容的连续定位要求对视频内容进行持续、稳定的跟踪。为此,在相关滤波跟踪的基础上,通过大分类边际学习框架将岭回归问题转化为大边际分类问题,而样本尺寸的扩充以及裁剪则为分类器的学习提供了更多、更为可靠的训练样本,这也使得跟踪方法能够更为稳定地对目标物实施跟踪。 3)针对噪声样本对相关滤波器学习的干扰问题,通过对相关滤波器噪声响应的抑制,提升相关滤波器对目标与背景的判别能力。在相关滤波器学习过程中,根据视频帧中目标的不同外观情况自适应地调整抑制效果。目标外观变化剧烈时,加强抑制作用,而外观变化较小时,减少抑制作用,以此来达到稳定跟踪的目的。 4)对于具有特定形状的目标物,可以基于霍夫变换方法来得到轮廓,以此对目标物进行检测定位。为此,提出了基于椭圆参数概率估计的椭圆检测方法,通过拟合关于椭圆参数的一个线性函数和一个二次函数,由此估计确定椭圆中心、主轴方向和主轴长度。 收集了视觉跟踪、椭圆检测等领域中公开测试数据集等,在此数据集上进行了较为广泛的测试,与目前的一些经典相关滤波跟踪算法在成功率、中心误差等常用指标上进行了性能的对比,目标定位特别在椭圆检出率上进行了对比,相关的研究成果能够取得较高的准确率。 本项目在论文、发明专利、软件著作权等方面取得了一定的研究成果。研究成果包括:在国内外期刊、会议上发表论文7篇,获得授权发明专利3件,申请发明专利7件,获得软件著作权1件。相关研究成果也被应用到相关企业的实际软件产品中,形成了一定的产业化规模和示范效应。其中,相关研究成果被应用到人数计数场景中,相关软件产品在常州众洁新材料科技有限公司实现了人数记录、在岗监测等自动考勤,提升该公司的管理质量、降低了公司的管理成本。研究成果被应用到变速箱换油机软件中,帮助常州车驰宝宝智能科技有限公司实现驾驶证上条形码定位、跟踪和识别,以此能够自动获取车辆相关信息,节约了公司的管理成本、提升了服务质量以及提高了车主换油保养的效率。