|
文 献 综 述 1.发展现状 随着人工智能和物联网的飞速发展,人们的生活逐渐智能化,从前简单的视频处理技术已经不能满足人们的需求。智能视频处理技术越来越多的被运用于日常生活中,在城市交通管理、公安侦查、军事跟踪等领域得到广泛的应用。在诸多图像视频智能处理技术中,运动物体检测技术占据着重要的地位,也是当前热门的研究领域。 运动物体检测技术的发展可以追溯到上个世纪70年代末,Jain等人就在他们的文献中率先提出了使用帧间差分的方法来提取运动目标[1]。帧间差分法通过对相邻两帧的分析运算,基于它们的差异性来对运动目标进行检测。虽然帧间差分法具有很好的鲁棒性,但是对运动目标内部的像素点不敏感,容易在内部出现“空洞”现象。之后学者们针对帧间差分法的不足进行了研究,一种新的研究思路逐渐成熟,即基于建立背景模型的背景差分法。背景差分法的关键在于背景模型的建立,国内外学者先后提出了多种背景模型建立的方法。Gloyer等人在他们的文献中提出了对图像序列取中值来构建背景模型的方法[2],但是这种方法不仅运算量大而且鲁棒性很差。此后,1997年Wren等人提出的单高斯背景建模法[3]和1999年Stauffer等人提出的混合高斯背景建模法[4]利用高斯模型结合阈值判断来建立背景模型。这种方法在复杂场景下也有很好的效果,但是计算量依然很大,而且现实背景特别是快速变化的背景与高斯模型有一定的偏差,所以在背景模型的建立中使用高斯模型是有一定的局限性的。为了解决这种概率估计假设的局限性,多种不需要概率统计假设的建模方法不断涌现出来,如无参数的基于核密度估计[5]的运动目标检测法,基于样本一致性(SACON)的背景建模方法[6,7],视觉背景提取法(ViBe)。随着国内外学者不断深入的研究,基于背景模型的检测方法逐渐趋于成熟。 除了上面的两种基于差分法的检测方法,还有一种基于二维平面光流场的检测方法。早在1976年,Poggio 和 Reichartdt就提出了关于光流的概念[8]。在 1981 年 Horn 和 Schunck[9]、Lucas 和 Kanade[10]将光流场与灰度相联系,引入了光流约束方程可以有效的计算出光流。此后对光流的计算研究有很多的成果,多种光流算法逐渐成 熟 。国内拟线圈的光流法,并将其应用到交通系统的车流检测中[11] 。也有很多学者在光流场的研究中做出了重要贡献。国防科技大学的胡庭波等,提出了基于立体匹配技术来计算光流场的方法;复旦大学的吴立德等研究了灰度时变图的光流场理论,并在此基础上提出了多通道方法;西安电子科技大学的计文平等,提出了基于虚所谓光流场就是所有像素点构成的二维瞬时速度场,可以表征目标的运动情况。光流法就是利用图像序列中相邻帧之间的关系来计算可以表征运动信息的光流场,进而确定各个像素位置的运动信息。光流法具有三个前提假设:第一,相邻帧之间的亮度恒定;第二,相邻视频帧的取帧时间连续,或者,相邻帧之间物体的运动比较“微小”;第三,保持空间一致性即同一子图像的像素点具有相同的运动。光流场的计算方法可以分成三种:基于区域或者基于特征的匹配方法;基于频域的方法;基于梯度的方法[12]。 2.运动目标检测的实现方法 2.1光流法 所谓光流场就是所有像素点构成的二维瞬时速度场,可以表征目标的运动情况。光流法就是利用图像序列中相邻帧之间的关系来计算可以表征运动信息的光流场,进而确定各个像素位置的运动信息。光流法具有三个前提假设:第一,相邻帧之间的亮度恒定;第二,相邻视频帧的取帧时间连续,或者,相邻帧之间物体的运动比较“微小”;第三,保持空间一致性即同一子图像的像素点具有相同的运动。光流场的计算方法可以分成三种:基于区域或者基于特征的匹配方法;基于频域的方法;基于梯度的方法[12]。 2.2帧间差分法 帧间差分法是对图像序列中相邻两帧或多帧作差分运算,通过对差分结果作阈值判断来确定运动目标的轮廓[13]。这种利用帧间差异性来确定运动目标区域的方法原理简单,适用范围广,鲁棒性好。但是这种方法只能检测运动目标的轮廓,如果目标运动区域很大,中心区域的检测效果会很差,会出现“空洞”现象。 3运动人体的识别 运动人体的识别需要对运动目标的细节特征进行分析,利用运动人体与普通运动目 |
标的区别来识别人体。根据识别特征的不同可以将人体识别方法大致分为三种:基于肤色的人体识别、基于运动特性的人体识别、基于轮廓的人体识别。这三种方法都有一定的局限性,基于肤色的人体识别对环境光线比较敏感,在光线较暗或变化的条件下识别的准确率会大大下降。基于运动特征的识别方法是根据人体运动的周期性和规律性进行识别,这种方法只能识别从侧面拍摄人体的情况。基于轮廓的识别方法是根据人体的头部、四肢和身躯呈现的轮廓比例特征进行识别,但是人体是非刚性的,在人体复杂运动时识别准确率不高[15]。
参考文献:
[1] Jain R, Nagel H H. On the analysis of accumulative difference pictures from image sequences of real world scenes.[J]. IEEE Transactions on Pattern Analysis amp; Machine Intelligence, 1979, 1(2):206-214.
[2] Gloyer B, Aghajan H K, Siu K Y, et al. Video-based freeway-monitoring system using recursive vehicle tracking[J]. Proc Spie, 1995, 2421:173-180.
[3] Wren C R, Azarbayejani A, Darrell T, et al. Pfinder: Real-time tracking of the human body[J]. IEEE Transactions on Pattern Analysis amp; Machine Intelligence, 1997, 19(7):780 - 785.
[4] Stauffer, Chris, Grimson, W.E.L. Adaptive Background Mixture Models for Real-Time Tracking[J]. Proc Cvpr, 1999, 2:2246.
[5] Elgammal A, Harwood D, Davis L. Non-parametric model for background substraction[J]. Proceedings of the Computer Vision, 2000:751--767.
[6] Wang H, Suter D. SACON: A Consensus Based Model for Background Subtraction[J]. Schools amp; Disciplines, 2005.
[7] Wang H, Suter D. Background Subtraction Based on a Robust Consensus Method[C]// Pattern Recognition, International Conference on. IEEE Computer Society, 2006:223-226.
[8] T. Poggio, W. Reichardt. Visual Control Orientation Behavior in the Fly: Part2 towards Underlying Neural Interactions. Quarterly Reviews in Biophysics, 1976, 9: 377~438.
[9] B. K. Horn, B. G. Schunck. Determining Optical Flow. Artificial Intelligence,
1981, 17(10): 185~203.
[10] B. Lucas, T. Kanade. An Iterative Image Registration Technique with an
Application to Stereo Vision. Artificial Intelligence, Vancouver, Canada, Aug,
1981, 674-679.
[11]胡博.基于 Mean Shift 目标跟踪算法研究及其DSP实现[D]. 西安电子科技大学, 2013.
[12]胡金金.基于光流法的运动目标快速跟踪算法研究[D]. 西安电子科技大学 2014.
[13]胡敬舒. 基于帧间差分的运动目标检测[D].哈尔滨工程大学,2013.
[14]王永超. 基于背景差分的多目标检测和跟踪技术[D].浙江大学,2015.
[15]尧政. 智能视频监控中运动人体检测与跟踪的研究[D].长春工业大学,2015.
