computer vision笔记:Peak-to-Sidelobe Ratio应用于目标跟踪

在Visual Object Tracking using Adaptive Correlation Filters一文中,我看到这样一句话:“The Peak-to-Sidelobe Ratio(PSR), which measures the strength of a correlation peak, can be used to detect occlusions or tracking failure, to stop the online update, and to reacquire the track if the object reappears with a similar appearance.”其大意为:用来衡量相关峰值强度的Peak-to-Sidelobe Ratio可以用于检测遮挡或者跟踪失误、停止实时更新和在相似外观再次出现时重新获取跟踪路径。我读完在想:这个PSR是什么?这么有用。结果百度了半天翻了几页没发现有任何有关它介绍或者解释的文章。于是看了一些英文文献,将自己的一些浅见写下来。

注:近期发现在DCF类的tracker中PSR得到了比较广泛的应用,所以原谅我当初论文看得少哈~

References

电子文献:
https://baike.baidu.com/item/pslr/19735601

参考文献:
[1]Understanding and Diagnosing Visual Tracking Systems
[2]Visual Object Tracking using Adaptive Correlation Filters
[3]Adaptive Model Update via Fusing Peak-to-sidelobe Ratio and Mean Frame Difference for Visual Tracking
[4]Multi-Cue Correlation Filters for Robust Visual Tracking


What

由于没有找到任何中文翻译,我只能取一个相近的(感觉指的差不多)。在百度百科中,我找到了如下解释:PSLR,峰值旁瓣比,peak side lobe ratio,定义为主瓣峰值强度对于最强旁瓣的峰值强度之比,多用于雷达信号脉冲压缩后对信号的评估。

注意:百度百科内的名词与我遇到的相差了一个“to”,且缩写也不同。

上面是百度百科内的一个配图,根据百科解释,最高的主瓣与第二高的主瓣之差,即是PLSR(峰值旁瓣比),在这里大小为-13.4dB。
此外,我还找到了一个称为峰均比(PAPR,peak-to-average power ratio)的概念,它等于波形的振幅和其有效值(RMS)之比,主要是针对功率的,这里就不细说了。
后来,我在一篇光学期刊的文章上找到了一个比较可靠的翻译,该文献中有一个名为“峰旁比”的名词,且文献内容与目标追踪相关。因此我暂且称其为峰旁比吧。个人觉得比峰值旁瓣比简洁且好听。


Why

其实中文翻译并不重要,重要的是它的作用。
在查阅文献的过程中,我看到了这样一个公式:

其中$P_{sr}^{t}$是此时第t帧的峰旁比,$f_{t}$是对于第t帧分类器预测的响应,$\mu _{t}$和$\sigma _{t}$分别是响应图$f$的均值和方差。
根据这种计算方法,我们可以大概分析一下峰旁比的作用。当初看到时,我觉得它与我在物理实验中做过的音叉共振实验中的品质因数有相似之处(品质因数$Q=\frac{f_{0}}{f_{2}-f_{1}}$)。
由公式可知,当响应中的峰值较高,且响应分布相对而言集中在峰值及周围时,峰旁比就会较高;反之,峰旁比就会较低。
那么什么时候会造成峰旁比较低呢?根据论文描述可以获得提示,当遇到遮挡,或者目标跟丢即响应区内不含目标主体时,就不会出现一个那么明显的峰值响应,同时响应也会较为分散了,此时分母较大、分子较小,峰旁比就会变低。
下面也是Visual Object Tracking using Adaptive Correlation Filters中的一张figure(这篇文章提出了MOSSE),我们需要的是a much stronger peak which translates into less drift and fewer dropped tracks。看了这个想必应该知道峰旁比发挥的作用和大致原因了。

和上面的峰值旁瓣比、峰均比相比较,显然峰旁比的定义能更好地表征响应的集中程度。


How

由峰旁比定义所得出的性质可知,峰旁比可以作为模型预测定位准确性和可信度的判据。我们可以利用峰旁比来调整Model Updater(The model updater controls the strategy and frequency of updating the observation model. It has to strike a balance between model adaptation and drift.)
我的想法是,我们可以设置一个threshold,当峰旁比小于这个threshold时,表示模型未能准确定位到目标(可信度较低),这时我们可以停止模型的更新,或者通过减小学习率等方法减慢模型的更新速度以防止模型受背景或者遮挡物较大影响,而当目标再次出现时难以复原导致最终完全跟丢的问题;而当峰旁比大于这个threshold时,我们可以实时更新模型,或者运用较大的学习率(也可以根据峰旁比将学习率划分成几个等级)。


碰到底线咯 后面没有啦

本文标题:computer vision笔记:Peak-to-Sidelobe Ratio应用于目标跟踪

文章作者:高深远

发布时间:2020年01月18日 - 21:39

最后更新:2020年02月23日 - 21:15

原始链接:https://gsy00517.github.io/computer-vision20200118213942/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

0%