computer vision笔记:反池化

除了内插值和反卷积(详见computer-vision笔记:上采样和下采样),反池化也是一种上采样方法。由于近些年来有用卷积替代池化的趋势,因此已经比较少用了,但我还是想写一下这种方法和一些自己的思考。


反池化

上图是池化的一个示例,但由于后面要进行反池化,因此我们还需额外把(编码器中的)最大池化层的索引都存储起来,用于之后(解码器中的)的反池化操作。

之后反池化就很简单了,如下图所示,恢复到原始尺寸,将数据映射到索引处,其它地方填充零。


思考

当我刚看到反池化的操作方法时,有点感觉这样在扩充的空间中直接填充零会不会太草率了,为什么不用同一区域做相同的填充或者平均填充呢?
后来想了一想,的确还是直接将最大值映射到原位置,其余地方填充零效果最好。这样尽管会忽略邻近的信息,也就是会丢弃大量低频信息,但是它有助于保持高频信息的完整性。
反过来想,倘若我们将最大值相同地填充至一个区域内(上图中邻近的4格)或者做平均填充,那么不但不能准确地表示高频信息,又不能保证能够表达出低频信息,这就不如上面的做法能保证高频信息的完整性。


池化优点

虽然前面说池化正在逐渐被卷积替代,但池化操作也不是一无是处。与卷积相比,池化有如下优点:

  1. 减少了进行端到端训练的参数量。
  2. 对max-pooling来说,它可以提高边界的勾画,即突出高频信息。

碰到底线咯 后面没有啦

本文标题:computer vision笔记:反池化

文章作者:高深远

发布时间:2020年02月07日 - 12:24

最后更新:2020年02月07日 - 13:05

原始链接:https://gsy00517.github.io/computer-vision20200207122427/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

0%