이미지가 작으면 cnn층을 몇개 쌓지 않아도 sliding할 부분이 작이지고, 중간 영역들은 filter들이 중복되어 겹쳐보이는 반면 양쪽 side는 중간에 비해 보는 횟수가 적다. 따라서 zero-padding으로 양쪽 사이드에 zero값을 두른다. 그러면 7×7입력에 3×3 필터연산을 수행할때 zero-padding을 하면 7×7출력을 얻게 한다. (N=9, (9-3/1)+1)
일반적으로 filter가 3이면 zero pad를 1개만 하고, filter가 5면 zero pad를 2개함
padding 써야 이미지 크기가 급격히 줄어드는 것 방지할 수 있다.
32×32×3 input에 5×5filter 10개와 stride1, pad가 2이면?
32×32×10이 된다!
파라미터 수는 (5×5×3)×10 + 10(bias)
<The brain/neuron ivew of CONV Layer>
1×1 convolution layer를 inputdmfh Fully Connected layer에 넣음 → 하나의 filter에 대한 영역에서 1개의 숫자가 나오게 된다(local connect와 유사)