
Paper Review
Deep Residual Learning for Image Recognition
[๋ ผ๋ฌธ๋ฆฌ๋ทฐ] ABSTRACT ์ด์ ์ ํ์ต ๋ฐฉ๋ฒ๋ณด๋ค ๊น์ ๋คํธ์ํฌ์ ํ์ต์ ์ข ๋ ์ฉ์ดํ๊ฒ ํ๊ธฐ ์ํ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. Residual networks๊ฐ ์ต์ ํํ๊ธฐ ๋ ์ฝ๊ณ , Depth๊ฐ ์ฆ๊ฐ๋ ๋ชจ๋ธ์์๋ ์๋นํ ์ฆ๊ฐ๋ ์ ํ๋๋ฅผ ์ป์ ์ ์์์ ๋ณด์ฌ์ค๋ค. INTRODUCTION Is learning better networks as easy as stacking more layers? ๋ ๋์ ๋คํธ์ํฌ๋ฅผ ํ์ตํ๋ ๊ฒ์ด ๋ ๋ง์ ๊ณ์ธต์ ์๋ ๊ฒ๋งํผ ์ฌ์ด๊ฐ? ์ ๊ทธ๋ฆผ์์ layer๊ฐ ๋ ๊น์ ๋นจ๊ฐ์์ด error๊ฐ ๋ ๋์ ๊ฒ์ ํ์ธํ ์ ์๋ค. layer๊ฐ ๊น์ด์ง์๋ก gradient๊ฐ vanishing/exploding ํ๋ ๋ฌธ์ ๊ฐ ์กด์ฌํ๋ค. ์ด ๋ฌธ์ ๋ normalized initialization, b..