Paper Review
[๋
ผ๋ฌธ๋ฆฌ๋ทฐ] ABSTRACT ๋ณธ ๋
ผ๋ฌธ์์๋ Large-scale image recogniotion์์ Convolutional network์ ๊น์ด๊ฐ ์ฑ๋ฅ์ ์ผ๋ง๋ ์ํฅ์ ๋ฏธ์น๋์ง ์กฐ์ฌํ์๋ค. ๋งค์ฐ ์์ 3 x 3 convolution filter๋ฅผ ๊ฐ์ง ์ํคํ
์ณ๋ฅผ ์ฌ์ฉํ์ฌ depth๋ฅผ ์ฆ๊ฐ์ํจ ๋คํธ์ํฌ์ ์ฑ๋ฅ์ ํ๊ฐํ์๋ค. Depth๋ฅผ Layer 16-19์ ๋์ ํฌ๊ธฐ๋ก ์ฆ๊ฐ์์ผ ์๋นํ ์ฑ๋ฅ ๊ฐ์ ์ ์ด๋ฃจ์๋ค. 1. INTRODUCTION ๋ณธ ๋
ผ๋ฌธ์์๋ ConvNet ์ํคํ
์ฒ ์ค๊ณ์ ๋ ๋ค๋ฅธ ์ค์ํ ์ธก๋ฉด์ธ ๊น์ด๋ฅผ ๋ค๋ฃฌ๋ค. ๋ชจ๋ layer์์ ๋งค์ฐ ์์(3×3) convolution filter๋ฅผ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ์คํ ๊ฐ๋ฅํ convolution layer๋ฅผ ์ถ๊ฐํ์ฌ ๋คํธ์ํฌ ๊น์ด๋ฅผ ๊พธ์คํ ์ฆ๊ฐ์ํด. ๊ฒฐ๊ณผ์ ..
AI/Machine Learning
๋ณธ ๋ด์ฉ์ ํธ์ฆ์จ ๋จธ์ ๋ฌ๋2 ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ฑํ์์ผ๋ฉฐ, ์๋ต๋ ๋ด์ฉ์ด๋ ์ถ๊ฐ๋ ๋ด์ฉ์ด ์์ต๋๋ค. [10.1] ์๋ฌผํ์ ๋ด๋ฐ์์ ์ธ๊ณต ๋ด๋ฐ๊น์ง [10.1.2] ๋ด๋ฐ์ ์ฌ์ฉํ ๋
ผ๋ฆฌ ์ฐ์ฐ ๋งค์ฐ ๋จ์ํ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ์ ์ํ์๋๋ฐ, ๊ทธ๊ฒ์ด ์ธ๊ณต ๋ด๋ฐ ๋
ผ๋ฆฌ ๋ช
์ ๊ณ์ฐ ๊ฐ๋ฅ ์ฒซ ๋ฒ์งธ ๋คํธ์ํฌ ํญ๋ฑ ํจ์ ๋ด๋ฐ A ํ์ฑํ, ๋ด๋ฐ C ํ์ฑํ ๋ด๋ฐ A ๋นํ์ฑํ, ๋ด๋ฐ C ๋นํ์ฑํ ๋ ๋ฒ์ฌ ๋คํธ์ํฌ ๋
ผ๋ฆฌ๊ณฑ ์ฐ์ฐ A, B ๋ชจ๋ ํ์ฑํ๋ ๋ ํ์ฑํ ์ธ ๋ฒ์งธ ๋คํธ์ํฌ A, B ์ค ํ๋๊ฐ ํ์ฑํ๋๋ฉด C๋ ํ์ฑํ ๋ค ๋ฒ์งธ ๋คํธ์ํฌ ๋ด๋ฐ A๊ฐ ํ์ฑํ๋๊ณ ๋ด๋ฐ B๊ฐ ๋นํ์ฑํ๋ ๋ ๋ด๋ฐ C๊ฐ ํ์ฑํ๋ฉ๋๋ค. ๋ง์ฝ ๋ด๋ฐ A๊ฐ ํญ์ ํ์ฑํ๋์ด ์๋ค๋ฉด ์ด ๋คํธ์ํฌ๋ ๋
ผ๋ฆฌ ๋ถ์ ์ฐ์ฐ์ด ๋ฉ๋๋ค. ์ฆ, ๋ด๋ฐ B๊ฐ ๋นํ์ฑํ๋ ๋ ๋ด๋ฐ C๊ฐ ํ์ฑํ๋๊ณ , ..
AI/Machine Learning
๋ณธ ๋ด์ฉ์ ํธ์ฆ์จ ๋จธ์ ๋ฌ๋2 ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ฑํ์์ผ๋ฉฐ, ์๋ต๋ ๋ด์ฉ์ด๋ ์ถ๊ฐ๋ ๋ด์ฉ์ด ์์ต๋๋ค. [8.1] ์ฐจ์์ ์ ์ฃผ ํ๋ จ ์ํ ๊ฐ๊ฐ์ด ๋ง์ ํน์ฑ์ ๊ฐ์ง๋๋ฐ ์ด๋ฐ ๋ง์ ํน์ฑ์ ํ๋ จ์ ๋๋ฆฌ๊ฒ ํ ๋ฟ๋ง ์๋๋ผ, ์ข์ ์๋ฃจ์
์ ์ฐพ๊ธฐ ์ด๋ ต๊ฒ ๋ง๋ ๋ค. ์ด๋ฐ ๋ฌธ์ ๋ฅผ ์ข
์ข
์ฐจ์์ ์ ์ฃผ๋ผ๊ณ ํ๋ค. ํ๋ จ ์ธํธ์ ์ฐจ์์ด ํด์๋ก ๊ณผ๋์ ํฉ ์ํ์ด ์ปค์ง๋ค. ์ฐจ์์ ์ ์ฃผ๋ฅผ ํด๊ฒฐํ๋ ํด๊ฒฐ์ฑ
์ค ํ๋๋ ํ๋ จ ์ํ์ ๋ฐ๋๊ฐ ์ถฉ๋ถํ ๋์์ง ๋๊น์ง ํ๋ จ ์ธํธ์ ํฌ๊ธฐ๋ฅผ ํค์ฐ๋ ๊ฒ [8.2] ์ฐจ์ ์ถ์๋ฅผ ์ํ ์ ๊ทผ ๋ฐฉ๋ฒ [8.2.1] ํฌ์ ๋ชจ๋ ํ๋ จ ์ํ์ด ๊ณ ์ฐจ์ ๊ณต๊ฐ ์์ ์ ์ฐจ์ ๋ถ๋ถ๊ณต๊ฐ์ ๋์ฌ ์๋ค. ๋ชจ๋ ์ํ์ด 2์ฐจ์ ๊ณต๊ฐ์ ๊ฐ๊น๊ฒ ๋ฐฐ์น๋์ด ์๋ค. ์ ์ฌ์ง์ 2์ฐจ์ ๋ถ๋ถ ๊ณต๊ฐ์ ์์ง์ผ๋ก ํฌ์ํ์ฌ 2D ๋ฐ์ดํฐ์
์ ์ป์ ์ ์๋ค. ์ด๋ฌํ..
AI/Machine Learning
๋ณธ ๋ด์ฉ์ ํธ์ฆ์จ ๋จธ์ ๋ฌ๋2 ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ฑํ์์ผ๋ฉฐ, ์๋ต๋ ๋ด์ฉ์ด๋ ์ถ๊ฐ๋ ๋ด์ฉ์ด ์์ต๋๋ค. [5.1] ์ํฌํธ ๋ฒกํฐ ๋จธ์ (SVM) ์ ํ์ด๋ ๋น์ ํ ๋ถ๋ฅ, ํ๊ท, ์ด์์น ํ์์๋ ์ฌ์ฉ๊ฐ๋ฅํ ๋ค๋ชฉ์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ SVM์ ๊ธฐ๋ณธ ์์ด๋์ด๋ ๋ผ์ง ๋ง์ง ๋ถ๋ฅ๋ก ๋ํ๋ธ๋ค. ๊ฐ ํด๋์ค ์ฌ์ด์ ๊ฐ์ฅ ํญ์ด ๋์ ๋๋ก๋ฅผ ์ฐพ๋ ๊ฒ ๋๋ก ๊ฒฝ๊ณ์ ์์นํ ์ํ์ ์ํฌํธ ๋ฒกํฐ๋ผ๊ณ ํ๋ค. SVM์ ํน์ฑ์ ์ค์ผ์ผ์ ๋ฏผ๊ฐํ๋ค. ๋ฐ๋ผ์ ์ฌ์ดํท๋ฐ์ StandardScaler๋ฅผ ์ฌ์ฉํด๋ณด์ ํ๋ ๋ง์ง ๋ถ๋ฅ ๋ชจ๋ ์ํ์ด ๋๋ก ๋ฐ๊นฅ์ชฝ์ ์ฌ๋ฐ๋ฅด๊ฒ ๋ถ๋ฅ ๋ฐ์ดํฐ๊ฐ ์ ํ์ ์ผ๋ก ๊ตฌ๋ถ๋ ์ ์์ด์ผ ์๋ํจ ์ด์์น์ ๋ฏผ๊ฐํ๋ค. ์ํํธ ๋ง์ง ๋ถ๋ฅ ํ๋ ๋ง์ง์์ ์ข ๋ ์ ์ฐํ ํํ์ ๋ชจ๋ธ ์ํ์ด ๋๋ก ์ค๊ฐ์ ์๊ฑฐ๋, ๋ฐ๋์ชฝ์ ์๋ ๊ฒฝ์ฐ์ธ ๋ง์ง ์ค๋ฅ ์ฌ์ด์ ์ ์ ..
Projects
ํ๋ก์ ํธ ๋ช
: ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ๋ฒ ์ข
๋ฅ ๋ถ๋ฅ ์์คํ
๊ฐ์ ๋ณธ ํ๋ก์ ํธ๋ ์๋ด ๋๋ถ๋ค์๊ฒ ๋์์ด ๋๊ณ ์ ์งํํ๊ฒ ๋์๋ค. ํ๋์ ๋ฒํต์๋ ํ ๋ง๋ฆฌ์ ์ฌ์๋ฒ์ด ์กด์ฌํด์ผ ํ๋ฉฐ, ๋ฒ๋ค์ ์ข
๋ฅ ๋ํ ์์ด๋ฉด ์๋๋ค. ๋ฐ๋ผ์ ๋ฒ๋ค์ ์ข
๋ฅ๋ฅผ ์ ํํ ํ์
ํ๊ณ ๋ถ๋ฅํด์ผ ํ ํ์๊ฐ ์๋ค. ๋ํ ๋ฒํต ์ฒญ์, ๊ฟ ์ฑ์ทจ, ๋์ฝ ์ดํฌ ๋ฑ์ ์ํด 1๋
์ ์ต์ 6ํ๋ ์ฌ์๋ฒ์ ์ฐพ์์ผ ํ ํ์๊ฐ ์๋ค. ๊ทธ๋ฆฌ๊ณ ๊ฟ์ ์ ์ฅํ๋ ๋จน์ด์ฅ๊ณผ ์์ ๋ณ๋ ์ฐ๋์ฅ์ ๊ด๋ฆฌ๋ฅผ ์ํด ๊ตฌ๋ถ๋์ด์ ธ์ผ ํ๋๋ฐ, ์ฌ์๋ฒ์ด ๋จน์ด์ฅ์ผ๋ก ์ด๋ํ์ฌ ์ฐ๋์ ํ๊ฒ ๋๋ฉด ์ฌ์๋ฒ์ ์ฐพ์ ์ฐ๋์ฅ์ผ๋ก ๋ค์ ์ด๋์์ผ์ผ ํ๋ฉฐ ์ฐ๋๋ ์๋ค์ ์ฐพ์ ์ฎ๊ฒจ์ค์ผ ํ๋ค. ํ์ง๋ง ์ฌ๋ฌ ๋ง๋ฆฌ์ ๋ฒ๋ค ์์์ ์ฌ์๋ฒ์ ์ ํํ ์ฐพ๊ธฐ๋ ์๋นํ ์๊ฐ์ด ์์๋ ๋ฟ๋ง ์๋๋ผ ์กฐ๊ทธ๋ง ์๋ค์ ์ฐพ์ ์ฎ๊ฒจ์ฃผ๋ ์ผ ๋ํ ..
AI/Machine Learning
๋ณธ ๋ด์ฉ์ ํธ์ฆ์จ ๋จธ์ ๋ฌ๋2 ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ฑํ์์ผ๋ฉฐ, ์๋ต๋ ๋ด์ฉ์ด๋ ์ถ๊ฐ๋ ๋ด์ฉ์ด ์์ต๋๋ค. [4.1] ์ ํ ํ๊ท ์ ํ ํ๊ท ๋ชจ๋ธ์ ์์ธก $y = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + ... +\theta_n x_n$ $y = h_\theta(x) = \theta \cdot x$ $y$๋ ์์ธก๊ฐ, $n$ ์ ํน์ฑ์ ์, $x_i$๋ $i$๋ฒ์งธ ํน์ฑ๊ฐ, $\theta_j$๋ $j$๋ฒ์งธ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ์ฑ๋ฅ ํ๊ฐ ์งํ ํ๊ท ์ ๊ณฑ๊ทผ ์ค์ฐจ(RMSE) : $\sqrt{MSE(\theta)}$ RMSE๋ฅผ ์ต์ํํ๋ $\theta$๋ฅผ ์ฐพ์์ผ ํ๋ค ์ ๊ท ๋ฐฉ์ ์ $\theta = (X^TX)^{-1}X^Ty$ $\theta$ ๋ ๋น์ฉ ํจ์๋ฅผ ์ต์ํํ๋ ๊ฐ์ด๋ค. $y$๋ $y^{1}$..
AI/Machine Learning
๋ณธ ๋ด์ฉ์ ํธ์ฆ์จ ๋จธ์ ๋ฌ๋2 ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ฑํ์์ผ๋ฉฐ, ์๋ต๋ ๋ด์ฉ์ด๋ ์ถ๊ฐ๋ ๋ด์ฉ์ด ์์ต๋๋ค. [3.2] SGDClassifier ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ์ด์ฉํ์ฌ ์ ํ ๋ชจ๋ธ์ ๊ตฌํ from sklearn.linear_model import SGDClassifier sgd_clf = SGDClassifier(max_iter=1000, tol=1e-3, random_state=42) sgd_clf.fit(X_train, y_train) [Tip] SGDClassifier๋ ํ๋ จํ๋ ๋ฐ ๋ฌด์์์ฑ์ ์ฌ์ฉ. ๋ฐ๋ผ์ ๊ฒฐ๊ณผ๋ฅผ ์ฌํํ๊ธฐ ์ํด์ random_state ๋งค๊ฐ๋ณ์๋ฅผ ์ง์ ํด์ผํจ [3.3] ์ฑ๋ฅ ์ธก์ ๋ฐฉ๋ฒ ๊ต์ฐจ ๊ฒ์ฆ ๊ต์ฐจ ๊ฒ์ฆ์ด๋ ์ฝ๊ฒ ๋งํด ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ๋ฒ ๋ฐ๋ณตํด์ ๋๋๊ณ ์ฌ๋ฌ ๋ชจ๋ธ์ ํ์ตํ์ฌ ์ฑ๋ฅ์ ํ๊ฐํ๋..
AI/Machine Learning
1. MNIST ๋ฐ์ดํฐ์
์ผ๋ก ๋ถ๋ฅ๊ธฐ๋ฅผ ๋ง๋ค์ด ํ
์คํธ ์ธํธ์์ 97% ์ ํ๋๋ฅผ ๋ฌ์ฑํด๋ณด์ธ์. from sklearn.datasets import fetch_openml import numpy as np mnist = fetch_openml('mnist_784', version = 1) X, y = mnist["data"], mnist["target"] y = y.astype(np.int) #Train, Test set ๋๋๊ธฐ X_train, X_test, y_train, y_test = X[:60000], X[60000:], y[:60000], y[60000:] from sklearn.neighbors import KNeighborsClassifier knn_clf = KNeighborsClassifier..