๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋์ ๋ชจ๋ ์ง๋ํ์ต(Supervised Learning)์ ์ฌ์ฉํ๋ ๋ํ์ ์ธ ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ์ ๋๋ค. ํ์ง๋ง ๋ ๊ธฐ์ ์ ๋ด๋ถ ๊ตฌ์กฐ์ ํจ์ ๊ตฌ์ฑ์์ ํฐ ์ฐจ์ด๊ฐ ์์ต๋๋ค. ๋จธ์ ๋ฌ๋์ ์ง๋ํ์ต์ ์ ํํจ์(Linear Function) ๊ธฐ๋ฐ ๋ชจ๋ธ์ด ๋ง๊ณ , ๋ฅ๋ฌ๋์ ๋น์ ํํจ์(Nonlinear Function)๋ฅผ ํ์ฉํ ๋ณต์กํ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ต๋๋ค. ์ด๋ฒ ๊ธ์์๋ ์ด ๋ ๊ธฐ์ ์ ์ง๋ํ์ต ๊ตฌ์กฐ๋ฅผ ์ค์ฌ์ผ๋ก, ์ ํ vs ๋น์ ํ ํจ์์ ์ฐจ์ด์ ์ ์ฉ ์ฌ๋ก๋ฅผ ์์์ ํจ๊ป ์ดํด๋ณด๊ฒ ์ต๋๋ค.
๐ ๋ชฉ์ฐจ
1. ์ง๋ํ์ต์ด๋ ๋ฌด์์ธ๊ฐ?
์ง๋ํ์ต(Supervised Learning)์ ์ ๋ ฅ(Input)๊ณผ ์ถ๋ ฅ(Output)์ ์ ๋ต ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ง ์ํ์์ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฐฉ์์ ๋๋ค. ๋ชจ๋ธ์ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ณ ์ ๋ต์ ์์ธกํ๋ ๋ฒ์ ํ์ตํ๊ฒ ๋๋ฉฐ, ํ๊ท, ๋ถ๋ฅ ๋ฑ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์์ต๋๋ค.
2. ๋จธ์ ๋ฌ๋ ์ง๋ํ์ต: ์ ํ ํจ์ ๊ธฐ๋ฐ
๋จธ์ ๋ฌ๋์์์ ์ง๋ํ์ต์ ์ ํํจ์ ๊ธฐ๋ฐ ๋ชจ๋ธ์ด ์ฃผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. ๋ํ์ ์ผ๋ก ์ ํ ํ๊ท(Linear Regression), ๋ก์ง์คํฑ ํ๊ท(Logistic Regression), SVM ๋ฑ์ด ์์ผ๋ฉฐ, ์ด๋ค์ ๋๋ถ๋ถ ๋ค์๊ณผ ๊ฐ์ ํํ์ ๋ชจ๋ธ์ ์ฌ์ฉํฉ๋๋ค:
y = wโxโ + wโxโ + ... + wโxโ + b
์ด์ ๊ฐ์ ๋ชจ๋ธ์ ์ ๋ ฅ๊ณผ ์ถ๋ ฅ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ง์ ๋๋ ํ๋ฉด์ผ๋ก ํํํ ์ ์์ด ๊ณ์ฐ์ ๊ฐ๋จํ์ง๋ง ๋ณต์กํ ํจํด์ ํ์ตํ๊ธฐ์๋ ํ๊ณ๊ฐ ์์ต๋๋ค.
3. ๋ฅ๋ฌ๋ ์ง๋ํ์ต: ๋น์ ํ ํจ์ ๊ธฐ๋ฐ
๋ฅ๋ฌ๋์์๋ ๋น์ ํ ํจ์(ํ์ฑํ ํจ์)๋ฅผ ํตํด ๋ณต์กํ ๊ด๊ณ๋ฅผ ํ์ตํ ์ ์๋๋ก ๋ชจ๋ธ์ ๊ตฌ์ฑํฉ๋๋ค. ์๋ฅผ ๋ค์ด ์๋์ ๊ฐ์ ์ธ๊ณต์ ๊ฒฝ๋ง(ANN) ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํฉ๋๋ค:
y = ReLU(wโxโ + wโxโ + ... + wโxโ + b)
์ฌ๊ธฐ์ ReLU
, Sigmoid
, Tanh
๋ฑ์ ๋น์ ํ ํ์ฑํ ํจ์๋ก, ๋ชจ๋ธ์ด ๋จ์ํ ์ง์ ์ด ์๋ ๊ณก์ , ๋น์ ํ ๊ฒฝ๊ณ๋ฅผ ํ์ตํ ์ ์๊ฒ ๋ง๋ญ๋๋ค.
4. ์ ํ vs ๋น์ ํ ๋ชจ๋ธ ๋น๊ต ์์
ํญ๋ชฉ | ๋จธ์ ๋ฌ๋ (์ ํ) | ๋ฅ๋ฌ๋ (๋น์ ํ) |
---|---|---|
ํจ์ ํํ | ์ ํ ํจ์ | ๋น์ ํ ํจ์ ํฌํจ |
๋ชจ๋ธ ๋ณต์ก๋ | ๋ฎ์ | ๋์ (๋ค์ธต ๊ตฌ์กฐ) |
ํ์ต ๋ฅ๋ ฅ | ์ง์ ์ ํจํด์ ๊ฐํจ | ๋ณต์กํ ๋น์ ํ ํจํด๊น์ง ํ์ต |
์ฆ, ๋จธ์ ๋ฌ๋์ ๊ฐ๋จํ๊ณ ๋น ๋ฅด์ง๋ง ํ๊ณ๊ฐ ๋ถ๋ช ํ๊ณ , ๋ฅ๋ฌ๋์ ๋ณต์กํ์ง๋ง ๋ ์ ์ฐํ๊ณ ๊ฐ๋ ฅํ ํํ๋ ฅ์ ๊ฐ์ง๋๋ค.
5. ์ ๋ฅ๋ฌ๋์ ๋น์ ํ ํจ์๋ฅผ ์ฌ์ฉํ ๊น?
๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ๋น์ ํ ํจ์๋ฅผ ์ฌ์ฉํ๋ ์ด์ ๋ ๊ฐ๋จํฉ๋๋ค. ์ธ์์ ๋๋ถ๋ถ์ ๋ฌธ์ ๋ ์ ํ์ด ์๋๊ธฐ ๋๋ฌธ์ ๋๋ค. ์ ํ ๋ชจ๋ธ์ ์ ๋ ฅ๊ณผ ์ถ๋ ฅ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ง์ ์ผ๋ก ํํํฉ๋๋ค. ํ์ง๋ง ์ค์ ๋ฌธ์ ๋ ๊ทธ๋ ๊ฒ ๋จ์ํ์ง ์์ฃ . ์๋ฅผ ๋ค์ด, ์ด๋ฏธ์ง ์ธ์, ์์ฐ์ด ์ฒ๋ฆฌ, ์์ฑ ๋ถ๋ฅ ๋ฑ์ ๋ชจ๋ ๋ณต์กํ ํจํด๊ณผ ์กฐ๊ฑด์ ๋ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ ๋ฌ๋ผ์ง๋ ๋น์ ํ ๋ฌธ์ ์ ๋๋ค.
โ ์์ 1: XOR ๋ฌธ์
๋ํ์ ์ธ ๋น์ ํ ๋ฌธ์ ๋ก XOR ๊ฒ์ดํธ๊ฐ ์์ต๋๋ค. XOR์ ์ ํ ๋ชจ๋ธ๋ก๋ ์ ๋ ๋ถ๋ฆฌํ ์ ์๋ ๋ฌธ์ ์ ๋๋ค. ์๋๋ฅผ ๋ณด์ธ์:
์ ๋ ฅ: (0,0) โ ์ถ๋ ฅ: 0 ์ ๋ ฅ: (1,0) โ ์ถ๋ ฅ: 1 ์ ๋ ฅ: (0,1) โ ์ถ๋ ฅ: 1 ์ ๋ ฅ: (1,1) โ ์ถ๋ ฅ: 0
์ด๋ฐ ๋ฌธ์ ๋ ํ๋์ ์ง์ ์ผ๋ก๋ ์ ๋ ๋๋ ์ ์์ต๋๋ค. ํ์ง๋ง ๋ฅ๋ฌ๋์ ์๋์ธต(Hidden Layer) + ๋น์ ํ ํ์ฑํ ํจ์๋ฅผ ์กฐํฉํด ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์์ต๋๋ค.
โ ์์ 2: ์ด๋ฏธ์ง ๋ถ๋ฅ
๊ณ ์์ด์ ๊ฐ์์ง๋ฅผ ๊ตฌ๋ถํ๋ ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ์๊ฐํด๋ณด์ธ์. ๋ ๋๋ฌผ์ ๊ท ๋ชจ์, ๋ ํฌ๊ธฐ, ํธ ํจํด ๋ฑ ๋ค์ํ ์๊ฐ์ ํน์ง์ด ์์ผ๋ฉฐ, ์ด ๊ด๊ณ๋ ์ ํ์ ์ผ๋ก ๋ถ๋ฆฌํ ์ ์์ต๋๋ค. ์ฌ๊ธฐ์ ๋ฅ๋ฌ๋์ ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง(CNN)์ ์์ญ ๊ฐ์ ๋น์ ํ ๊ณ์ธต์ ํตํด ์ด๋ฐ ํจํด์ ํ์ตํ ์ ์์ต๋๋ค.
โ ์์ 3: ์ธ์ด ๊ฐ์ ๋ถ์
โ์ด ์ํ ์ง์ง ๋๋ฌด ์ข์์!โ ์ โ์ด ์ํ ๋๋ฌด ์ง๋ฃจํ์ด์.โ๋ ๋จ์ด๊ฐ ์ ์ฌํ์ง๋ง ๊ฐ์ ์ ์ ๋ฐ๋์ ๋๋ค. ์ด๋ฌํ ๋์์ค์ ๋ฌธ๋งฅ์ ํ์ ํ๊ธฐ ์ํด์๋ ๋จ์ด ๊ฐ์ ๋ณต์กํ ๊ด๊ณ(๋น์ ํ์ฑ)๋ฅผ ์ดํดํ ์ ์์ด์ผ ํ๊ณ , ์ด๋ ๋ฅ๋ฌ๋์ ์ํ ์ ๊ฒฝ๋ง(RNN)์ด๋ ํธ๋์คํฌ๋จธ ๋ชจ๋ธ์์ ๊ฐ๋ฅํฉ๋๋ค.
โ ๊ธฐ์ ์ ์ผ๋ก ์ ํ์ํ๊ฐ?
๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ์ธต์ ์ฌ๋ฌ ๊ฐ ์๋๋ผ๋, ๋น์ ํ ํจ์ ์์ด ์ ํ ํจ์๋ง ์ฌ์ฉํ๋ฉด ์๋ฌด๋ฆฌ ๋ง์ด ์์๋ ๊ฒฐ๊ตญ ํ๋์ ์ ํ ๋ชจ๋ธ์ ๋ถ๊ณผํฉ๋๋ค. ์ด๋ฅผ ์ํ์ ์ผ๋ก๋ ๋ค์๊ณผ ๊ฐ์ด ํํํ ์ ์์ต๋๋ค:
y = Wโ(Wโ(Wโx)) = (WโยทWโยทWโ)x โ ๊ฒฐ๊ตญ y = Wx
์ฆ, ์ ํ ํจ์๋ง ๊ณ์ ๊ณฑํ๋ฉด ๊ทธ ๊ฒฐ๊ณผ๋ ๋ ๋ค๋ฅธ ํ๋์ ์ ํ ํจ์์ ๋๋ค. ๊ทธ๋์ ๋ฐ๋์ ์ธต ์ฌ์ด์ ๋น์ ํ ํจ์(ํ์ฑํ ํจ์)๋ฅผ ๋ฃ์ด์ผ ๋ชจ๋ธ์ด ๋น์ ํ ๋ฌธ์ ๋ ํ์ตํ ์ ์์ต๋๋ค.
6. ๋ง๋ฌด๋ฆฌ ์์ฝ
๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋ ๋ชจ๋ ์ง๋ํ์ต์ ์ฌ์ฉํ์ง๋ง, ์ฌ์ฉํ๋ ํจ์ ๊ตฌ์กฐ์ ์ฐจ์ด๊ฐ ์์ต๋๋ค. ๋จธ์ ๋ฌ๋์ ์ ํ ํจ์ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์กฐ๊ฐ ๋จ์ํ์ง๋ง, ๋ฅ๋ฌ๋์ ๋น์ ํ ํจ์์ ๊ณ์ธต์ ๊ตฌ์กฐ๋ก ๋ณต์กํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์์ต๋๋ค. ์ ํ๋์ ํํ๋ ฅ, ์ ์ฐ์ฑ ๋ฉด์์ ๋ฅ๋ฌ๋์ด ๋ ๊ฐ๋ ฅํ์ง๋ง, ๋ฌธ์ ์ ๋ณต์ก๋์ ๋ฐ๋ผ ์ ์ ํ ๋ชจ๋ธ์ ์ ํํ๋ ๊ฒ์ด ๊ฐ์ฅ ์ค์ํฉ๋๋ค.