๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ์ตํ๋ค ๋ณด๋ฉด ๊ฐ์ฅ ํํ ๋ง์ฃผ์น๋ ๋ฌธ์ ๊ฐ ๊ณผ์ ํฉ(overfitting)์
๋๋ค. ์ด๋ ํจ๊ณผ์ ์ผ๋ก ๊ณผ์ ํฉ์ ์ค์ด๋ ๋ํ์ ์ธ ๋ฐฉ๋ฒ ์ค ํ๋๊ฐ ๋ฐ๋ก ๊ท์ ํ(Regularization)์
๋๋ค.
ํนํ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋์์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๊ท์ ํ ๊ธฐ๋ฒ์ด L1 ๊ท์ ์ L2 ๊ท์ ์ธ๋ฐ์, ์ด๋ฒ ๊ธ์์๋ ์ด ๋ ๊ฐ์ง ๊ท์ ๋ฐฉ๋ฒ์ ๊ฐ๋
, ์ํ์ ์ ์, ์ฐจ์ด์ , ์ธ์ ์ฌ์ฉํ๋ฉด ์ข์์ง๋ฅผ ์ ๋ฆฌํด๋ณด๊ฒ ์ต๋๋ค.
๐ ๋ชฉ์ฐจ
1. ๊ท์ ํ(Regularization)๋?
๊ท์ ํ๋ ๋ชจ๋ธ์ด ํ๋ จ ๋ฐ์ดํฐ์ ๊ณผํ๊ฒ ์ ํฉ(overfit)๋๋ ๊ฒ์ ๋ฐฉ์งํ๊ธฐ ์ํด ๋ชจ๋ธ์ ๋ณต์ก๋์ ํจ๋ํฐ(์ ์ฝ ์กฐ๊ฑด)๋ฅผ ๋ถ์ฌํ๋ ๋ฐฉ๋ฒ์
๋๋ค.
๊ฐ๋จํ ๋งํด, ๋๋ฌด ํฐ ๊ฐ์ค์น(weight)๋ฅผ ๊ฐ๋ ๋ชจ๋ธ์ ์ผ๋ฐํ ์ฑ๋ฅ์ด ๋จ์ด์ง ์ ์์ผ๋ฏ๋ก ๊ฐ์ค์น๋ฅผ ์๊ฒ ์ ์งํ๋๋ก ๋ฒ์ ์ ์ฃผ๋ ๊ฒ์ด์ฃ .
2. L1 ๊ท์ (Lasso)๋?
L1 ๊ท์ ๋ ์์ค ํจ์์ ๊ฐ์ค์น์ ์ ๋๊ฐ ํฉ์ ๋ํด์ฃผ๋ ๋ฐฉ์์ ๋๋ค. ์ด๋ฅผ ํตํด ๋ถํ์ํ ๊ฐ์ค์น๋ 0์ผ๋ก ์๋ ดํ๊ฒ ๋ง๋ค์ด ๋ชจ๋ธ์ ๋ ๋จ์ํ๊ฒ ๋ง๋ญ๋๋ค.
Loss = MSE + λ * Σ|wแตข|
- λ (๋๋ค)๋ ๊ท์ ๊ฐ๋๋ฅผ ์กฐ์ ํ๋ ํ์ดํผํ๋ผ๋ฏธํฐ์
๋๋ค.
- ์ผ๋ถ ๊ฐ์ค์น๋ฅผ 0์ผ๋ก ๋ง๋ค์ด ๋ณ์ ์ ํ(feature selection)์ ํจ๊ณผ์ ์
๋๋ค.
- ๋ํ ์๊ณ ๋ฆฌ์ฆ: Lasso ํ๊ท(Lasso Regression)
3. L2 ๊ท์ (Ridge)๋?
L2 ๊ท์ ๋ ์์ค ํจ์์ ๊ฐ์ค์น ์ ๊ณฑ์ ํฉ์ ๋ํด์ฃผ๋ ๋ฐฉ์์ ๋๋ค. ์ด ๋ฐฉ์์ ๊ฐ์ค์น๋ฅผ 0์ ๊ฐ๊น๊ฒ ๋ง๋ค๋, ์์ ํ 0์ผ๋ก ๋ง๋ค์ง๋ ์์ต๋๋ค.
Loss = MSE + λ * Σ(wแตข²)
- ๊ฐ์ค์น์ ํฌ๊ธฐ๋ฅผ ์๊ฒ ์ ์งํ์ฌ ๋ชจ๋ธ์ ๋ถ๋๋ฝ๊ฒ ์ผ๋ฐํํ๋ ๋ฐ ํจ๊ณผ์ ์
๋๋ค.
- L1๊ณผ๋ ๋ฌ๋ฆฌ ๋ชจ๋ ๋ณ์์ ๊ธฐ์ฌ๋๋ฅผ ๋จ๊น
- ๋ํ ์๊ณ ๋ฆฌ์ฆ: Ridge ํ๊ท(Ridge Regression), ๋ฅ๋ฌ๋์ Weight Decay
4. L1 vs L2 ๊ท์ ์ ์ฐจ์ด์
ํญ๋ชฉ | L1 ๊ท์ (Lasso) | L2 ๊ท์ (Ridge) |
---|---|---|
ํจ๋ํฐ ํญ | |w| (์ ๋๊ฐ) | w² (์ ๊ณฑ) |
๊ฐ์ค์น ์ฒ๋ฆฌ | ์ผ๋ถ ๊ฐ์ค์น๋ฅผ 0์ผ๋ก ๋ง๋ฆ | ๋ชจ๋ ๊ฐ์ค์น๋ฅผ ์๊ฒ ์ ์ง |
๋ณ์ ์ ํ | O (ํน์ฑ ์ ํ ํจ๊ณผ) | X (๋ชจ๋ ํน์ฑ ์ฌ์ฉ) |
ํ์ฉ ๋ถ์ผ | ํฌ์ ๋ชจ๋ธ, ํผ์ฒ ์ค์๋ ๋ถ์ | ๋ฅ๋ฌ๋, ์ ํ ํ๊ท ์ผ๋ฐํ |
5. ์ธ์ L1, ์ธ์ L2๋ฅผ ์ฌ์ฉํ ๊น?
- L1 ๊ท์ ๋ → ๋ง์ ํผ์ฒ ์ค **์ค์ํ ๊ฒ๋ง ๋จ๊ธฐ๊ณ ์ถ์ ๋**
- L2 ๊ท์ ๋ → ๋ชจ๋ ํผ์ฒ๋ฅผ ์ฌ์ฉํ๋ **๊ณผ์ ํฉ์ ์ค์ด๊ณ ์ถ์ ๋**
- L1 + L2 ํผํฉ: ์๋ผ์คํฑ๋ท(Elastic Net) ๊ท์ ๋ก ๋ ๋ฐฉ์์ ์ฅ์ ์ ๋ชจ๋ ์ทจํจ
๋ฅ๋ฌ๋์์๋ ์ผ๋ฐ์ ์ผ๋ก L2 ๊ท์ (weight decay)๊ฐ ๋ ๋ง์ด ์ฐ์ด๋ฉฐ, ๋จธ์ ๋ฌ๋์์๋ ๋ณ์ ์ ํ์ ์ํด L1 ๊ท์ ๋๋ ํผํฉ ๋ฐฉ์์ด ์ ํธ๋ฉ๋๋ค.
6. ๋ง๋ฌด๋ฆฌ ์์ฝ
L1๊ณผ L2 ๊ท์ ๋ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋์์ ๊ณผ์ ํฉ ๋ฐฉ์ง์ ์ผ๋ฐํ ์ฑ๋ฅ ํฅ์์ ์ํด ํ์์ ์ธ ๊ธฐ๋ฒ์
๋๋ค.
- L1์ **๊ฐ์ค์น๋ฅผ 0์ผ๋ก ๋ง๋ค์ด ๋ถํ์ํ ํผ์ฒ ์ ๊ฑฐ(ํฌ์์ฑ)** - L2๋ **๊ฐ์ค์น๋ฅผ ์๊ฒ ์ ์งํ์ฌ ๋ชจ๋ธ์ ๋ถ๋๋ฝ๊ฒ ์ผ๋ฐํ** - ๋ชฉ์ ์ ๋ง๊ฒ ์ ํํ๊ฑฐ๋, ๋ ๊ฐ์ง๋ฅผ ํผํฉํ ElasticNet๋ ํ์ฉ ๊ฐ๋ฅ
์ฑ๋ฅ ์ข์ ๋ชจ๋ธ์ ๋ง๋ค๊ณ ์ถ๋ค๋ฉด, ๊ท์ ํ์ ๋ํ ์ดํด๋ ํ์์
๋๋ค!