๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ์ต์ํค๋ค ๋ณด๋ฉด ํ๋ จ ๋ฐ์ดํฐ์์๋ ์ ํ๋๊ฐ ๋์ง๋ง, ์ค์ ๋ฐ์ดํฐ์์๋ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ๊ฒฝ์ฐ๊ฐ ์์ต๋๋ค.
์ด๋ฌํ ํ์์ ๊ณผ์ ํฉ(Overfitting)์ด๋ผ๊ณ ํฉ๋๋ค.
๊ณผ์ ํฉ์ ์ด๋ณด์๋ฟ ์๋๋ผ ์ ๋ฌธ๊ฐ๋ค๋ ์์ฃผ ๋ง์ฃผ์น๋ ๋ฌธ์ ๋ก,
๋ชจ๋ธ์ด ๋๋ฌด ์ ํ์ตํ ๋๋จธ์ง ์ผ๋ฐํ์ ์คํจํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.
์ด๋ฒ ๊ธ์์๋ ๊ณผ์ ํฉ์ ๊ฐ๋
๋ถํฐ ๋ฐ์ ์์ธ, ๊ณผ์์ ํฉ๊ณผ์ ์ฐจ์ด, ๊ทธ๋ฆฌ๊ณ ํจ๊ณผ์ ์ธ ํด๊ฒฐ ๋ฐฉ๋ฒ๊น์ง ์ฝ๊ฒ ์ค๋ช
ํด๋ณด๊ฒ ์ต๋๋ค.
๐ ๋ชฉ์ฐจ
1. ๊ณผ์ ํฉ์ด๋ ๋ฌด์์ธ๊ฐ?
๊ณผ์ ํฉ(Overfitting)์ ๋จธ์ ๋ฌ๋์ด๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ํ๋ จ ๋ฐ์ดํฐ์ ๋๋ฌด ๊ณผํ๊ฒ ๋ง์ถฐ์ ธ ๊ฒ์ฆ ๋ฐ์ดํฐ๋ ์ค์ ๋ฐ์ดํฐ์ ๋ํด ์ผ๋ฐํ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ํ์์ ๋งํฉ๋๋ค. ๋ชจ๋ธ์ด ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ ์ธ์ฐ๋ ๋ฐ ์ง์คํ๋ฉด์, ์คํ๋ ค ์๋ก์ด ์ํฉ์ ์ ์ฒ๋ฆฌํ์ง ๋ชปํ๊ฒ ๋๋ ๊ฒ์ด์ฃ .
2. ๊ณผ์ ํฉ์ด ๋ฐ์ํ๋ ์ด์
- ๋ชจ๋ธ์ด ๋๋ฌด ๋ณต์กํ ๋: ์ธต์ด ๊น๊ณ ํ๋ผ๋ฏธํฐ ์๊ฐ ๋ง์ผ๋ฉด ํ๋ จ ๋ฐ์ดํฐ์ ๊ณผํ๊ฒ ์ ์ํฉ๋๋ค.
- ๋ฐ์ดํฐ ์์ด ๋ถ์กฑํ ๋: ๋ฐ์ดํฐ๊ฐ ์ ์ผ๋ฉด ๋ชจ๋ธ์ด ์ผ๋ฐํํ ๊ธฐํ๊ฐ ์ค์ด๋ญ๋๋ค.
- ํ๋ จ ํ์๊ฐ ๋๋ฌด ๋ง์ ๋: ์ํฌํฌ ์๊ฐ ๋ง์์ง๋ฉด ๋ ธ์ด์ฆ๊น์ง ํ์ตํ๊ฒ ๋ฉ๋๋ค.
- ๋ฐ์ดํฐ์ ๋ ธ์ด์ฆ๊ฐ ๋ง์ ๋: ๋ชจ๋ธ์ด ์ก์๊น์ง ํ์ตํ๋ฉด์ ์ฑ๋ฅ ์ ํ๊ฐ ๋ฐ์ํฉ๋๋ค.
3. ๊ณผ์์ ํฉ๊ณผ์ ์ฐจ์ด
๊ณผ์ ํฉ๊ณผ ๋ฐ๋๋๋ ๊ฐ๋ ์ ๊ณผ์์ ํฉ(Underfitting)์ ๋๋ค. ์ด๋ ๋ชจ๋ธ์ด ๋๋ฌด ๋จ์ํ์ฌ ํ๋ จ ๋ฐ์ดํฐ์กฐ์ฐจ ์ ํ์ตํ์ง ๋ชปํ๋ ๊ฒฝ์ฐ์ ๋๋ค.
๊ตฌ๋ถ | ๊ณผ์ ํฉ | ๊ณผ์์ ํฉ |
---|---|---|
๋ชจ๋ธ ๋ณต์ก๋ | ๋๋ฌด ๋ณต์กํจ | ๋๋ฌด ๋จ์ํจ |
ํ๋ จ ๋ฐ์ดํฐ ์ ํ๋ | ๋งค์ฐ ๋์ | ๋ฎ์ |
๊ฒ์ฆ ๋ฐ์ดํฐ ์ ํ๋ | ๋ฎ์ | ๋ฎ์ |
4. ๊ณผ์ ํฉ์ ์งํ์ ํ๋จ ๊ธฐ์ค
- ํ๋ จ ์ ํ๋๋ ๋งค์ฐ ๋์ง๋ง ๊ฒ์ฆ ์ ํ๋๋ ๋ฎ์
- ํ๋ จ ์์ค์ ๊ฐ์ํ์ง๋ง ๊ฒ์ฆ ์์ค์ ๋ค์ ์ฆ๊ฐ
- ์์ธก ๊ฒฐ๊ณผ๊ฐ ๋ฐ์ดํฐ์ ๋ฐ๋ผ ์ง๋์น๊ฒ ๋ฏผ๊ฐํ๊ฒ ๋ฐ์
5. ๊ณผ์ ํฉ ๋ฐฉ์ง ๋ฐฉ๋ฒ
- ๋๋กญ์์(Dropout): ํ์ต ์ค ์ผ๋ถ ๋ด๋ฐ์ ๋ฌด์์๋ก ์ ๊ฑฐ
- ์ ๊ทํ(Regularization): L1/L2 ํจ๋ํฐ ์ ์ฉ
- ์กฐ๊ธฐ ์ข ๋ฃ(Early Stopping): ๊ฒ์ฆ ์์ค์ด ์ฆ๊ฐํ๋ฉด ํ์ต ์ค๋จ
- ๋ฐ์ดํฐ ์ฆ๊ฐ(Data Augmentation): ํ์ต ๋ฐ์ดํฐ ๋ค์ํ
- ๋ชจ๋ธ ๊ฐ์ํ: ํ๋ผ๋ฏธํฐ ์ ์ค์ด๊ธฐ, ๊ตฌ์กฐ ๋จ์ํ
6. ๋ง๋ฌด๋ฆฌ ์์ฝ
๊ณผ์ ํฉ์ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ๋๋ฌด ์ ํ์ตํ๊ธฐ ๋๋ฌธ์ ์คํ๋ ค ์ผ๋ฐํ์ ์คํจํ๋ ์ํฉ์
๋๋ค.
์ด๋ ์ ์ ํ ๊ท์ ์ ํ๋์ ํตํด ์ถฉ๋ถํ ํด๊ฒฐํ ์ ์๋ ๋ฌธ์ ์ด๋ฉฐ,
ํ๋ จ ์ฑ๋ฅ๋ฟ ์๋๋ผ ๊ฒ์ฆ ์ฑ๋ฅ๊น์ง ๊ณ ๋ คํ๋ ๊ฒ์ด ์ง์ ํ ๋ชจ๋ธ ์ค๊ณ์
๋๋ค.
๋ค์ํ ๋ฐฉ๋ฒ์ผ๋ก ๊ณผ์ ํฉ์ ๋ฐฉ์งํ๊ณ , ๋ ๋์ ์ฑ๋ฅ์ ๊ฐ์ง ๋ชจ๋ธ์ ๋ง๋ค์ด๋ณด์ธ์!