๋ฅ๋ฌ๋ ๋ฌธ์ ๋ฅผ ํธ๋๋ฐ ์ฒซ ๊ฑธ์์ "์ด๊ฒ ํ๊ท์ผ? ๋ถ๋ฅ์ผ?"๋ถํฐ ํ๋จํ๋ ๊ฒ! ์ด๋ณด์๋ ๋ฐ๋ก ์ดํดํ ์ ์๊ฒ ์ถ๋ ฅ ๋ณ์ ๊ธฐ์ค์ผ๋ก ๋ฑ ์ ๋ฆฌํด๋๋ฆฝ๋๋ค.
์๋ ํ์ธ์! ๋ฅ๋ฌ๋ ์ ๋ฌธ์๋ผ๋ฉด ๋ฐ๋์ ๊ตฌ๋ถํ ์ ์์ด์ผ ํ ์ค์ํ ์ฃผ์ , ๋ฐ๋ก ํ๊ท์ ๋ถ๋ฅ ๋ฌธ์ ์ ์ฐจ์ด์ ์ ๋ํด ์ ๋ฆฌํด๋ณด์์ต๋๋ค. ์ ๋ ์ฒ์์ ๋ชจ๋ธ์ ๋ง๋ค ๋ ์ด๋ค ์์ค ํจ์์ ์ถ๋ ฅ ๊ตฌ์กฐ๋ฅผ ์จ์ผ ํ ์ง ํท๊ฐ๋ ธ๋ ๊ฒฝํ์ด ์๊ฑฐ๋ ์. ์ด๋ฒ ๊ธ์์๋ ๋ค์ํ ์์์ ํจ๊ป ์ถ๋ ฅ ๋ณ์์ ๊ตฌ์กฐ๊น์ง ์ฝ๊ฒ ์ค๋ช ํด๋๋ฆด๊ฒ์.
๋ชฉ์ฐจ
1. ํ๊ท ๋ฌธ์ ๋?
ํ๊ท ๋ฌธ์ ๋ ์ฐ์์ ์ธ ์์น ๊ฐ์ ์์ธกํ๋ ๋ฌธ์ ์ ๋๋ค. ์ถ๋ ฅ๊ฐ์ด ์ค์ ํํ๋ก ๋์ค๊ธฐ ๋๋ฌธ์, ์ ๋ต์ด ๋ช ํํ ๋๋๋ ๋ถ๋ฅ ๋ฌธ์ ์๋ ๋ค๋ฆ ๋๋ค.
- ์ถ๋ ฅ ๋ณ์: 1๊ฐ ์ด์์ ์ฐ์ ์ค์ ๊ฐ
- ์์ค ํจ์: ํ๊ท ์ ๊ณฑ์ค์ฐจ(MSE), ํ๊ท ์ ๋์ค์ฐจ(MAE) ๋ฑ
์์ | ์ถ๋ ฅ๊ฐ |
---|---|
์ง๊ฐ ์์ธก | \$300,000 (๋จ์ผ ์ค์) |
๋ฉํฐ ์ถ๋ ฅ ํ๊ท | ์ฌ๋ฌ ๊ฐ์ ์ค์ (ex. ์ง๊ฐ, ์ ์ง๋น, ์๋ฆฌ๋น ๋ฑ) |
2. ๋ถ๋ฅ ๋ฌธ์ ๋?
๋ถ๋ฅ ๋ฌธ์ ๋ ๋ฏธ๋ฆฌ ์ ์๋ ๋ฒ์ฃผ(Class) ์ค ํ๋ ๋๋ ์ฌ๋ฌ ๊ฐ๋ฅผ ์์ธกํ๋ ๋ฌธ์ ์ ๋๋ค. ์ถ๋ ฅ๊ฐ์ ๋ฒ์ฃผํ์ด๋ฉฐ, ๋ถ๋ฅ ๋ฐฉ์์ ๋ฐ๋ผ ์ด์ง, ๋ค์ค, ๋ค์ค ๋ ์ด๋ธ๋ก ๋๋ฉ๋๋ค.
- ์ถ๋ ฅ ๋ณ์: ํด๋์ค ์์ ๋ฐ๋ผ ๋ฌ๋ผ์ง
- ์์ค ํจ์: ์ด์ง ํฌ๋ก์ค์ํธ๋กํผ, ๋ฒ์ฃผํ ํฌ๋ก์ค์ํธ๋กํผ ๋ฑ
2-1. ์ด์ง ๋ถ๋ฅ (Binary Classification)
๋ ๊ฐ์ง ํด๋์ค ์ค ํ๋๋ฅผ ์์ธกํ๋ ๋ฌธ์ ์ ๋๋ค.
- ์ถ๋ ฅ ๊ฐ: 1๊ฐ์ ํ๋ฅ ๋๋ 0/1
- ์์: ์คํธ๋ฉ์ผ ๋ถ๋ฅ → ์คํธ(1) / ์ ์(0)
2-2. ๋ค์ค ๋ถ๋ฅ (Multi-class Classification)
์ธ ๊ฐ ์ด์์ ํด๋์ค ์ค ํ๋๋ฅผ ์์ธกํฉ๋๋ค.
- ์ถ๋ ฅ ๊ฐ: ํด๋์ค ์๋งํผ (One-hot encoding ๋๋ softmax)
- ์์: ์ซ์ ๋ถ๋ฅ (0~9) → ์ถ๋ ฅ ๋ ธ๋ ์: 10
2-3. ๋ค์ค ๋ ์ด๋ธ ๋ถ๋ฅ (Multi-label Classification)
์ฌ๋ฌ ํด๋์ค์ ๋์์ ์ํ ์ ์๋ ๊ฒฝ์ฐ๋ฅผ ๋ค๋ฃน๋๋ค.
- ์ถ๋ ฅ ๊ฐ: ๊ฐ ํด๋์ค์ ๋ํด 0 ๋๋ 1 (์ด์ง ํ์ N๊ฐ)
- ์์: ์ํ ์ฅ๋ฅด ์์ธก → ์ก์ (1), ๋ก๋งจ์ค(0), ๋๋ผ๋ง(1)
ํ๊ท vs ๋ถ๋ฅ ๋น๊ต ์์ฝ
์ ๋ฆฌํ์๋ฉด, ํ๊ท์ ๋ถ๋ฅ๋ ์ถ๋ ฅ ๋ณ์์ ํํ์ ๋ฌธ์ ์ ์ฑ๊ฒฉ์ ๋ฐ๋ผ ์์ ํ ๋ค๋ฆ ๋๋ค. ์๋ ํ๋ฅผ ํตํด ํต์ฌ ์ฐจ์ด์ ์ ํ๋์ ์ ๋ฆฌํด๋ณด์ธ์!
ํญ๋ชฉ | ํ๊ท (Regression) | ๋ถ๋ฅ (Classification) |
---|---|---|
์ถ๋ ฅ ๊ฐ ํํ | ์ฐ์์ ์ธ ์ค์ ๊ฐ | ํด๋์ค ๋ผ๋ฒจ (๋ฒ์ฃผ) |
์์ | ์ง๊ฐ ์์ธก, ์ฃผ๊ฐ ์์ธก | ์คํธ ๋ถ๋ฅ, ์๊ธ์จ ์ธ์ |
์์ค ํจ์ | MSE, MAE | ํฌ๋ก์ค์ํธ๋กํผ |
์ถ๋ ฅ์ธต ํ์ฑํ ํจ์ | ์ ํ (Linear) | ์๊ทธ๋ชจ์ด๋ / ์ํํธ๋งฅ์ค |
๋ฌธ์ ๋ฅผ ์ ๋๋ก ์ ์ํด์ผ ์ฌ๋ฐ๋ฅธ ๋ชจ๋ธ ์ค๊ณ๊ฐ ๊ฐ๋ฅํฉ๋๋ค. ๋ชจ๋ธ๋ณด๋ค ๋จผ์ ๋ฌธ์ ์ ํ์ ํ์คํ ํ์ ํด๋ณด์ธ์!
ํ๊ท๋ ์ฐ์ ๊ฐ์ ์์ธกํ๋ฏ๋ก ์ํํธ๋งฅ์ค์ฒ๋ผ ํ๋ฅ ๋ถํฌ๋ฅผ ์ถ๋ ฅํ๋ ํจ์๋ ์ ํฉํ์ง ์์ต๋๋ค. ๋ณดํต ์ ํ ํ์ฑํ ํจ์๋ฅผ ์ฌ์ฉํฉ๋๋ค.
์ด์ง ๋ถ๋ฅ๋ 1๊ฐ์ ๋ ธ๋์ ์๊ทธ๋ชจ์ด๋ ํจ์๋ฅผ, ๋ค์ค ๋ถ๋ฅ๋ ํด๋์ค ์๋งํผ์ ๋ ธ๋์ ์ํํธ๋งฅ์ค๋ฅผ ์ฌ์ฉํฉ๋๋ค.
๋ค์ค ๋ถ๋ฅ๋ ํ๋์ ํด๋์ค๋ง ์ ํ๋๋ฉฐ, ๋ค์ค ๋ ์ด๋ธ์ ์ฌ๋ฌ ํด๋์ค์ ๋์์ ์์๋ ์ ์์ต๋๋ค.
์๋์, ํ๊ท ๋ฌธ์ ๋ ์์น ์์ธก์ด๋ฏ๋ก one-hot encoding์ด ํ์ํ์ง ์์ต๋๋ค. ๊ทธ๊ฒ์ ๋ถ๋ฅ ๋ฌธ์ ์์ ํด๋์ค ๋ผ๋ฒจ ํํ์ฉ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค.
ํ๊ท์ ๋ถ๋ฅ ๋ฌธ์ ์ ์ฐจ์ด, ์ด์ ํ์คํ ๊ฐ์ด ์ค์ จ๋์? ์ด๋ค ๋ฌธ์ ๋ฅผ ํ๊ณ ์๋์ง ์ ๋๋ก ์ดํดํด์ผ ์ ์ ํ ์ถ๋ ฅ ๊ตฌ์กฐ์ ์์ค ํจ์๋ฅผ ์ ํํ ์ ์์ด์. ์ฒ์์๋ ์ถ๋ ฅ์ด ๋ญ๊ฐ ๋ค๋ฅธ์ง ํท๊ฐ๋ฆด ์ ์์ง๋ง, ์์ ๋ฅผ ํตํด ์ง์ ๋ชจ๋ธ์ ๋ง๋ค์ด๋ณด๋ฉด ํจ์ฌ ์ฝ๊ฒ ์ดํดํ ์ ์์ต๋๋ค. ๊ถ๊ธํ ์ ์ด๋ ํท๊ฐ๋ฆฌ๋ ๊ฐ๋ ์ด ์๋ค๋ฉด ๋๊ธ๋ก ์์ ๋กญ๊ฒ ๋จ๊ฒจ์ฃผ์ธ์!