๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
IT/AI, ๋”ฅ๋Ÿฌ๋‹

ํšŒ๊ท€ vs ๋ถ„๋ฅ˜ ๋ฌธ์ œ ์™„์ „ ์ •๋ณต: ์ถœ๋ ฅ ํ˜•ํƒœ๋ถ€ํ„ฐ ์˜ˆ์‹œ๊นŒ์ง€

by ๐Ÿ”ฅ๊นก ๋‹ค ๊ณ ! 2025. 3. 27.

๋”ฅ๋Ÿฌ๋‹ ๋ฌธ์ œ๋ฅผ ํ‘ธ๋Š”๋ฐ ์ฒซ ๊ฑธ์Œ์€ "์ด๊ฒŒ ํšŒ๊ท€์•ผ? ๋ถ„๋ฅ˜์•ผ?"๋ถ€ํ„ฐ ํŒ๋‹จํ•˜๋Š” ๊ฒƒ! ์ดˆ๋ณด์ž๋„ ๋ฐ”๋กœ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๊ฒŒ ์ถœ๋ ฅ ๋ณ€์ˆ˜ ๊ธฐ์ค€์œผ๋กœ ๋”ฑ ์ •๋ฆฌํ•ด๋“œ๋ฆฝ๋‹ˆ๋‹ค.

์•ˆ๋…•ํ•˜์„ธ์š”! ๋”ฅ๋Ÿฌ๋‹ ์ž…๋ฌธ์ž๋ผ๋ฉด ๋ฐ˜๋“œ์‹œ ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•  ์ค‘์š”ํ•œ ์ฃผ์ œ, ๋ฐ”๋กœ ํšŒ๊ท€์™€ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์˜ ์ฐจ์ด์ ์— ๋Œ€ํ•ด ์ •๋ฆฌํ•ด๋ณด์•˜์Šต๋‹ˆ๋‹ค. ์ €๋„ ์ฒ˜์Œ์— ๋ชจ๋ธ์„ ๋งŒ๋“ค ๋•Œ ์–ด๋–ค ์†์‹ค ํ•จ์ˆ˜์™€ ์ถœ๋ ฅ ๊ตฌ์กฐ๋ฅผ ์จ์•ผ ํ• ์ง€ ํ—ท๊ฐˆ๋ ธ๋˜ ๊ฒฝํ—˜์ด ์žˆ๊ฑฐ๋“ ์š”. ์ด๋ฒˆ ๊ธ€์—์„œ๋Š” ๋‹ค์–‘ํ•œ ์˜ˆ์‹œ์™€ ํ•จ๊ป˜ ์ถœ๋ ฅ ๋ณ€์ˆ˜์˜ ๊ตฌ์กฐ๊นŒ์ง€ ์‰ฝ๊ฒŒ ์„ค๋ช…ํ•ด๋“œ๋ฆด๊ฒŒ์š”.

1. ํšŒ๊ท€ ๋ฌธ์ œ๋ž€?

ํšŒ๊ท€ ๋ฌธ์ œ๋Š” ์—ฐ์†์ ์ธ ์ˆ˜์น˜ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ์ถœ๋ ฅ๊ฐ’์ด ์‹ค์ˆ˜ ํ˜•ํƒœ๋กœ ๋‚˜์˜ค๊ธฐ ๋•Œ๋ฌธ์—, ์ •๋‹ต์ด ๋ช…ํ™•ํžˆ ๋‚˜๋‰˜๋Š” ๋ถ„๋ฅ˜ ๋ฌธ์ œ์™€๋Š” ๋‹ค๋ฆ…๋‹ˆ๋‹ค.

  • ์ถœ๋ ฅ ๋ณ€์ˆ˜: 1๊ฐœ ์ด์ƒ์˜ ์—ฐ์† ์‹ค์ˆ˜ ๊ฐ’
  • ์†์‹ค ํ•จ์ˆ˜: ํ‰๊ท ์ œ๊ณฑ์˜ค์ฐจ(MSE), ํ‰๊ท ์ ˆ๋Œ€์˜ค์ฐจ(MAE) ๋“ฑ
์˜ˆ์‹œ ์ถœ๋ ฅ๊ฐ’
์ง‘๊ฐ’ ์˜ˆ์ธก \$300,000 (๋‹จ์ผ ์‹ค์ˆ˜)
๋ฉ€ํ‹ฐ ์ถœ๋ ฅ ํšŒ๊ท€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์‹ค์ˆ˜ (ex. ์ง‘๊ฐ’, ์œ ์ง€๋น„, ์ˆ˜๋ฆฌ๋น„ ๋“ฑ)

2. ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋ž€?

๋ถ„๋ฅ˜ ๋ฌธ์ œ๋Š” ๋ฏธ๋ฆฌ ์ •์˜๋œ ๋ฒ”์ฃผ(Class) ์ค‘ ํ•˜๋‚˜ ๋˜๋Š” ์—ฌ๋Ÿฌ ๊ฐœ๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ์ถœ๋ ฅ๊ฐ’์€ ๋ฒ”์ฃผํ˜•์ด๋ฉฐ, ๋ถ„๋ฅ˜ ๋ฐฉ์‹์— ๋”ฐ๋ผ ์ด์ง„, ๋‹ค์ค‘, ๋‹ค์ค‘ ๋ ˆ์ด๋ธ”๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค.

  • ์ถœ๋ ฅ ๋ณ€์ˆ˜: ํด๋ž˜์Šค ์ˆ˜์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์ง
  • ์†์‹ค ํ•จ์ˆ˜: ์ด์ง„ ํฌ๋กœ์Šค์—”ํŠธ๋กœํ”ผ, ๋ฒ”์ฃผํ˜• ํฌ๋กœ์Šค์—”ํŠธ๋กœํ”ผ ๋“ฑ

2-1. ์ด์ง„ ๋ถ„๋ฅ˜ (Binary Classification)

๋‘ ๊ฐ€์ง€ ํด๋ž˜์Šค ์ค‘ ํ•˜๋‚˜๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค.

  • ์ถœ๋ ฅ ๊ฐ’: 1๊ฐœ์˜ ํ™•๋ฅ  ๋˜๋Š” 0/1
  • ์˜ˆ์‹œ: ์ŠคํŒธ๋ฉ”์ผ ๋ถ„๋ฅ˜ → ์ŠคํŒธ(1) / ์ •์ƒ(0)

2-2. ๋‹ค์ค‘ ๋ถ„๋ฅ˜ (Multi-class Classification)

์„ธ ๊ฐœ ์ด์ƒ์˜ ํด๋ž˜์Šค ์ค‘ ํ•˜๋‚˜๋ฅผ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค.

  • ์ถœ๋ ฅ ๊ฐ’: ํด๋ž˜์Šค ์ˆ˜๋งŒํผ (One-hot encoding ๋˜๋Š” softmax)
  • ์˜ˆ์‹œ: ์ˆซ์ž ๋ถ„๋ฅ˜ (0~9) → ์ถœ๋ ฅ ๋…ธ๋“œ ์ˆ˜: 10

2-3. ๋‹ค์ค‘ ๋ ˆ์ด๋ธ” ๋ถ„๋ฅ˜ (Multi-label Classification)

์—ฌ๋Ÿฌ ํด๋ž˜์Šค์— ๋™์‹œ์— ์†ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฝ์šฐ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค.

  • ์ถœ๋ ฅ ๊ฐ’: ๊ฐ ํด๋ž˜์Šค์— ๋Œ€ํ•ด 0 ๋˜๋Š” 1 (์ด์ง„ ํ˜•์‹ N๊ฐœ)
  • ์˜ˆ์‹œ: ์˜ํ™” ์žฅ๋ฅด ์˜ˆ์ธก → ์•ก์…˜(1), ๋กœ๋งจ์Šค(0), ๋“œ๋ผ๋งˆ(1)

ํšŒ๊ท€ vs ๋ถ„๋ฅ˜ ๋น„๊ต ์š”์•ฝ

์ •๋ฆฌํ•˜์ž๋ฉด, ํšŒ๊ท€์™€ ๋ถ„๋ฅ˜๋Š” ์ถœ๋ ฅ ๋ณ€์ˆ˜์˜ ํ˜•ํƒœ์™€ ๋ฌธ์ œ์˜ ์„ฑ๊ฒฉ์— ๋”ฐ๋ผ ์™„์ „ํžˆ ๋‹ค๋ฆ…๋‹ˆ๋‹ค. ์•„๋ž˜ ํ‘œ๋ฅผ ํ†ตํ•ด ํ•ต์‹ฌ ์ฐจ์ด์ ์„ ํ•œ๋ˆˆ์— ์ •๋ฆฌํ•ด๋ณด์„ธ์š”!

ํ•ญ๋ชฉ ํšŒ๊ท€ (Regression) ๋ถ„๋ฅ˜ (Classification)
์ถœ๋ ฅ ๊ฐ’ ํ˜•ํƒœ ์—ฐ์†์ ์ธ ์‹ค์ˆ˜ ๊ฐ’ ํด๋ž˜์Šค ๋ผ๋ฒจ (๋ฒ”์ฃผ)
์˜ˆ์‹œ ์ง‘๊ฐ’ ์˜ˆ์ธก, ์ฃผ๊ฐ€ ์˜ˆ์ธก ์ŠคํŒธ ๋ถ„๋ฅ˜, ์†๊ธ€์”จ ์ธ์‹
์†์‹ค ํ•จ์ˆ˜ MSE, MAE ํฌ๋กœ์Šค์—”ํŠธ๋กœํ”ผ
์ถœ๋ ฅ์ธต ํ™œ์„ฑํ™” ํ•จ์ˆ˜ ์„ ํ˜• (Linear) ์‹œ๊ทธ๋ชจ์ด๋“œ / ์†Œํ”„ํŠธ๋งฅ์Šค

๋ฌธ์ œ๋ฅผ ์ œ๋Œ€๋กœ ์ •์˜ํ•ด์•ผ ์˜ฌ๋ฐ”๋ฅธ ๋ชจ๋ธ ์„ค๊ณ„๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ๋ณด๋‹ค ๋จผ์ € ๋ฌธ์ œ ์œ ํ˜•์„ ํ™•์‹คํžˆ ํŒŒ์•…ํ•ด๋ณด์„ธ์š”!

Q ํšŒ๊ท€ ๋ฌธ์ œ์—๋„ ์†Œํ”„ํŠธ๋งฅ์Šค ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

ํšŒ๊ท€๋Š” ์—ฐ์† ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋ฏ€๋กœ ์†Œํ”„ํŠธ๋งฅ์Šค์ฒ˜๋Ÿผ ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ํ•จ์ˆ˜๋Š” ์ ํ•ฉํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋ณดํ†ต ์„ ํ˜• ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

Q ์ด์ง„ ๋ถ„๋ฅ˜์™€ ๋‹ค์ค‘ ๋ถ„๋ฅ˜์˜ ์ถœ๋ ฅ์ธต์€ ์–ด๋–ป๊ฒŒ ๋‹ค๋ฅด๋‚˜์š”?

์ด์ง„ ๋ถ„๋ฅ˜๋Š” 1๊ฐœ์˜ ๋…ธ๋“œ์— ์‹œ๊ทธ๋ชจ์ด๋“œ ํ•จ์ˆ˜๋ฅผ, ๋‹ค์ค‘ ๋ถ„๋ฅ˜๋Š” ํด๋ž˜์Šค ์ˆ˜๋งŒํผ์˜ ๋…ธ๋“œ์— ์†Œํ”„ํŠธ๋งฅ์Šค๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

Q ๋‹ค์ค‘ ๋ถ„๋ฅ˜์™€ ๋‹ค์ค‘ ๋ ˆ์ด๋ธ” ๋ถ„๋ฅ˜์˜ ์ฐจ์ด๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”?

๋‹ค์ค‘ ๋ถ„๋ฅ˜๋Š” ํ•˜๋‚˜์˜ ํด๋ž˜์Šค๋งŒ ์„ ํƒ๋˜๋ฉฐ, ๋‹ค์ค‘ ๋ ˆ์ด๋ธ”์€ ์—ฌ๋Ÿฌ ํด๋ž˜์Šค์— ๋™์‹œ์— ์†Œ์†๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Q ํšŒ๊ท€ ๋ฌธ์ œ๋„ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์ฒ˜๋Ÿผ one-hot encoding์„ ์‚ฌ์šฉํ•˜๋‚˜์š”?

์•„๋‹ˆ์š”, ํšŒ๊ท€ ๋ฌธ์ œ๋Š” ์ˆ˜์น˜ ์˜ˆ์ธก์ด๋ฏ€๋กœ one-hot encoding์ด ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ทธ๊ฒƒ์€ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ ํด๋ž˜์Šค ๋ผ๋ฒจ ํ‘œํ˜„์šฉ์œผ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

ํšŒ๊ท€์™€ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์˜ ์ฐจ์ด, ์ด์ œ ํ™•์‹คํžˆ ๊ฐ์ด ์˜ค์…จ๋‚˜์š”? ์–ด๋–ค ๋ฌธ์ œ๋ฅผ ํ’€๊ณ  ์žˆ๋Š”์ง€ ์ œ๋Œ€๋กœ ์ดํ•ดํ•ด์•ผ ์ ์ ˆํ•œ ์ถœ๋ ฅ ๊ตฌ์กฐ์™€ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ์„ ํƒํ•  ์ˆ˜ ์žˆ์–ด์š”. ์ฒ˜์Œ์—๋Š” ์ถœ๋ ฅ์ด ๋ญ๊ฐ€ ๋‹ค๋ฅธ์ง€ ํ—ท๊ฐˆ๋ฆด ์ˆ˜ ์žˆ์ง€๋งŒ, ์˜ˆ์ œ๋ฅผ ํ†ตํ•ด ์ง์ ‘ ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด๋ณด๋ฉด ํ›จ์”ฌ ์‰ฝ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ถ๊ธˆํ•œ ์ ์ด๋‚˜ ํ—ท๊ฐˆ๋ฆฌ๋Š” ๊ฐœ๋…์ด ์žˆ๋‹ค๋ฉด ๋Œ“๊ธ€๋กœ ์ž์œ ๋กญ๊ฒŒ ๋‚จ๊ฒจ์ฃผ์„ธ์š”!