๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
IT/AI, ๋”ฅ๋Ÿฌ๋‹

์ง€๋„ํ•™์Šต ๋ฌธ์ œ, ํšŒ๊ท€์•ผ? ๋ถ„๋ฅ˜์•ผ? ๋ชจ๋ธ ์„ ํƒ๋ฒ•๊นŒ์ง€ ์™„๋ฒฝ ๊ฐ€์ด๋“œ

by ๐Ÿ”ฅ๊นก ๋‹ค ๊ณ ! 2025. 4. 1.

๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ๊ฐ€์žฅ ๋จผ์ € ๋งˆ์ฃผ์น˜๋Š” ์งˆ๋ฌธ์ด ์žˆ์Šต๋‹ˆ๋‹ค. "์ด ๋ฌธ์ œ๋Š” ํšŒ๊ท€์ธ๊ฐ€์š”? ๋ถ„๋ฅ˜์ธ๊ฐ€์š”?"

์ง€๋„ํ•™์Šต(Supervised Learning)์€ ํฌ๊ฒŒ ํšŒ๊ท€(Regression)์™€ ๋ถ„๋ฅ˜(Classification) ๋‘ ๊ฐ€์ง€๋กœ ๋‚˜๋‰˜๋ฉฐ, ๋ฌธ์ œ์˜ ๋ชฉํ‘œ์— ๋”ฐ๋ผ ์„ ํƒํ•ด์•ผ ํ•  ๋ชจ๋ธ๋„ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค.

์ด๋ฒˆ ๊ธ€์—์„œ๋Š” ํšŒ๊ท€์™€ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์˜ ์ฐจ์ด๋ฅผ ์ดํ•ดํ•˜๊ณ , ๊ฐ ๋ฌธ์ œ์— ์–ด๋–ค ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด ์ ํ•ฉํ•œ์ง€ ํ•œ๋ˆˆ์— ์ •๋ฆฌํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.


1. ์ง€๋„ํ•™์Šต์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€?

์ง€๋„ํ•™์Šต(Supervised Learning)์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์™€ ์ •๋‹ต(Label)์ด ํ•จ๊ป˜ ์ฃผ์–ด์ง€๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ค๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ๋ชฉํ‘œ๋Š” ์ƒˆ๋กœ์šด ์ž…๋ ฅ์— ๋Œ€ํ•ด ์ •ํ™•ํ•œ ์˜ˆ์ธก ๊ฐ’์„ ๋งŒ๋“ค์–ด๋‚ด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ง€๋„ํ•™์Šต์˜ ๋ฌธ์ œ ์œ ํ˜•์€ ํฌ๊ฒŒ ๋‘ ๊ฐ€์ง€, ํšŒ๊ท€(์ˆ˜์น˜ ์˜ˆ์ธก)์™€ ๋ถ„๋ฅ˜(๋ฒ”์ฃผ ์˜ˆ์ธก)๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค.

2. ํšŒ๊ท€ ๋ฌธ์ œ๋ž€?

ํšŒ๊ท€(Regression)๋Š” ์ •๋‹ต์ด ์—ฐ์†์ ์ธ ์ˆซ์ž(์‹ค์ˆ˜)์ผ ๋•Œ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ์ธก ๊ฒฐ๊ณผ๊ฐ€ ์ˆ˜์น˜ ๋ฐ์ดํ„ฐ๋ผ๋ฉด ํšŒ๊ท€ ๋ฌธ์ œ๋กœ ํŒ๋‹จํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๐Ÿงพ ์˜ˆ์‹œ:

  • ์•„ํŒŒํŠธ์˜ ๊ฐ€๊ฒฉ ์˜ˆ์ธก
  • ๊ธฐ์˜จ ๋ณ€ํ™” ์˜ˆ์ธก
  • ๋งค์ถœ, ์ˆ˜์ต, ์ง€์ˆ˜ ์˜ˆ์ธก

3. ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋ž€?

๋ถ„๋ฅ˜(Classification)์€ ์ •๋‹ต์ด ์นดํ…Œ๊ณ ๋ฆฌ(๋ฒ”์ฃผํ˜•, ํด๋ž˜์Šค)์ผ ๋•Œ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ์ธก ๊ฒฐ๊ณผ๊ฐ€ ‘๋ฌด์—‡์ธ์ง€’ ๋˜๋Š” ‘์–ด๋–ค ๊ทธ๋ฃน์ธ์ง€’๋ฅผ ์•Œ๋ ค์ฃผ๋Š” ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค.

๐Ÿงพ ์˜ˆ์‹œ:

  • ์ด๋ฉ”์ผ์ด ์ŠคํŒธ์ธ๊ฐ€ ์•„๋‹Œ๊ฐ€
  • ์•” ์ง„๋‹จ ๊ฒฐ๊ณผ๊ฐ€ ์–‘์„ฑ์ธ๊ฐ€ ์Œ์„ฑ์ธ๊ฐ€
  • ๊ณ ๊ฐ์ด ์ดํƒˆํ•  ๊ฒƒ์ธ๊ฐ€ ์•„๋‹ ๊ฒƒ์ธ๊ฐ€
  • ์‚ฌ์ง„ ์† ๋™๋ฌผ์ด ๊ณ ์–‘์ด์ธ๊ฐ€ ๊ฐœ์ธ๊ฐ€

4. ๋ฌธ์ œ ์œ ํ˜•์— ๋”ฐ๋ฅธ ๋ชจ๋ธ ์„ ํƒ ๊ฐ€์ด๋“œ

๋ฌธ์ œ์˜ ๊ฒฐ๊ณผ๊ฐ€ ์ˆ˜์น˜์ธ๊ฐ€์š”? → ํšŒ๊ท€ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์„ธ์š”.

๋ฌธ์ œ์˜ ๊ฒฐ๊ณผ๊ฐ€ ๋ฒ”์ฃผํ˜•์ธ๊ฐ€์š”? → ๋ถ„๋ฅ˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์„ธ์š”.

๋ฌธ์ œ ์œ ํ˜• ์˜ˆ์‹œ ์ถ”์ฒœ ๋ชจ๋ธ
ํšŒ๊ท€ ๊ฐ€๊ฒฉ ์˜ˆ์ธก, ์˜จ๋„ ์˜ˆ์ธก, ์ˆ˜์ต ์˜ˆ์ธก ์„ ํ˜• ํšŒ๊ท€, ๊ฒฐ์ • ํŠธ๋ฆฌ ํšŒ๊ท€, ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ ํšŒ๊ท€, XGBoost Regressor
์ด์ง„ ๋ถ„๋ฅ˜ ์ŠคํŒธ ๋ฉ”์ผ ์—ฌ๋ถ€, ์งˆ๋ณ‘ ์ง„๋‹จ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€, SVM, ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ, LightGBM
๋‹ค์ค‘ ๋ถ„๋ฅ˜ ์‚ฌ์ง„ ๋ถ„๋ฅ˜, ๋‰ด์Šค ์นดํ…Œ๊ณ ๋ฆฌ ์˜ˆ์ธก KNN, ๋‹คํ•ญ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€, Naive Bayes, CNN

5. ๋งˆ๋ฌด๋ฆฌ ๋ฐ ์š”์•ฝ

๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ๊ณ ๋ฅด๊ธฐ ์ „, ๊ฐ€์žฅ ๋จผ์ € ํ™•์ธํ•ด์•ผ ํ•  ๊ฒƒ์€ ๊ฒฐ๊ณผ๊ฐ’์ด ์ˆ˜์น˜์ธ์ง€, ๋ฒ”์ฃผ์ธ์ง€์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ๊ธฐ์ค€์œผ๋กœ ํšŒ๊ท€ ๋ชจ๋ธ๊ณผ ๋ถ„๋ฅ˜ ๋ชจ๋ธ์„ ๋‚˜๋ˆ„๊ณ , ๊ฐ ๋ฌธ์ œ์— ์ตœ์ ํ™”๋œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์„ ํƒํ•ด์•ผ ์˜ˆ์ธก ์„ฑ๋Šฅ์„ ๋†’์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฒ˜์Œ์—” ์–ด๋ ต์ง€๋งŒ, ์ด ์›๋ฆฌ๋งŒ ๋ช…ํ™•ํžˆ ์ตํ˜€๋‘๋ฉด ์–ด๋–ค ๋ฌธ์ œ๋“  ์ž์‹  ์žˆ๊ฒŒ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!