๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
IT/AI, ๋”ฅ๋Ÿฌ๋‹

๋น„์šฉ ํ•จ์ˆ˜๋ž€? ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ์˜ค์ฐจ๋ฅผ ์ธก์ •ํ•˜๋Š” ํ•ต์‹ฌ ๊ฐœ๋…

by ๐Ÿ”ฅ๊นก ๋‹ค ๊ณ ! 2025. 4. 7.

๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ฌ ๋•Œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ธฐ์ค€์€ "์ •ํ™•ํ•œ ์˜ˆ์ธก์„ ํ•˜๋Š”๊ฐ€?" ์ž…๋‹ˆ๋‹ค. ๊ทธ ์ •ํ™•๋„๋ฅผ ์ˆ˜์น˜ํ™”ํ•˜๊ณ , ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ํ•ต์‹ฌ ๋„๊ตฌ๊ฐ€ ๋ฐ”๋กœ ๋น„์šฉ ํ•จ์ˆ˜(Cost Function)์ž…๋‹ˆ๋‹ค.

๋น„์šฉ ํ•จ์ˆ˜๋Š” ์ „์ฒด ๋ฐ์ดํ„ฐ์—์„œ ๋ชจ๋ธ์ด ์–ผ๋งˆ๋‚˜ ์˜ค์ฐจ๋ฅผ ๋‚ด๊ณ  ์žˆ๋Š”์ง€๋ฅผ ์ˆ˜์น˜๋กœ ํ‘œํ˜„ํ•œ ํ•จ์ˆ˜์ด๋ฉฐ, ์ด ๊ฐ’์ด ์ž‘์•„์งˆ์ˆ˜๋ก ๋ชจ๋ธ์˜ ์˜ˆ์ธก์ด ์ •๋‹ต์— ๊ฐ€๊นŒ์›Œ์ง„๋‹ค๋Š” ๋œป์ž…๋‹ˆ๋‹ค. ์ด๋ฒˆ ๊ธ€์—์„œ๋Š” ๋น„์šฉ ํ•จ์ˆ˜์˜ ๊ฐœ๋…๊ณผ ์—ญํ• , ์ข…๋ฅ˜๋ฅผ ์‰ฝ๊ณ  ๋ช…ํ™•ํ•˜๊ฒŒ ์ •๋ฆฌํ•ด๋ด…๋‹ˆ๋‹ค.

 


1. ๋น„์šฉ ํ•จ์ˆ˜๋ž€ ๋ฌด์—‡์ธ๊ฐ€?

๋น„์šฉ ํ•จ์ˆ˜(Cost Function)๋Š” ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•œ ๊ฐ’๊ณผ ์‹ค์ œ ๊ฐ’ ์‚ฌ์ด์˜ ์ „์ฒด ์˜ค์ฐจ๋ฅผ ์ˆ˜์น˜ํ™”ํ•œ ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ์–ผ๋งˆ๋‚˜ ํ‹€๋ ธ๋Š”์ง€๋ฅผ ์ธก์ •ํ•˜๋ฉฐ, ๋จธ์‹ ๋Ÿฌ๋‹ ํ•™์Šต ๊ณผ์ •์—์„œ ์ด ๊ฐ’์„ ์ตœ์†Œํ™”ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค.

2. ์™œ ๋น„์šฉ ํ•จ์ˆ˜๊ฐ€ ํ•„์š”ํ•œ๊ฐ€?

๋ชจ๋ธ์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜๋ฉด์„œ ์ˆ˜๋งŽ์€ ๊ฐ€์ค‘์น˜(weight)์™€ ํŽธํ–ฅ(bias)์„ ์กฐ์ ˆํ•ฉ๋‹ˆ๋‹ค. ์ด๋•Œ, ์–ด๋–ค ๋ฐฉํ–ฅ์œผ๋กœ ์กฐ์ •ํ•ด์•ผ ํ• ์ง€๋ฅผ ๊ฒฐ์ •ํ•ด์ฃผ๋Š” ๊ธฐ์ค€์ด ๋ฐ”๋กœ ๋น„์šฉ ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ๋น„์šฉ ํ•จ์ˆ˜๊ฐ€ ์ž‘์•„์ง€๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์—…๋ฐ์ดํŠธํ•˜๋ฉด, ๋ชจ๋ธ์€ ์ ์  ๋” ์˜ˆ์ธก ์ •ํ™•๋„๊ฐ€ ๋†’์•„์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

3. ํšŒ๊ท€์—์„œ์˜ ๋น„์šฉ ํ•จ์ˆ˜ ์ข…๋ฅ˜

ํšŒ๊ท€ ๋ฌธ์ œ์—์„œ๋Š” ์˜ˆ์ธก๊ฐ’๊ณผ ์‹ค์ œ๊ฐ’์˜ ์ฐจ์ด๋ฅผ **์—ฐ์†์ ์ธ ์ˆ˜์น˜ ์˜ค์ฐจ**๋กœ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค. ์ž์ฃผ ์“ฐ์ด๋Š” ๋น„์šฉ ํ•จ์ˆ˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • MSE (Mean Squared Error): ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ
  • MAE (Mean Absolute Error): ํ‰๊ท  ์ ˆ๋Œ€ ์˜ค์ฐจ
  • RMSE (Root Mean Squared Error): ์ œ๊ณฑ ์˜ค์ฐจ์˜ ์ œ๊ณฑ๊ทผ

MSE๋Š” ํฐ ์˜ค์ฐจ์— ๋ฏผ๊ฐํ•˜๊ฒŒ ๋ฐ˜์‘ํ•˜์—ฌ ํ•™์Šต์ด ๋” ์ •๋ฐ€ํ•ด์ง€๋ฉฐ, MAE๋Š” ์ด์ƒ์น˜์— ๊ฐ•ํ•œ ํŠน์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

4. ๋ถ„๋ฅ˜์—์„œ์˜ ๋น„์šฉ ํ•จ์ˆ˜ ์ข…๋ฅ˜

๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ๋Š” ์˜ˆ์ธก๊ฐ’์ด **ํ™•๋ฅ  ๋˜๋Š” ํด๋ž˜์Šค ๋ ˆ์ด๋ธ”**์ด๊ธฐ ๋•Œ๋ฌธ์— ์˜ค์ฐจ ๊ณ„์‚ฐ ๋ฐฉ์‹์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค. ์ฃผ๋กœ ํ™•๋ฅ  ๊ธฐ๋ฐ˜์˜ ํ•จ์ˆ˜๋“ค์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

  • Binary Cross Entropy: ์ด์ง„ ๋ถ„๋ฅ˜ ๋ฌธ์ œ
  • Categorical Cross Entropy: ๋‹ค์ค‘ ํด๋ž˜์Šค ๋ถ„๋ฅ˜ ๋ฌธ์ œ
  • Hinge Loss: SVM์—์„œ ์‚ฌ์šฉํ•˜๋Š” ์†์‹ค ํ•จ์ˆ˜

Cross Entropy๋Š” ์˜ˆ์ธก ํ™•๋ฅ ๊ณผ ์‹ค์ œ ํด๋ž˜์Šค ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ์ธก์ •ํ•˜๋ฉฐ, ์˜ˆ์ธก์ด ํ‹€๋ฆด์ˆ˜๋ก ๋†’์€ ์†์‹ค ๊ฐ’์„ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค.

5. ๋น„์šฉ ํ•จ์ˆ˜์™€ ๋ชจ๋ธ ํ•™์Šต์˜ ๊ด€๊ณ„

๋ชจ๋ธ์ด ํ•™์Šตํ•˜๋Š” ๊ณผ์ •์€ **๋น„์šฉ ํ•จ์ˆ˜๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ •ํ•˜๋Š” ๊ณผ์ •**์ž…๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์€ ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ•(Gradient Descent) ๊ฐ™์€ ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค.

๐Ÿ‘‰ ์‰ฝ๊ฒŒ ๋งํ•ด, ๋น„์šฉ ํ•จ์ˆ˜๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด ํ•™์Šต ์ค‘์— "์ง€๊ธˆ ์–ผ๋งˆ๋‚˜ ํ‹€๋ฆฌ๊ณ  ์žˆ๋Š”์ง€"๋ฅผ ์•Œ๋ ค์ฃผ๋Š” ์„ฑ์ ํ‘œ์ด์ž ๋‚˜์นจ๋ฐ˜์ž…๋‹ˆ๋‹ค.

6. ๋งˆ๋ฌด๋ฆฌ ์š”์•ฝ

๋น„์šฉ ํ•จ์ˆ˜๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด ์–ผ๋งˆ๋‚˜ ์˜ค์ฐจ๋ฅผ ๋‚ด๊ณ  ์žˆ๋Š”์ง€ ์ธก์ •ํ•˜๋Š” ํ•ต์‹ฌ ๋„๊ตฌ์ž…๋‹ˆ๋‹ค. ํšŒ๊ท€ ๋ฌธ์ œ์—์„œ๋Š” ์ˆ˜์น˜ ์˜ค์ฐจ๋ฅผ, ๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ๋Š” ํ™•๋ฅ  ๊ธฐ๋ฐ˜ ์˜ค์ฐจ๋ฅผ ๊ณ„์‚ฐํ•˜๋ฉฐ, ๋ชจ๋ธ์€ ์ด ๋น„์šฉ ํ•จ์ˆ˜๋ฅผ ์ตœ์†Œํ™”ํ•˜๋„๋ก ํ•™์Šตํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

๐Ÿ’ก ์ข‹์€ ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ธฐ ์œ„ํ•œ ์ฒซ๊ฑธ์Œ์€ ์ ์ ˆํ•œ ๋น„์šฉ ํ•จ์ˆ˜๋ฅผ ์„ ํƒํ•˜๋Š” ๊ฒƒ์—์„œ ์‹œ์ž‘๋ฉ๋‹ˆ๋‹ค!