λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
IT/AI, λ”₯λŸ¬λ‹

λ”₯λŸ¬λ‹ 좜λ ₯μΈ΅μ—μ„œ μ†Œν”„νŠΈλ§₯슀 ν•¨μˆ˜κ°€ μ‚¬μš©λ˜λŠ” 이유

by πŸ”₯κΉ‘ λ‹€ κ³ ! 2025. 4. 9.

λ”₯λŸ¬λ‹μ—μ„œ 이미지 λΆ„λ₯˜λ‚˜ λ¬Έμž₯ λΆ„λ₯˜μ™€ 같은 닀쀑 클래슀 λΆ„λ₯˜ 문제λ₯Ό ν’€κΈ° μœ„ν•΄μ„œλŠ” ν΄λž˜μŠ€λ³„λ‘œ 예츑 ν™•λ₯ μ„ 계산할 수 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€. μ΄λ•Œ κ°€μž₯ 많이 μ“°μ΄λŠ” ν•¨μˆ˜κ°€ λ°”λ‘œ μ†Œν”„νŠΈλ§₯슀 ν•¨μˆ˜(Softmax Function)μž…λ‹ˆλ‹€.

μ†Œν”„νŠΈλ§₯μŠ€λŠ” μ—¬λŸ¬ 개의 숫자 좜λ ₯값을 ν™•λ₯  κ°’(총합 1)으둜 λ³€ν™˜ν•΄ μ£ΌκΈ° λ•Œλ¬Έμ— 좜λ ₯μΈ΅μ—μ„œ 각 ν΄λž˜μŠ€μ— 속할 ν™•λ₯ μ„ μ§μ ‘μ μœΌλ‘œ 얻을 수 있게 λ„μ™€μ€λ‹ˆλ‹€. 이번 κΈ€μ—μ„œλŠ” μ†Œν”„νŠΈλ§₯슀 ν•¨μˆ˜μ˜ κ°œλ…, μˆ˜μ‹, νŠΉμ§•, μ‚¬μš© μœ„μΉ˜ 등을 μ‹œκ°μ μœΌλ‘œ μ •λ¦¬ν•΄λ³΄κ² μŠ΅λ‹ˆλ‹€.


1. μ†Œν”„νŠΈλ§₯슀 ν•¨μˆ˜λž€?

μ†Œν”„νŠΈλ§₯슀 ν•¨μˆ˜(Softmax Function)λŠ” μ£Όμ–΄μ§„ μ‹€μˆ˜ 벑터λ₯Ό ν™•λ₯  λΆ„ν¬λ‘œ λ°”κΎΈμ–΄μ£ΌλŠ” ν•¨μˆ˜μž…λ‹ˆλ‹€. 좜λ ₯ κ²°κ³ΌλŠ” 0~1 μ‚¬μ΄μ˜ 값이며, 총합이 1이 λ˜λ„λ‘ μ •κ·œν™”λ©λ‹ˆλ‹€.

μ΄λŸ¬ν•œ νŠΉμ„± 덕뢄에 닀쀑 클래슀 λΆ„λ₯˜(multi-class classification) λ¬Έμ œμ—μ„œ 각 ν΄λž˜μŠ€κ°€ 정닡일 ν™•λ₯ μ„ ν‘œν˜„ν•˜λŠ” 데 맀우 μ ν•©ν•©λ‹ˆλ‹€.

2. μ†Œν”„νŠΈλ§₯슀 μˆ˜μ‹κ³Ό 계산 원리

μ†Œν”„νŠΈλ§₯슀 ν•¨μˆ˜μ˜ μˆ˜μ‹μ€ λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

softmax(xi) = exp(xi) / Σ exp(xj)

즉, 각 μž…λ ₯κ°’ xiλ₯Ό μ§€μˆ˜ ν•¨μˆ˜(exp)λ₯Ό μ μš©ν•œ λ’€, 전체 κ°’μ˜ ν•©μœΌλ‘œ λ‚˜λˆ„μ–΄ μ •κ·œν™”λœ ν™•λ₯  값을 λ§Œλ“­λ‹ˆλ‹€.

μ˜ˆμ‹œλ‘œ [2.0, 1.0, 0.1]μ΄λΌλŠ” λ‘œμ§“(logit)이 μžˆμ„ λ•Œ, μ†Œν”„νŠΈλ§₯슀λ₯Ό μ μš©ν•˜λ©΄ μ•½ [0.71, 0.21, 0.08]둜 λ³€ν™˜λ©λ‹ˆλ‹€. κ°€μž₯ 큰 값이 κ°€μž₯ 높은 ν™•λ₯ λ‘œ λ³€ν™˜λ˜λŠ” 것이 νŠΉμ§•μž…λ‹ˆλ‹€.

3. μ†Œν”„νŠΈλ§₯슀의 νŠΉμ§•

  • ν™•λ₯  뢄포λ₯Ό λ§Œλ“ λ‹€: 좜λ ₯κ°’ 총합이 1이 되며, 각 ν΄λž˜μŠ€μ— λŒ€ν•œ ν™•λ₯  해석이 κ°€λŠ₯
  • 좜λ ₯이 λ―Όκ°ν•˜λ‹€: λ‘œμ§“ 차이가 클수둝 ν™•λ₯  차이도 극적으둜 λ²Œμ–΄μ§
  • μ§€μˆ˜ ν•¨μˆ˜ μ‚¬μš©: κ°’μ˜ 차이λ₯Ό κ°•μ‘°ν•˜μ—¬ 큰 값에 더 큰 κ°€μ€‘μΉ˜λ₯Ό λΆ€μ—¬

4. μ–Έμ œ, μ–΄λ””μ„œ μ‚¬μš©λ˜λŠ”κ°€?

μ†Œν”„νŠΈλ§₯슀 ν•¨μˆ˜λŠ” 주둜 닀쀑 클래슀 λΆ„λ₯˜ 문제의 좜λ ₯측에 μ‚¬μš©λ©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄ 이미지가 μ–΄λ–€ 동물인지(고양이/개/토끼 쀑 ν•˜λ‚˜)λ₯Ό λΆ„λ₯˜ν•˜λŠ” λ¬Έμ œμ—μ„œ 각 ν΄λž˜μŠ€κ°€ 정닡일 ν™•λ₯ μ„ κ³„μ‚°ν•©λ‹ˆλ‹€.

λ˜ν•œ 좜λ ₯이 ν™•λ₯  뢄포이기 λ•Œλ¬Έμ— 크둜슀 μ—”νŠΈλ‘œν”Ό 손싀 ν•¨μˆ˜μ™€ ν•¨κ»˜ 자주 μ‚¬μš©λ©λ‹ˆλ‹€. 이 쑰합은 λΆ„λ₯˜ λ¬Έμ œμ—μ„œ κ°€μž₯ 널리 μ“°μ΄λŠ” μ‘°ν•©μž…λ‹ˆλ‹€.

5. 마무리 μš”μ•½

μ†Œν”„νŠΈλ§₯슀 ν•¨μˆ˜λŠ” λ”₯λŸ¬λ‹ λΆ„λ₯˜ λͺ¨λΈμ˜ 좜λ ₯값을 ν™•λ₯ λ‘œ λ³€ν™˜ν•΄μ£ΌλŠ” ν•„μˆ˜ ν•¨μˆ˜μž…λ‹ˆλ‹€. μˆ˜μ‹μ€ κ°„λ‹¨ν•˜μ§€λ§Œ κΈ°λŠ₯은 κ°•λ ₯ν•˜λ©°, 좜λ ₯ ν΄λž˜μŠ€μ— λŒ€ν•œ 직관적인 ν™•λ₯  해석이 κ°€λŠ₯ν•΄μ§‘λ‹ˆλ‹€.

크둜슀 μ—”νŠΈλ‘œν”Ό 손싀 ν•¨μˆ˜μ™€ ν•¨κ»˜ μ‚¬μš©λ˜λ©°, 닀쀑 클래슀 λΆ„λ₯˜μ—μ„œ μ •λ‹΅ μ˜ˆμΈ‘μ„ ν™•λ₯ μ μœΌλ‘œ ν‘œν˜„ν•˜λŠ” 핡심 λ„κ΅¬μž…λ‹ˆλ‹€.

λ”₯λŸ¬λ‹μ„ κ³΅λΆ€ν•˜λŠ” λͺ¨λ“  이듀이 κΌ­ μ΄ν•΄ν•˜κ³  μžˆμ–΄μ•Ό ν•  μ€‘μš”ν•œ κ°œλ…μž…λ‹ˆλ‹€!