λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
IT/AI, λ”₯λŸ¬λ‹

μ‹ κ²½λ§μ—μ„œ ν™œμ„±ν™” ν•¨μˆ˜λž€? μ’…λ₯˜, μ—­ν• , 선택 κΈ°μ€€κΉŒμ§€ ν•œ λ²ˆμ— 정리

by πŸ”₯κΉ‘ λ‹€ κ³ ! 2025. 3. 31.

λ”₯λŸ¬λ‹ λͺ¨λΈμ—μ„œ μž…λ ₯이 계산을 거쳐 μ „λ‹¬λ˜λŠ” κ³Όμ • 쀑, κ°€μž₯ μ€‘μš”ν•œ μš”μ†Œ 쀑 ν•˜λ‚˜κ°€ λ°”λ‘œ ν™œμ„±ν™” ν•¨μˆ˜(Activation Function)μž…λ‹ˆλ‹€. λ‹¨μˆœνžˆ μ„ ν˜• μ—°μ‚°λ§ŒμœΌλ‘œλŠ” λ³΅μž‘ν•œ 문제λ₯Ό ν’€ 수 μ—†κΈ° λ•Œλ¬Έμ—, 신경망은 ν™œμ„±ν™” ν•¨μˆ˜λ₯Ό 톡해 λΉ„μ„ ν˜•μ„±(Non-linearity)을 λΆ€μ—¬ν•©λ‹ˆλ‹€. 이번 κΈ€μ—μ„œλŠ” ν™œμ„±ν™” ν•¨μˆ˜μ˜ κ°œλ…κ³Ό μ—­ν• , 그리고 μ£Όμš” ν•¨μˆ˜λ“€μ˜ νŠΉμ„±κ³Ό μ‚¬μš©μ²˜λ₯Ό μ •λ¦¬ν•΄λ³΄κ² μŠ΅λ‹ˆλ‹€.


1. ν™œμ„±ν™” ν•¨μˆ˜λž€?

ν™œμ„±ν™” ν•¨μˆ˜(Activation Function)λŠ” 인곡 μ‹ κ²½λ§μ—μ„œ 각 λ‰΄λŸ°μ˜ 좜λ ₯값을 κ²°μ •μ§“λŠ” ν•¨μˆ˜μž…λ‹ˆλ‹€. λ…Έλ“œμ— μž…λ ₯된 값이 λ‹¨μˆœ μ„ ν˜• 계산을 λ„˜μ–΄μ„œ **λ³΅μž‘ν•œ λΉ„μ„ ν˜• 관계λ₯Ό ν•™μŠ΅**ν•  수 μžˆλ„λ‘ λ„μ™€μ€λ‹ˆλ‹€.

2. ν™œμ„±ν™” ν•¨μˆ˜κ°€ ν•„μš”ν•œ 이유

λ§Œμ•½ ν™œμ„±ν™” ν•¨μˆ˜ 없이 μ„ ν˜• μ—°μ‚°λ§Œ λ°˜λ³΅λœλ‹€λ©΄, 아무리 측을 깊게 μŒ“μ•„λ„ κ²°κ΅­ **ν•˜λ‚˜μ˜ μ„ ν˜• ν•¨μˆ˜λ‘œ 수렴**ν•˜κ²Œ λ©λ‹ˆλ‹€. 이 경우, λ”₯λŸ¬λ‹μ˜ μ˜λ―Έκ°€ μ‚¬λΌμ§€κ²Œ 되죠.

ν™œμ„±ν™” ν•¨μˆ˜λŠ” μ΄λŸ¬ν•œ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³ , 신경망이 λ³΅μž‘ν•œ 곑선, νŒ¨ν„΄, νŠΉμ§•μ„ ν•™μŠ΅ν•  수 있게 λ§Œλ“œλŠ” 핡심 역할을 ν•©λ‹ˆλ‹€.

3. λŒ€ν‘œμ μΈ ν™œμ„±ν™” ν•¨μˆ˜ μ’…λ₯˜

μ•„λž˜λŠ” λŒ€ν‘œμ μΈ ν™œμ„±ν™” ν•¨μˆ˜λ“€κ³Ό κ·Έ μˆ˜μ‹μž…λ‹ˆλ‹€:

  • Sigmoid: 1 / (1 + e-x) → 좜λ ₯ λ²”μœ„: (0, 1)
  • Tanh: (ex - e-x) / (ex + e-x) → 좜λ ₯ λ²”μœ„: (-1, 1)
  • ReLU (Rectified Linear Unit): max(0, x)
  • Leaky ReLU: x if x > 0 else αx (αλŠ” μž‘μ€ 수, 예: 0.01)
  • Softmax: 각 클래슀의 ν™•λ₯ κ°’ 좜λ ₯ → 닀쀑 λΆ„λ₯˜μ—μ„œ 좜λ ₯측에 μ‚¬μš©

4. ν•¨μˆ˜λ³„ 비ꡐ 및 νŠΉμ§• 정리

ν•¨μˆ˜ 좜λ ₯ λ²”μœ„ νŠΉμ§• μ‚¬μš© μœ„μΉ˜
Sigmoid 0 ~ 1 ν™•λ₯ λ‘œ 해석 κ°€λŠ₯, 기울기 μ†Œμ‹€ 문제 있음 이진 λΆ„λ₯˜ 좜λ ₯μΈ΅
Tanh -1 ~ 1 Sigmoid보닀 쀑심이 0에 κ°€κΉŒμ›Œ ν•™μŠ΅ μ•ˆμ • 은닉측
ReLU 0 ~ ∞ λΉ λ₯Έ ν•™μŠ΅, κ°„λ‹¨ν•œ 계산, 죽은 λ‰΄λŸ° 문제 있음 은닉측 (κΈ°λ³Έ)
Leaky ReLU -∞ ~ ∞ ReLU 단점 보완 (죽은 λ‰΄λŸ° 방지) 은닉측 (ReLU λŒ€μ²΄)
Softmax 0 ~ 1 (총합 1) ν™•λ₯  뢄포 λ°˜ν™˜, 닀쀑 λΆ„λ₯˜μš© 좜λ ₯μΈ΅ (닀쀑 λΆ„λ₯˜)

5. 마무리 μš”μ•½

ν™œμ„±ν™” ν•¨μˆ˜λŠ” λ”₯λŸ¬λ‹μ—μ„œ λ‰΄λŸ°μ˜ 좜λ ₯값을 μ‘°μ •ν•˜κ³ , λ„€νŠΈμ›Œν¬μ— λΉ„μ„ ν˜•μ„±μ„ λΆ€μ—¬ν•˜λŠ” 맀우 μ€‘μš”ν•œ μš”μ†Œμž…λ‹ˆλ‹€.
πŸ”Ή ReLUλŠ” κΈ°λ³Έ 은닉측 ν™œμ„±ν™” ν•¨μˆ˜
πŸ”Ή Sigmoid / SoftmaxλŠ” 좜λ ₯μΈ΅μ—μ„œ 자주 μ‚¬μš©
πŸ”Ή ν•¨μˆ˜ 선택은 문제 μœ ν˜•κ³Ό μΈ΅ μœ„μΉ˜μ— 따라 λ‹€λ₯΄κ²Œ μ μš©λ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€.

🧠 μ˜¬λ°”λ₯Έ ν™œμ„±ν™” ν•¨μˆ˜λ₯Ό μ„ νƒν•˜λ©΄ ν•™μŠ΅ 속도와 정확도 λͺ¨λ‘ ν–₯상될 수 μžˆμŠ΅λ‹ˆλ‹€!