λ₯λ¬λ λͺ¨λΈμ νμ΅μν¬ λ κ°μ₯ κΈ°λ³Έμ΄ λλ κ°λ
μ€ νλκ° κ²½μ¬νκ°λ²(Gradient Descent)μ
λλ€. νμ§λ§ κ²½μ¬νκ°λ²λ§μΌλ‘λ λͺ¨λ νμ΅ λ¬Έμ λ₯Ό ν΄κ²°νκΈ°μ νκ³κ° λΆλͺ
ν©λλ€.
μ΄λ¬ν νκ³λ₯Ό 보μνκ³ , νμ΅ μλμ μμ μ±μ λμ΄κΈ° μν΄ λ±μ₯ν κ²μ΄ λ°λ‘ μ΅ν°λ§μ΄μ (Optimizer)μ
λλ€. μ΄λ² κΈμμλ κ²½μ¬νκ°λ²μ λ¨μ λΆν° μμν΄ μ΅ν°λ§μ΄μ μ κ°λ
, λν μκ³ λ¦¬μ¦κΉμ§ μ½κ² μ€λͺ
ν΄λ립λλ€.
π λͺ©μ°¨
1. κ²½μ¬νκ°λ²μ΄λ?
κ²½μ¬νκ°λ²(Gradient Descent)μ λ¨Έμ λ¬λκ³Ό λ₯λ¬λμμ κ°μ₯ κΈ°λ³Έμ μΈ μ΅μ ν μκ³ λ¦¬μ¦μ
λλ€. λΉμ© ν¨μμ κ°μ μ΅μννκΈ° μν΄ κΈ°μΈκΈ°(λ―ΈλΆκ°)λ₯Ό κ³μ°νκ³ , μ΄λ₯Ό λ°λΌ νλΌλ―Έν°λ₯Ό μ‘°κΈμ© μ‘°μ ν©λλ€.
μ¦, μ°μ λ΄λ €κ°λ κ²μ²λΌ μμ€ ν¨μμ μ΅μ μ (μ΅μκ°)μ μ°Ύμκ°λ λ°©μμ
λλ€.
2. κ²½μ¬νκ°λ²μ νκ³
- νμ΅λ₯ μ‘°μ μ΄ μ΄λ ΅λ€: λ무 μμΌλ©΄ λλ¦¬κ³ , λ무 ν¬λ©΄ λ°μ°ν¨
- κ΅μ μ΅μκ°(local minima)μ λΉ μ§ μ μμ: μ 체 μ΅μ κ°μ΄ μλ μ€κ°μμ λ©μΆ€
- κ³κ³‘ν ꡬ쑰μμ λλ¦Ό: κ²½μ¬κ° μμͺ½μΌλ‘ κΈλ³νλ κ³³μμ μ§λν¨
- λͺ¨λ νλΌλ―Έν°μ λμΌν νμ΅λ₯ μ μ©: λΉν¨μ¨μ μΈ μ λ°μ΄νΈ λ°μ
μ΄λ¬ν νκ³λ€μ μ€μ λ₯λ¬λ νμ΅ μ μ±λ₯ μ νλ νμ΅ μ€ν¨λ‘ μ΄μ΄μ§ μ μκΈ° λλ¬Έμ, μ΄λ₯Ό 보μνκΈ° μν λ€μν κ°μ λ μ΅ν°λ§μ΄μ κ° κ°λ°λμμ΅λλ€.
3. μ΅ν°λ§μ΄μ λ 무μμΈκ°?
μ΅ν°λ§μ΄μ (Optimizer)λ κ²½μ¬νκ°λ²μ κΈ°λ³Έ μ리λ₯Ό κ°μ νμ¬ λ λΉ λ₯΄κ³ μ ννκ² μμ€ ν¨μμ μ΅μκ°μ μ°Ύμ μ μλλ‘ μ€κ³λ μκ³ λ¦¬μ¦μ
λλ€.
κ° νλΌλ―Έν°μ λ³νλμ μλμΌλ‘ μ‘°μ νκ±°λ, μ΄μ μ κ·ΈλλμΈνΈλ₯Ό λ°μν΄ λ°©ν₯μ 보μ ν¨μΌλ‘μ¨ νμ΅ μμ μ±, μλ ΄ μλ, μ νλ λͺ¨λλ₯Ό ν₯μμν΅λλ€.
4. λνμ μΈ μ΅ν°λ§μ΄μ μ’ λ₯
- SGD (Stochastic Gradient Descent): κΈ°λ³Έ κ²½μ¬νκ°λ²μΌλ‘, λ―Έλλ°°μΉ λ¨μ μ λ°μ΄νΈ
- Momentum: μ΄μ κ·ΈλλμΈνΈ λ°©ν₯μ λ°μν΄ λ λΉ λ₯Έ μλ ΄ μ λ
- RMSProp: νλΌλ―Έν°λ§λ€ λ€λ₯Έ νμ΅λ₯ μ μ©, μ§λ μ΅μ
- Adam: Momentum + RMSProp μ‘°ν©, κ°μ₯ λ리 μ¬μ©λλ μ΅ν°λ§μ΄μ
5. μ΅ν°λ§μ΄μ μ ν μ κ³ λ €ν μ
- λ°μ΄ν° ν¬κΈ°, 볡μ‘λ, λ Έμ΄μ¦μ λ°λΌ λ€λ₯Έ μ΅ν°λ§μ΄μ κ° μ ν©ν μ μμ΅λλ€. - μ΄λ³΄μλ λλΆλΆμ κ²½μ° Adamμ μ¬μ©νλ κ²μ΄ μμ ν μ νμ λλ€. - κ·Έλ¬λ μ λ°ν μ‘°μ μ΄ νμν κ²½μ°μ SGD + Momentumμ μ¬μ©ν΄λ³΄λ κ²λ μ’μ΅λλ€.
6. λ§λ¬΄λ¦¬ μμ½
κ²½μ¬νκ°λ²μ λ¨Έμ λ¬λ μ΅μ νμ κΈ°λ³Έμ΄μ§λ§, νμ€μ 볡μ‘ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ°μ νκ³κ° μ‘΄μ¬ν©λλ€. μ΄λ¬ν νκ³λ₯Ό 극볡νκΈ° μν΄ λ±μ₯ν μ΅ν°λ§μ΄μ λ νμ΅ μλλ₯Ό λμ΄κ³ , λ μμ μ μΈ μλ ΄μ κ°λ₯νκ² ν΄μ£Όλ μ€λ§νΈν λꡬμ
λλ€.
Adam, RMSProp, Momentum λ± λ€μν μκ³ λ¦¬μ¦μ μ΄ν΄νκ³ νλ‘μ νΈμ λ§λ μ΅μ μ μ΅ν°λ§μ΄μ λ₯Ό μ ννλ κ²μ΄ μ€μν©λλ€.