λ₯λ¬λμμ ‘λ²‘ν°μ 거리’λ₯Ό κ³μ°νλ 건 μκ°λ³΄λ€ μμ£Ό μ¬μ©λ©λλ€. νΉν νΉμ§ 벑ν°(feature vector)λ μλ² λ©(embedding) κ° μ μ¬λλ₯Ό νλ¨ν λ κ°μ₯ λ리 μ°μ΄λ λ°©λ²μ΄ λ°λ‘ μ ν΄λ¦¬λμ 거리(Euclidean Distance)μ
λλ€.
μ΄λ² κΈμμλ μ ν΄λ¦¬λμ 거리λ 무μμΈμ§, μνμ μ μλ μ΄λ€μ§, κ·Έλ¦¬κ³ λ₯λ¬λμμλ μ΄λμ μ°μ΄λμ§λ₯Ό μμ μ ν¨κ» μμλ³΄κ² μ΅λλ€.
π λͺ©μ°¨
1. μ ν΄λ¦¬λμ 거리λ?
μ ν΄λ¦¬λμ 거리(Euclidean Distance)λ μ°λ¦¬κ° **μΌμμμ μ¬μ©νλ μ§μ 거리(λ μ μ¬μ΄μ 거리)**λ₯Ό λ§ν©λλ€. μ¦, 2μ°¨μ νλ©΄μμλ λ μ μ¬μ΄λ₯Ό μλ μ§μ μ κΈΈμ΄μ΄κ³ , nμ°¨μ λ²‘ν° κ³΅κ°μμλ λ λ²‘ν° μ¬μ΄μ '거리'λ₯Ό μΈ‘μ νλ λνμ μΈ λ°©λ²μ
λλ€.
κ°μ₯ μ§κ΄μ μ΄κ³ λ리 μ°μ΄λ 거리 κ³μ° λ°©μμ΄κΈ° λλ¬Έμ λ¨Έμ λ¬λ/λ₯λ¬λμμ λ€μν κ³³μμ μ¬μ©λ©λλ€.
2. μνμ μ μμ κ³μ° 곡μ
λ λ²‘ν° X = (xβ, xβ, ..., xβ)κ³Ό Y = (yβ, yβ, ..., yβ) μ¬μ΄μ μ ν΄λ¦¬λμ 거리λ λ€μκ³Ό κ°μ΄ κ³μ°λ©λλ€.
Euclidean Distance = √((xβ - yβ)² + (xβ - yβ)² + ... + (xβ - yβ)²)
μλ₯Ό λ€μ΄ 2μ°¨μ λ²‘ν° A = (3, 4)μ B = (0, 0)μ μ ν΄λ¦¬λμ 거리λ √(3² + 4²) = √(9 + 16) = √25 = 5κ° λ©λλ€.
3. λ₯λ¬λμμμ νμ© μ¬λ‘
- 1. μ΄λ―Έμ§ κ²μ: μλ² λ©λ μ΄λ―Έμ§ λ²‘ν° κ° μ ν΄λ¦¬λμ 거리λ₯Ό λΉκ΅νμ¬ μ μ¬ μ΄λ―Έμ§ κ²μ
- 2. ν΄λ¬μ€ν°λ§(K-means): μ€μ¬ 벑ν°μ κ° λ°μ΄ν° λ²‘ν° κ° κ±°λ¦¬λ₯Ό λΉκ΅νμ¬ κ·Έλ£Ήν
- 3. μΌκ΅΄ μΈμ(FaceNet λ±): μ¬λ μΌκ΅΄μ 벑ν°λ‘ μλ² λ©ν λ€, μ ν΄λ¦¬λμ κ±°λ¦¬κ° μμΌλ©΄ κ°μ μ¬λμΌλ‘ νλ¨
- 4. Siamese Network: λ μνμ μ μ¬λλ₯Ό νλ¨νκΈ° μν΄ μ ν΄λ¦¬λμ 거리λ₯Ό μ¬μ©νμ¬ Loss κ³μ°
λ₯λ¬λμμλ 벑ν°λ₯Ό λΉκ΅νλ μν©μ΄ λ§€μ° λ§μλ°, μ΄λ κ°μ₯ κΈ°λ³Έμ μ΄κ³ λ리 μ°μ΄λ λ°©λ²μ΄ λ°λ‘ μ ν΄λ¦¬λμ 거리μ λλ€.
4. μ ν΄λ¦¬λμ 거리 vs μ½μ¬μΈ μ μ¬λ
λΉκ΅ νλͺ© | μ ν΄λ¦¬λμ 거리 | μ½μ¬μΈ μ μ¬λ |
---|---|---|
μλ―Έ | μ λμ μΈ κ±°λ¦¬ | λ²‘ν° κ° λ°©ν₯μ μ μ¬μ± |
κΈΈμ΄ μν₯ | μν₯ λ°μ | μν₯ μμ (λ¨μ 벑ν°λ‘ μ κ·ν) |
μ¬μ© μμ | Siamese Network, K-means λ± | λ¬Έμ μ μ¬λ, NLP μλ² λ© λΉκ΅ |
μ¦, λ 벑ν°μ 'ν¬κΈ°μ 거리' μμ²΄κ° μ€μνλ©΄ μ ν΄λ¦¬λμ 거리, λ°©ν₯λ§ μ€μνλ€λ©΄ μ½μ¬μΈ μ μ¬λλ₯Ό μ¬μ©ν©λλ€.
5. λ§λ¬΄λ¦¬ μμ½
μ ν΄λ¦¬λμ 거리(Euclidean Distance)λ λ₯λ¬λμμ λ²‘ν° κ° μ μ¬λλ₯Ό μΈ‘μ ν λ κ°μ₯ λ리 μ°μ΄λ λ°©λ² μ€ νλμ
λλ€.
μ§κ΄μ μ΄κ³ κ³μ°μ΄ μ¬μ°λ©°, μ΄λ―Έμ§λ μλ² λ© λ²‘ν° λΉκ΅μμ λμ ν¨κ³Όλ₯Ό 보μ
λλ€. νμ§λ§ λ°μ΄ν°μ νΉμ±κ³Ό λͺ©μ μ λ°λΌ μ½μ¬μΈ μ μ¬λ, 맨ν΄νΌ 거리 λ± λ€λ₯Έ 거리 μΈ‘μ λ²κ³Ό ν¨κ» κ³ λ €νλ κ²μ΄ μ€μν©λλ€.
νΉν λ₯λ¬λμμλ **λ¨μν μν κ°λ
μ΄ λͺ¨λΈ μ±λ₯κ³Ό μ§κ²°λκΈ° λλ¬Έμ**, 거리 μΈ‘μ λ°©μμ λν μ΄ν΄λ νμλΌκ³ ν μ μμ΅λλ€.