π λͺ©μ°¨
1. λΉμ§λ νμ΅μ΄λ 무μμΈκ°?
1-1. λΉμ§λ νμ΅μ μ μ
λ¨Έμ λ¬λμμ κ°μ₯ ν₯λ―Έλ‘μ΄ μμ μ€ νλλ λ°λ‘ λΉμ§λ νμ΅(Unsupervised Learning)μ λλ€. λΉμ§λ νμ΅μ μ§λ νμ΅μ²λΌ λ°μ΄ν°μ 'μ λ΅'μ΄ μ£Όμ΄μ§μ§ μλ λ°©μμΌλ‘, μκ³ λ¦¬μ¦μ΄ μ€μ€λ‘ λ°μ΄ν°μ ν¨ν΄μ μ°Ύλλ‘ νλ ¨λ©λλ€. μ¦, λ μ΄λΈ μλ λ°μ΄ν°λ₯Ό κΈ°λ°μΌλ‘ λ°μ΄ν° λ΄μ ꡬ쑰, κ΅°μ§, λΆν¬ λ±μ νμ΅νλ κ²μ΄μ£ .
1-2. μ§λ νμ΅κ³Όμ μ°¨μ΄μ
μ§λ νμ΅μ μ λ ₯μ λν΄ μ λ΅μ΄ μ£Όμ΄μ§κ³ , λͺ¨λΈμ΄ μ΄λ₯Ό μμΈ‘νλλ‘ νμ΅ν©λλ€. λ°λ©΄ λΉμ§λ νμ΅μμλ μ λ΅μ΄ μ‘΄μ¬νμ§ μκΈ° λλ¬Έμ, μ νλλ μ€μ°¨μ¨ κ°μ λͺ νν μ§νκ° μμ΅λλ€. λμ μκ³ λ¦¬μ¦μ μ체μ μΈ κΈ°μ€μΌλ‘ λ°μ΄ν°λ₯Ό κ·Έλ£Ήννκ±°λ μ°¨μμ μΆμνλ λ±μ λ°©μμΌλ‘ νμ΅ν©λλ€.
2. λΉμ§λ νμ΅μ μ£Όμ μκ³ λ¦¬μ¦
2-1. ν΄λ¬μ€ν°λ§ (K-means, DBSCAN λ±)
ν΄λ¬μ€ν°λ§μ λ°μ΄ν°λ₯Ό μ μ¬ν νΉμ±μ κ°μ§ κ·Έλ£ΉμΌλ‘ λλλ κΈ°λ²μ λλ€. λνμ μΈ μκ³ λ¦¬μ¦μΌλ‘λ K-meansμ DBSCANμ΄ μμ΅λλ€. μλ₯Ό λ€μ΄ κ³ κ°μ μ±ν₯μ λ°λΌ κ·Έλ£Ήννκ±°λ, λ΄μ€ κΈ°μ¬λ₯Ό μ£Όμ λ³λ‘ λΆλ₯νλ λ° νμ©λ©λλ€.
2-2. μ°¨μ μΆμ (PCA, t-SNE λ±)
μ°¨μ μΆμλ κ³ μ°¨μ λ°μ΄ν°λ₯Ό μκ°ννκ±°λ μ²λ¦¬ ν¨μ¨μ λμ΄κΈ° μν κΈ°λ²μ λλ€. PCA(μ£Όμ±λΆ λΆμ)κ³Ό t-SNEκ° λνμ μΈ λ°©λ²μΌλ‘ μ¬μ©λ©λλ€. PCAλ μνμ μΌλ‘ μ 보 μμ€μ μ΅μννλ©° μ°¨μμ μΆμνκ³ , t-SNEλ μκ°ν λͺ©μ μ λ°μ΄λ μ±λ₯μ 보μ λλ€.
2-3. μ€ν μΈμ½λμ μ κ²½λ§ κΈ°λ° λ°©λ²
λ₯λ¬λμμλ μ€ν μΈμ½λ(Autoencoder)λ₯Ό ν΅ν΄ λΉμ§λ νμ΅μ΄ μ΄λ€μ§λλ€. μ λ ₯ λ°μ΄ν°λ₯Ό μμΆ ν 볡μνλ©° μ€μν νΉμ§μ μλμΌλ‘ μΆμΆν©λλ€. VAE(Variational Autoencoder), GAN(Generative Adversarial Network) λ±λ λΉμ§λ νμ΅μ μ°μ₯μ μ λλ€.
3. λΉμ§λ νμ΅μ νμ© μ¬λ‘
3-1. μ΄μ νμ§ λ° ν¨ν΄ λΆμ
λΉμ§λ νμ΅μ μ μ ν¨ν΄μ νμ΅ν ν μ΄λ₯Ό λ²μ΄λ λ°μ΄ν°λ₯Ό 'μ΄μ'μΌλ‘ μΈμν μ μμ΅λλ€. μ΄λ μ μ©μΉ΄λ μ¬κΈ° νμ§, μ 쑰곡μ μ€λ₯ κ°μ§, λ€νΈμν¬ μΉ¨μ νμ§ λ±μ λ리 νμ©λ©λλ€.
3-2. μΆμ² μμ€ν
λ·νλ¦μ€, μ νλΈ λ±μ μΆμ² μμ€ν μ μ μ λ€μ νλ ν¨ν΄μ ν΄λ¬μ€ν°λ§νκ±°λ, νλ ¬ λΆν΄λ₯Ό ν΅ν΄ μ μ¬ μ μ /μ½ν μΈ λ₯Ό μλ λΆλ₯ν©λλ€. μ΄λ¬ν λΆμμ λλΆλΆ λΉμ§λ νμ΅μ μν΄ μ§νλ©λλ€.
4. λΉμ§λ νμ΅μ μν μ€μ ν
4-1. μ μ²λ¦¬ λ° νΌμ² μ€μΌμΌλ§ μ€μμ±
λΉμ§λ νμ΅μ λ³μ κ° κ±°λ¦¬ κΈ°λ° κ³μ°μ λ§μ΄ νμ©νκΈ° λλ¬Έμ, μ€μΌμΌλ§μ νμμ
λλ€. StandardScaler
λλ MinMaxScaler
λ₯Ό μ¬μ©ν΄ νΉμ±λ€μ μ€μΌμΌμ λ§μΆ°μΌ μ¬λ°λ₯Έ κ²°κ³Όλ₯Ό μ»μ μ μμ΅λλ€.
4-2. μκ³ λ¦¬μ¦ μ ν κΈ°μ€
λ°μ΄ν°μ λ°λ, λ Έμ΄μ¦, ννμ λ°λΌ μ μ ν μκ³ λ¦¬μ¦μ μ νν΄μΌ ν©λλ€. μλ₯Ό λ€μ΄ λ°μ΄ν°κ° λ°μ§λΌ μκ³ λ Έμ΄μ¦κ° μ λ€λ©΄ K-meansκ° μ ν©νκ³ , 볡μ‘νκ±°λ μ΄μμΉκ° λ§λ€λ©΄ DBSCANμ΄ λ λμ μ νμΌ μ μμ΅λλ€.
5. λ§λ¬΄λ¦¬ λ° μμ½
λΉμ§λ νμ΅μ μ€μ€λ‘ λ°μ΄ν°λ₯Ό νμνκ³ κ΅¬μ‘°λ₯Ό λ°κ²¬νλ κ³Όμ μ λλ€. λΉμ ν, λκ·λͺ¨, λΉλΌλ²¨ λ°μ΄ν°κ° λμ³λλ μ€λλ , κ·Έ μ€μμ±μ κ°μλ‘ μ»€μ§κ³ μμ΅λλ€. λ€μν μκ³ λ¦¬μ¦μ μ΄ν΄νκ³ μ€μ μ μ©ν΄λ³΄λ©΄, λΉμ§λ νμ΅μ μ μ¬λ ₯μ λμ± κΉμ΄ μκ² μ²΄κ°ν μ μμ κ²μ λλ€.