λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
IT/AI, λ”₯λŸ¬λ‹

μ—°μ†λ³€μˆ˜ vs μ΄μ‚°λ³€μˆ˜ – 데이터 νƒ€μž… μ™„μ „ 정볡

by πŸ”₯κΉ‘ λ‹€ κ³ ! 2025. 4. 6.

데이터 λΆ„μ„μ΄λ‚˜ λ¨Έμ‹ λŸ¬λ‹μ„ λ°°μš°λ‹€ 보면 "이건 μ—°μ†λ³€μˆ˜μΈκ°€μš”, μ΄μ‚°λ³€μˆ˜μΈκ°€μš”?"λΌλŠ” μ§ˆλ¬Έμ„ 자주 μ ‘ν•˜κ²Œ λ©λ‹ˆλ‹€. λ³€μˆ˜μ˜ νŠΉμ„±μ„ μ œλŒ€λ‘œ μ΄ν•΄ν•˜λ©΄, μ–΄λ–€ 뢄석 방법을 써야 할지, μ–΄λ–€ μ‹œκ°ν™” κΈ°λ²•μ΄λ‚˜ μ•Œκ³ λ¦¬μ¦˜μ„ μ μš©ν• μ§€λ₯Ό λͺ…ν™•νžˆ μ•Œ 수 있게 λ©λ‹ˆλ‹€.

이번 κΈ€μ—μ„œλŠ” **μ—°μ†λ³€μˆ˜(Continuous Variable)** 와 **μ΄μ‚°λ³€μˆ˜(Discrete Variable)** 의 κ°œλ…μ„ μ •λ¦¬ν•˜κ³ , 각 λ³€μˆ˜μ˜ λŒ€ν‘œ μ˜ˆμ‹œμ™€ λ¨Έμ‹ λŸ¬λ‹ 적용 μ‹œ κ³ λ €ν•  μ κΉŒμ§€ μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€.


1. λ³€μˆ˜λž€ 무엇인가?

λ³€μˆ˜(Variable)λŠ” λ°μ΄ν„°μ—μ„œ **κ΄€μ°°ν•˜κ±°λ‚˜ μΈ‘μ •ν•  수 μžˆλŠ” 속성**을 λ§ν•©λ‹ˆλ‹€. μˆ«μžν˜• λ³€μˆ˜ μ€‘μ—μ„œλ„ κ°’μ˜ κ°œμˆ˜κ°€ λ¬΄ν•œν•œμ§€(연속), λ˜λŠ” μ…€ 수 μžˆλŠ”μ§€(이산)에 따라 κ΅¬λΆ„λ©λ‹ˆλ‹€.

2. μ—°μ†λ³€μˆ˜λž€?

μ—°μ†λ³€μˆ˜(Continuous Variable)λŠ” **두 κ°’ 사이에 무수히 λ§Žμ€ 값이 μ‘΄μž¬ν•  수 μžˆλŠ” λ³€μˆ˜**μž…λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄ μ‚¬λžŒμ˜ ν‚€κ°€ 170cm라면, 170.1, 170.15, 170.152cm λ“± λ¬΄ν•œλŒ€λ‘œ μ •λ°€ν•œ 값이 μ‘΄μž¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

πŸ“Œ μ˜ˆμ‹œ:

  • ν‚€, λͺΈλ¬΄κ²Œ
  • μ˜¨λ„, μ‹œκ°„
  • 수읡, 맀좜

3. μ΄μ‚°λ³€μˆ˜λž€?

μ΄μ‚°λ³€μˆ˜(Discrete Variable)λŠ” **값이 λͺ…ν™•ν•˜κ²Œ 끊겨 μžˆλŠ” λ³€μˆ˜**μž…λ‹ˆλ‹€. λ‹€μ‹œ 말해, **ν•˜λ‚˜ν•˜λ‚˜ μ…€ 수 μžˆλŠ” κ°’**만 κ°€μ§€λŠ” λ³€μˆ˜μ΄λ©°, μ†Œμˆ˜μ  λ‹¨μœ„κ°€ μ—†μŠ΅λ‹ˆλ‹€.

πŸ“Œ μ˜ˆμ‹œ:

  • μ‚¬λžŒ 수
  • μ£Όλ¬Έ 건수
  • 고객 μ΄νƒˆ μ—¬λΆ€ (0 λ˜λŠ” 1)

4. μ—°μ†λ³€μˆ˜ vs μ΄μ‚°λ³€μˆ˜ 비ꡐ

ꡬ뢄 μ—°μ†λ³€μˆ˜ μ΄μ‚°λ³€μˆ˜
κ°’μ˜ 개수 λ¬΄ν•œνžˆ 많음 μ…€ 수 있음
μ†Œμˆ˜μ  가짐 μ—†μŒ
μ˜ˆμ‹œ ν‚€, λͺΈλ¬΄κ²Œ, μ˜¨λ„ 학생 수, ꡬ맀 횟수
μ‹œκ°ν™” νžˆμŠ€ν† κ·Έλž¨, μ„ ν˜• κ·Έλž˜ν”„ λ§‰λŒ€κ·Έλž˜ν”„, 파이차트

5. λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈ 적용 μ‹œ 주의점

- μ—°μ†λ³€μˆ˜λŠ” νšŒκ·€ λ¬Έμ œμ— 자주 μ‚¬μš©λ˜λ©°, μ„ ν˜• νšŒκ·€λ‚˜ κ²°μ • 트리 νšŒκ·€ λͺ¨λΈμ„ μ μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€. - μ΄μ‚°λ³€μˆ˜λŠ” λΆ„λ₯˜ λ¬Έμ œμ— ν™œμš©λ˜λ©°, λ‘œμ§€μŠ€ν‹± νšŒκ·€, SVM, 랜덀 포레슀트 λΆ„λ₯˜κΈ° λ“±κ³Ό ν•¨κ»˜ μ‚¬μš©λ©λ‹ˆλ‹€.
λ˜ν•œ, 일뢀 μ΄μ‚°λ³€μˆ˜λŠ” One-hot Encoding λ“±μ˜ μ „μ²˜λ¦¬κ°€ ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

6. 마무리 μš”μ•½

μ—°μ†λ³€μˆ˜μ™€ μ΄μ‚°λ³€μˆ˜μ˜ μ°¨μ΄λŠ” 데이터 뢄석과 λͺ¨λΈ μ„ νƒμ—μ„œ 맀우 μ€‘μš”ν•©λ‹ˆλ‹€. λ°μ΄ν„°μ˜ νŠΉμ„±μ„ μ˜¬λ°”λ₯΄κ²Œ μ΄ν•΄ν•˜κ³  뢄석 λͺ©μ μ— λ§žλŠ” μ²˜λ¦¬μ™€ μ‹œκ°ν™”λ₯Ό 톡해 더 μ •ν™•ν•˜κ³  μ‹ λ’°ν•  수 μžˆλŠ” κ²°κ³Όλ₯Ό 얻을 수 μžˆμŠ΅λ‹ˆλ‹€.