λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°
IT/AI, λ”₯λŸ¬λ‹

λ¨Έμ‹ λŸ¬λ‹ 전톡λͺ¨λΈλ“€ 정리

by πŸ”₯κΉ‘ λ‹€ κ³ ! 2025. 4. 5.

λ¨Έμ‹ λŸ¬λ‹μ΄λž€ λ‹¨μ–΄λŠ” 이제 우리 μΌμƒμ—μ„œλ„ μ΅μˆ™ν•œ κ°œλ…μ΄ λ˜μ—ˆμŠ΅λ‹ˆλ‹€. ν•˜μ§€λ§Œ 막상 λ¨Έμ‹ λŸ¬λ‹μ„ κ³΅λΆ€ν•˜λ €κ³  ν•˜λ©΄ λ‹€μ–‘ν•œ μ•Œκ³ λ¦¬μ¦˜λ“€μ΄ λ“±μž₯ν•΄ μ–΄λ””μ„œλΆ€ν„° μ‹œμž‘ν•΄μ•Ό 할지 λ§‰λ§‰ν•˜κ³€ ν•˜μ£ .

κ·Έλž˜μ„œ μ˜€λŠ˜μ€ λ¨Έμ‹ λŸ¬λ‹μ˜ 기초이자 κ°€μž₯ **전톡적인 μ•Œκ³ λ¦¬μ¦˜ 4가지**λ₯Ό μ†Œκ°œν•©λ‹ˆλ‹€. λ°”λ‘œ μ„ ν˜• νšŒκ·€(Linear Regression), λ‘œμ§€μŠ€ν‹± νšŒκ·€(Logistic Regression), SVM(Support Vector Machine), κ²°μ • 트리(Decision Tree)μž…λ‹ˆλ‹€.

이 λͺ¨λΈλ“€μ€ λ¨Έμ‹ λŸ¬λ‹μ˜ μž…λ¬ΈμžλΏλ§Œ μ•„λ‹ˆλΌ μ‹€λ¬΄μ—μ„œλ„ μ—¬μ „νžˆ 많이 μ‚¬μš©λ˜κ³  있으며, μ•Œκ³ λ¦¬μ¦˜μ˜ 핡심 κ°œλ…μ„ μ΄ν•΄ν•˜λŠ” 데 큰 도움을 μ€λ‹ˆλ‹€. 각 μ•Œκ³ λ¦¬μ¦˜μ˜ 원리, νŠΉμ§•, μ‚¬μš© μ˜ˆμ‹œλ₯Ό ν•¨κ»˜ μ •λ¦¬ν•΄λ³΄κ² μŠ΅λ‹ˆλ‹€.


1. μ„ ν˜• νšŒκ·€ (Linear Regression)

1-1. κ°œμš”μ™€ 원리

μ„ ν˜• νšŒκ·€λŠ” 독립 λ³€μˆ˜μ™€ 쒅속 λ³€μˆ˜ κ°„μ˜ μ„ ν˜• 관계λ₯Ό λͺ¨λΈλ§ν•˜λŠ” 기초적인 νšŒκ·€ μ•Œκ³ λ¦¬μ¦˜μž…λ‹ˆλ‹€. 주어진 데이터λ₯Ό 직선 ν˜•νƒœλ‘œ κ°€μž₯ 잘 μ„€λͺ…ν•  수 μžˆλ„λ‘ νšŒκ·€μ„ μ„ 그리며, 이λ₯Ό 톡해 연속적인 값을 μ˜ˆμΈ‘ν•©λ‹ˆλ‹€.

1-2. μ‚¬μš© μ˜ˆμ‹œ

- μ•„νŒŒνŠΈ 가격 예츑 - 주식 가격 예츑 - 날씨(μ˜¨λ„) λ³€ν™” 예츑 - κ΄‘κ³ λΉ„ λŒ€λΉ„ 맀좜 예츑


2. λ‘œμ§€μŠ€ν‹± νšŒκ·€ (Logistic Regression)

2-1. κ°œμš”μ™€ 원리

λ‘œμ§€μŠ€ν‹± νšŒκ·€λŠ” 이진 λ˜λŠ” 닀쀑 λΆ„λ₯˜ λ¬Έμ œμ— μ ν•©ν•œ 지도 ν•™μŠ΅ μ•Œκ³ λ¦¬μ¦˜μž…λ‹ˆλ‹€. 데이터가 μ–΄λ–€ ν΄λž˜μŠ€μ— μ†ν•˜λŠ”μ§€λ₯Ό ν™•λ₯ λ‘œ κ³„μ‚°ν•˜λ©°, 좜λ ₯값은 0κ³Ό 1 μ‚¬μ΄μ˜ ν™•λ₯ λ‘œ λ‚˜νƒ€λ‚©λ‹ˆλ‹€. 핡심은 μ‹œκ·Έλͺ¨μ΄λ“œ ν•¨μˆ˜λ₯Ό μ‚¬μš©ν•˜μ—¬ κ²°κ³Όλ₯Ό μ΄μ§„ν™”ν•œλ‹€λŠ” μ μž…λ‹ˆλ‹€.

2-2. μ‚¬μš© μ˜ˆμ‹œ

- 이메일 슀팸 λΆ„λ₯˜ - μ§ˆλ³‘ 진단(μ–‘μ„±/μŒμ„±) - 고객 μ΄νƒˆ 예츑 - 금육 μ‹ μš© μœ„ν—˜ λΆ„λ₯˜


3. μ„œν¬νŠΈ 벑터 λ¨Έμ‹  (SVM)

3-1. κ°œμš”μ™€ 원리

SVM(Support Vector Machine)은 두 클래슀λ₯Ό κ°€μž₯ 잘 κ΅¬λΆ„ν•˜λŠ” κ²°μ • 경계(μ΄ˆν‰λ©΄)λ₯Ό μ°ΎλŠ” λΆ„λ₯˜ μ•Œκ³ λ¦¬μ¦˜μž…λ‹ˆλ‹€. λ§ˆμ§„(margin)을 μ΅œλŒ€λ‘œ ν•˜λŠ” μ΄ˆν‰λ©΄μ„ κΈ°μ€€μœΌλ‘œ 데이터λ₯Ό λΆ„λ¦¬ν•˜λ©°, κ³ μ°¨μ›μ—μ„œλ„ 효과적으둜 μž‘λ™ν•  수 μžˆλ„λ‘ 컀널 ν•¨μˆ˜λ₯Ό ν™œμš©ν•©λ‹ˆλ‹€.

3-2. μ‚¬μš© μ˜ˆμ‹œ

- 손글씨 숫자 λΆ„λ₯˜ - μ–Όκ΅΄ 인식 - λ¬Έμ„œ λΆ„λ₯˜ (ν…μŠ€νŠΈ λΆ„λ₯˜) - μœ μ „μž 데이터 뢄석


4. κ²°μ • 트리 (Decision Tree)

4-1. κ°œμš”μ™€ 원리

κ²°μ • νŠΈλ¦¬λŠ” 데이터λ₯Ό 쑰건에 따라 λ‚˜λˆ„λ©° 트리 ν˜•νƒœλ‘œ μ˜μ‚¬κ²°μ • κ·œμΉ™μ„ ν•™μŠ΅ν•˜λŠ” λͺ¨λΈμž…λ‹ˆλ‹€. 루트 λ…Έλ“œμ—μ„œ μ‹œμž‘ν•΄ 쑰건에 따라 λΆ„κΈ°ν•˜λ©°, μ΅œμ’…μ μœΌλ‘œ 리프 λ…Έλ“œμ—μ„œ 예츑 κ²°κ³Όλ₯Ό λ„μΆœν•©λ‹ˆλ‹€. μ‹œκ°μ μœΌλ‘œ 해석이 μ‰¬μ›Œ 이해도 높은 μ•Œκ³ λ¦¬μ¦˜μž…λ‹ˆλ‹€.

4-2. μ‚¬μš© μ˜ˆμ‹œ

- 고객 ꡬ맀 예츑 - λŒ€μΆœ 승인 μ—¬λΆ€ νŒλ‹¨ - 직원 이직 예츑 - μ‹ μš© 점수 λΆ„λ₯˜