
# 머신러닝 개요와 지도 학습

## 1. 머신러닝의 종류
- **지도 학습 (Supervised Learning)**, **비지도 학습 (Unsupervised Learning)**, **강화 학습 (Reinforcement Learning)** 등.
- 지도 학습은 **입출력 쌍**을 기반으로 입력을 출력으로 매핑하는 함수를 학습하는 방식.

---

## 2. 지도 학습 (Supervised Learning)
### 목표
- 입력(독립변수)으로부터 출력(종속변수)을 예측하는 함수 생성.

### 적용 분야
- **분류 (Classification)**: 데이터를 특정 클래스(카테고리)로 구분.
- **회귀 (Regression)**: 연속적인 출력값을 예측.

### 데이터 타입
- **양적 입력/출력**: 숫자형 데이터 (예: 회귀 분석).
- **질적 입력/출력**: 범주형 데이터 (예: 분류).
- **순서형 데이터**: 순서가 있는 범주형 데이터 (예: Small, Medium, Large).

---

## 3. 예측 모델
- **선형 모델과 최소 제곱법**: 데이터를 직선으로 근사하여 예측.
- **k-최근접 이웃 (k-Nearest Neighbor)**:
  - 주변 데이터의 다수결 원칙으로 분류.
  - 거리 기반으로 가장 가까운 `k`개의 데이터 참고.

---

## 4. 분류 알고리즘
### 주요 알고리즘
- 나이브 베이즈 (Naive Bayes), 로지스틱 회귀 (Logistic Regression), 결정 트리 (Decision Tree), SVM, 인공신경망, 앙상블 등.

### 결정 트리 (Decision Tree)
- **구조**:
  - **규칙 노드 (Decision Node)**: 조건을 정의.
  - **리프 노드 (Leaf Node)**: 최종 클래스.
- **규칙 생성 기준**:
  - 엔트로피 (Entropy), 지니 불순도 (Gini Impurity).
- **장점**:
  - 직관적이고 시각화가 쉬움.
  - 전처리가 필요 없음.
- **단점**:
  - 과적합(overfitting) 문제로 테스트 데이터에 대한 정확도 저하.

---

## 5. 사용자 행동 인식
- **UCI 데이터 세트** 활용:
  - 스마트폰 센서 데이터를 활용해 인간 행동 분석.
  - 데이터 전처리(중복된 피처 제거), 하이퍼파라미터 최적화 포함.
- **피처 중요도 평가**:
  - 중요한 피처를 분석하여 모델 성능 향상.

---

## 6. 결론
- 지도 학습은 예측 및 분류 문제 해결에 매우 효과적.
- 데이터 품질과 모델 과적합 문제에 주의 필요.
- 결정 트리와 k-NN 같은 기본 모델부터 복잡한 앙상블 모델까지 다양한 방법 활용 가능.


In [None]:

# Example Code: Decision Tree Classification
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Load dataset
data = load_iris()
X, y = data.data, data.target

# Split dataset into train and test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Initialize Decision Tree Classifier
clf = DecisionTreeClassifier()

# Train the model
clf.fit(X_train, y_train)

# Make predictions
y_pred = clf.predict(X_test)

# Evaluate the model
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy:.2f}")
