## 의사결정 나무 (Decision Tree)

### 알고리즘의 원리

1. **특성 선택**:
- 각 노드에서 데이터를 분할할 특성을 선택한다. 

2. **분할 (Splitting)**:
- 선택된 특성을 기준으로 데이터를 둘 이상의 그룹으로 나눈다. 이 과정은 트리의 각 노드에서 재귀적으로 수행된다.

3. **정지 기준 (Stopping Criteria)**:
- 분할이 멈추는 조건을 설정한다. 보통 최소 샘플 수, 최대 트리 깊이, 최소 불순도 감소량 등의 기준을 사용하여 더 이상 의미 있는 분할이 이루어지지 않을 때 멈춘다.

4. **예측 (Prediction)**:
- 새로운 데이터가 입력되면, 루트 노드에서부터 시작하여 각 노드의 조건을 통해 트리를 따라가며 리프 노드에 도달한다. 리프 노드에 도달하면 해당 노드의 값(분류 문제의 경우 클래스, 회귀 문제의 경우 수치 값)을 예측값으로 반환한다.

1. **노드 (Node)**:
   - **루트 노드 (Root Node)**: 트리의 최상단 노드로, 전체 데이터셋을 포함하며, 첫 번째 분할이 이루어지는 지점을 나타낸다.
   - **내부 노드 (Internal Node)**: 분할된 후의 자식 노드로, 해당 노드의 특성을 기준으로 데이터를 다시 분할한다.
   - **리프 노드 (Leaf Node)**: 더 이상 분할되지 않는 노드로, 최종 예측값(분류 결과 또는 회귀 값)을 나타낸다.

2. **분기 (Branch)**:
   - 각 노드에서 자식 노드로 이동하는 경로를 의미하며, 데이터가 특정 특성과 조건에 따라 분기되는 과정이다.

3. **조건 (Decision)**:
   - 각 노드에서 데이터를 분할할 때 사용되는 기준이다. 주로 이진 분기(binary split)로 나뉘며, 수치형 특성의 경우 특정 값을 기준으로 크거나 작음에 따라, 범주형 특성의 경우 특정 범주에 속하는지에 따라 데이터를 분할한다.

### Decision Tree 알고리즘의 작동 원리

### Decision Tree의 장점

- **해석 가능성**: 의사결정 경로를 시각적으로 표현할 수 있어 모델의 예측 과정이 직관적으로 이해되며, 특성의 중요도 파악이 용이하다.
- **비모수적 특성**: 데이터의 분포에 대한 가정을 필요로 하지 않으며, 다양한 데이터 유형을 처리할 수 있다.
- **비선형 관계 처리**: 특성 간의 복잡한 비선형 관계를 잘 학습할 수 있다.

### Decision Tree의 단점

- **과적합**: 트리가 너무 깊어질 경우 학습 데이터에 과적합될 위험이 있다. 이를 방지하기 위해 가지치기(pruning) 기술을 사용하거나, 최대 깊이 설정, 최소 샘플 수 설정 등의 제약을 둔다.
- **데이터 민감성**: 작은 데이터 변화에 의해 트리 구조가 크게 달라질 수 있다.
- **편향된 데이터 처리**: 불균형한 데이터셋에서는 편향된 예측을 할 수 있다.


### 코드 설명

1. **데이터 로드**:
   - Iris 데이터셋을 로드하여 X와 y에 각각 특성과 레이블을 저장한다.

2. **데이터 분할**:
   - 학습과 테스트 데이터로 분할하여 학습 과정과 성능 평가를 수행한다.

3. **모델 학습**:
   - `DecisionTreeClassifier`를 사용하여 Decision Tree 모델을 학습한다. 여기서는 트리의 최대 깊이를 3으로 설정하였다.

4. **예측 및 평가**:
   - 테스트 데이터를 사용하여 예측을 수행하고, 정확도와 분류 리포트를 출력한다.

Decision Tree는 간단하고 직관적인 구조로 인해 널리 사용되며, 다양한 문제에 적용할 수 있는 유연성을 제공한다.