# 11. Matplotlib 데이터 시각화


## 문법 설명

### 1. Matplotlib 기본

**정의**: Python의 대표적인 데이터 시각화 라이브러리입니다.

**임포트**:
```python
import matplotlib.pyplot as plt
import numpy as np
```

**핵심 개념**:
- **Figure**: 전체 그림 (캔버스)
- **Axes**: 개별 그래프 (플롯 영역)
- **Axis**: 축 (x축, y축)

**OOP 스타일 (권장)**:
```python
fig, ax = plt.subplots()
ax.plot(x, y)
ax.set_title("제목")
plt.show()
```

**한글 폰트 설정**:
```python
plt.rc('font', family='Malgun Gothic')  # Windows
plt.rcParams['axes.unicode_minus'] = False  # 마이너스 기호
```

---

### 2. 기본 차트 유형

**선 그래프 (Line Plot)**:
```python
ax.plot(x, y, label="레이블", linewidth=2, marker='o')
```

**막대 그래프 (Bar Chart)**:
```python
ax.bar(x, y, color='blue', edgecolor='black')
```

**산점도 (Scatter Plot)**:
```python
ax.scatter(x, y, s=크기, c=색상, alpha=투명도)
```

**히스토그램 (Histogram)**:
```python
ax.hist(data, bins=30, color='blue', edgecolor='white')
```

**박스 플롯 (Box Plot)**:
```python
ax.boxplot(data, vert=True, patch_artist=True)
```

---

### 3. 서브플롯

**여러 그래프 배치**:
```python
fig, axes = plt.subplots(행, 열, figsize=(너비, 높이))
axes[0, 0].plot(x, y)  # 첫 번째 서브플롯
axes[0, 1].bar(x, y)   # 두 번째 서브플롯
```

**다양한 크기 배치**:
```python
fig = plt.figure()
ax1 = fig.add_subplot(2, 2, 1)  # 2x2 중 첫 번째
ax2 = fig.add_subplot(2, 2, 2)  # 2x2 중 두 번째
```

---

### 4. 차트 커스터마이징

**축 설정**:
- `ax.set_xlim(시작, 끝)`: x축 범위
- `ax.set_ylim(시작, 끝)`: y축 범위
- `ax.set_xticks(리스트)`: x축 눈금
- `ax.set_xlabel("레이블")`: x축 레이블
- `ax.grid(True)`: 그리드 표시

**범례와 주석**:
- `ax.legend(loc="위치")`: 범례
- `ax.annotate("텍스트", xy=(x,y), xytext=(x,y))`: 주석
- `ax.text(x, y, "텍스트")`: 텍스트 추가

**색상과 스타일**:
- 색상: `color='red'`, `color='#3498db'`, `color=(0.2, 0.4, 0.8)`
- 선 스타일: `linestyle='-'`, `'--'`, `'-.'`, `':'`
- 마커: `marker='o'`, `'s'`, `'^'`, `'D'`

---
## 실습 시작

아래 실습을 통해 위 문법들을 직접 사용해봅니다.

---

## 시각화가 AI에서 중요한 이유

- **데이터 이해**: 분포, 이상치, 패턴을 직관적으로 파악
- **모델 디버깅**: 학습 곡선, 예측 결과 분석
- **결과 보고**: 성능 지표, 비교 분석 결과 전달
- **탐색적 분석(EDA)**: 특성 간 관계, 클래스 분포 확인

---
## 11.1 Matplotlib 기초

### 11.1.1 기본 설정과 한글 폰트

### 11.1.2 Figure와 Axes 개념

Matplotlib의 핵심 구조:
- **Figure**: 전체 그림 (캔버스)
- **Axes**: 개별 그래프 (플롯 영역)
- **Axis**: 축 (x축, y축)

```
Figure (전체 캔버스)
┌─────────────────────────────────┐
│  Axes 1        │  Axes 2        │
│  ┌──────────┐  │  ┌──────────┐  │
│  │  그래프   │  │  │  그래프   │  │
│  └──────────┘  │  └──────────┘  │
└─────────────────────────────────┘
```

In [None]:
# Figure와 Axes 생성
# 간단한 선 그래프

---
## 11.2 기본 차트 유형

### 11.2.1 선 그래프 (Line Plot)

시간에 따른 변화, 추세 분석에 적합합니다.

In [None]:
# 데이터 준비
# 선 그래프 그리기

### 11.2.2 막대 그래프 (Bar Chart)

카테고리별 비교에 적합합니다.

In [None]:
# 값 표시

### 11.2.3 산점도 (Scatter Plot)

두 변수 간의 관계, 분포 확인에 적합합니다.

In [None]:
# 가상의 2D 데이터 (2개 클래스)
# 클래스 A
# 클래스 B

### 11.2.4 히스토그램 (Histogram)

데이터 분포 확인에 적합합니다.

In [None]:
# 정규분포 데이터 생성
# 단일 plot
# 평균선
# 제목 및 라벨

---
## 11.3 OOP 스타일과 서브플롯

### 11.3.1 OOP 스타일 vs Functional 스타일

- **Functional**: `plt.plot()`, `plt.title()` - 간단한 그래프에 적합
- **OOP**: `fig, ax = plt.subplots()` - 복잡한 그래프, 서브플롯에 권장

In [None]:
# Functional 스타일 (간단한 경우)

In [None]:
# OOP 스타일 (권장)

### 11.3.2 여러 서브플롯 배치

In [None]:
# 2x2 서브플롯
# 데이터 준비
# 각 서브플롯에 그래프 그리기
# 전체 제목

In [None]:
# 다양한 크기의 서브플롯
# 왼쪽 큰 플롯
# 오른쪽 위
# 오른쪽 아래

---
## 11.4 차트 커스터마이징

### 11.4.1 색상과 스타일

In [None]:
# 다양한 색상 지정 방법

In [None]:
# 선 스타일과 마커

### 11.4.2 축 설정

In [None]:
# 축 범위 설정
# 눈금 설정
# 눈금 레이블
# 그리드
# 보조 눈금

### 11.4.3 범례와 주석

In [None]:
# 범례 위치 지정
# 주석 추가
# 텍스트 추가

---
## 연습문제

### 문제 1: 기본 그래프
다음 데이터로 선 그래프와 막대 그래프를 나란히 그리세요.
```python
months = ['1월', '2월', '3월', '4월', '5월', '6월']
sales = [150, 180, 220, 190, 250, 310]
```

In [None]:
# 여기에 코드 작성

### 문제 2: 산점도와 회귀선
랜덤 데이터를 생성하고 산점도를 그린 후, 추세선을 추가하세요.
(힌트: numpy.polyfit, numpy.poly1d 사용)

In [None]:
# 여기에 코드 작성

### 문제 3: 파이 차트
다음 데이터로 파이 차트를 그리세요. 가장 큰 부분을 강조하세요.
```python
categories = ['A', 'B', 'C', 'D', 'E']
values = [30, 25, 20, 15, 10]
```

In [None]:
# 여기에 코드 작성

### 문제 4: 박스 플롯
3개 그룹의 데이터 분포를 박스 플롯으로 비교하세요.

In [None]:
# 여기에 코드 작성