# Matplotlib

## 1. Matplotlib 개요

### 1.1 개요
- 파이썬에서 자료를 시각화(Visualization)해주는 패키지
- Pandas 시리즈와 데이터프레임의 plot 메소드 활용

### 1.2 그릴 수 있는 Chart / Plot
- 라인 플롯(line plot)
- 산점도(scatter plot)
- 막대 그래프(bar chart), 히스토그램(histogram)
- 박스 플롯(box plot)
- 파이 차트(pie chart)
- 컨투어 플롯(contour plot), 서피스 플롯(surface plot)

### 1.3 참고 사이트
- 갤러리(http://matplotlib.org/gallery.html)

## 2. 한글설정

In [1]:
import matplotlib as mpl
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm
import numpy as np
import pandas as pd

In [None]:
mpl.rcParams['axes.unicode_minus'] = False # minus 표시
plt.rcParams["font.family"] = 'NanumBarunGothic'
plt.rcParams["font.size"] = 10

## 3. Line Plot
- 데이터가 시갂, 순서 등에 따라 어떻게 변화하는지 보여주기 위해 사용
- Series 타입에서 value가 y축, index가 x축

In [None]:
x = [0, 1, 2, 3]
y = [0, 1, 4, 9]
plt.plot(y, x)
plt.show()

In [None]:
s = pd.Series(np.random.randn(10).cumsum(), index=np.arange(10))
plt.plot(s) # s.plot()

In [None]:
df = pd.DataFrame(np.random.randn(10, 4).cumsum(axis=0),
columns=(['A','B','C','D']), index=(np.arange(0,100,10)))
plt.plot(s, color='g', marker='o', linestyle='-')
plt.plot(s, 'bs--')

- color: blue, green, red, cyan, magenta, yellow, black(k), white
- marker: circle(o), 삼각형(^), 역삼각형(v), 사각형(s), 별(*), 플러스(+)
- linestyle: 직선(-), dashed(--), dash-dot(-.), dotted(:)

## 4. 산점도(Scatter Plot)
- Anscombe's quartet: 기술 통계치가 거의 같은 4가지 데이터 셋
- x와 y의 관계를 눈으로 확인하고자 할 때

In [None]:
x = np.random.randn(100)
y = np.random.randn(100)
plt.scatter(x, y)
plt.show()

In [None]:
x = np.random.rand(100)
y = np.random.rand(100)
colors = np.random.rand(100)
area = np.pi * (15 * np.random.rand(100))**2
plt.scatter(x, y, label='Samples', s=area, c=colors, alpha=0.5)

- s: 도형의 크기(size)
- c: 도형의 색상(color)
- alpha: 투명도 (0-완전 투명, 1-완전 불투명)

In [None]:
x1 = np.random.normal(1, 1, size=(100, 1))
x2 = np.random.normal(-2, 4, size=(100, 1))
plt.scatter(x1, x2, color='r', marker='s')