## 학습목표
 1. matplotlib을 통한 data visualization

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
import numpy as np

### 데이터 생성

In [None]:
x = np.linspace(0, 10, 11)
y = x ** 2 + 2 * x

In [None]:
x

In [None]:
y

### 그래프 출력하기
 - plot함수 (선 그래프), scatter(점 그래프), hist(히스토그램) 등 사용
   - 함수의 parameter 혹은 plt의 다른 함수로 그래프 형태 및 설정을 변경 가능
   - 기본적으로, x, y에 해당하는 값이 필요

In [None]:
plt.plot(x, y)

In [None]:
plt.scatter(x, y)

### 그래프에 주석 추가 

* **x, y 축 및 타이틀**

In [None]:
plt.xlabel('X values')
plt.ylabel('Y values')
plt.title('X-Y relationship')
plt.plot(x, y)

* **grid 추가**

In [None]:
plt.xlabel('X values')
plt.ylabel('Y values')
plt.title('X-Y relationship')
plt.plot(x, y)

# grid 추가
plt.grid(True)

* **x, y축 범위 지정**

In [None]:
plt.xlabel('X values')
plt.ylabel('Y values')
plt.title('X-Y relationship')
plt.plot(x, y)

# grid 추가
plt.grid(True)

# 범위 지정
plt.xlim(0, 20) 
plt.ylim(0, 120)

### plot 함수 parameters
 - 그래프의 형태에 대한 제어 가능
 - https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.plot

* 그래프의 색상 변경

In [None]:
plt.plot(x, y, 'r')

In [None]:
plt.plot(x, y, 'b')

In [None]:
plt.plot(x, y, 'y')

In [None]:
# RGB string으로 색상 명시
# https://goo.gl/UWBcGE
plt.plot(x, y, '#e27f1b')

* 그래프 선스타일 변경

In [None]:
plt.plot(x, y, '-.')

In [None]:
plt.plot(x, y, 'g^') # 색과 함께 지정 가능

In [None]:
plt.plot(x, y, 'm:') # 색과 함께 지정 가능

* 그래프 두께 변경
 - linewidth 명시

In [None]:
plt.plot(x, y, 'm:', linewidth=4.5) 

* keyword parameter 이용하여 모든 속성 설정
 - https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.plot
 - color
 - linestyle
 - marker
 - markerfacecolor
 - markersize 등등

In [None]:
plt.plot(x, y, color='green', linestyle='--', marker='^',
     markerfacecolor='blue', markersize=10)

### subplot으로 여러 그래프 출력하기
 - subplot함수로 구획을 구별하여 각각의 subplot에 그래프 출력

In [None]:
plt.subplot(2, 2, 1)
plt.plot(x, y, 'r')

plt.subplot(2, 2, 2)
plt.plot(y, x, 'g')

plt.subplot(2, 2, 3)
plt.plot(x, 2*x, 'b')

plt.subplot(2, 2, 4)
plt.plot(x, np.exp(x), 'k')

### figure으로 그래프 출력하기
 - figure : 그래프를 출력하기 위한 빈 공간(도화지)로 생각하면 이해가 쉬움
 - https://matplotlib.org/api/figure_api.html

In [None]:
fig = plt.figure()
axes = fig.add_axes([0.1, 0.1, 1.0, 1.0]) # left, bottom, width, height (figure에 대한 비율)

axes.plot(x, y)

# 
axes.set_xlabel('X values')
axes.set_ylabel('Y values')
axes.set_title('X-Y relationship')

* **add_axes rect**
 - rect의 각 값은 figure에서의 절대 위치를 의미

In [None]:
fig = plt.figure()

axes1 = fig.add_axes([0.0, 0.0, 1.0, 1.0])
axes1 = fig.add_axes([0.1, 0.1, 0.8, 0.8])
axes2 = fig.add_axes([0.2, 0.2, 0.3, 0.3])
axes2 = fig.add_axes([0.5, 0.5, 0.4, 0.4])

### Figure size와 DPI

In [None]:
fig = plt.figure(figsize=(3, 3)) # size in inches
axes1 = fig.add_axes([0, 0, 1, 1])
axes2 = fig.add_axes([1.2, 0, 1, 1])

axes1.plot(x, y)
axes2.plot(y, x)

In [None]:
fig = plt.figure(figsize=(6, 3)) # size in inches
axes1 = fig.add_axes([0, 0, 1, 1])
axes2 = fig.add_axes([1.2, 0, 1, 1])

axes1.plot(x, y)
axes2.scatter(y, x)

In [None]:
fig = plt.figure(figsize=(6, 3), dpi=200) # size in inches
axes1 = fig.add_axes([0, 0, 1, 1])
axes2 = fig.add_axes([1.2, 0, 1, 1])

axes1.plot(x, y)
axes2.scatter(y, x)

### subplots 함수
 - figure와 subplot을 한번에 생성

In [None]:
fig, axes = plt.subplots()

axes.plot(x, y)

In [None]:
fig, axes = plt.subplots(nrows=1, ncols=2)

axes[0].plot(x, y)
axes[1].plot(y, x)

# subplot간의 충돌을 자동 방지
plt.tight_layout()

### Legend(범례)
 - 하나의 plot에 여러 그래프를 그릴 경우 범례를 사용하여 구별 가능
 - 각 plot의 label을 설정하여 해당 값을 legend로 사용

In [None]:
fig, axes = plt.subplots(figsize=(8, 6))

axes.set_xlim(0, 10)
axes.set_ylim(0, 100)
axes.plot(x, y, label='square')
axes.plot(x, y + x, label='square2')
axes.plot(x, x, label='identical')

axes.legend(loc='center')

In [None]:
fig, axes = plt.subplots(figsize=(8, 6))

axes.set_xlim(0, 10)
axes.set_ylim(0, 100)
axes.plot(x, y, label='square')
axes.plot(x, y + x, label='square2')
axes.plot(x, x, label='identical')

axes.legend(loc='best')

### hist함수 사용
 - histogram 생성
 - bins로 historgram bar 개수 설정

In [None]:
# 데이터 생성
data = np.random.randint(1, 100, size=200)

In [None]:
plt.hist(data, bins=5, alpha=0.5, normed=True)
plt.xlabel('data')
plt.ylabel('frequency')
plt.grid(True)

In [None]:
plt.hist(data, bins=10, alpha=0.5)
plt.xlabel('data')
plt.ylabel('frequency')
plt.grid(True)