# ![title](https://upload.wikimedia.org/wikipedia/en/5/56/Matplotlib_logo.svg)

matplotlib은 데이터 시각화를 위한 파이썬 라이브러리이다.

그래프 작성을 위한 공학용 소프트웨어인 MATLAB과 유사하게 사용할 수 있도록 고안되었다.

matplotlib을 통해 다양한 도표를 작성할 수 있다.

![title](http://codetorial.net/matplotlib/_images/matplotlib_intro2.png)
![title](https://upload.wikimedia.org/wikipedia/commons/c/ca/Mpl_screenshot_figures_and_code.png)

# <font color="blue">matplotlib 불러오기</font>

matplotlib을 사용할 땐 주로 pyplot이라고 하는 서브 라이브러리를 사용한다.

pyplot엔 도표를 그리기 위해 필요한 대부분의 도구들이 포함되어 있다.

pyplot은 일반적으로 plt라는 별칭으로 불러온다.

In [0]:
import matplotlib.pyplot as plt

# <font color="blue">선도표(line plot) 그리기</font>

## <font color="orange">기본적인 그래프 그리기</font>

**plot()** 함수는 그래프를 표시하기 전에 데이터를 적용하는 역할을 한다.

plot() 함수의 인자로 표시할 데이터를 전달한 후 **show()** 함수를 통해 출력한다.

In [0]:
plt.plot([0, 1, 2, 3])
plt.show()

위 코드에서 plot() 함수에 전달된 리스트는 자동으로 y축의 값으로 설정된다. x축의 값 또한 0부터 시작해서 1의 간격으로 자동으로 설정된다.

또는 다음 코드와 같이 두 개의 리스트를 전달함으로써 각각 x축의 값, y축의 값으로 설정된 그래프를 그릴 수도 있다.

In [0]:
plt.plot([2, 4, 6, 8], [1, 16, 4, 9])
plt.show()

리스트 뿐만 아니라 numpy array를 전달할 수도 있다. 실제로 plot() 함수에 전달되는 데이터는 함수 내부에서 numpy array로 처리된다.

In [0]:
import numpy as np

x = np.arange(0., 5., .1) # 0.0부터 5.0까지의 범위를 0.1 간격으로 나눈 숫자들로 이루어진 numpy array 생성

plt.plot(x, x ** 2)
plt.show()

하나의 그림에 여러 개의 그래프를 표시할 수도 있다.

In [0]:
x = np.linspace(0, 2 * np.pi, 100) # 0부터 2π까지의 범위를 100개만큼 나눈 숫자들로 이루어진 numpy array 생성

plt.plot(x, np.sin(x), x, np.cos(x)) # plt.plot(x1, y1, x2, y2, ...)
plt.show()

## <font color="orange">제목 표시하기</font>

**title()** 함수를 이용해서 그림의 제목을 표시할 수 있다.

또한 **xlabel()** 함수와 **ylabel()** 함수를 이용해서 각각 x축의 이름과 y축의 이름을 표시할 수 있다.



In [0]:
plt.plot(["Jan", "Feb", "Mar"], [104.8, 72.9, 134.7])

plt.title("Monthly Sales Graph")
plt.xlabel("Month")
plt.ylabel("Sales")

plt.show()

plot() 함수에 label 키워드 인자를 설정함으로써 그래프에 이름을 지정할 수 있다.

이렇게 지정된 이름은 **legend()** 함수를 통해 범례로써 표시할 수 있다.

In [0]:
x  = [1, 2, 3, 4, 5, 6, 7, 8, 9]
y1 = [1, 3, 5, 3, 1, 3, 5, 3, 1]
y2 = [2, 4, 6, 4, 2, 4, 6, 4, 2]
plt.plot(x, y1, label="line L")
plt.plot(x, y2, label="line H")
plt.plot()

plt.xlabel("x axis")
plt.ylabel("y axis")
plt.title("Line Graph Example")
plt.legend()
plt.show()

## <font color="orange">축 설정하기</font>



**xlim()**, **ylim()** 함수를 통해 각 축의 범위를 설정할 수 있다.

**axis()** 함수를 통해 한꺼번에 설정할 수도 있다. 이때는 xmin, xmax, ymin, ymax 값을 리스트 형태로 전달한다.

In [0]:
plt.plot([1, 2, 3, 4], [1, 4, 9, 16])

plt.xlim(0, 5)
plt.ylim(0, 25)
# plt.axis([0, 5, 0, 25])

plt.show()

**xscale()**, **yscale()** 함수를 통해 각 축의 스케일을 설정할 수 있다.

설정할 수 있는 스케일의 종류는 선형(linear), 로그(log), 시메트릭 로그(symlog), 로짓(logit)이 있다.

**grid()** 함수를 통해 그리드(격자) 선을 표시할 수 있다.

In [0]:
x = np.arange(0., 1., .01)

plt.plot(x, x)
plt.yscale("linear")
plt.title("linear scale")
plt.grid()
plt.show()

plt.plot(x, x)
plt.yscale("log")
plt.title("log scale")
plt.grid()
plt.show()

plt.plot(x, x)
plt.yscale("symlog")
plt.title("symlog scale")
plt.grid()
plt.show()

plt.plot(x, x)
plt.yscale("logit")
plt.title("logit scale")
plt.grid()
plt.show()

**xticks(), yticks()** 함수를 통해 각 축의 눈금(ticks)을 설정할 수 있다.

In [0]:
plt.plot([1, 3, 2, 4])
plt.show()

plt.plot([1, 3, 2, 4])
plt.xticks(np.arange(0., 2., .5)) # 표시할 눈금 값을 numpy array 형태로 전달
plt.show()

plt.plot([1, 3, 2, 4])
plt.xticks([0, 1, 3], ['January', 'February', 'March'], rotation=30) # 표시할 눈금 값, 명칭, 회전 설정
plt.show()

plt.plot([1, 3, 2, 4])
plt.xticks([]) # 눈금을 없앰
plt.show()

## <font color="orange">스타일</font>

plot() 함수에 다양한 키워드 인수를 전달하여 스타일을 바꿀 수 있다.

In [0]:
plt.plot([0, 1, 2, 3, 4, 5], [0, 1, 4, 9, 16, 25], color="red", linestyle="dashed", linewidth=2.5, marker="o", markeredgecolor="green", markerfacecolor="yellow", markersize=9.3)

plt.show()

상징을 사용해서 문자열 형태로 설정할 수도 있다.

In [0]:
x = np.linspace(0, 2 * np.pi, 10)

plt.plot(x, np.sin(x), "ro--", x, np.cos(x), "g^-.", x, -np.sin(x), "bx:") # 적색 선 원형 마커 실선 / 녹색 선 삼각형 마커 실점선 / 청색 선 가위표 마커 점선
plt.xlim(0, 2 * np.pi)

plt.show()

주요 요소들에 대한 상징은 다음 표와 같다.

![대체 텍스트](http://codetorial.net/matplotlib/_images/set_marker_03.png)

# <font color="blue">막대 그래프(bar chart) 그리기</font>

**bar()** 함수를 이용해서 막대 그래프를 그릴 수 있다.

In [0]:
x1 = [1, 3, 4, 5, 6, 7, 9]
y1 = [4, 7, 2, 4, 7, 8, 3]

x2 = [2, 4, 6, 8, 10]
y2 = [5, 6, 2, 6, 2]

plt.bar(x1, y1, label="Blue Bar", color='blue', edgecolor="yellow", linewidth=3)
plt.bar(x2, y2, label="Green Bar", color='green', edgecolor="red", linewidth=3)
plt.plot()

plt.xlabel("bar number")
plt.ylabel("bar height")
plt.title("Bar Chart Example")
plt.legend()
plt.show()

**barh()** 함수를 이용해서 수평 막대 그래프를 그릴 수 있다.

In [0]:
x1 = [1, 3, 4, 5, 6, 7, 9]
y1 = [4, 7, 2, 4, 7, 8, 3]

x2 = [2, 4, 6, 8, 10]
y2 = [5, 6, 2, 6, 2]

plt.barh(x1, y1, label="Blue Bar", color='blue', edgecolor="yellow", linewidth=3)
plt.barh(x2, y2, label="Green Bar", color='green', edgecolor="red", linewidth=3)
plt.plot()

plt.xlabel("bar number")
plt.ylabel("bar height")
plt.title("Bar Chart Example 2")
plt.legend()
plt.gca().invert_yaxis() # y축의 순서를 거꾸로 한다.
plt.show()

# <font color="blue">산점도(scatter plot) 그리기</font>

**scatter()** 함수를 이용해서 산점도를 그릴 수 있다.

In [0]:
x1 = [2, 3, 4]
y1 = [5, 5, 5]

x2 = [1, 2, 3, 4, 5]
y2 = [2, 3, 2, 3, 4]
y3 = [6, 8, 7, 8, 7]

plt.scatter(x1, y1)
plt.scatter(x2, y2, marker='v', color='r')
plt.scatter(x2, y3, marker='^', color='r')
plt.title('Scatter Plot Example')
plt.show()

삼차원 산점도를 그릴 수도 있다.

In [0]:
fig = plt.figure() # 새 figure 객체를 만든다. figure 객체는 그림과 관련된 모든 요소를 담는 최상위 컨테이너이다.
ax = fig.add_subplot(111, projection = '3d') # figure 객체에 새 플롯을 추가한다.

x1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y1 = np.random.randint(10, size=10)
z1 = np.random.randint(10, size=10)

x2 = [-1, -2, -3, -4, -5, -6, -7, -8, -9, -10]
y2 = np.random.randint(-10, 0, size=10)
z2 = np.random.randint(10, size=10)

ax.scatter(x1, y1, z1, c='b', marker='o', label='blue') # 플롯에 산점도를 추가한다.
ax.scatter(x2, y2, z2, c='g', marker='D', label='green') # 플롯에 산점도를 추가한다.

ax.set_xlabel('x axis')
ax.set_ylabel('y axis')
ax.set_zlabel('z axis')
plt.title("3D Scatter Plot Example")
plt.legend()
plt.tight_layout(pad=0.) # figure 객체의 외곽선과 플롯 객체의 외곽선 간의 간격을 조정한다.
plt.show()

# <font color="blue">히스토그램(histogram) 그리기</font>

**hist()** 함수를 이용해서 히스토그램을 그릴 수 있다.

In [0]:
n =  np.random.randn(1000) # 평균이 0, 표준편차가 1인 표준정규분포 난수 1000개 생성

m = [m for m in range(len(n))]
plt.bar(m, n)
plt.title("Raw Data")
plt.show()

plt.hist(n, bins=10) # 표현할 데이터를 20개의 구간으로 나눈다.
plt.title("Histogram")
plt.show()

plt.hist(n, cumulative=True, bins=20)
plt.title("Cumulative Histogram")
plt.show()

# <font color="blue">원 그래프(pie chart) 그리기</font>

**pie()** 함수를 이용해서 원 그래프를 그릴 수 있다.

In [0]:
plt.pie([0.3, 0.35, 0.4])

plt.title('Pie Chart Example')
plt.show()

pie() 함수에 전달하는 값은 굳이 비율값을 전달하지 않고 일반적인 숫자 값을 전달하더라도 값들의 총합에 대한 비율을 알아서 계산해서 표시해준다.

다양한 옵션들을 이용해서 원 그래프를 다른 방식으로 표시할 수 있다.

In [0]:
sections = [12, 24, 36]
labels = 'S1', 'S2', 'S3'
colors = ['r', 'g', 'b']

plt.pie(sections, # 조각의 크기를 설정하는 기본값.
        explode=(0.2, 0, 0), # 조각을 중심으로부터 얼마만큼 떨어지게 할 것인지 설정한다.
        labels=labels, # 조각의 이름을 표시한다.
        colors=colors, # 조각의 색깔을 결정한다.
        autopct='%.2f%%', # 비율(%)을 표시하는 형식 문자열을 지정한다.
        shadow=True, # 그림자를 표시한다.
        startangle=90, # 조각이 시작하는 위치를 결정한다. 기본 값은 0.
        counterclock=False, # 반시계방향으로 순서대로 표시할지 결정한다. 기본 값은 True.
        rotatelabels=True) # 조각의 이름을 회전시킨다. 기본 값은 False.

plt.title('Pie Chart Example 2')
plt.show()

# <font color="blue">서브플롯 그리기</font>

**subplot()** 함수를 이용해서 하나의 figure에 여러 개의 그래프를 하나의 figure에 모두 그릴 수 있다.

In [0]:
x1 = np.linspace(0.0, 5.0)
x2 = np.linspace(0.0, 2.0)

y1 = np.cos(2 * np.pi * x1) * np.exp(-x1)
y2 = np.cos(2 * np.pi * x2)

plt.subplot(2, 1, 1) # nrows=2, ncols=1, index=1
plt.plot(x1, y1, 'o-')
plt.title('A tale of 2 subplots')
plt.ylabel('Damped oscillation')

plt.subplot(2, 1, 2) # nrows=2, ncols=1, index=2
plt.plot(x2, y2, '.-')
plt.xlabel('time (s)')
plt.ylabel('Undamped')

plt.show()

**subplots()** 함수를 이용해서 표시할 수도 있다. subplots() 함수로 표시할 플롯의 개수를 설정한 다음, 반환되는 객체를 이용해서 각 플롯의 데이터를 설정한다.

In [0]:
fig, axes = plt.subplots(1, 4, sharex=True, sharey=True) # 행의 개수, 열의 개수를 전달한다. x값과 y값을 공유하고 싶으면 각각 sharex, sharey 옵션을 True로 설정한다.

fig.set_size_inches((16, 4)) # figure의 크기를 설정한다.

axes[0].scatter(np.random.random(100), np.random.random(100), color="cyan", edgecolor="red", alpha=0.5)
axes[1].scatter(np.random.random(100), np.random.random(100), color="magenta", edgecolor="green", alpha=0.5)
axes[2].scatter(np.random.random(100), np.random.random(100), color="yellow", edgecolor="blue", alpha=0.5)
axes[3].scatter(np.random.random(100), np.random.random(100), color="white", edgecolor="black", alpha=0.5)

axes[0].set_title("subplot 0")
axes[1].set_title("subplot 1")
axes[2].set_title("subplot 2")
axes[3].set_title("subplot 3")
plt.show()

또는 **subplot2grid()** 함수를 이용해서 격자식 레이아웃 형태로 배치할 수도 있다.

In [0]:
fig = plt.figure()
ax1 = plt.subplot2grid((6, 2), (0, 0), rowspan=1, colspan=1) # 격자 크기, 표시할 플롯의 위치, 행 통합, 열 통합 값을 차례로 전달한다.
ax2 = plt.subplot2grid((6, 2), (1, 0), rowspan=3, colspan=2)
ax3 = plt.subplot2grid((6, 2), (4, 0), rowspan=2, colspan=1)
ax4 = plt.subplot2grid((6, 2), (4, 1), rowspan=2, colspan=1)

ax1.plot(np.arange(100), np.random.rand(100))
ax2.plot(np.arange(100), np.random.randint(10, size=100))
ax3.plot(np.arange(50), np.random.randint(5, size=50))
ax4.plot(np.arange(50), np.random.randint(5, size=50))

plt.tight_layout()
plt.show()