# **Matplotlib 사용법**

Matplotlib는 가장 일반적인 차트 작성 패키지

In [None]:
import matplotlib.pyplot as plt
# 사용가능한 스타일 조회
print(plt.style.available)
# plt 스타일 수정
# plt.style.use('seaborn-white')
# plt.style.use('seaborn-whitegrid')
# plt.style.use('seaborn-bright')
# plt.style.use('seaborn-dark')
plt.style.use('seaborn-notebook')
# plt.style.use('fivethirtyeight')

# **Line Plots**

선 그래프

In [None]:
x = [1, 2, 3, 4, 5, 6, 7, 8, 9]
y1 = [1, 3, 5, 3, 1, 3, 5, 3, 1]
y2 = [2, 4, 6, 4, 2, 4, 6, 4, 2]
plt.plot(x, y1, label='line L')
plt.plot(x, y2, label='line H')

# x축, y축 범례지정
plt.xlabel('x axis')
plt.ylabel('y axis')
# title 지정
plt.title('Line Graph Example')
# 범례 출력
plt.legend()
plt.show()

# **Bar Plots**

막대 그래프

In [None]:
import matplotlib.pyplot as plt
# 겹치는 지수 4와 6을 확인
x1 = [1, 3, 4, 5, 6, 7, 9]
y1 = [4, 7, 2, 4, 7, 8, 3]

x2 = [2, 4, 6, 8, 10]
y2 = [5, 6, 2, 6, 2]

# Colors: https://matplotlib.org/api/colors_api.html
plt.bar(x1, y1, label='Blue Bar', color='b')
plt.bar(x2, y2, label='Green Bar', color='g')

plt.xlabel("bar number")
plt.ylabel("bar height")
plt.title('Bar chart Example')
plt.legend()
plt.show()

# **Histograms**

히스토그램

In [None]:
import matplotlib.pyplot as plt
import numpy as np
# Numpy를 사용하여 5 주변의 종 곡선에서 랜덤 데이터 묶음을 생성
n = 5 + np.random.randn(1000)
m = [m for m in range(len(n))]

plt.bar(m, n)
plt.title('Raw Data')
plt.show()

# 히스토그램 생성
# 막대의 개수 bins=20
plt.hist(n, bins=20)
plt.title('Histogram')
plt.show()

# 누적 히스토그램 생성
plt.hist(n, cumulative=True, bins=20)
plt.title('Cumulative Histogram')
plt.show()

# **Scatter Plots**

산점도 그래프

In [None]:
import matplotlib.pyplot as plt
x1 = [2, 3, 4]
y1 = [5, 5, 5]

x2 = [1, 2, 3, 4, 5]
y2 = [2, 3, 2, 3, 4]
y3 = [6, 8, 7, 8, 7]

# Markers: https://matplotlib.org/api/markers_api.html
plt.scatter(x1, y1)
plt.scatter(x2, y2, marker='v', color='r')
plt.scatter(x2, y3, marker='^', color='m')
plt.title('Scatter Plot Example')
plt.show()

# **Stack Plots**

스택 그래프

In [None]:
import matplotlib.pyplot as plt
index = [1, 2, 3, 4, 5, 6, 7, 8, 9]
arr1 = [23, 40, 28, 43, 8, 44, 43, 1, 17]
arr2 = [17, 30, 22, 14, 17, 17, 29, 22, 30]
arr3 = [15, 31, 18, 22, 18, 19, 13, 32, 39]

# 스택그래프에 범례를 추가하는것은 까다로움
plt.plot([], [], color = 'r', label = 'D 1')
plt.plot([], [], color = 'g', label = 'D 2')
plt.plot([], [], color = 'b', label = 'D 3')

plt.stackplot(index, arr1, arr2, arr3, colors = ['r', 'g', 'b'])
plt.title('Stack Plot Example')
plt.legend()
plt.show()

# **Pie charts**

파이 그래프

In [None]:
import matplotlib.pyplot as plt
labels = 'S1', 'S2', 'S3'
sections = [56, 66, 24]
colors = ['c', 'g', 'y']

plt.pie(sections, labels=labels, colors=colors,
        startangle = 90,
        explode = (0, 0.1, 0),
        autopct = '%1.2f%%')
plt.axis('equal') # Try commenting this out.
plt.title('Pie Chart Example')
plt.show()

# **fill_between and alpha**

선분차트 채우기 그래프

In [None]:
import matplotlib.pyplot as plt
import numpy as np

ys = 200 + np.random.randn(100)
x = [x for x in range(len(ys))]

plt.plot(x, ys, '-')
# alpha = 채우는 색 투명도
plt.fill_between(x, ys, 195, where=(ys > 195), facecolor='g', alpha=0.6)

plt.title('Fills and Alpha Example')
plt.show()

# **Subplotting using Subplot2grid**

Subplot2그리드 사용

In [None]:
import matplotlib.pyplot as plt
import numpy as np

def random_plots():

    xs = []
    ys = []
  
    for i in range(20):
        x = i
        y = np.random.randint(10)
        
        xs.append(x)
        ys.append(y)
    
    return xs, ys
#figure라는 그림단위를 사용하여 그래프를 그림
fig = plt.figure()
ax1 = plt.subplot2grid((5, 2), (0, 0), rowspan=1, colspan=2)
ax2 = plt.subplot2grid((5, 2), (1, 0), rowspan=3, colspan=2)
ax3 = plt.subplot2grid((5, 2), (4, 0), rowspan=1, colspan=1)
ax4 = plt.subplot2grid((5, 2), (4, 1), rowspan=1, colspan=1)

print(type(ax1))
x, y = random_plots()
ax1.plot(x, y)

x, y = random_plots()
ax2.plot(x, y)

x, y = random_plots()
ax3.plot(x, y)

x, y = random_plots()
ax4.plot(x, y)

plt.tight_layout()
plt.show()

# **Plot styles**

Plot 스타일<br>
차트는 기본적으로 Seaborn의 사용자 지정 스타일을 사용함

# **3D Graphs**


3D Scatter Plots<br>
3D 산점도 그래프

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from mpl_toolkits.mplot3d import axes3d

fig = plt.figure()
ax = fig.add_subplot(111, projection = '3d')

x1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y1 = np.random.randint(10, size=10)
z1 = np.random.randint(10, size=10)

x2 = [-1, -2, -3, -4, -5, -6, -7, -8, -9, -10]
y2 = np.random.randint(-10, 0, size=10)
z2 = np.random.randint(10, size=10)

ax.scatter(x1, y1, z1, c='b', marker='o', label='blue')
ax.scatter(x2, y2, z2, c='g', marker='D', label='green')

ax.set_xlabel('x axis')
ax.set_ylabel('y axis')
ax.set_zlabel('z axis')
plt.title('3D Scatter Plot Example')
plt.legend()
plt.tight_layout()
plt.show()

# **3D Bar Plots**

3D 막대 그래프

In [None]:
import matplotlib.pyplot as plt
import numpy as np

fig = plt.figure()
ax = fig.add_subplot(111, projection = '3d')

x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y = np.random.randint(10, size=10)
z = np.zeros(10)

dx = np.ones(10)
dy = np.ones(10)
dz = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
ax.bar3d(x, y, z, dx, dy, dz, color='g')

ax.set_xlabel('x axis')
ax.set_ylabel('y axis')
ax.set_zlabel('z axis')
plt.title('3D Bar Chart Example')
plt.tight_layout()
plt.show()

# **Wireframe Plots**

와이어프레임 그래프

In [None]:
import matplotlib.pyplot as plt

fig = plt.figure()
ax = fig.add_subplot(111, projection = '3d')

x, y, z = axes3d.get_test_data()
ax.plot_wireframe(x, y, z, rstride = 2, cstride = 2)

plt.title('Wireframe Plot Example')
plt.tight_layout()
plt.show()

# **Seaborn**

python의 시각화 모듈 Seaborn

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

# 랜덤 데이터 생성
num_points = 20

# x는 5, 6, 7이 되지만 또한 무작위로 빙글빙글 돌게 된다.
# 5 + 0~19정수 + 표준정규분포의 난수
x = 5 + np.arange(num_points) + np.random.randn(num_points)

# y는 10, 11, 12... 하지만 훨씬 더 무작위로 빙빙 돌렸다.
y = 10 + np.arange(num_points) + 5 * np.random.randn(num_points)
sns.regplot(x, y)
plt.show()

이 산점도는 회귀선이 적합하고 Seaborn의 레지스트리도에 대한 호출이 한 번만 있으면 되는 단순한 산점도임

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# 랜덤 데이터의 10 x 10
side_length = 10

# 5를 중심으로 값을 랜덤화한 10 x 10 행렬
data = 5 + np.random.randn(side_length, side_length)

# 다음 두 선은 (9, 9)에 가까워질수록 값을 크게 만듬
data += np.arange(side_length)
data += np.reshape(np.arange(side_length), (side_length, 1))

# 히트맵 생성
sns.heatmap(data)
plt.show()

# **Altair**

python 대화형 데이터 시각화 Altair

Altair는 Python에서 대화형 시각화를 생성하기 위한 선언형 시각화 라이브러리이며, 기본적으로 Colab에서 설치 및 사용하도록 설정됩니다.

In [None]:
# 대화형 산점도
import altair as alt
from vega_datasets import data
cars = data.cars()
alt.Chart(cars).mark_point().encode(
    x = 'Horsepower',
    y = 'Miles_per_Gallon',
    color = 'Origin'
).interactive()

# **Plotly**

온라인 분석 및 데이터 시각화 도구 Plotly

In [None]:
from plotly.offline import iplot
import plotly.graph_objs as go

data = [
    go.Contour(
        z = [[10, 10.625, 12.5, 15.625, 20],
             [5.625, 6.25, 8.125, 11.25, 15.625],
             [2.5, 3.125, 5., 8.125, 12.5],
             [0.625, 1.25, 3.125, 6.25, 10.625],
             [0, 0.625, 2.5, 5.625, 10]]
    )
]
iplot(data)

# **Bokeh**

자유분방한 시각화 도구 Bokeh

In [None]:
import numpy as np
from bokeh.plotting import figure, show
from bokeh.io import output_notebook

output_notebook()

N = 4000
x = np.random.random(size=N) * 100
y = np.random.random(size=N) * 100
radii = np.random.random(size=N) * 1.5
colors = ["#%02x%02x%02x" % (r, g, 150) for r, g in zip(np.floor(50+2*x).astype(int), np.floor(30+2*y).astype(int))]

p = figure()
p.circle(x, y, radius=radii, fill_color=colors, fill_alpha=0.6, line_color=None)
show(p)