## 부록 2.3 matplotlinb 입문

In [None]:
# 공통 처리

# 불필요한 경고 메시지 무시
import warnings
warnings.filterwarnings('ignore')

# 라이브러리 임포트
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 한글 글꼴 설정
import platform

if platform.system() == 'Windows':
    plt.rc('font', family='Malgun Gothic')
elif platform.system() == 'Darwin':
    plt.rc('font', family='Apple Gothic')

# 데이터프레임 출력용 함수
from IPython.display import display

# 그래프 글꼴 크기 설정
plt.rcParams["font.size"] = 14

### 1. 단순 방식 (plt.xxx 함수 사용)

#### 산점도

In [None]:
# 데이터 준비
import seaborn as sns
df_iris = sns.load_dataset("iris") 

# 결과 확인
display(df_iris.head())

# 산점도 x좌표를 위한 시리즈
xs = df_iris['sepal_length']

# 산점도 y좌표를 위한 시리즈
ys = df_iris['sepal_width']

In [None]:
# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (6, 6)

# 산점도 그리기
plt.scatter(xs, ys)

# 화면에 출력
plt.show()

#### 함수의 그래프

In [None]:
# 데이터 준비

# 시그모이드 함수 정의
def sigmoid(x, a):
    return 1/(1 + np.exp(-a*x))

# 그래프 x좌표를 위한 리스트
xp = np.linspace(-3, 3, 61)

#### 간단한 예

In [None]:
# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (6, 6)

# 그래프 그리기
plt.plot(xp, sigmoid(xp, 1.0))

# 화면에 출력
plt.show()

#### 복잡한 예

In [None]:
# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (6, 6)

# 레이블이 달린 그래프 그리기 #1
plt.plot(xp, sigmoid(xp, 1.0), 
         label='시그모이드함수1', lw=3, c='k')

# 레이블이 달린 그래프 그리기 #2
plt.plot(xp, sigmoid(xp, 2.0), 
         label='시그모이드함수2', lw=2, c='b')

# 눈금 그리기
plt.grid()

# 범례 그리기
plt.legend()

# 축 표시
plt.xlabel('x축')
plt.ylabel('y축')

# 화면 출력
plt.show()

### 2. fig, ax 변수를 사용하는 방식

#### 시계열 그래프 그리기

In [None]:
# 데이터 준비

# 아이스크림 지출액
df_ice = pd.read_excel('https://github.com/flourscent\
/sample-data/blob/master/data/ice-sales.xlsx?raw=true', 
    sheet_name=0)

# 결과 확인
display(df_ice.head())

In [None]:
# ax 변수를 구하기
# 그래프 크기 설정도 겸한다
fig, ax = plt.subplots(figsize=(12, 4))

# 그래프 그리기
ax.plot(df_ice['연월'], df_ice['지출'], c='b')

# 날짜 설정용 라이브러리
import matplotlib.dates as mdates

# 눈금 간격을 3개월로 설정
days = mdates.MonthLocator(bymonth=range(1,13,3))
ax.xaxis.set_major_locator(days)

# x축의 레이블을 90도 회전
ax.tick_params(axis='x', rotation=90)

# 눈금 표시
ax.grid()

# 화면 출력
plt.show()

### 3. ax 변수를 사용하는 방식 2 (그래프 영역을 여러 개 만드는 경우)

#### 여러 개의 그래프 영역에 그래프 그리기

In [None]:
# 데이터 준비

# 손글씨 데이터
# 시간이 오래 걸릴 수 있으니 주의
from sklearn.datasets import fetch_openml
mnist = fetch_openml('mnist_784', version=1,)

# 이미지 데이터
image = mnist.data.values
# 정답 데이터
label = mnist.target

In [None]:
# 그래프 크기 설정
plt.figure(figsize=(10, 3))

# 이미지 20장을 출력
for i in range(20): 
    
    # i번째 ax 변수를 얻음
    ax = plt.subplot(2, 10, i+1)
    
    # i번째 이미지 데이터를 28x28 크기로 변환
    img = image[i].reshape(28,28)
    
    # img를 이미지로 그림
    ax.imshow(img, cmap='gray_r')
    
    # 정답 데이터를 타이틀로 표시
    ax.set_title(label[i])
    
    # x, y 눈금 표시하지 않음
    ax.set_xticks([])
    ax.set_yticks([])
    
# 인접 오브젝트와 부딪히지 않게 함
plt.tight_layout()

# 화면 출력
plt.show() 

### 4. 데이터프레임을 이용하는 방식

#### 데이터프레임으로 히스토그램 그리기

In [None]:
# 히스토그램 그리기

# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (8, 8)

# 히스토그램 그리기
df_iris.hist()

# 화면 출력
plt.show()

#### 시리즈를 사용한 막대그래프 그리기

In [None]:
# 데이터 준비

# df_iris['sepal_width']의 값마다 건수를 집계하고 상위 5가지를 뽑음
counts_ser = df_iris['sepal_width'].value_counts().iloc[:5]

# 결과 확인
print(counts_ser)

In [None]:
# value_counts 함수의 실행 결과로 막대그래프 그리기

# 그래프 크기 설정
plt.rcParams['figure.figsize'] = (4, 4)

# 시리즈 데이터를 사용해 막대그래프 그리기
counts_ser.plot(kind='bar')

# 화면 출력
plt.show()