In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

# 끝은 시각화! - Matplotlib의 활용법!

#### Matplotlib은 주로 2차원의 데이터를 시각화하기 위한 서드파티 패키지이다. 
#### 동작하는 운영시스템을 가리지 않는다는 점, 자세한 그리기 설정이 가능한 점, 다양한 출력 형식에 대응하고 있는 점 등 대표적인 시각화 툴로서 널리 사용되고 있다.

# 그래프 그리기 기초

In [None]:
# Matplotlib에서 그래프를 그리기 위해 matplotlib.pyplot 모듈을 불러온다.
import matplotlib.pyplot as plt 
plt.rc('font', family='NanumBarunGothic')  # 한글 폰트 미리 설정 --> 나눔바른


In [None]:
# 예시1. 
# 예로 심플한 그래프를 그려보자. 여기에서는 show()에 따른 코드를 입력한 코드 셀의 바로 아래에 그림이 인라인 표시되는 것을 기억해 둔다.
fig = plt.figure()
ax = fig.add_subplot(111)

dat = [0, 1]
ax.plot(dat)

# 그림을 인라인(inline) 표시함
plt.show()

# 피겨(Figure)와 서브플롯(subplot)

#### Matplotlib에서는 그래프를 작성하기 전에 '피겨 오브젝트'(Figure Object)와 '서브 플롯'을 생성할 필요가 있다.
#### 피켜는 서브플롯을 작성하는 영역이고 서브플롯은 그래프를 작성하기 위한 영역이다.
#### Subplot은 최소 1 개이상 작성할 필요가 있다.
#### 피겨에 서브플롯을 추가하는 방법으로 figure.add_subplot() 방법과 pyplot.subplots()란 함수를 이용할 수 있다.



In [None]:
# 예시2. add_subplot() 방법으로 서브플롯 배치하기
# 이 방법에서는 처음에 figure() 함수로 Figure 클래스의 인스턴스를 생성한다.
# 이 인스턴스를 피겨 또는 피겨 오브젝트라고 표기한다.
# 계속해서 add_subplot() 메서드로 서브플롯을 피겨 오브젝트의 지정된 위치에 배치한다.

# 피겨 생성
fig = plt.figure()

# 피겨 안에 서브플롯을 3개 배치한다.
ax1 = fig.add_subplot(221) # 2행2열 1번
ax2 = fig.add_subplot(222) # 2행2열 2번      <---  이 괄호 안의 숫자는 첫 번째부터 순서대로 i)총행수 , ii) 총열수, iii) 서브플롯 번호를
ax3 = fig.add_subplot(223) # 2행3열 3번             나타낸다.

plt.show()

In [None]:
# 예시 3. 서브플롯 번호 할당 순서의 확인
fig = plt.figure()

# 서브플롯 작성
ax1 = fig.add_subplot(221)
ax2 = fig.add_subplot(222)
ax3 = fig.add_subplot(223)

# 번호 기술
for i, ax in enumerate([ax1, ax2, ax3], start = 1):   # 각 서브플롯에 번호를 그리는 처리를 추가하고 있다.
    txt = 'ax{0}\n(22{0})'.format(i)                  # 이 결과를 보면 번호는 배치되는 서브플롯의 행 방향 순서대로 할당되어, 행의 끝까지
    ax.text(0.2, 0.4, txt, fontsize = 24)             # 오면 다음 행의 왼쪽 끝의 서브플롯에 할당되는 것을 알 수 있다.

plt.show()

In [None]:
# 예시 4. 서브플롯 번호 할당 순서의 확인
fig = plt.figure()

# 서브플롯 작성 --> 콤마 단락기법
ax1 = fig.add_subplot(2,2,1)         # 이 기법은 반복처리 등에서 변수를 사용하여 서브플롯을 그릴 때 유용하다.
ax2 = fig.add_subplot(2,2,2)
ax3 = fig.add_subplot(2,2,3)

# 번호 기술
for i, ax in enumerate([ax1, ax2, ax3], start = 1):   
    txt = 'ax{0}\n(22{0})'.format(i)                 
    ax.text(0.2, 0.4, txt, fontsize = 24)             

plt.show()

In [None]:
# 예시 5. subplots() 함수를 이용해서 서브플롯 배치하기
# 위에서는 서브플롯을 개별로 그리고 있지만 pyplot.subplots() 함수를 사용해서 피겨 생성과 서브플롯의 배치를 동시에 실행하는 방법도 있다.
# add_subplot() 방법과 비교해서 간결하게 코드를 기술할 수 있다.

# 피겨 오브젝트 작성과 서브플롯 배치를 동시에 실행
fig, axes = plt.subplots(2, 2)     # 2행2열의 4개의 서브플롯이 배치되어 있는 것을 확인할 수 있다.
print(type(axes), axes)
plt.show()                         # subplots()함수를 이용해서 서브플롯을 추가한 경우에는 axes에 대해 [1, 0]처럼 행렬의 위치를 지정해서
                                   # 서브플롯을 참조할 수 있다.
                                   # 행열의 지정은 0부터 시작하는 점에 주의한다.
                                   # 예: [0, 0] --> 1행 1열
                                   #     [1, 1] --> 2행 2열 등

In [None]:
# 예시 6. 1행 2열째 서브플롯에 서브플롯 타이틀을 지정
fig, axes = plt.subplots(2, 2)
axes[0, 1].set_title('Subplot 0-1')
plt.show()

# style 적용하기

In [None]:
# 스타일이란 그래프의 선 굵기나 색 등 그래프의 체재에 관한 정보를 모아놓은 것
# 스타일은 style.use() 함수로 적용할 수 있다.

# 예시 7. 아래 그림에서 ggplot 스타일을 적용하고 있다.
#         초기 설정의 스타일이다. ggplot 스타일에서는 초기 설정에서 그리드선이 그려진다.

# style 적용
plt.style.use('ggplot')

fig = plt.figure()
ax = fig.add_subplot(111) # 1행1열 첫 번째
dat = [0, 1]
ax.plot(dat)

plt.show()

# 꺾은선 그래프

#### 꺾은선 그래프는 플롯된 점과 점을 직선으로 연결한 그래프이다.
#### 꺾은선 그래프는 Axes.plot() 방법을 사용해서 그린다.
#### 만약, plot() 방법의 인수가 하나뿐인 경우, 부여된 인수는 Y값으로 설정되어 X값은 자동적으로 
#### '최솟값 = 0',  '최댓값 = 리스트의 요소수 - 1'의 정수열이 지정된다.

In [None]:
# 예시 8. 꺾은선 그래프 그리기
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')
plt.style.use('ggplot')

fig = plt.figure()
ax = fig.add_subplot(111)

ax.plot([1, 3])

plt.show()

#### plot() 메서드에서는 다음과 같은 데이터형이 넘겨진다.
#### - 리스트
#### - 튜플
#### - numpy.ndarray (==> 배열을 뜻한다 )
#### - pd.Series(시리즈)


In [None]:
# 예시 9. X값과 Y값을 지정한 꺾은선 그래프 그리기
fig = plt.figure()
ax = fig.add_subplot(111)

x = [0, 2, 4]
y = [0, 4, 2]

ax.plot(x, y)
plt.show()

# 여러 개의 선을 그리는 경우

In [None]:
# 예시 10.
# plot() 방법을 여러 번 실행하면 1개의 서브플롯에 여러 개의 그래프를 겹쳐서 그릴 수 있다.
# 아래 그림은 2개의 선이 그려졌다.

fig = plt.figure()
ax = fig.add_subplot(111)

x = [0, 2, 4]
y1 = [0, 4, 2.5]   # 빨간색 점들
y2 = [4, 0, 1.5]   # 푸른색 점들

# 2개의 선 그리기 
ax.plot(x, y1)     # 빨간색 선
ax.plot(x, y2)     # 푸른색 선

plt.show()

# 꺾은선 그래프 활용해보기

In [None]:
# 실제 데이터를 이용해서 그래프를 그린다.
# 데이터는 anime_stock_returns.csv 파일을 이용한다.
# 이 csv파일에는 TOEI ANIMATION 및 IG Port의 주가 등락률이 시계열(일단위)로 기록되어 있다.

import pandas as pd
df = pd.read_csv('/content/drive/MyDrive/ColabNotebooks/Basic_Python/anime/anime_stock_returns.csv', index_col = 0, parse_dates = ['Date'], encoding = 'utf-8')
# 여기서 index_col은 '인덱스 컬럼을 어떤 컬럼을 기준으로 할 것인가'란 뜻을 가지고 있어 우리는 첫 번째 열인 '날짜(Date)'로 인덱싱 할것이다.
# parse_dates는 일단 인덱싱을 날짜 기준으로 하는데 이 형태가 '날짜'이라고 인식시키는 옵션이다.
df.head()

In [None]:
# 예시 11. anime_stock_returns.csv 꺾은선 그래프
fig = plt.figure(figsize = (10, 4))
ax = fig.add_subplot(111)

# 데이터와 범례 지정
ax.plot(df.index, df['TOEI ANIMATION'], label = 'TOEI ANIMATION')
ax.plot(df.index, df['IG Port'], label = 'IG Port')

# 제목, 축레이블 지정
ax.set_title('주가등락률 2년간 추이')
ax.set_ylabel('주가등락률')
ax.set_xlabel('년월')

# 범례 유효화
ax.legend()
plt.show()                       # 본 그래프에서는 첫 번째 그래프로 X값에 날짜를, Y값에 TOEI ANIMATION의 주가 등락률을 
                                 # 반영한 꺾은선 그래프를 그리고 있다.
                                 # 그리고 두 번째 그래프로 X값에 날짜를, Y값에 IG Port의 주가 등락률을 반영한 꺾은선 그래프를 그리고 있다.
                                 # 그래서 데이터를 시각화한 덕분에 두 회사의 주가 등락률의 추이를 알 수 있게 되었다.

# 두 개의 축을 가진 그래프 그리기

#### Matplotlib에서 X축을 공유해 2개의 Y축을 가진 그림을 작성하는 경우에는 Axes.twinx() 방법을 사용한다.
#### Y축을 공유해서 2개의 X축을 가진 그림을 그리는 경우에는 twiny() 방법을 사용한다.
#### twinx() 방법을 사용해서 마감가(Close)와 거래량(Volume)을 하나의 그래프로 나타내고 있다.
#### 즉, 마감가는 꺾은선 그래프로, 거래량은 막대 그래프로 나타내고 있다.

In [None]:
# 예시12. 두 개의 축을 가진 그래프
t4816 = pd.read_csv('/content/drive/MyDrive/ColabNotebooks/Basic_Python/anime/4816.csv', index_col = 0, parse_dates = ['Date'], encoding = 'utf-8')

fig = plt.figure(figsize = (10, 4))
ax1 = fig.add_subplot(111) # 1행1열 첫 번째

ax1.plot(t4816.index, t4816['Close'], color = 'b', label = '주가')

# X축을 공유해서 Y축을 2개 사용하는 설정
ax2 = ax1.twinx()
ax2.bar(t4816.index, t4816['Volume'], color = 'g', label = '거래총액', width = 2)

# 축과 축레이블 설정
ax1.set_yticks([i * 2000 for i in range(5)])
ax1.set_ylabel('주가')
ax2.set_yticks([i * 5000 for i in range(5)])
ax2.set_ylabel('거래총액')
ax1.set_xlabel('년월')

# 그래프 제목 설정
ax1.set_title('주가와 거래총액')

# 범례설정
ax1.legend(loc = 1)
ax2.legend(loc = 2)

plt.show()

# 첫 번째 그래프에 왼쪽 축(Y축)과 X축을 그린 후, 두 번째 그래프 오른쪽 축(Y축)을 그리고 있다.
# twinx() 방법으로 ax1과 ax2의 X축을 공유하는 설정이 되어 있기 때문에 두 번째 그래프는 첫 번째의 서브플롯에 겹쳐져 그려진다.

# 산포도 그래프 (Scatterplot)

### 산포도 그래프는 X축과 Y축에 수량이나 크기 등을 대응시켜서 적합한 점에 데이터를 플롯한 그래프이다.
### 산포도 그래프는 X축과 Y축에 취한 두 개의 값에 함수가 있는지 없는지 보는 것에 유용하다.
### 또한, 데이터의 분포 상황을 확인할 때에도 활용할 수 있다.

In [None]:
# 예시 13. 산포도 그래프 작성하기
# 산포도 그래프는 Axes.scatter() 방법을 사용해서 그린다.
# scatter() 방법의 제1, 제2인수에 각각 X값과 Y값을 부여한다.
# 아래 예시에서는 x에 1~100까지의 정수값을 100개, y에 0~1의 값을 취한 난수에 x와 4를 곱한 것을 부여해서 각각 X값, Y값으로 하고 있다.

import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')
import numpy as np

plt.style.use('ggplot')

# 입력값 생성
x = np.arange(1, 101)           # 여기서 np.arange는 for문에서 보았던 range(범위)란 뜻이며 1부터 100까지이다.
y = 4 * x * np.random.rand(100) # 여기서 np.random.rand()는 무작위의 숫자를 생성해준다. 본 예시에서는 100개의 y값으로 설정함.

# 산포도 그래프 그리기
fig = plt.figure()
ax = fig.add_subplot(111)

ax.scatter(x, y)

plt.show()

# 산포도 그래프 활용하기

In [None]:
# 실제 데이터는 anime_master.csv 파일을 이용한다.
# 본 데이터는 애니메이션의 제목이나 장르, 에피소드 수나 평점 데이터가 포함되어 있다.

import pandas as pd
anime_master = pd.read_csv('anime/anime_master.csv', index_col = 'anime_id',  encoding = 'utf-8')
anime_master.head()

In [None]:
# 예시 14. members와 rating 값으로 산포도 그래프 작성
# X값으로 'members'를, Y값으로 rating을 지정하는 것에 따라 산포도 그래프를 작성할 수 있다.
# 그려진 기호를 반투명으로 하는 값(alpha = 0.5)도 설정되어 있다.

fig = plt.figure()
ax = fig.add_subplot(111)

ax.scatter(anime_master['members'], anime_master['rating'], alpha = 0.5)
plt.show()

# 멤버 수(members)와 평점(rating)사이에 명확한 상관관계는 없지만 멤버 수의 증가에 따른 평점이 8 부근에 위치되는 경향을 파악

# 그룹화된 산포도 그래프 작성하기

In [None]:
# 예시 15.
# 위 데이터에서는 'type'이라는 열을 가지고 있다.
# type은 애니메이션 작품의 배급 종별을 의미한다.
# 먼저, type 중복 없는 리스트를 작성한다.

types = anime_master['type'].unique()
print(types)


In [None]:
# 예시 16.
# 꺾은선 그래프와 비슷하게 하나의 서브플롯에 겹쳐서 산포도 그래프를 그릴수 있다.
# 그래서 배급 종별마다 일치하는 데이터를 추출해서 그려보았다.
# 배급 종별은 6종류가 있기 때문에 6개의 데이터 세트가 플롯되어 있다.

fig = plt.figure(figsize = (10, 5))
ax = fig.add_subplot(111)

for t in types:
    x = anime_master.loc[anime_master['type'] == t, 'members']
    y = anime_master.loc[anime_master['type'] == t, 'rating']
    
    ax.scatter(x, y, alpha = 0.5, label = t)
    
ax.set_title('배급 종별로 그룹화한 데이터 산포도 그래프')
ax.set_xlabel('Members')
ax.set_ylabel('Ratings')
plt.ticklabel_format(style='plain') # X축의 숫자가 0부터 1.0으로 표시되어 있는데 이렇게 표시하지 말고 원래의 범위를 설정함.

ax.legend(loc = 'lower right', fontsize = 12)

plt.show()

# 막대그래프

### 막대그래프는 수량을 막대의 길이로 나타낸 그래프이다.

In [None]:
# 막대그래프는 Axes.bar() 메서드를 사용해서 그린다. 
# bar()의 제1, 제2인수에 각각 X값과 Y값을 부여한다.
# 예시 17.
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')

plt.style.use('ggplot')
fig = plt.figure()
ax = fig.add_subplot(111)

x = [1, 2]
y = [1, 3]

ax.bar(x, y)

plt.show()

In [None]:
# 예시 18. 눈금레이블을 붙일 경우
# X값을 부여해서 인수 tick_label에 눈금레이블을 설정해서 작성한다.

# 황축의 눈금에 레이블 설정
fig = plt.figure()
ax = fig.add_subplot(111)

labels = ['사과', '오랜지']
ax.bar(x, y, tick_label = labels)

plt.show()

In [None]:
# 예시 19. 위 예시처럼 그래프를 그린 후 Axes.set_xticks()방법으로 X축 눈금을 설정하고 Axes.set_xticklabels() 방법으로 눈금 레이블을 설정한다.

# 그리기
fig = plt.figure()
ax = fig.add_subplot(111)

ax.bar(x, y)

# X축의 축눈금과 축눈금 레이블
ax.set_xticks(x)
ax.set_xticklabels(labels)

plt.show()

# 수평 막대그래프를 작성하는 경우

### 수평 막대그래프는 Axes.barh() 방법을 이용해서 그린다.


In [None]:
# 예시 20. 수평 막대그래프 그리기
fig = plt.figure()
ax = fig.add_subplot(111)

ax.barh(x, y, tick_label = labels)

plt.show()

# 막대그래프 활용하기

In [None]:
# 예시 21.
# 실제 데이터는 anime_master.csv 파일을 이용했다. 

import pandas as pd

anime_master = pd.read_csv('/content/drive/MyDrive/ColabNotebooks/Basic_Python/anime/anime_master.csv', encoding = 'utf-8')
anime_master.head()

#### 막대그래프는 수량의 대소를 시각화할 때 적당하다.
#### 여기에서는 작품의 배급 종별마다 멤버수의 합계 값을 추출해서 막대그래프로 그린다.
#### X값에 배급 종별, Y값에 배급 종별마다의 합계 멤버수를 부여해서 그렸다.
#### x에 대해서는 len() 함수로 데이터프레임의 데이터 수를 계수하고 
#### range()함수로 그 범위의 정수 열을 생성하고 있다.
#### 또한, X축 레이블에는 Series의 인덱스를 부여한다.

In [None]:
# 예시 22. 배급 종별마다 합계 멤버 수의 막대그래프 그리기

fig = plt.figure()
ax = fig.add_subplot(111)

y = anime_master.groupby('type').sum()['members']
x = range(len(y))

xlabels = y.index
ax.bar(x, y, tick_label = xlabels)
ax.set_ylabel('합계 멤버수')

plt.show()           #  Y축의 '1e8'이라고 표시되어 있는데 이것은 수치에 10의 8승을 곱한 수치를 나타낸다.


# 여러가지 그룹에 대한 막대그래프 작성하기

In [None]:
# 여러 그룹의 막대그래프를 그릴 때에는 공부가 필요하다.
# 여러 번 bar()를 실행하면 최초에 그려진 오브젝트가 뒤에 그려진 오브젝트에 의해 덮어씌어 진다.

# 예시 23. (실패 사례) 여러 그룹 막대그래프 그리기

import numpy as np
# 데이터 세트 작성
x = [1,2]
y1 = [1,2]
y2 = [2,4]
y3 = [3,6]

# 복수 그룹의 막대 그래프
fig = plt.figure()
ax = fig.add_subplot(111)

w = 0.2
ax.bar(x, y1, label = 'y1')
ax.bar(x, y2, label = 'y2')
ax.bar(x, y3, label = 'y3')

ax.legend()

plt.show()    # 실패 사례 그래프


In [None]:
# 예시 24. 여러 그룹 막대그래프 그리기 (해결 방법)
# 위 예시를 피하기 위해서는 X값을 막대의 가로 폭만큼 비켜서 그릴 필요가 있다.
# 막대그래프의 가로 폭 w를 0.2로 설정하고 X값을 0.2씩 비켜서 그리고 있다.

# 복수 그룹의 막대그래프 그리기
fig = plt.figure()
ax = fig.add_subplot(111)

w = 0.2
ax.bar(x, y1, width = w, label = 'y1')
ax.bar(np.array(x) + w, y2, width = w, label = 'y2')
ax.bar(np.array(x) + w * 2, y3, width = w, label = 'y3')

ax.legend()

plt.show()

# 여러 그룹의 막대그래프 활용하기

In [None]:
# 예시 25. 
# 실제 데이터는 anime_genre_top10_pivoted.csv 파일을 이용했다.

import pandas as pd
anime_genre_top10 = pd.read_csv('/content/drive/MyDrive/ColabNotebooks/Basic_Python/anime/anime_genre_top10_pivoted.csv', encoding = 'utf-8', index_col = 'genre')
anime_genre_top10

In [None]:
# 예시 26. 배급 종별 / 장르별 막대그래프 그리기
# X값을 0.1씩 증가시키면서 열별로 그리고 있다.
# 이 결과에서도 TV 합계 수가 돌출되어 있고 다음에 Movie 멤버 수가 많은 것을 알 수 잇다.

fig = plt.figure(figsize = (18, 3))
ax = fig.add_subplot(111)

wt = np.array(range(len(anime_genre_top10)))
w = 0.1

for i in anime_genre_top10.columns:
    ax.bar(wt, anime_genre_top10[i], width = w, label = i)
    wt = wt + w
    
ax.set_xticks(np.array(range(len(anime_genre_top10))))
ax.set_xticklabels(anime_genre_top10.index, ha = 'left')
ax.set_ylabel('누적 멤버수')
ax.legend()

plt.show()



In [None]:
# Music이나 ONA 값이 상대적으로 작기 때문에 눈으로 확인하는 것이 어렵다.
# 이 같은 경우에 로그 축을 이용하면 가독성이 좋아진다.
# Y축을 로그축에 설정하는 경우에는 set_yscale() 방법에 log를 지정한다.

# 예시 27.

fig = plt.figure(figsize = (18, 3))
ax = fig.add_subplot(111)

wt = np.array(range(len(anime_genre_top10)))
w = 0.1

for i in anime_genre_top10.columns:
    ax.bar(wt, anime_genre_top10[i], width = w, label = i)
    wt = wt + w
    
ax.set_xticks(np.array(range(len(anime_genre_top10))))
ax.set_xticklabels(anime_genre_top10.index, ha = 'left')
ax.set_ylabel('누적 멤버수')
ax.set_yscale('log')
ax.legend()

plt.show()

# 누적 막대그래프 작성하기

#### 누적 막대그래프를 그릴 때에도 여러 그룹의 막대그래프와 같이 작성시 요령이 필요하다.
#### y1, y2, y3이라는 3개의 값을 누적한 경우의 그리기 순서를 설명하겠다.
#### 실제의 그리기 순서는 다음과 같다.

#### (1) y1과 y2와 y3의 합을 그린다.
#### (2) (1)에서 y2와 y3의 합을 겹쳐서 그린다.
#### (3) (2)에 y1을 겹쳐서 그린다.


In [None]:
# 예시 28. 누적 막대그래프 그리기
# 데이터 세트 작성

x = np.arange(5)
np.random.seed(0)
y = np.random.rand(15).reshape((3, 5))
y1, y2, y3 = y

y1b = np.array(y1)
y2b = y1b + np.array(y2)
y3b = y2b + np.array(y3)

# 누적 막대 그래프 그리기
fig = plt.figure(figsize = (10, 3))
ax = fig.add_subplot(111)

ax.bar(x, y3b, label = 'y3')
ax.bar(x, y2b, label = 'y2')
ax.bar(x, y1b, label = 'y1')

ax.legend()

plt.show()

# 누적 막대그래프 활용하기

In [None]:
# 실제 데이터는 앞에서 이용한 anime_genre_top10_pivoted.csv 파일을 이용했다.
# 예시 29. 배급 종별 / 장르별 막대그래프 그리기

fig = plt.figure(figsize = (15, 3))
ax = fig.add_subplot(111)

rows, cols = len(anime_genre_top10), len(anime_genre_top10.columns)
x = range(rows)

for i, t in enumerate(anime_genre_top10.columns):
    # i열부터 마지막까지의 합을 계산
    y = anime_genre_top10.iloc[:, i: cols].sum(axis = 1)
    
    ax.bar(x, y, label = t)

ax.set_xticks(range(rows))
ax.set_xticklabels(anime_genre_top10.index)
ax.set_ylabel('누적 멤버수')
ax.legend()

plt.show()               # 각 열에서 마지막 열까지의 합계 값을 y에 저장하고  Y값으로 그리고 있다.
                        # 배급 타입별에서는 어느 장르도 TV의 비율이 많은 것과 더불어 장르별로는 Comedy와 Action의 총멤버 수가 특히 많은 것을 확인할 수 있다.

# 히스토그램 Histogram

#### 히스토그램은 세로축에 횟수(값의 출현빈도), 가로축에 계급(값의 상한 값 ~ 하한 값의 폭)을 취급하는 그래프로, 데이터의 분포 형상을 시각적으로 인식하기 위해이용된다.
#### 데이터의 분포 형상(분포형)은 통계학적으로 중요한 의미를 가지고 있다.

In [None]:
# 히스토그램은 Axes.hist() 방법을 사용해서 작성한다.
# 평균값 100, 표준편차 10의 정규분포에 따라 만 개의 데이터 히스토그램을 그려 보았다.
# 예시 30.

import numpy as np
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')

plt.style.use('ggplot')

# 데이터 세트 작성
mu = 100 # 평균값
sigma = 10 # 표준편차
x = np.random.normal(mu, sigma, 10000)

# 히스트그램 그리기
fig = plt.figure()
ax = fig.add_subplot(111)
ax.hist(x)

plt.show()

# 막대의 폭과 수를 변경하는 경우

In [None]:
# hist() 방법에는 데이터 외에 히스토그램 그림에 관한 인수를 부여할 수 있다.
# rwidth로 막대의 폭을, bins로 막대의 개수를 지정하고 있다.
# 이와 같이 인수를 지정하면 막대의 폭이나 개수가 변경된 그래프가 출력됨.

# 예시 31. 인수를 설정한 히스토그램 그리기
fig = plt.figure()
ax = fig.add_subplot(111)
ax.hist(x, rwidth = 0.9, bins = 16)

plt.show()


# 히스토그램 활용하기

In [None]:
# 실제 데이터는 anime_master.csv 파일을 이용했다.\
# 예시 32.
import pandas as pd

anime_master = pd.read_csv('/content/drive/MyDrive/ColabNotebooks/Basic_Python/anime/anime_master.csv', index_col = 'anime_id', encoding = 'utf-8')
anime_master.head()

In [None]:
# 평점 분포에 대해 Matplotlib으로 시각화를 실행한다.
# 평점이 0 ~ 10의 범위에서 실행되고 있기 때문에 값의 범위를 range에서 0 ~ 10으로 지정한다.
# 6 ~ 7 사이의 데이터가 가장 많고 0 ~ 3이나 9 ~ 10의 데이터는 극단적으로 적은 것을 확인할 수 있다.

# 예시 33. 평점 시각화
fig = plt.figure()
ax = fig.add_subplot(111)

ax.hist(anime_master['rating'], range = (0, 10), rwidth = 0.9)
ax.set_title('평점')

plt.show()

In [None]:
# Q1. 위 예시처럼 에피소드 수도 히스토그램으로 그려보세요. 에피소드 수는 텔레비전 애니메이션의 00화라는 의미로,
#     영화의 경우에는 기본적으로 값이 1이 된다.
#     여기에서는 에피소드 수의 불균형이 크다고 예상되는 TV에 한정해서 시각화 해보세요.

fig = plt.figure()
ax = fig.add_subplot(111)
df_tv = anime_master['type'] == 'TV'

ax.hist(anime_master['    '], rwidth = 0.9) # 빈칸 채우기 1.
ax.set_title('     ')                       # 빈칸 채우기 2.

plt.show()

In [None]:
# 위 예시처럼 대부분의 데이터가 처음 계급으로 뭉쳐 있다. 
# 극히 일부 극단적으로 이야기 수가 많은 작품이 있기 때문에 이 같은 히스토그램이 되었다고 볼 수 있다.
# 그 같은 경우, 히스토그램 범위 지정이 유효하다.

# 예시 34. 히스토그램 범위 지정
fig = plt.figure()
ax = fig.add_subplot(111)

# range의 값을 (0, 100) 으로 지정한다.
ax.hist(df_tv['episodes'], rwidth = 0.9, range = (0, 100))
ax.set_title("Episodes(0-100)")

plt.show()      # TV 애니메이션은 텔레비전 방영 구조상, 1작품 분량(10 ~ 13화 정도) 또는 2작품 분량(23 ~ 25화 정도)의
                # 작품이 많다.
             

# 근사 곡선 추가

In [None]:
# 근사 곡선은 히스토그램을 그린 후에 꺾은선 그래프로 그린다. 여기에서는 정규분포를 이용해서 근사한다.

# 예시 35.
bins = 50 # 막대수
dfmin = np.min(anime_master['rating']) # 데이터 최솟값
dfmax = np.max(anime_master['rating']) # 데이터 최댓값

# 히스토그램 그리기
fig = plt.figure()
ax = fig.add_subplot(111)

ax.hist(anime_master['rating'], bins = bins, range = (dfmin, dfmax), density = True, rwidth = 0.9)

# 평균과 표준편차
mu, sigma = anime_master['rating'].mean(), anime_master['rating'].std()

# X값
x = np.linspace(dfmin, dfmax, bins) # 막대 단락

# 근사적 확률밀도함수를 사용해 Y값 생성
y = 1 / (sigma * np.sqrt(2 * np.pi)) * np.exp(-(x - mu) ** 2 / (2 * sigma**2))

# 근사곡선 그리기
ax.plot(x, y)

plt.show()

### 근사 곡선은 다음 단계로 그린다.
### (1) anime_master['rating'] 데이터 세트의 평균값과 표준편차 구하기
### (2) numpy.linespace로 각 막대 단락 값(막대의 상한값과 하한값) 구하기
### (3) 구해진 평균값, 표준편차, 단락값으로부터 정규분포의 확률밀도함수에 따라 Y값 산출하기
### (4) 구해진 X값과 Y값으로 근사 곡선 그리기

# 여러 그룹을 겹쳐서 그리기

In [None]:
# 같은 서브플롯에 히스토그램을 반복해서 그리면 여러 그룹의 히스토그램을 겹쳐서 그리는 것이 가능하다.
# 예시 36. 여러 그룹의 히스토그램을 겹쳐서 그리기

types = anime_master['type'].unique()
labels = types.tolist()

fig = plt.figure(figsize = (8, 6))
ax = fig.add_subplot(111)

b_num = np.arange(0, 10.5, 0.5)

for t in types:
    ax.hist(anime_master.loc[anime_master['type'] == t, 'rating'],
            bins = b_num,
            rwidth = 0.9,
            alpha = 0.5,
            label = t)
ax.legend()
ax.set_xlabel('rating')
ax.set_ylabel('Count(rating)')

plt.show()           # 평균이 0부터 10의 범위에서 실행되기 때문에 range() 함수를 사용해서 b_num에 0.5씩 0부터 10사이의 수치를 저장하고 있다.

# 여러 그룹을 나열하여 그리기

In [None]:
# 여러 그룹의 히스토그램을 겹쳐 그려서 시인성이 떨어지는 경우에는 그룹을 나열하는 방법이 있다.
# 중첩 리스트를 작성한 후 그리면 여러 그룹을 옆으로 나열한 히스토그램을 그릴 수 있다.

# 예시 37. 여러 그룹의 히스토그램 나열하여 그리기
# 데이터세트 작성
dataset = [anime_master.loc[anime_master['type'] == t, 'rating'] for t in types]

fig = plt.figure(figsize = ( 8 ,6 ))
ax = fig.add_subplot(111)

ax.hist(dataset, bins = np.arange(0, 10.5, 0.5),
        rwidth = 0.9, alpha = 0.8,
        label = labels)

ax.legend()
ax.set_xlabel('rating')
ax.set_ylabel('Count(rating)')

plt.show()

# 여러 그룹을 누적해서 그리기

In [None]:
# 여러 그룹의 히스토그램을 그려서 전체의 분포와 그 내역을 확인하는 경우에는 누적 히스토그램이 유효하다.
# 여러 그룹을 나열해서 그린 방법과 같이 데이터 세트를 작성한 후 인수 stacked 에 True를 지정해서 그리면 누적 히스토그램이 그려진다.

# 예시 38. 누적 히스토그램 그리기
fig = plt.figure(figsize = (8 ,6))
ax = fig.add_subplot(111)

ax.hist(dataset,
       bins = np.arange(0, 10.5, 0.5), 
                        rwidth = 0.9,
                        alpha = 0.7,
                        label = labels,
                        stacked = True)

ax.legend()
ax.set_xlabel('rating')
ax.set_ylabel('Count(rating)')

plt.show()

# 원그래프

#### 원그래프는 전체에 대한 각 요소의 비율을 추출하고, 추출한 비율에 따라 원형을 부채꼬로 분할한 그래프이다.
#### 원그래프는 각 요소의 비율을 비교할 때 이용된다.

# 원그래프 그리기

##### Matplotlib에서는 Axes.pie() 방법을 사용한다.
##### pie()방법의 제1 인수에 요소의 값을 부여해서 그릴 수 있다.


In [None]:
# 예시 39. 원그래프 그리기
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')

plt.style.use('ggplot')

labels = ['자전거','버스', '차']
sizes = [ 25, 40, 35]

fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

#  원 그래프 그리기
ax.pie(sizes, labels = labels)
plt.show()

##### Matplotlib의 초기 설정에서는 도수법으로 0도의 위치(시계 세 시의 위치)에서 반시계 방량으로 요소를 그려간다.
##### 중심 좌표는 (0, 0), 반경은 1이다.
##### 원의 중심 좌표가 (0,0), 처음 요소 '자전거'가 좌표(0.9, 0)에서 시작해서 부채꼴로 그려져 있는 것을 확인할 수 있다.
##### 계속해서 두 번째 요소 '버스'가 좌표(0,0.9)에서 시작해서 부채꼴로 그려져 있따.

In [None]:
# 예시 40. 원그래프와 축의 관계 그리기
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

ax.pie(sizes, labels = labels, radius = 0.9, frame = True)
ax.text(-0.3, 0, '(0,0)', fontsize = 9)

plt.show()

# 원그래프의 서식 설정을 하는 경우 (참고)

In [None]:
# 예시 41. 원그래프 서식 설정
# 원그래프 서식 설정

fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

# 부채꼴 서식 설정용 사전
wprops = {'edgecolor': 'black',
         'linewidth' : 2}

# 텍스트 서식 설정용 사전
tprops = {'fontsize' : 18}

ax.pie(sizes,
      explode = (0, 0.05, 0),
      labels = labels,
      autopct = '%1.0f%%',
      pctdistance = 0.5,
      shadow = False,
      labeldistance = 1.35,
      startangle = 90,
      radius = 0.3,
      counterclock = False,
      wedgeprops = wprops,
      textprops = tprops,
      center = (0.5, 0.5),
      frame = True)

plt.show()

# 원그래프 활용하기

In [None]:
# 실제 데이터는 anime_genre_top10_pivoted.csv 파일을 이용했다.
# 예시 42. 
import pandas as pd

anime_genre_top10 = pd.read_csv('/content/drive/MyDrive/ColabNotebooks/Basic_Python/anime/anime_genre_top10_pivoted.csv', index_col = 'genre', encoding = 'utf-8')
anime_genre_top10.head()

#### 원그래프는 데이터의 비율을 비교할 때 유용한 그래프이다.
#### 여기에서는 Movie와 TV의 총 멤버수 내역을 원그래프로 그려서 장르의 내역 비율을 비교한다.
#### 원그래프는 90도 위치에서 시계 방향으로 내림차순으로 요소를 나열하는 것이 일반적이다.
#### 먼저, TV와 Movie의 데이터를 각각 내림차순으로 정렬한 Series를 작성한다.

In [None]:
# 예시 43. 데이터 정렬
# TV
df_tv = anime_genre_top10.sort_values(by = 'TV', ascending = False)['TV']

# Movie
df_movie = anime_genre_top10.sort_values(by = 'Movie', ascending = False)['Movie']
df_tv         # 내림차순으로 정렬한 데이터(TV)

In [None]:
# 멤버 수가 많은 Comedy에서 내림차순으로 데이터가 나열되어 있다.
# 정렬한 Movie의 데이터를 사용해서 그래프를 그린다.

# 예시 44. TV와 Movie와의 장르 내역 비교를 위한 원그래프 그리기
fig = plt.figure(figsize = (9 ,4))
ax1 = fig.add_subplot(121)
ax2 = fig.add_subplot(122)

# 컬러 세트
colors1 = ('gold', 'coral','plum', 'orchid','lightseagreen',
           'yellowgreen', 'lightskyblue', 'pink','cornflowerblue',
           'orangered')
colors2 = ('coral', 'orangered','plum','gold',
           'cornflowerblue', 'yellowgreen', 'lightseagreen','orchid',
           'lightskyblue')

# TV 원그래프
ax1.pie(df_tv, 
        explode = (0, 0, 0, 0, 0, 0, 0.15, 0,0,0.15),
       labels = df_tv.index,
       autopct = '%1.0f%%',
       colors = colors1,
       startangle = 90, counterclock = False)

# Movie 원그래프
ax2.pie(df_movie,
        explode = (0, 0, 0, 0, 0, 0, 0.15, 0,0,0.15),
       labels = df_movie.index,
       autopct = '%1.0f%%',
       colors = colors2,
       startangle = 90, counterclock = False)

ax1.set_title('TV')
ax2.set_title('Movie')

fig.subplots_adjust(wspace = 0.3) # 서브블록 사이의 공간 조정

plt.show()    # 장르의 비교가 쉽도록 장르마다 색을 설정했다.
              # Adventure(모험물)와 School(학원물) 2개의 장르에 대해 다음과 같은 것을 알 수 있다.
              # Adventure(모험물)
              # - Movie에서는 14%(두 번째로 높음), TV에서는 7% (가장 낮음)
              # School(학원물)
              # - Movie에서는 2%, TV에서는 9%
              # 즉, 일상적으로 보는 텔레비전에서는 학교생활 같은 일상을 그린 것의 비율이 비교적으로 많은 것에 비해,
              # 영화에서는 비일상적인 모험이 그려진 비율이 높다는 짐작할 수 있다.

# Matplotlib을 활용해 보자!

#### Matplotlib에서는 원호, 화살표, 원형, 정다각형, 타원형, 부채꼴, 직사각형, 다각형과 같은 여러가지 모양의 도형을 matplotlib.patches 모듈로 그릴 수 있다.

# 원호 그리기

In [None]:
# 원호는 matplotlib.patches.Arc 클래스로 그린다.
# 원호를 그릴 때는 인수 xy에 듀플형으로 중심 좌표를, 인수 width와 height에 폭과 높이를, angle에 도수로 회전 각도를 지정한다.
# theta1과 theta2에는 각각 그림 시작과 종료 각도를 지정한다.
# 각도는 모두 0도의 위치를 기준으로 한다.

# 예시 45. 원호 그리기
import numpy as np
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')
import matplotlib.patches as mpatches

# Arc 원호
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

c1 = mpatches.Arc(xy = (0.4, 0.5), width = 0.4, height = 0.4, angle = 30,
                 theta1 = 0, theta2 = 230, linewidth = 10, color = 'lightblue')
c2 = mpatches.Arc(xy = (0.6, 0.5), width = 0.4, height = 0.4, angle = 30,
                 theta1 = 0, theta2 = 230, linewidth = 10, color = 'pink')

ax.add_patch(c1)
ax.add_patch(c2)

plt.show()

# 화살표 그리기

In [None]:
# 화살표는 matplotlib.patches.Arrrow 클래스로 그린다. 화살표를 그릴 때는 인수 x와 y에 각각 시작점 x 좌표와 y 좌표를, 
# dx와 dy에 시작점 좌표로부터의 폭과 높이를, width에 화살표의 폭을 지정한다.

# 예시 46. 화살표 그리기
# Arrow 화살표
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

a1 = mpatches.Arrow(x = 0.1, y = 0.4, dx = 0.6, dy = 0.5, width = 0.5, color = 'lightblue')
a2 = mpatches.Arrow(x = 0.3, y = 0.1, dx = 0.6, dy = 0.5, width = 0.5, color = 'pink')
ax.add_patch(a1)
ax.add_patch(a2)

plt.show()

# 화살표의 서식을 보다 상세하게 지정하고 싶은 경우

In [None]:
# 화살표의 서식을 보다 상세하게 지정하고 싶은 경우에는 matplotlib.patches.FancyArrow 클래스를 사용한다.
# FancyArrow 클래스를 사용한 경우 Arrow 클래스에서 지정 가능한 항목을 추가해서 head_width, head_length, shape와 같은 항목의 지정이 가능하게 된다.
# head_width는 화살표 끝의 폭, head_length는 화살표 끝의 길이를 지정하는 인수이다.
# shape는 화살표의 형태 지정으로 full(전체표시), left(좌측표시), right(우측표시) 지정이 가능하다.

# 예시 47. 화살표 그리기 2
# FancyArrow 화살표
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)
a1 = mpatches.FancyArrow(x = 0.2, y = 0.3, dx = 0.4, dy = 0.3, width = 0.1,
                        head_width = 0.3, head_length = 0.2, shape = 'right', color = 'lightblue')
a2 = mpatches.FancyArrow(x = 0.2, y = 0.3, dx = 0.4, dy = 0.3, width = 0.1,
                        head_width = 0.3, head_length = 0.2, shape = 'left', color = 'pink')

ax.add_patch(a1)
ax.add_patch(a2)

plt.show()


# 원형 그리기

In [None]:
# 원형은 matplotlib.patches.Circle 클래스로 그린다.
# 원형을 그릴 때는 인수 xy에 듀플형으로 중심 좌표를, radius에 반지름을 지정해서 그린다.
# 도너츠 모양이 그려져 있는 것처럼 보이는 것은 파란 원에 하얀 원을 겹쳐서 그리고 있기 때문이다.

# 예시 48. 원형 그리기

# Circle 원형
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)
c1 = mpatches.Circle(xy = (0.5, 0.5), radius = 0.4, color = 'lightblue')
c2 = mpatches.Circle(xy = (0.5, 0.5), radius = 0.2, color = 'white')
ax.add_patch(c1)
ax.add_patch(c2)

plt.show()

# 정다각형 그리기

#### 정다각형은 matplotlib.patches.CirclePolygon 클래스로 그린다. 정다각형의 인수는 원형의 경우와 기본적으로 같지만 resolution이 추가되는 점이 다르다.
#### resolution은 그린 원을 근사할 때의 변의 수이다.
#### resolution에 6(외측)과 8(내측)을 지정하고 있기 때문에 팔각형으로 흰 부분이 빠진 파란 육각형의 그림이 출력되어 있다.

In [None]:
# 예시 49. 정다각형 그리기

fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

cp1 = mpatches.CirclePolygon(xy = (0.5, 0.5), radius = 0.4, resolution = 6, color = 'lightblue')
cp2 = mpatches.CirclePolygon(xy = (0.5, 0.5), radius = 0.2, resolution = 8, color = 'white')

ax.add_patch(cp1)
ax.add_patch(cp2)

plt.show()


# 타원형 그리기

#### 타원형은 matplotlib.patches.Ellipse 클래스로 그린다.
#### 타원형을 그릴 때는 인수 xy에 중심 좌표를, width와 height에 폭과 높이를, angle에 회전 각도를 지정한다.

In [None]:
# 예시 50. 타원형 그리기
# Ellipse 타원형
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

e1 = mpatches.Ellipse(xy = (0.5, 0.5), width = 0.8, height = 0.5,
                     angle = 30, color = 'lightblue')
e2 = mpatches.Ellipse(xy = (0.5, 0.5), width = 0.5, height = 0.2,
                     angle = 30, color = 'white')

ax.add_patch(e1)
ax.add_patch(e2)

plt.show()


# 부채꼴 그리기

#### 부채꼴은 matplotlib.patches.Wedge 클래스로 그린다.
#### 부채꼴을 그릴 때는 인수 center에 중심 좌표를, r에는 반지름을 부여한다.
#### theta1과 theta2는 각각 베인 자국의 시작점과 종료점의 각도이다.

In [None]:
# Wedge 부채꼴
# 예시 51.
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

w1 = mpatches.Wedge(center = (0.3, 0.55), r = 0.25, theta1 = 30, theta2 = -30, color = 'pink')
w2 = mpatches.Wedge(center = (0.7, 0.4), r = 0.25, theta1 = 210, theta2 = 150, color = 'lightblue')

ax.add_patch(w1)
ax.add_patch(w2)

plt.show()


# 직사각형 그리기

#### 직사각형은 matplotlib.patches.Rectangle 클래스로 그린다. 직사각형을 그릴 때는 인수 xy에 직사각형 왼쪽 아래 각의 좌표를, width와 height에 지정한 좌표부터의 폭과 높이, angle에 회전 각도를 지정한다.

In [None]:
# 예시 52.직사각형 그리기
# Rectangle 직사각형 그리기
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

r1 = mpatches.Rectangle(xy = (0.1, 0.4), width = 0.5, height = 0.5, angle = 0, color = 'lightblue')
r2 = mpatches.Rectangle(xy = (0.4, 0.1), width = 0.5, height = 0.5, angle = 0, color = 'pink')

ax.add_patch(r1)
ax.add_patch(r2)

plt.show()


# 다각형 그리기

#### 다각형은 matplotlib.patches.Polygon 클래스로 그린다. 
#### 다각형을 그릴 때는 인수 xy에 다각형의 꼭지점 좌표를 지정한다.

In [None]:
# 예시 53. Polygon 다각형
fig = plt.figure(figsize =(3,3))
ax = fig.add_subplot(111)

p1 = mpatches.Polygon(xy = [(0, 0.2), (0.3, 0.8), (0.6, 0.2)], facecolor = 'lightblue')
p2 = mpatches.Polygon(xy = [(0.4, 0.8), (0.7, 0.2), (1.0, 0.8)], facecolor = 'pink')

ax.add_patch(p1)
ax.add_patch(p2)

plt.show()


# 서브플롯의 서식 설정하기

In [None]:
# 인수           | 설명
# facecolor      | 그리기 영역 색
# frame_on       | 그리기 유무(True = 그리기, False = 그리지 않음)
# xscale, yscale | 'linear', 'log', 'logit', 'symlog'

In [None]:
# 예시 54. 서브플롯 인수설정
fig = plt.figure(figsize = (3, 3))

# 서브플롯 서식 설정
ax = fig.add_subplot(111, facecolor = 'lightblue',
                    xlim = [0, 15],
                    ylim = [1, 10000],
                    yscale = 'log')

ax.plot([1, 5, 10], [10, 100, 1000])

plt.show()


# 서브플롯 사이의 여백 설정하기

In [None]:
#### 여백을 설정하지 않은 상태에서 서브플롯을 여러 개 그리면 축은 0부터 1의 범위로 그려져 인접한 그래프와 축 눈금 레이블이 서로 겹쳐진다.

# 예시 55. 초기 설정의 여백 설정으로 서브플롯 그리기
fig = plt.figure(figsize = (3, 3))

ax1 = fig.add_subplot(221)
ax2 = fig.add_subplot(222)
ax3 = fig.add_subplot(223)
ax4 = fig.add_subplot(224)

plt.show()

# 서브플롯 사이의 여백 조정하기

In [None]:
# 겹치는 것을 해결하기 위해서 subplots_adjust() 함수를 사용한다.
# 즉, 이 함수의 실행에 따라 서브플롯 사이의 여백이 조정된다.

# 예시 56. 서브플롯 사이의 여백을 조정해서 그리기
fig = plt.figure(figsize = (3, 3))

ax1 = fig.add_subplot(221)
ax2 = fig.add_subplot(222)
ax3 = fig.add_subplot(223)
ax4 = fig.add_subplot(224)

# 서브 플롯 사이의 여백 조정
fig.subplots_adjust(wspace = 0.5, hspace = 0.5)

plt.show()         # wspace와 hspace는 각각 행 방향과 열 방향에 합쳐지는 서브플롯 사이의 여백을 설정하는 항목이다.
                   # wspace는 테두리 폭의, hspace는 테두리 높이의 평균값을 각각 1로 한 경우의 비율로 부여한다.
                   # 그 외에도 좌우상하(left, right, top , bottom)의 여백 설정이 가능하다.
                   # 이들 값은 피겨 오브젝트의 폭, 높이를 각각 1로 한 경우의 비율로 부여한다.
            

In [None]:
# 예시 57. 서브플롯 주위 여백 조정
fig = plt.figure(figsize = (3, 3))

ax1 = fig.add_subplot(221)
ax2 = fig.add_subplot(222)
ax3 = fig.add_subplot(223)
ax4 = fig.add_subplot(224)

# 서브 플롯 주변의 공간 조정
fig.subplots_adjust(left = 0.2, right = 0.8, bottom = 0.2, top = 0.8)

plt.show()


# 색 지정과 컬러맵

#### 색과 불투명도 설정하기

#### Matplotlib에서는 다양한 색의 설정이 가능하다.
#### 옵션: 
#### color (오브젝트 색)
#### facecolor (채우기 색)
#### edgecolor (테두리선 색)

In [None]:
# 또한, 색의 설정과 동시에 불투명도를 alpha 옵션에서 설정할 수 있다.
# alpha는 0부터 1의 실수로 설정할 수 있다.
# alpha가 1인 경우 오브젝트는 완전히 불투명, 0 인 경우 완전히 투명이 된다.
# 변수 z의 플롯과 범례의 불투명도를 조정하고 있다.
# 플롯의 채우기 색은 color로, 테두리선의 색은 edgecolor로, 불투명도는 alpha로 지정되어 있다.
# 범례의 불투명도를 설정하는 경우에는 인수 framealpha에 값을 부여한다.

# 예시 58. 색 설정
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')
import numpy as np

x = np.arange(0, 6, 0.1)
y = np.sin(x)
z = np.cos(x)

fig = plt.figure()
ax = fig.add_subplot(111)

# 그리기
ax.scatter(x, y, label = 'sin', color = 'lightblue', edgecolor = 'blue')
ax.scatter(x, z, label = 'cos', color = 'lightblue', edgecolor = 'blue', alpha = 0.3)
ax.legend(framealpha = 1, loc = 'lower right')

plt.show()

# 컬러맵 이용하기

In [None]:
# 컬러맵은 색의 조합을 정의한 것으로 matplotlib.cm 모듈을 사용해서 설정할 수 있다.
# 예시 59. 컬러맵으로 색지정

import matplotlib.cm as cm

fig = plt.figure()
ax = fig.add_subplot(111)

x = np.arange(20)
y = np.arange(20)

ax.scatter(x, y + 5, color = cm.spring(0.5), label = 'spring(0.5)')
ax.scatter(x, y, color = cm.get_cmap('winter')(0.5), label = 'winter(0.5)')

ax.legend()

plt.show()

# 선의 서식 설정

### 선의 색과 굵기 설정하기

In [None]:
# 예시 60.
import matplotlib.pyplot as plt
import numpy as np
plt.style.use('ggplot')

x = np.array([0, 1])
y = [0, 1]

fig = plt.figure(figsize = (9, 3))
ax = fig.add_subplot(111, xlim = (-0.2, 4))

# 선의 굵기와 투명도를 설정하여 그리기
ax.plot(x, y, linewidth = 1, color = 'b', label = 'linewidth=1(alpha = 1.0)')
ax.plot(x + 0.1, y, linewidth = 1, color = 'b', alpha = 0.5, label = 'linewidth=1(alpha=0.5)')

ax.plot(x + 0.3, y, linewidth = 2, color = 'b', label = 'linewidth=2(alpha=1.0)')
ax.plot(x + 0.4, y, linewidth = 2, color = 'b', alpha = 0.5, label = 'linewidth=2(alpha=0.5)')
ax.plot(x + 0.7, y, linewidth = 5, color = 'b', label = 'linewidth=2(alpha=1.0)')
ax.plot(x + 0.8, y, linewidth = 5, color = 'b', alpha = 0.5, label = 'linewidth=5(alpha=0.5)')
ax.plot(x + 1.1, y, linewidth = 10, color = 'b', label = 'linewidth=10(alpha=1.0)')
ax.plot(x + 1.3, y, linewidth = 10, color = 'b', alpha = 0.5, label = 'linewidth=10(alpha=0.5)')

ax.legend()
plt.show()


# 선의 끝 모양 설정하기

In [None]:
# 선의 끝 모양은 solid_capstyle에서 설정한다. 끝 모양을 바꾼 선을 그려보았다.
# 예시 61. 선의 끝 모양 설정

x = [0.1, 1]
y = np.array([0, 0])

fig = plt.figure(figsize = (6, 3))
ax = fig.add_subplot(111, xlim = (0, 1.7), ylim = (-0.2, 1.2))

# 선의 끝 모양을 설정하고 그리기
ax.plot(x, y+ 1, linewidth=12, solid_capstyle = 'butt', label = 'butt')
ax.plot(x, y+ 0.5, linewidth=12, solid_capstyle = 'round', label = 'round')
ax.plot(x, y, linewidth=12, solid_capstyle = 'projecting', label = 'projecting')

ax.legend()

plt.show()


# 선 종류 설정하기

In [None]:
# 선의 종류는 linestyle에서 설정한다.
# 문자열, 기호, 튜플로 설정할 수 있다.
# 예시 62. 선 종류 설정

x = np.array([0, 1])
y = np.array([1.9, 1.9])

fig = plt.figure(figsize = (6,4))
ax = fig.add_subplot(111, xlim = (-0.1, 1.7), ylim = (0, 2))

# 선 종류를 설정하고 그리기
ax.plot(x, y, linewidth = 5, color = 'b', linestyle = 'solid', label = 'solid')
ax.plot(x, y - 0.1, linewidth = 5, color = 'b', alpha = 0.5, linestyle = '-', label = '-')

ax.plot(x, y - 0.4, linewidth = 5, color = 'b', linestyle = 'dashed', label = 'dashed')
ax.plot(x, y - 0.6, linewidth = 5, color = 'b', alpha = 0.5, linestyle = '--', label = '--')

ax.plot(x, y - 0.9, linewidth = 5, color = 'b', linestyle = 'dashdot', label = 'dashdot')
ax.plot(x, y - 1.0, linewidth = 5, color = 'b', alpha = 0.5, linestyle = '-.', label = '-.')

ax.plot(x, y - 1.3, linewidth = 5, color = 'b', linestyle = 'dotted', label = 'dotted')
ax.plot(x, y - 1.4, linewidth = 5, color = 'b', alpha = 0.5, linestyle = ':', label = ':')

ax.plot(x, y - 1.7, linewidth = 5, color = 'g', linestyle = (0, (5, 2)), label = '(0, (5, 2))')
ax.plot(x, y - 1.8, linewidth = 5, color = 'g', linestyle = (4, (5, 2)), label = '(0, (5, 2))')

ax.legend()

plt.show()

# 폰트와 텍스트상자 서식 설정

#### Matplotlib에서는 서브플롯의 이름, 폭 이름, 범례 등 다양한 문서 오브젝트에 대해 폰트와 텍스트상자의 서식을 설정할 수 있다.
#### 폰트의 서식은 matplotlib.font_manager.FontPropteries 클래스로, 텍스트상자에 관한 서식은 matplotlib.text.Text 클래스로 지정한다.

# 텍스트 그리기

In [None]:
# 예시 63. 텍스트 그리기
import matplotlib.pyplot as plt

fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

# 텍스트 그리기
ax.text(2, 4, 'Text', size = 40)

ax.set_xticks([i * 2 for i in range(6)])
ax.set_yticks([i * 2 for i in range(6)])

ax.grid(linestyle = '-') # 눈금선 그리기

plt.show()

# 폰트 서식 설정하기

In [None]:
# 폰트의 서식 세트를 사전형으로 작성해서 지정하는 방법도 있다.
# 예시 64. 폰트 설정
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

# 폰트 설정하고 텍스트 그리기
ax.text(0.2, 0.6, 'Text', alpha = 0.5, color = 'Red', size = 40)

# 폰트 설정하고 텍스트 그리기 (사전 사용)
fps = {
    'family' : 'fantasy',
    'style' : 'italic',
    'weight' : 'heavy',
    'size' : 40,
    'color' : 'Green'
}
ax.text(0.2, 0.2, 'Text', alpha = 0.5, color = 'Red', fontdict = fps)

ticks = [0.2 * i for i in range(6)]
ax.set_xticks(ticks)
ax.set_yticks(ticks)
ax.grid(linestyle = '-')

plt.show()     # 아래 그림의 상단은 폰트 설정을 직접 인수로 부여한 예, 
               # 하단은 사전으로 부여한 예이다.
               # 하단에서는 사전으로 색을 초록색으로 지정하고 있지만, 실제 그림 색은 직접 지정한 레드가 되어 있다.
               # 이처럼 사전으로 부여한 서식은 인수로 부여한 서식에 따라 덮어 쓰여진다.

# 텍스트상자 서식 설정하기

#### 텍스트상자의 서식은 인수 bbox에서 설정할 수 있다.
#### 텍스트상자의 채우기 색, 테두리 선의 색과 굵기 등을 지정할 수 있다.
#### 상단 문자열은 텍스트상자의 서식을 사전형식으로 부여해서 설정되어 있고,
#### 하단의 문자열은 서식을 개별로 부여해 설정하고 있다.

In [None]:
# 예시 64. 텍스트상자 서식 설정
fig = plt.figure(figsize = (3, 3))
ax = fig.add_subplot(111)

# 텍스트상자 서식 사전
boxprops = {
    'facecolor' : 'pink',
    'edgecolor' : 'red',
    'alpha'     : 0.5,
    'boxstyle'  : 'Sawtooth',
    'linewidth' : 2
}

# 텍스트상자 그리기
ax.text(0.07, 0.5, '텍스트 상자\n서식 사전에 따른\n설정', bbox = boxprops, size = 18)
ax.text(0.07, 0.2, '채우기색 설정', bbox = {'alpha' : 0.2}, backgroundcolor = 'Blue', size = 16)

ticks = [0.2 * i for i in range(6)]
ax.set_xticks(ticks)
ax.set_yticks(ticks)
ax.grid(linestyle = '-')

plt.show()

# 파일 출력

#### PNG나 SVG과 같은 형식으로 파일을 출력하는 방법과 출력할 때 피겨 조정 방법에 대해 설명한다.

## 파일 출력하기

In [None]:
# 파일 출력에는 savefig() 함수를 사용한다.
# 예시 65. 파일 출력

import matplotlib.pyplot as plt

fig = plt.figure()
ax = fig.add_subplot(111)

dat = [1, 3, 2]

ax.plot(dat)

fname = '/content/drive/MyDrive/ColabNotebooks/Basic_Python/save_fig.svg'     # 파일 저장 형식은 format 옵션에서 'PNG', 'PDF', 'PS, 'EPS', SVG 등을 지정할 수 있는데 
                           # 파일명을 저장하고 싶은 형식에 대해 확장자를 붙이는 것으로 저장 형식이 자동 판별된다.
plt.savefig(fname)

plt.show()