### 1. Pandas 이용해서 엑셀 파일을 파이썬에서 열기

- 파이썬에서 데이터 시각화를 하기 위해서는 우선 데이터 파일을 불러와야 함
- 엑셀 시트와 같은 테이블 형태의 데이터를 시각화할 일이 많음
- Pandas 패키지를 이용해서 보다 쉽게 테이블 데이터를 불러오고 적용할 수 있음

In [None]:
import pandas as pd

# load file
file_name = 'data/1/data.csv' # data 폴더 안에 1 폴더 안에 data.csv 라는 파일이 있음
data = pd.read_csv(file_name)

In [None]:
# 한번 데이터를 보겠습니다
data

In [None]:
# 한 column씩 보겠습니다
data.Close # 혹은 data['Close']

In [None]:
# 몇 개의 row를 선택해서 볼 수도 있습니다
data[100:102]

### 2. Matplotlib 이용해서 그래프 만들기

- Matplotlib은 가장 간단하면서 가장 대중적인 파이썬의 데이터 시각화 툴
- 테이블 데이터 등을 이용해서 쉽게 여러 그래프를 만들 수 있음
- 데이터를 이용한 시계열 그래프를 만듦

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
# 종가 (Close)가 1년동안 어떻게 바뀌는지 알아보고자 그래프를 그림
plt.plot(data.Close)
plt.show()

In [None]:
# 크기 조정을 위해서는 plt.figure 사용
plt.figure(figsize=(40,24))
plt.plot(data.Close)
plt.show()

In [None]:
# 색깔 및 두께 바꿔가면서 할 수도 있음
plt.figure(figsize=(40,24))
plt.plot(data.Close,linewidth=10, color='green')
plt.show()

In [None]:
# x축, y축에 표시된 값 크기 및 내용 변경, 제목 생성
plt.figure(figsize=(40,24))
plt.plot(data.Close,linewidth=10)
plt.suptitle('Change of close prices over last year', fontsize=80)
plt.xlabel('Date', fontsize=80)
plt.ylabel('Price', fontsize=80)
plt.show()

In [None]:
# x축에 표시된 값을 날짜로 변경 (날짜는 pandas Dataframe에서 찾을 수 있음)
plt.figure(figsize=(40,24))
plt.plot(data.Close,linewidth=10)
plt.suptitle('Change of close prices over last year', fontsize=80)
plt.xlabel('Date', fontsize=80)
plt.ylabel('Price', fontsize=80)
plt.rc('xtick', labelsize=50)
plt.rc('ytick', labelsize=50)
ax = plt.gca() # grab current axis
ax.set_xticks([0,50,100,150,200,250,300,350])
ax.set_xticklabels([data.Date[0],data.Date[50],
                    data.Date[100],data.Date[150],
                    data.Date[200],data.Date[250],
                    data.Date[300],data.Date[350]],
                   rotation=45)
plt.show()

In [None]:
# 다 그려진 그래프 위에서 특정 지점을 나타내고 텍스트를 넣어봅시다
plt.figure(figsize=(40,24))
plt.plot(data.Close,linewidth=10)
plt.suptitle('Change of Ripple prices over last year', fontsize=80)
plt.xlabel('Date', fontsize=80)
plt.ylabel('Price', fontsize=80)
plt.rc('xtick', labelsize=50)
plt.rc('ytick', labelsize=50)
ax = plt.gca() # grab current axis
ax.set_xticks([0,50,100,150,200,250,300,350])
ax.set_xticklabels([data.Date[0],data.Date[50],data.Date[100],data.Date[150],data.Date[200],data.Date[250],data.Date[300],
                    data.Date[350]],rotation=45)
p1 = 270
ax.annotate('purchase', 
            xy=(p1,data.Close[p1]), 
            xytext=(p1-20,data.Close[p1]+0.2), 
            arrowprops=dict(facecolor='red', 
                            shrink=0.05), 
            fontsize=60)
p2 = 280
ax.annotate('sell', xy=(p2,data.Close[p2]), xytext=(p2-10,data.Close[p2]-0.3), 
            arrowprops=dict(facecolor='black', shrink=0.05), fontsize=60)
p3 = 325
ax.annotate('purchase', xy=(p3,data.Close[p3]), xytext=(p3-30,data.Close[p3]+0.2), 
            arrowprops=dict(facecolor='red', shrink=0.05), fontsize=60)
p4 = 340
ax.annotate('sell', xy=(p4,data.Close[p4]), xytext=(p4+10,data.Close[p4]+0.2), 
            arrowprops=dict(facecolor='black', shrink=0.05), fontsize=60)
p5 = 360
ax.annotate('purchase', xy=(p5,data.Close[p5]), xytext=(p5,data.Close[p5]+0.2), 
            arrowprops=dict(facecolor='red', shrink=0.05), fontsize=60)
plt.show()

In [None]:
# 저장하기
# 다 그려진 그래프 위에서 특정 지점을 나타내고 텍스트를 넣어봅시다
plt.figure(figsize=(40,24))
plt.plot(data.Close,linewidth=10)
plt.suptitle('Change of Ripple prices over last year', fontsize=80)
plt.xlabel('Date', fontsize=80)
plt.ylabel('Price', fontsize=80)
plt.rc('xtick', labelsize=50)
plt.rc('ytick', labelsize=50)
ax = plt.gca() # grab current axis
ax.set_xticks([0,50,100,150,200,250,300,350])
ax.set_xticklabels([data.Date[0],data.Date[50],data.Date[100],data.Date[150],data.Date[200],data.Date[250],data.Date[300],
                    data.Date[350]],rotation=45)
p1 = 270
ax.annotate('purchase', 
            xy=(p1,data.Close[p1]), 
            xytext=(p1-20,data.Close[p1]+0.2), 
            arrowprops=dict(facecolor='red', 
                            shrink=0.05), 
            fontsize=60)
p2 = 280
ax.annotate('sell', xy=(p2,data.Close[p2]), xytext=(p2-10,data.Close[p2]-0.3), 
            arrowprops=dict(facecolor='black', shrink=0.05), fontsize=60)
p3 = 325
ax.annotate('purchase', xy=(p3,data.Close[p3]), xytext=(p3-30,data.Close[p3]+0.2), 
            arrowprops=dict(facecolor='red', shrink=0.05), fontsize=60)
p4 = 340
ax.annotate('sell', xy=(p4,data.Close[p4]), xytext=(p4+10,data.Close[p4]+0.2), 
            arrowprops=dict(facecolor='black', shrink=0.05), fontsize=60)
p5 = 360
ax.annotate('purchase', xy=(p5,data.Close[p5]), xytext=(p5,data.Close[p5]+0.2), 
            arrowprops=dict(facecolor='red', shrink=0.05), fontsize=60)
plt.savefig('Ripple chart.png')

### 3. Matplotlib 이용해서 다양한 시계열 데이터 간 비교

- 여러 개의 시계열 데이터 간 비교 그래프
- 범례 추가 등을 통한 가독성 향상

In [None]:
# 아까와 같이 데이터를 pandas 형태로 저장합니다
import pandas as pd
import os # 파일 디렉토리 확인 및 불러오기를 쉽게 해주는 패키지
file_dir = 'data/2/'
files = os.listdir(file_dir)
print(files)
coins = [x.split('.')[0] for x in files] # csv 빼고 이름만 남기게
print(coins)

In [None]:
# for문쓰면서 처리하기 쉽게 dictionary에다가 pandas dataframe 저장
coin_dict = dict()
for i,coin in enumerate(coins):
    filename = files[i] # .csv 달린 파일이름
    coin_dict[coin] = pd.read_csv(os.path.join(file_dir,filename))

In [None]:
# dictionary에 어떻게 저장되었는지 봅시다
coin_dict['bitcoin']

In [None]:
# 모든 값들을 다 넣어서 시각화해 봅시다
plt.figure(figsize=(40,20))
for coin in coins:
    plt.plot(coin_dict[coin].Close, linewidth=5)
plt.show()

In [None]:
# 범례를 넣어서 각각의 선을 파악할 수 있습니다
plt.figure(figsize=(40,20))
for coin in coins:
    plt.plot(coin_dict[coin].Close, 
             linewidth=5,
            label=coin)
plt.legend(loc='upper left',fontsize=50)
plt.show()

In [None]:
# 실제 증가량이 아닌, 증가비율로 봄으로써 상대적인 비교가 가능해집니다
import numpy as np # numpy: 행렬연산 및 여러 수학연산을 위한 간편한 패키지
plt.figure(figsize=(40,20))
# plt.suptitle('Change ratio of close prices over last year', fontsize=80)
# plt.xlabel('Date', fontsize=80)
# plt.ylabel('Increase', fontsize=80)
# plt.rc('xtick', labelsize=50)
# plt.rc('ytick', labelsize=50)
# ax = plt.gca() # grab current axis
# ax.set_xticks([0,50,100,150,200,250,300,350])
# ax.set_xticklabels([data.Date[0],data.Date[50],data.Date[100],data.Date[150],data.Date[200],data.Date[250],data.Date[300],
#                     data.Date[350]],rotation=45)
for coin in coins:
    # 첫번째 값으로 표준화 진행
    start = coin_dict[coin].Close[0] 
    normalized = coin_dict[coin].Close.tolist()
    normalized = np.array(normalized)
    normalized = normalized/start
    plt.plot(normalized,linewidth=5,
            label=coin)
plt.legend(loc='upper left',fontsize=50)
plt.show()

In [None]:
# 실제 증가량이 아닌, 증가비율로 봄으로써 상대적인 비교가 가능해집니다
import numpy as np # numpy: 행렬연산 및 여러 수학연산을 위한 간편한 패키지
plt.figure(figsize=(40,20))
plt.suptitle('Change ratio of close prices over last year', fontsize=80)
plt.xlabel('Date', fontsize=60)
plt.ylabel('Increase', fontsize=60)
plt.rc('xtick', labelsize=50)
plt.rc('ytick', labelsize=50)
ax = plt.gca() # grab current axis
ax.set_xticks([0,50,100,150,200,250,300,350])
ax.set_xticklabels([data.Date[0],data.Date[50],data.Date[100],data.Date[150],data.Date[200],data.Date[250],data.Date[300],
                    data.Date[350]],rotation=45)
for coin in coins:
    # 첫번째 값으로 표준화 진행
    start = coin_dict[coin].Close[0] 
    normalized = coin_dict[coin].Close.tolist()
    normalized = np.array(normalized)
    normalized = normalized/start
    plt.plot(normalized,linewidth=5,
            label=coin)
plt.legend(loc='upper left',fontsize=50)
plt.show()

In [None]:
# 이건 거래량 비교를 위한 그림입니다
import numpy as np # numpy: 행렬연산 및 여러 수학연산을 위한 간편한 패키지
plt.figure(figsize=(40,20))
plt.suptitle('Change of volume over last year', fontsize=80)
plt.xlabel('Date', fontsize=80)
plt.ylabel('Volume', fontsize=80)
plt.rc('xtick', labelsize=50)
plt.rc('ytick', labelsize=50)
ax = plt.gca() # grab current axis
ax.set_xticks([0,50,100,150,200,250,300,350])
ax.set_xticklabels([data.Date[0],data.Date[50],data.Date[100],data.Date[150],data.Date[200],data.Date[250],data.Date[300],
                    data.Date[350]],rotation=45)
for coin in coins:
    plt.plot(coin_dict[coin].Volume,linewidth=5, label=coin)
plt.legend(loc='upper left',fontsize=50)
plt.show()