In [None]:
from google.colab import drive , files
drive.mount('/content/drive')

In [None]:
#!unzip '/content/drive/MyDrive/Plotly Practice/archive.zip' -d '/content/drive/MyDrive/Plotly Practice/'

### Plotly Practice Code

In [None]:
# plotly install
!pip install plotly

In [None]:
# kaleido install
# 그림파일로 추출을 하려면 kaleido라는 패키지가 필요
!pip install kaleido

In [None]:
# statsmodels install
# 추세선 기능을 활용하기 위해서 statsmodels 패키지 추가 설치 필요
!pip install statsmodels

### Plotly 기초 그래프 생성

Plotly를 사용해서 그래프를 그릴때 사용하는 2가지 대표적인 방법이 존재.

1. graph_objects 모듈을 활용한 생성

2. express 모듈을 활용한 그래프 생성

- 각 장단점


|  | <b>장점</b> | <b>단점</b> |
|--|--|--|
| graph_objects| 그래프를 세세하게 구성 가능 | 코드가 길고 문법이 복잡하여 시간이 오래 걸리고 학습하기 어렵다 |
| express | 간단한 코드로 쉽게 그래프 표현 가능 | 정해진 템플릿 외 세세한 조정이 어려워 세세한 조정 필요시 graph_objects 도움이 필요함 |

In [None]:
# graph_objects

import plotly.graph_objects as go

# go.Figure() 함수를 활용해서 기본 그래프를 생성한다

fig = go.Figure(
    data = [go.Bar(x = [1,2,3] , y = [1,3,2])] ,
    layout = go.Layout(
        title = go.layout.Title(text = 'A Figure Specified By A Graph Object')
    )
)

fig.show()

In [None]:
# express

import plotly.express as px

fig = px.bar(x = ["a" , "b" , "c"] , y = [1 , 3 , 2] ,
             title = 'A Figure Specified By express')

fig.show()

In [None]:
# add_trace

fig = go.Figure()

fig.add_trace(go.Bar(x = [1,2,3] , y = [1,3,2]))

fig.show()

In [None]:
df = px.data.iris()

fig = px.scatter(df , x = 'sepal_width' , y = 'sepal_length' , color = 'species' ,
                 title = 'Using The add_trace() method with A Plotly Express Figure')

fig.add_trace(
    go.Scatter(
        x = [2 , 4] ,
        y = [4 , 8] ,
        mode = 'lines' ,
        line = go.scatter.Line(color = 'gray') ,
        showlegend = False
    )
)

fig.show()

In [None]:
# update_traces

from plotly.subplots import make_subplots

fig = make_subplots(rows = 1 , cols = 2)

fig.add_scatter(y = [4 , 2 , 2.5] , mode = 'markers' ,
                marker = dict(size = 20 , color = 'LightSeaGreen') ,
                name = 'a' , row = 1 , col = 1)

fig.add_bar(y = [2 , 1 , 3] ,
            marker = dict(color = 'MediumPurple') ,
            name = 'b' , row = 1 , col = 1)

fig.add_scatter(y = [2 , 3.5 , 4] , mode = 'markers' ,
                marker = dict(size = 20 , color = 'MediumPurple') ,
                name = 'c' , row = 1 , col = 2)

fig.add_bar(y = [1 , 3 , 2] ,
            marker = dict(color = 'LightSeaGreen') ,
            name = 'd' , row = 1 , col = 2)

# 한번에 Bar plot만 색을 파란색으로 바꾸기
fig.update_traces(marker = dict(color = 'RoyalBlue') ,
                  selector = dict(type = 'bar'))

fig.show()

In [None]:
# update_layout

fig = go.Figure(
    data = go.Bar(x = [1 , 2 , 3] , y = [1 , 3 , 2])
)

fig.update_layout(title_text = 'Using update_layout() With Graph Object Figures' ,
                  title_font_size = 30)

fig.show()

In [None]:
# update_xaxes() / update_yaxes()

df = px.data.tips()

x = df['total_bill']
y = df['tip']

fig = go.Figure(
    data = go.Scatter(x = x , y = y , mode = 'markers')
)

fig.update_xaxes(title_text = 'Total Bill ($)')
fig.update_yaxes(title_text = 'Tip ($)')

fig.show()

## 04-01 Plotly 그래프 사이즈 설정하기

In [None]:
# width , height 설정 가능

fig = px.bar(x = ['a','b','c'] , y = [1 , 3 , 2] , width = 600 , height = 400)

fig.show()

In [None]:
fig = go.Figure(
    data = [go.Bar(x = [1,2,3] ,
                   y = [1,3,2])]
)

fig.update_layout(width = 600 , height = 400)

fig.show()

In [None]:
# Margine 적용 방법

fig.update_layout(
    width = 600 ,
    height = 400 ,
    margin_l = 50 ,
    margin_r = 50 ,
    margin_b = 100 ,
    margin_t = 100 ,

    # Background color 지정 가능
    paper_bgcolor = 'LightSteelBlue'
)

fig.show()

## 04-02 Plotly 타이틀 설정하기

In [None]:
# express

fig = px.bar(x = ['a','b','c'] , y = [1 , 3 , 2] , title = 'Title 설정하기')
fig.show()

In [None]:
# graph_object

fig = go.Figure(
    data = [go.Bar(x = [1,2,3] , y=[1,3,2])] ,
    layout = go.Layout(title = go.layout.Title(text = 'Title 설정하기'))
)

fig.show()

In [None]:
# 두 방법 모두 커버하는 방법이 존재

fig.update_layout(title_text = '타이틀 입력')

In [None]:
# 위치 설정하기

fig = px.bar(x = ['a','b','c'] , y = [1 , 3 , 2] , title = 'Title 설정하기')

fig.update_layout(
    title_x = 0.5 ,
    title_y = 0.9 ,
    title_xanchor = 'center' ,
    title_yanchor = 'middle'
)

fig.show()

In [None]:
fig.update_layout(
    title_y = 0.9 ,
    title_x = 0.5 ,
    title_xanchor = 'center' ,
    title_yanchor = 'middle' ,
    title_font_size = 25 ,
    title_font_color = 'red' ,
    title_font_family = 'Times'
)

fig.show()

## 04-03 Plotly 축 범위 설정하기

In [None]:
df = px.data.iris()

fig = px.scatter(df , x = 'sepal_width' , y = 'sepal_length' , facet_col = 'species')

fig.update_xaxes(range = [0 , 5])
fig.update_yaxes(range = [0 , 10])

fig.show()

In [None]:
# 축 범위 역방향으로 지정하기

fig.update_xaxes(autorange = 'reversed')
fig.update_yaxes(autorange = 'reversed')

In [None]:
# Log 스케일 지정하기

# 데이터의 범위가 너무 넓은 경우에는 Log스케일로 축을 변환합니다.

import numpy as np

x = np.linspace(1 , 200 , 30)

fig = go.Figure(
    go.Scatter(x = x , y = x**3)
)

fig.update_xaxes(type = 'log')
fig.update_yaxes(type = 'log')

fig.show()

## 04-04 Plotly tick(눈금) / tick 레이블 표시 설정하기

In [None]:
df = px.data.iris()

fig = px.scatter(df , x = 'sepal_width' , y = 'sepal_length' , facet_col = 'species')

fig.update_xaxes(ticks = 'outside')
fig.update_yaxes(ticks = 'inside')

fig.show()

In [None]:
fig = px.scatter(df , x = 'sepal_width' , y = 'sepal_length' , facet_col = 'species')

fig.update_xaxes(ticks = 'outside')
fig.update_yaxes(ticks = 'inside' , col = 1)

fig.show()

In [None]:
fig.update_xaxes(ticks = 'outside' , dtick = 0.5)
fig.update_yaxes(ticks = 'inside' , dtick = 2)

fig.show()

In [None]:
# 스타일 설정

fig.update_xaxes(ticks = 'outside' , tickwidth = 2 , tickcolor = 'crimson' , ticklen = 10)
fig.update_yaxes(ticks = 'outside' , tickwidth = 2 , tickcolor = 'crimson' , ticklen = 10)

fig.show()

In [None]:
# minor tick 추가

df = px.data.tips()

fig = px.scatter(df , x = 'total_bill' , y = 'tip' , color = 'sex')

fig.update_xaxes(ticks = 'outside' , tickwidth = 2 , tickcolor = 'crimson' , ticklen = 10)
fig.update_yaxes(ticks = 'outside' , tickwidth = 2 , tickcolor = 'crimson' , ticklen = 10)

fig.update_xaxes(minor_ticks = 'outside' , minor_tickcolor = 'black')
fig.update_yaxes(minor_ticks = 'outside' , minor_tickcolor = 'black')

fig.show()

In [None]:
# plotly 에서는 레이블이 자동으로 생성이 된다.
# 만약 레이블의 위치를 지정하고 싶은 경우에는 ticklabelposition을 사용한다

df = px.data.iris()

fig = px.scatter(df ,
                 x = 'sepal_width' ,
                 y = 'sepal_length' ,
                 facet_col = 'species')

fig.update_yaxes(ticklabelposition = 'inside top')
fig.update_xaxes(ticklabelposition = 'inside left')

fig.show()

## 04-05 Plotly 그리드 설정하기

In [None]:
df = px.data.iris()

fig = px.scatter(df , x = 'sepal_width' , y = 'sepal_length' , facet_col = 'species')

fig.update_xaxes(showgrid = True , minor_showgrid = True , col = 1)
fig.update_yaxes(showgrid = True , minor_showgrid = True , col = 1)

fig.show()

In [None]:
fig = px.scatter(df , x = 'sepal_width' , y = 'sepal_length' , facet_col = 'species')

fig.update_xaxes(minor_showgrid = True , griddash = 'dash' , gridcolor = 'black' , minor_griddash = 'dot' , minor_gridcolor = 'LightPink')
fig.update_yaxes(minor_showgrid = True , griddash = 'dash' , gridcolor = 'black' , minor_griddash = 'dot' , minor_gridcolor = 'LightPink')

fig.show()

## 04-06 Plotly 여러개의 그래프 겹쳐 그리기

In [None]:
# 그래프를 겹쳐 그리는 방법은 2단계를 거칩니다.

# 1. Base 그래프 그리기

# 2. 추가 그래프 그리기 (add_trace()를 사용)

In [None]:
# 1. Base 그래프 그리기

fig = px.scatter(
    x = [0 , 1 , 2 , 3 , 4] ,
    y = [0 , 1 , 4 , 9 , 16] ,
    size = [20] * 5
)

fig.show()

In [None]:
# 2. 추가 그래프 그리기

fig.add_trace(
    go.Scatter(
        x = [0 , 1 , 2 , 3 , 4] ,
        y = [0 , 1 , 4 , 9 , 16]
    )
)

fig.show()

In [None]:
np.random.seed(1)

N = 100
random_x = np.linspace(0 , 1 , N)
random_y0 = np.random.randn(N) + 5
random_y1 = np.random.randn(N)
random_y2 = np.random.randn(N) - 5

fig = go.Figure()

fig.add_trace(
    go.Scatter(
        x = random_x ,
        y = random_y0 ,
        mode = 'lines' ,
        name = 'lines'
    )
)

fig.add_trace(
    go.Scatter(
        x = random_x ,
        y = random_y1 ,
        mode = 'lines+markers' ,
        name = 'markers'
    )
)

fig.add_trace(
    go.Scatter(
        x = random_x ,
        y = random_y2 ,
        mode = 'markers' ,
        name = 'markers'
    )
)

fig.show()

## 04-07 Plotly 여러개의 그래프 나눠 그리기

In [None]:
# 그래프를 나눠서 그리는 방법도 2단계를 거친다

# 1. 그래프를 나누어 그릴 공간 생성
# make_subplots()를 통해서 생성된다.

# 2. 각 공간에 Trace 채워 넣기
# fig.add_trace()를 활용해서 채운다.
# 이때 , row , col를 사용해서 index를 지정한다.

In [None]:
fig = make_subplots(rows = 1 , cols = 2)

In [None]:
fig.add_trace(
    go.Scatter(
        x = [1 , 2 , 3] ,
        y = [4 , 5 , 6]) ,
        row = 1 ,
        col = 1
)

fig.add_trace(
    go.Scatter(
        x = [20 , 30 , 40] ,
        y = [50 , 60 , 70]) ,
        row = 1 ,
        col = 2
)

fig.show()

In [None]:
# 서브 타이틀을 달 수 있다

fig = make_subplots(rows = 1 , cols = 2 ,
                    subplot_titles = ('First' , 'Second'))

fig.add_trace(
    go.Scatter(
        x = [1 , 2 , 3] ,
        y = [4 , 5 , 6]) ,
        row = 1 ,
        col = 1
)

fig.add_trace(
    go.Scatter(
        x = [20 , 30 , 40] ,
        y = [50 , 60 , 70]) ,
        row = 1 ,
        col = 2
)

fig.show()

In [None]:
# 각 공간별로 크기 비율 지정하기

fig = make_subplots(
    rows = 2 , cols = 2 ,
    column_widths = [0.7 , 0.3] ,
    row_heights = [0.7 , 0.3]
)

fig.add_trace(
    go.Scatter(
        x = [1 , 2 , 3] ,
        y = [4 , 5 , 6] ,
    ) ,
    row = 1 , col = 1
)

fig.add_trace(
    go.Scatter(
        x = [20 , 30 , 40] ,
        y = [50 , 60 , 70]
    ) ,
    row = 1 , col = 2
)

fig.add_trace(
    go.Scatter(
        x = [300 , 400 , 500] ,
        y = [600 , 700 , 800]
    ) ,
    row = 2 , col = 1
)

fig.add_trace(
    go.Scatter(
        x = [4000 , 5000 , 6000] ,
        y = [7000 , 8000 , 9000]
    ) ,
    row = 2 , col = 2
)

fig.show()

In [None]:
# 분할 공간 합병하기

fig = make_subplots(
    rows = 2 , cols = 2 ,
    specs = [[{} , {}] ,
             [{"colspan" : 2} , None]] ,
    subplot_titles = ('First Subplot' , 'Second Subplot' , 'Third Subplot')
)

fig.add_trace(
    go.Scatter(
        x = [1 , 2] ,
        y = [1 , 2]
    ) ,
    row = 1 , col = 1
)

fig.add_trace(
    go.Scatter(
        x = [1 , 2] ,
        y = [1 , 2]
    ) ,
    row = 1 , col = 2
)

fig.add_trace(
    go.Scatter(
        x = [1 , 2 , 3] ,
        y = [2 , 1 , 2]
    ) ,
    row = 2 , col = 1
)

fig.update_layout(showlegend = False ,
                  title_text = 'Specs with Subplot Title')

fig.show()

# specs = [[{} , {}] , [{"colspan" : 2} , None]]
# 여기서 1행의 그래프는 그대로 사용하기 때문에 아무것도 안 하는 {}를 표시
# 2행부터는 합병하기 때문에 {}안에 정보를 넣어서 합병

## 04-08 Plotly 범례 지정하기 (Legend)

In [None]:
# 범례 생성하기

df = px.data.tips()

df.head()

In [None]:
# express는 범례가 자동으로 생성됩니다.
# color 패러미터를 사용

fig = px.scatter(df , x = 'total_bill' , y = 'tip' , color = 'sex')

fig.show()

In [None]:
# graph_objects의 경우 두단계의 과정을 거칠 필요가 있습니다.

# 1.데이터 가공

Female = df.loc[df['sex'] == 'Female' , :]
Female.head()

Male = df.loc[df['sex'] == 'Male' , :]
Male.head()

In [None]:
# 2. 그래프 그리기

fig = go.Figure()

fig.add_trace(
    go.Scatter(
        x = Female.total_bill ,
        y = Female.tip ,
        mode = 'markers' ,
        name = 'Female'
    )
)

fig.add_trace(
    go.Scatter(
        x = Male.total_bill ,
        y = Male.tip ,
        mode = 'markers' ,
        name = 'Male'
    )
)

fig.show()

In [None]:
# 범례 위치 지정하기

fig = px.scatter(df , x = 'total_bill' , y = 'tip' , color = 'sex')

fig.update_layout(
    legend_yanchor = 'top' ,
    legend_y = 0.99 ,
    legend_xanchor = 'left' ,
    legend_x = 0.01
)

fig.show()

In [None]:
# 범례 스타일 지정

fig = px.scatter(df , x = 'total_bill' , y = 'tip', color = 'sex')

fig.update_layout(
    legend_title_text = '성별' ,
    legend_title_font_family = 'Times New Roman' ,
    legend_title_font_color = 'red' ,
    legend_title_font_size = 20 ,
    legend_font_family = 'Courier' ,
    legend_font_size = 12 ,
    legend_font_color = 'black' ,
    legend_bgcolor = 'LightSteelBlue' ,
    legend_bordercolor = 'Black' ,
    legend_borderwidth = 2
)

fig.show()

## 04-09 Plotly 수직선 / 수평선 / 사각영역 그리기

In [None]:
# 데이터 불러오기
df = px.data.iris()

# 그래프 그리기
fig = px.scatter(df , x = 'petal_length' , y = 'petal_width')

# 수평선 추가하기
fig.add_hline(y = 0.9 , line_width = 3 ,
              line_dash = "dash" ,
              line_color = 'green' ,
              annotation_text = '수평선' ,
              annotation_position = 'bottom right' ,
              annotation_font_size = 20 ,
              annotation_font_color = 'green' ,
              annotation_font_family = 'Times New Roman')

fig.add_vline(x = 3 , line_width = 3 ,
              line_dash = 'dash' ,
              line_color = 'red' ,
              annotation_text = '수직선' ,
              annotation_position = 'top left' ,
              annotation_font_size = 20 ,
              annotation_font_color = 'red' ,
              annotation_font_family = 'Times New Roman')

fig.show()

In [None]:
# 데이터 불러오기
df = px.data.iris()

# 그래프 그리기
fig = px.scatter(df , x = 'petal_length' , y = 'petal_width')

# 수직 사각 영역 추가하기
fig.add_vrect(x0 = 3 , x1 = 5 , line_width = 0 , fillcolor = 'green' , opacity = 0.2 ,
              annotation_text = '수직 영역' ,
              annotation_position = 'bottom right' ,
              annotation_font_size = 20 ,
              annotation_font_color = 'green' ,
              annotation_font_family = 'Times New Roman'
              )

# 수평 사각 영역 추가하기
fig.add_hrect(y0 = 0.9 , y1 = 1.5 , line_width = 0 , fillcolor = 'red' , opacity = 0.2 ,
              annotation_text = '수평 영역' ,
              annotation_position = 'top left' ,
              annotation_font_size = 20 ,
              annotation_font_color = 'red' ,
              annotation_font_family = 'Times New Roman')

fig.show()

In [None]:
# 시계열 데이터에서 수평선 / 사각영역 그리기

# 시계열 데이터의 경우에는 일정 기간을 표기하기 위해서 사각 영역을 표시하는 경우가 많다.

# 주식 데이터 Load
df = px.data.stocks(indexed = True)

# 그래프 그리기
fig = px.line(df)

# 수평선 그리기
fig.add_hline(y = 1 , line_dash = 'dot' ,
              annotation_text = 'Jan 1, 2018 baseline' ,
              annotation_position = 'bottom right' ,
              annotation_font_size = 20 ,
              annotation_font_color = 'blue'
)

# 수직 영역 그리기
fig.add_vrect(x0 = '2018-09-24' , x1 = '2018-12-18' ,
              annotation_text = 'decline' , annotation_position = 'top left' ,
              annotation = dict(font_size = 20 , font_family = 'Times New Roman') ,
              fillcolor = 'green' , opacity = 0.25 , line_width = 0)
fig.show()

## 04-10 Plotly Color 활용하기(Colormap)

In [None]:
# CSS색 이름으로 넣기

fig = px.bar(x = ['a','b','c'] , y = [1 , 3 , 2] ,
             color = ['red','green','blue'] ,
             color_discrete_map = 'identity')

fig.show()

In [None]:
# RGB 값으로 넣기

fig = px.bar(x = ['a','b','c'] , y = [1 , 3 , 2] ,
             color = ['rgb(255,0,0)' , 'rgb(0,128,0)' , 'rgb(0,0,255)'] ,
             color_discrete_map = 'identity')

fig.show()

In [None]:
# Color Code로 입력

fig = px.bar(x = ['a','b','c'] , y = [1 , 3 , 2] ,
             color = ['#FF0000' , '#008000' , '#0000FF'] ,
             color_discrete_map = 'identity')

fig.show()

In [None]:
# Plotly에는 4개의 colormap set이 존재한다.

# 1) 불연속 데이터용 Colormap --> Bar차트와 같은 범주형 데이터나 Label이 필요한 구분에 사용

# 2) 연속 데이터용 Colormap --> 수치데이터와 같은 연속형 데이터를 표현하기에 용이

# 3) 발산 데이터용 Colormap --> 중간에 흰색으로 수렴하는 연속형 Colormap

# 4) 순환 데이터용 Colormap --> 순환하는 시간 데이터 (시간 , 요일 , 계절)에 사용하기 용이한 Colormap

In [None]:
# Plotly Colormap 사용방법

# Bar차트에 컬러맵 적용하기 (불연속 데이터)
df = px.data.gapminder().query('year == 2007')

fig = px.bar(df , y = 'continent' , x = 'pop' , color = 'continent' ,
             color_discrete_sequence = px.colors.qualitative.G10)

fig.show()

In [None]:
# 산점도 그래프에 컬러맵 적용하기 (연속형 데이터)

df = px.data.iris()

fig = px.scatter(df , x = 'sepal_width' , y = 'sepal_length' ,
                 color = 'sepal_length' ,
                 color_continuous_scale = px.colors.sequential.Viridis)

fig.show()

In [None]:
# graph_objects

fig = go.Figure()

values = list(range(40))

fig.add_trace(
    go.Scatter(
        x = values ,
        y = values ,
        marker_size = 16 ,
        marker_cmax = 39 ,
        marker_cmin = 0 ,
        marker_color = values ,
        marker_colorbar_title = 'Colorbar' ,
        marker_colorscale = 'Viridis' ,
        mode = 'markers'
    )
)

fig.show()

## 04-11 Plotly 템플릿 활용하기

In [None]:
# 템플릿 종류 확인하기

import plotly.io as pio
pio.templates

In [None]:
df = px.data.gapminder()
df_2007 = df.query('year == 2007')

for template in ['ggplot2' , 'seaborn' , 'simple_white' , 'plotly' ,
                 'plotly_white' , 'plotly_dark' , 'presentation' , 'xgridoff' ,
                 'ygridoff' , 'gridon']:

                 fig = px.scatter(df_2007 ,
                                  x = 'gdpPercap' , y = 'lifeExp' ,
                                  size = 'pop' , color = 'continent' ,
                                  log_x = True , size_max = 60 ,
                                  template = template ,
                                  title = 'Gapminder 2007 : \'{}\' theme'.format(template))

                 fig.show()

In [None]:
# 템플릿 적용하기

# default 템플릿 지정하기

pio.templates.default = 'plotly_dark'

In [None]:
# express 에서 템플릿 지정하기

fig = px.scatter(df_2007 , x = 'gdpPercap' , y = 'lifeExp' ,
                 template = 'plotly_dark')

In [None]:
# graph_objects 에서 템플릿 지정하기

fig.update_layout(template = 'plotly_dark')

## 04-12 Plotly 파일로 추출하기

In [None]:
df = px.data.tips()

fig = px.histogram(df , x = 'sex' ,
                   y = 'tip' ,
                   histfunc = 'sum' ,
                   facet_col = 'smoker' ,
                   color = 'sex' ,
                   color_discrete_sequence = px.colors.qualitative.G10
                   )

fig.show()

# PNG파일로 저장하기
fig.write_image('fig.png')