## Scatter Plot 산점도

Plotly에서 그래프를 그리는 방법이 크게 두가지로 나뉨.

1. Express를 통해서 그리는 방법
2. Graph_objects를 통해서 그리는법


### 1.Express

In [49]:
import plotly.express as px # Express를 통해서 그리기

fig = px.line(x=['a','b','c'], y=[1,3,2], title = 'Sample figure')
print(fig)
fig.show()

Figure({
    'data': [{'hoverlabel': {'namelength': 0},
              'hovertemplate': 'x=%{x}<br>y=%{y}',
              'legendgroup': '',
              'line': {'color': '#636efa', 'dash': 'solid'},
              'mode': 'lines',
              'name': '',
              'showlegend': False,
              'type': 'scatter',
              'x': array(['a', 'b', 'c'], dtype=object),
              'xaxis': 'x',
              'y': array([1, 3, 2]),
              'yaxis': 'y'}],
    'layout': {'legend': {'tracegroupgap': 0},
               'template': '...',
               'title': {'text': 'Sample figure'},
               'xaxis': {'anchor': 'y', 'domain': [0.0, 1.0], 'title': {'text': 'x'}},
               'yaxis': {'anchor': 'x', 'domain': [0.0, 1.0], 'title': {'text': 'y'}}}
})


* fig 객체는 기본적으로 JSON 형식으로 데이터가 그려짐.
* fig를 print하면 다음과 같이 JSON 형식의 데이터를 볼 수 있다.

In [50]:
# Scatter plot with Plotly Express

df = px.data.iris()

fig = px.scatter(df, x='sepal_width', y='sepal_length',
                    color='species', # Species 열의 값에 따라 크기를 변화
                    hover_data=['petal_width'],# 참고할 데이터 추가
                    title = 'Iris Data - Scatter Plot')

fig.show()

In [51]:
# 위의 산점도 그래프에서 color, size 를 넣지 않으면 크기가 기본 값, 색도 모두 기본 색상으로 표현됨

fig = px.scatter(df, x="sepal_width", y="sepal_length",
                 hover_data=['petal_width'], # 참고할 데이터 추가
                 title='Iris Data - Scatter Plot' # 그래프 타이틀 지정
                )
fig.show()

### Scatterplot with Plotly Graph-object

* 줄여서 go라고 많이 사용함.

* go를 통해서 Figure객체를 선언하고 Figure내에 필요한 Data와 Layout등을 설정해주는 방식.

* 조금은 더 번거롭거나 귀찮을 수 있지만, 자신이 원하는 방식으로 상세하게 커스터마이징 해서 그래프를 그리고 싶다면 graph_objects를 사용하는 것이 좋다.

In [52]:
import plotly.graph_objects as go

fig = go.Figure(data=go.Scatter( # x축 값을 생략한 경우 DataFrame의 Index에 의해 배치됨
    y = df['sepal_length'], # y축 값 sepal_length 값에 따라 배치
    mode='markers', # Scatter Plot을 그리기 위해 Markers 
    marker=dict(    # Marker에 대한 세부적은 설정을 지정
        size=20,    # 점 크기
        color=df['petal_length'], # 색깔 값을 petal_length에 따라 변하도록 설정 
        colorscale='Viridis', # one of plotly colorscales
        showscale=True,  # colorscales 보여줌
        line_width=1, # 마커 라인 두께 설정
    )
))
fig.update_layout(title='Iris Data')
fig.show()

### Plotly Express - Lineplot

* express 객체를 통해서 lineplot을 그릴 수 있다.

In [53]:
import plotly.express as px

df = px.data.gapminder()
df.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.85303,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.10071,AFG,4
3,Afghanistan,Asia,1967,34.02,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4


In [54]:
# Canada에 해당되는 부분만 선택해서 그래프 그리기

fig = px.line(df[df['country'] == 'Canada'],
              x='year',
              y= 'lifeExp',
              title = 'Life expectancy in Canada')

fig.show()

In [55]:
# 대륙별로 색깔을 다르게 지정하고, line을 국가별로 선택하는 옵션

fig = px.line(df, x='year', y='lifeExp',
              title = 'Life expectancy in Canada',
              color = 'continent', # seaborn의 hue
              line_group = 'country',
              hover_name = 'country')

fig.show()

### Plotlt - graph_objects - Scatter plot line plot

* graph_objects를 통해서 line plot을 그릴 때는 주로 Scatter를 사용해서 시각화함.

* Scatter 산점도를 사용하되, mode를 line or marker를 선택해서 line그래프를 그림.

* marker를 통해서 값을 좀 더 자세하게 볼 수도 있음.


In [56]:
import plotly.graph_objects as go


# Create random data with numpy
import numpy as np
np.random.seed(1)

N = 100
random_x = np.linspace(0, 1, N)
random_y0 = np.random.randn(N) + 5
random_y1 = np.random.randn(N)
random_y2 = np.random.randn(N) - 5

# Create traces
fig = go.Figure()
fig.add_trace(go.Scatter(x=random_x, y=random_y0,
                    mode='lines', # Line plot만 그리기
                    name='lines'))
fig.add_trace(go.Scatter(x=random_x, y=random_y1,
                    mode='lines+markers', # Line Plot에 마커찍기
                    name='lines+markers'))
fig.add_trace(go.Scatter(x=random_x, y=random_y2,
                    mode='markers', # 마커만 찍기
                    name='markers'))

fig.show()

### Plotly - graph_objects - Scatter & Line plot - 옵션

* plotly는 전체적으로 JSON 형식을 사용하기에 dictionary 형태로 옵션을 설정해주는 경우가 많다.

* line plot을 그리는데 상세한 옵션을 선택해줄 수 있다.

* line이라는 변수에 dict형태로 어떻게 라인을 설정할 것이지 지정해 준다.

* 색깔이나 두께 혹은 그리는 방식(dash or dot) 등으로 표현할 수 있다.

In [57]:
import plotly.graph_objects as go

# 데이터를 생성하는 부분 List로 데이터를 생성
month = ['January', 'February', 'March', 'April', 'May', 'June', 'July',
         'August', 'September', 'October', 'November', 'December']
high_2000 = [32.5, 37.6, 49.9, 53.0, 69.1, 75.4, 76.5, 76.6, 70.7, 60.6, 45.1, 29.3]
low_2000 = [13.8, 22.3, 32.5, 37.2, 49.9, 56.1, 57.7, 58.3, 51.2, 42.8, 31.6, 15.9]
high_2007 = [36.5, 26.6, 43.6, 52.3, 71.5, 81.4, 80.5, 82.2, 76.0, 67.3, 46.1, 35.0]
low_2007 = [23.6, 14.0, 27.0, 36.8, 47.6, 57.7, 58.9, 61.2, 53.3, 48.5, 31.0, 23.6]
high_2014 = [28.8, 28.5, 37.0, 56.8, 69.7, 79.7, 78.5, 77.8, 74.1, 62.6, 45.3, 39.9]
low_2014 = [12.7, 14.3, 18.6, 35.5, 49.9, 58.0, 60.0, 58.6, 51.7, 45.2, 32.2, 29.1]

fig = go.Figure()
# Create and style traces
fig.add_trace(go.Scatter(x=month, y=high_2014, name='High 2014',
                         line=dict(color='firebrick', width=4))) # Line에 옵션 선택
fig.add_trace(go.Scatter(x=month, y=low_2014, name = 'Low 2014',
                         line=dict(color='royalblue', width=4)))
fig.add_trace(go.Scatter(x=month, y=high_2007, name='High 2007',
                         line=dict(color='firebrick', width=4,
                              dash='dash') # dash options include 'dash', 'dot', and 'dashdot'
))

fig.add_trace(go.Scatter(x=month, y=low_2007, name='Low 2007',
                         line = dict(color='royalblue', width=4, dash='dash')))
fig.add_trace(go.Scatter(x=month, y=high_2000, name='High 2000',
                         line = dict(color='firebrick', width=4, dash='dot')))
fig.add_trace(go.Scatter(x=month, y=low_2000, name='Low 2000',
                         line=dict(color='royalblue', width=4, dash='dot')))

# Edit the layout
fig.update_layout(title='Average High and Low Temperatures in New York',
                   xaxis_title='Month',
                   yaxis_title='Temperature (degrees F)')


fig.show()