# EDA 사용 설명서 4탄 - Plotly

## 1. Plotly란?
- Plotly: python 기반 오픈 소스 시각화 라이브러리로, interactive한 품질의 그래프를 만들 수 있음

#### [ 중요 모듈 ]
- graph_objects


    - plotly에서 제공하는 데이터 시각화를 위한 모듈
    
    - Low-level interface를 제공
    
    - 원하는 대로 그래프를 수정하고 제어할 수 있지만, 문법이 복잡하고 사용하기 어려움
    
    
    
- express


    - 사용하기 쉽도록 구현된 모듈
    
    - High-level interface를 제공
    
    - 약간의 코딩으로도 세련된 그래프를 그릴 수 있지만, 기능이 제한적임

## 2. 사전 준비

### 1) plotly 설치하기

In [1]:
!pip install plotly



### 2) plotly import

In [2]:
import plotly.express as px

# plotly 그래프를 표시하기 위한 코드
import plotly.io as pio
pio.renderers.default = 'notebook_connected'

### 3) 데이터 불러오기

In [3]:
iris = px.data.iris()
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,species_id
0,5.1,3.5,1.4,0.2,setosa,1
1,4.9,3.0,1.4,0.2,setosa,1
2,4.7,3.2,1.3,0.2,setosa,1
3,4.6,3.1,1.5,0.2,setosa,1
4,5.0,3.6,1.4,0.2,setosa,1


In [4]:
gapminder = px.data.gapminder()
gapminder.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.85303,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.10071,AFG,4
3,Afghanistan,Asia,1967,34.02,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4


In [5]:
tips = px.data.tips()
tips.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


## 3. Scatter Plot
- scatter(): 산점도를 그리는 함수


- color: seaborn의 hue와 같이 범주별로 다른 색상의 점으로 표시


- size: 그룹화 변수로 범주별로 점의 크기를 다르게 표시


- hover_data: 마우스 커서를 점에 위치시키면 표시되는 정보를 추가할 수 있음


- show(): 그래프를 표시하는 함수

In [7]:
fig = px.scatter(iris, x='sepal_width', y='sepal_length', color='species', size='petal_length', hover_data=['petal_width'])
fig.show()

![image-2.png](attachment:image-2.png)

## 4. Line Chart
- line(): 선 그래프를 그리는 함수


- title: 문자열을 지정하면 차트의 제목 추가할 수 있음


- color: 그룹화하여 범주별 다른 색상의 점 표시

In [8]:
df = gapminder.query("country == 'Canada'")
df.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
240,Canada,Americas,1952,68.75,14785584,11367.16112,CAN,124
241,Canada,Americas,1957,69.96,17010154,12489.95006,CAN,124
242,Canada,Americas,1962,71.3,18985849,13462.48555,CAN,124
243,Canada,Americas,1967,72.13,20819767,16076.58803,CAN,124
244,Canada,Americas,1972,72.88,22284500,18970.57086,CAN,124


In [9]:
fig = px.line(df, x='year', y='lifeExp', title='Life Expectancy in Canada')
fig.show()

![image-2.png](attachment:image-2.png)

In [10]:
df = px.data.gapminder().query("continent == 'Oceania'")
fig = px.line(df, x='year', y='lifeExp', color='country')
fig.show()

![image-2.png](attachment:image-2.png)

## 5. Box Plot
- box(): 상자 그림을 그리는 함수

In [11]:
fig = px.box(tips, y='total_bill')
fig.show()

![image.png](attachment:image.png)

In [12]:
fig = px.box(tips, x='time', y='total_bill')
fig.show()

![image.png](attachment:image.png)

## 6. Histogram
- histogram(): 히스토그램을 그리는 함수


- nbins: 히스토그램 빈의 개수를 설정 가능

In [13]:
fig = px.histogram(tips, x='total_bill')
fig.show()

![image.png](attachment:image.png)

In [14]:
fig = px.histogram(tips, x='total_bill', nbins=20)
fig.show()

![image.png](attachment:image.png)