# **Plotly**

### **1) plotly 설치하기**



다음 명령으로 plotly 라이브러리를 설치합니다.

In [1]:
!pip install plotly



### **2) plotly import하기**



In [1]:
import plotly.express as px

### **3) 데이터 불러오기**



In [2]:
iris = px.data.iris()
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,species_id
0,5.1,3.5,1.4,0.2,setosa,1
1,4.9,3.0,1.4,0.2,setosa,1
2,4.7,3.2,1.3,0.2,setosa,1
3,4.6,3.1,1.5,0.2,setosa,1
4,5.0,3.6,1.4,0.2,setosa,1


In [3]:
## gapminder 데이터는 국가별 년도별 life expectancy, GDP per capita, 그리고 population에 대한 데이터입니다.
gapminder = px.data.gapminder()
gapminder.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.85303,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.10071,AFG,4
3,Afghanistan,Asia,1967,34.02,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4


In [4]:
tips = px.data.tips()
tips.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


<br>

## **3. Scatter Plot**

ㅤ**✔ㅤscatter()**는 산점도를 그리는 함수입니다.
<br><br>
ㅤ**✔ㅤcolor** 파라미터를 사용하면 seaborn의 hue 파라미터와 같이 범주별로 다른 색상의 점으로 표시합니다.
<br><br>
ㅤ**✔ㅤsize** 파라미터 역시 그룹화 변수로 범주별로 점의 크기를 다르게 표시합니다.
<br><br>
ㅤ**✔ㅤhover_data** 파라미터로 마우스 커서를 점에 위치시키면 표시되는 정보를 추가할 수 있습니다.
<br><br>
ㅤ**✔ㅤshow()** 함수로 그래프를 표시합니다.
<br><br>

In [5]:
fig = px.scatter(iris, x='sepal_width', y='sepal_length', color='species', size='petal_length', hover_data=['petal_width'])
fig.show()

* iris 데이터의 'sepal_width'를 x값으로 'sepal_length'를 y값으로 지정하여 산점도를 그렸습니다.

* **color='species'**

  color 파라미터를 "species"로 지정하여 species 별로 다른 색상의 점을 나타냅니다.

* **size='petal_length'**

  size 파라미터를 "petal_length"로 지정하여 꽃잎의 길이가 커질수록 점의 크기가 점점 커집니다..

* **hover_data=['petal_width']**

  호버 정보에 petal_width의 데이터를 추가합니다.

## **4. Line Chart**


ㅤ**✔ㅤline()**은 선 그래프를 그리는 함수입니다.
<br><br>
ㅤ**✔ㅤtitle** 파라미터에 문자열을 지정하면 차트의 제목을 추가할 수 있습니다.
<br><br>
ㅤ**✔ㅤcolor** 파라미터에 변수를 지정하면 그룹화하여 범주별 다른 색상의 점을 표시합니다.
<br><br>

In [6]:
df = gapminder.query("country=='Canada'")
df.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
240,Canada,Americas,1952,68.75,14785584,11367.16112,CAN,124
241,Canada,Americas,1957,69.96,17010154,12489.95006,CAN,124
242,Canada,Americas,1962,71.3,18985849,13462.48555,CAN,124
243,Canada,Americas,1967,72.13,20819767,16076.58803,CAN,124
244,Canada,Americas,1972,72.88,22284500,18970.57086,CAN,124


* gapminder 데이터에서 country값이 'Canada'인 데이터만 df에 저장했습니다.

<br>

In [7]:
fig = px.line(df, x='year', y='lifeExp', title='Life expectancy in Canada')
fig.show()

* df 데이터의 'year'를 x값으로, 'lifeExp'를 y값으로 지정해 선 그래프를 그렸습니다.

* **title='Life expectancy in Canada'**

  title 파라미터를 이용해 차트의 제목을 'Life expectancy in Canada'로 설정했습니다.

<br>

In [8]:
df = px.data.gapminder().query("continent == 'Oceania'")
fig = px.line(df, x='year', y='lifeExp', color='country')
fig.show()

* gapminder 데이터에서 continent의 값이 'Oceania'인 데이터만 df에 저장했습니다.

* **color='country'**

  color 파라미터를 'country'로 지정하여 'country'별로 다른 색상의 점으로 나타납니다.

<br>

## **5. Box Plot**

box()는 상자 그림을 그리는 함수입니다.

In [9]:
fig = px.box(tips, y='total_bill')
fig.show()

* tips 데이터의 'total_bill'을 y값으로 지정하여 수직 방향의 상자 그림을 그렸습니다.


<br>

In [10]:
fig = px.box(tips, x='time', y='total_bill')
fig.show()

* **x='time'**

  범주형 변수를 x의 인수에 할당하면, 각 값에 대한 수직 상자 그림이 한 번에 그려집니다.

<br>

## **6. Histogram**

ㅤ**✔ㅤhistogram()**는 히스토그램을 그리는 함수입니다.
<br><br>
ㅤ**✔ㅤnbins** 파라미터로 히스토그램 빈의 개수를 설정할 수 있습니다.
<br><br>

In [11]:
fig = px.histogram(tips, x='total_bill')
fig.show()

* tips 데이터의 'total_bill'을 x값으로 지정하여 히스토그램을 그렸습니다.

<br>

In [12]:
fig = px.histogram(tips, x='total_bill', nbins=20)
fig.show()

* **nbins=20**

  nbins 파라미터를 20으로 지정하여 빈 수를 선택하였습니다.



<br>

## **7. 정리하기**

* **plotly express 모듈 import**

  `import plotly.express as px`

* **scatter plot**

  `scatter(iris, x='sepal_width', y='sepal_length', color='species', size="petal_length", hover_data=["petal_width"])`

* **line chart**

  `line(df, x='year', y='lifeExp', color='country', title='Life expectancy in Canada')`

* **box plot**

  `box(tips, x='time', y='total_bil')`

* **histogram**

  `histogram(tips, x='total_bill', nbins=20)`