# Plotly

O Plotly é uma biblioteca Python amplamente utilizada para visualização de dados interativa e gráficos. Ela oferece uma variedade de recursos para criar gráficos interativos e personalizados, permitindo que os desenvolvedores e cientistas de dados criem visualizações atraentes e informativas

[Acesse a documentação oficial.](https://plotly.com/)

## Para instalar

``` python'1
pip install -U plotly
```

## Importação de bibliotecas

In [10]:
import numpy as np
import pandas as pd
import plotly.express as px

In [7]:
px.line(x=[1, 2, 3, 4, 5], y=[10, 40, 20, 50, 5])

## Utilizado um DataFrame

In [8]:
df = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/flights.csv')

In [9]:
df.head()

Unnamed: 0,year,month,passengers
0,1949,January,112
1,1949,February,118
2,1949,March,132
3,1949,April,129
4,1949,May,121


In [10]:
df.tail()

Unnamed: 0,year,month,passengers
139,1960,August,606
140,1960,September,508
141,1960,October,461
142,1960,November,390
143,1960,December,432


In [11]:
df_agrupado_pelo_mes = df.groupby('month', sort=False).mean().reset_index()

In [12]:
df_agrupado_pelo_mes.head()

Unnamed: 0,month,year,passengers
0,January,1954.5,241.75
1,February,1954.5,235.0
2,March,1954.5,270.166667
3,April,1954.5,267.083333
4,May,1954.5,271.833333


In [13]:
px.line(df_agrupado_pelo_mes, x='month', y='passengers')

In [14]:
df.head()

Unnamed: 0,year,month,passengers
0,1949,January,112
1,1949,February,118
2,1949,March,132
3,1949,April,129
4,1949,May,121


In [15]:
px.line(df, x='month', y='passengers', color='year')

# Gráficos básicos

In [16]:
df = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv')

In [17]:
df.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


In [18]:
df.tail()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
239,29.03,5.92,Male,No,Sat,Dinner,3
240,27.18,2.0,Female,Yes,Sat,Dinner,2
241,22.67,2.0,Male,Yes,Sat,Dinner,2
242,17.82,1.75,Male,No,Sat,Dinner,2
243,18.78,3.0,Female,No,Thur,Dinner,2


## Gráfico de barras

In [19]:
df_agrupado_pelo_dia = df.groupby('day', sort=False).agg({'total_bill': np.sum}).reset_index()

In [20]:
df_agrupado_pelo_dia

Unnamed: 0,day,total_bill
0,Sun,1627.16
1,Sat,1778.4
2,Thur,1096.33
3,Fri,325.88


In [21]:
px.bar(df_agrupado_pelo_dia, x='day', y='total_bill')

In [22]:
df_agrupado_pelo_dia_e_sexo = df.groupby(['day', 'sex'], sort=False).agg({'total_bill': np.sum}).reset_index()

In [23]:
df_agrupado_pelo_dia_e_sexo

Unnamed: 0,day,sex,total_bill
0,Sun,Female,357.7
1,Sun,Male,1269.46
2,Sat,Male,1227.35
3,Sat,Female,551.05
4,Thur,Male,561.44
5,Thur,Female,534.89
6,Fri,Male,198.57
7,Fri,Female,127.31


In [24]:
px.bar(df_agrupado_pelo_dia_e_sexo, x='day', y='total_bill', color='sex', barmode='group')

In [25]:
px.bar(df_agrupado_pelo_dia_e_sexo, x='total_bill', y='day', color='sex', barmode='group', orientation='h')

## Gráfico de dispersão

In [26]:
px.scatter(df, x='total_bill', y='tip', color='day', hover_name='time')

## Gráfico de pizza

In [27]:
qtde_pedidos_por_dia = df['day'].value_counts()

In [28]:
qtde_pedidos_por_dia

day
Sat     87
Sun     76
Thur    62
Fri     19
Name: count, dtype: int64

In [29]:
qtde_pedidos_por_dia.index

Index(['Sat', 'Sun', 'Thur', 'Fri'], dtype='object', name='day')

In [30]:
qtde_pedidos_por_dia.values

array([87, 76, 62, 19], dtype=int64)

In [31]:
px.pie(qtde_pedidos_por_dia, names=qtde_pedidos_por_dia.index, values=qtde_pedidos_por_dia.values)

# Gráficos Estatísticos

In [11]:
df = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv')

In [12]:
df.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


## Gráfico de histograma

In [11]:
px.histogram(df, x='total_bill', color='day', nbins=40, histnorm='probability density', marginal='box')

## Gráfico de distribuição

In [2]:
import plotly.figure_factory as ff
import numpy as np

In [5]:
x1 = np.random.randn(1000)
x2 = np.random.randn(1000) + 5

In [6]:
ff.create_distplot([x1, x2], group_labels=['Normal1', 'Normal 2'])

In [13]:
df.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


In [22]:
ff.create_distplot([ df['total_bill'], df['tip'] ],
                   group_labels=['Total bill', 'Tips'])

## Boxplot

O boxplot ou diagrama de caixa é uma ferramenta gráfica que permite visualizar a distribuição e valores discrepantes (outliers) dos dados, fornecendo assim um
meio complementar para desenvolver uma perspectiva sobre o caráter dos dados. Além disso, o boxplot também é uma disposição gráfica comparativa.
Ele é composto por algumas medidas de estatísticas descritivas como o mínimo, máximo, primeiro quartil, segundo quartil (ou mediana) e o terceiro quartil.

In [24]:
df = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv')

In [25]:
df.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


In [26]:
df['total_bill'].describe() # Estatística descritiva

count    244.000000
mean      19.785943
std        8.902412
min        3.070000
25%       13.347500
50%       17.795000
75%       24.127500
max       50.810000
Name: total_bill, dtype: float64

In [27]:
px.box(df, x='total_bill')

In [28]:
# Se na posição x, for plotado uma variavel numerica, é recomendado que no
# no eixo y use uma variavel categorica
px.box(df, x='total_bill', y='day')

In [29]:
px.box(df, x='total_bill', y='day', color='sex')

In [30]:
px.box(df, x='total_bill', points='all')

## Histograma 2D (Heatmap)

In [32]:
px.density_heatmap(df, x='day', y='sex', z='total_bill')

In [33]:
px.density_heatmap(df, x='day', y='sex', z='total_bill', histfunc='avg')

In [37]:
px.density_heatmap(df, x='total_bill', y='tip', marginal_x='histogram', marginal_y='box', height=600)