# Aula 4 - Plotly

[Documentação Plotly Express](https://plotly.com/python-api-reference/plotly.express.html)

### Imports e Configurações

In [None]:
# !pip install plotly
# !pip install -U kaleido
# !pip install -U nbformat
# !pip install statsmodels

In [None]:
# importando a biblioteca
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

In [None]:
# definindo as configurações

# autoreload permite a recarga dos módulos antes da execução dos códigos
# doc: https://ipython.org/ipython-doc/3/config/extensions/autoreload.html
%reload_ext autoreload
%autoreload 2

### Carregando as Bases de Dados

In [None]:
# importando a base 'flights' do seaborn


In [None]:
# importando a base 'penguins' do seaborn



### Gráficos

Processo de plotagem:
1. entender os dados
2. entender a questão de negócio
3. realizar as transformações necessárias
4. realizar a plotagem

Documentação:

https://plotly.com/python-api-reference/

#### Gráfico de Barras

In [None]:
# observando a base de dados



Qual a quantidade de pinguins por ilha?

Comparativo da sintaxe:

* Seaborn

    > `sns.countplot(data=df_data, x='x_data')`

* Plotly

    > `px.histogram(data_frame=df_data, x='x_data')`

In [None]:
# visualizando com o seaborn - countplot



In [None]:
# visualizando com o plotly - bar



In [None]:
# realizando transformações



In [None]:
# visualizando com o plotly - bar



In [None]:
# visualizando com o histogram - bar



Qual a quantidade de pinguins por ilha e segmentado por sexo?

In [None]:
# visualizando com o seaborn - countplot



In [None]:
# visualizando com o histogram - bar



In [None]:
# visualizando lado a lado



Qual a média do comprimento da nadadeira por ilha, segmentado por espécie?

Comparativo da sintaxe:

* Seaborn

    > `sns.barplot(data=df_data, x='x_data', y='y_data', estimator='mean')`

* Plotly

    > `px.histogram(data_frame=df_data, x='x_data', y='y_data', histfunc='avg')`

In [None]:
# base de dados pinguins



In [None]:
# utilizando o seaborn - barplot



In [None]:
# utilizando o plotly - histogram



#### Estilizando um Gráfico

Transformando o layout completo do gráfico do plotly:
*    xaxis_title - titulo eixo x
*    yaxis_title - titulo eixo y
*    legend_title - titulo da legenda
*    font_color - cor da fonte
*    title - titulo do gráfico
*    template - template de formato do gráfico

In [None]:
# atribuindo o gráfico a uma variável 



In [None]:
# alterando os parâmetros estéticos do gráfico



Outros templates:
- ggplot2,
- seaborn,
- simple_white,
- plotly,
- plotly_white,
- plotly_dark,
- presentation,
- xgridoff,
- ygridoff,
- gridon,
- none

In [None]:
# alterando o template


#### Exportando um Gráfico

In [None]:
# exportando o gráfico em uma página html


In [None]:
# exportando o gráfico como uma figura


#### Gráfico de Histograma

In [None]:
# observando o dataframe


Qual a distribuição da massa corporal facetado por sexo e espécie?

In [None]:
# visualizando a distribuição com plotly - histogram


In [None]:
# facetando a visualização


#### Gráfico de Caixa

In [None]:
# base de dados penguins



Temos outliers no peso corporal dos pinguins?

In [None]:
# visualizando a distibuição com plotly - boxp



In [None]:
# segmentando a distribuição por sexo



In [None]:
# segmentando a distribuição por sexo e espécie



#### Gráfico de Linhas

In [None]:
# base de dados flights



Qual a quantidade de passageiros por ano?

In [None]:
# transformando os dados



In [None]:
# visualizando com plotly - line



Qual a média de passageiros por ano?

In [None]:
# visualizando a média de passageiros por ano com plotly - line



Qual a quantidade de passageiros por ano, segmentado por mês?

In [None]:
# visualizando com ploty - line



In [None]:
# transformando o layout do gráfico do plotly


#### Gráfico de Dispersão

In [None]:
# base de dados pinguins



Qual a relação entre o comprimento e a profundidado do bico?

In [None]:
# visualizando com plotly - scatter



In [None]:
# segmentando por espécie



In [None]:
# adicionando linha de tendencia



In [None]:
# segmentando por espécie e adicionando linhas de tendencia



### Atividade

Resolver as questões abaixo. Em seguida, criar um repositório público no GitHub e armazenar no notebook criado, enviando somente o link do NOTEBOOK para o [Formulário](https://docs.google.com/forms/d/e/1FAIpQLSf8IUCLt4kowhHhB3SRQofE2I8NuXuDadBYjRHqUxgb3yWOaQ/viewform).

In [None]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import plotly.express as px


#### Questão 1

Criar 2 vetores, um com uma série historica de anos de 1970 até 2022 e um segundo vetor com a mesma quantidade de observações e números inteiros aleatórios variando de 1 a 20000. Em seguida montar um gráfico com a melhor visualização para os dados com a biblioteca Plotly Express.

#### Questão 2

Criar uma lista com as letras do alfabeto, depois um vetor com a mesma quantidade de observações e números inteiros aleatórios variando de 10 a 100. Em seguida montar um gráfico com a melhor visualização para os dados com a biblioteca Plotly Express.

Utilize o objeto string para resolver a questão:

```
import string
string.ascii_lowercase
```

#### Questão 3

Criar 2 vetores com a mesma quantidade de observações, 500 registros , de números inteiros aleatórios, o primeiro variando de 1000 a 2000, o segundo variando de 5000 a 10000. Em seguida montar um gráfico com a melhor visualização para os dados com a biblioteca Plotly Express, demonstrando relação entre as variáveis.

#### Questão 4

Criar uma vetor com 500 registros de números inteiros variando entre 125 e 857. Em seguida montar um gráfico que mostre a dispersão com a melhor visualização para os dados com a biblioteca Plotly Express.