## 0 - Importando as bibliotecas e configurando o Plotly
Inicialmente, precisamos instalar e importar as bibliotecas que serão utilizadas. Também é necessário deixar o plotly no modo offline.

In [None]:
# Instalando as bibliotecas
%pip install plotly
%pip install cufflinks
%pip install chart-studio

In [None]:
import pandas as pd
import seaborn as sns
import numpy as np
import chart_studio.plotly as py
import cufflinks as cf

import plotly.graph_objects as go
import plotly.express as px

In [None]:
# Configurando o plotly para o modo offline
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
init_notebook_mode(connected=True)
cf.go_offline()

## 1 - Line plots
Esse tipo de gráfico é muito comum, principalmente na análise de séries temporais. Nesse exemplo, estão sendo explorados os dados dos preços de gasolina no Brasil entre 2004 e 2019, fornecidos pela ANP.

In [None]:
# Lendo os dados
gas_df = pd.read_csv('../input/gas-prices-in-brazil/2004-2019.tsv', sep='\t', index_col=0, parse_dates=['DATA INICIAL', 'DATA FINAL'])
gas_df.head()

In [None]:
# Selecionando apenas a gasolina em São Paulo
df_precos = gas_df.query('ESTADO == "SAO PAULO" and PRODUTO == "GASOLINA COMUM"')

In [None]:
# Plotando os dados com lineplot do seaborn
sns.lineplot(data=df_precos, x='DATA INICIAL', y='PREÇO MÉDIO REVENDA')

In [None]:
# Plotando os dados de forma identica com o Plotly
px.line(df_precos, x='DATA INICIAL', y='PREÇO MÉDIO REVENDA')

Com o Plotly, notamos que o gráfico é mais interativo que o do seaborn, mesmo quando escrevemos uma quantidade menor de código. Mas também devemos levar em conta que o Plotly é muito mais pesado que o seaborn, isso é ainda mais evidente quando geramos muitos gráficos em um notebook, ou temos que gerar gráficos que usam muitos dados.

In [None]:
# Criando um gŕafico personalizado
px.line(
    gas_df.query('ESTADO == "SAO PAULO" and PRODUTO != "GLP"'),
    x='DATA INICIAL',
    y='PREÇO MÉDIO REVENDA',
    color='PRODUTO',
    labels={'DATA INICIAL':'Data', 'PREÇO MÉDIO REVENDA':'Preço médio de revenda'},
    title='Preços médios de revenda para vários combustíveis entre 2004 e 2019'
)

In [None]:
# Usando o graph_objects, podemos personalizar mais ainda

fig = go.Figure() # Inicializando uma figura

fig.add_trace(go.Scatter(
    x=gas_df.query('ESTADO == "SAO PAULO" and PRODUTO == "GASOLINA COMUM"')['DATA INICIAL'],
    y=gas_df.query('ESTADO == "SAO PAULO" and PRODUTO == "GASOLINA COMUM"')['PREÇO MÉDIO REVENDA'],
    mode='lines',
    name='São Paulo',
    line=dict(color='red', width=2, dash='dash')
))

fig.add_trace(go.Scatter(
    x=gas_df.query('ESTADO == "RIO DE JANEIRO" and PRODUTO == "GASOLINA COMUM"')['DATA INICIAL'],
    y=gas_df.query('ESTADO == "RIO DE JANEIRO" and PRODUTO == "GASOLINA COMUM"')['PREÇO MÉDIO REVENDA'],
    mode='lines',
    name='Rio de Janeiro',
    line=dict(color='green', width=2, dash='dashdot')
))

fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        showticklabels=True,
        ticks='outside',
        linecolor='rgb(150, 150, 150)',
        linewidth=3,
        tickfont=dict(
            family='Arial',
            size=14,
        )
    ),
    
    yaxis=dict(
        showline=True,
        showticklabels=True,
        gridcolor='rgb(200, 200, 200)',
        linecolor='rgb(150, 150, 150)',
        linewidth=3,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=14,
        )
    ),
    
    plot_bgcolor='white',
    title='Preço da gasolina em SP e RJ'
)

fig

## 2 - Scatter plots
Esse tipo de gráfico é útil para observar tendências e identificar agrupamentos nos dados.

In [None]:
# Carregando o dataset iris, contém dados de diferentes espécies de flores
iris = sns.load_dataset("iris")
iris.head()

In [None]:
# Criando um scatter plot simples
px.scatter(iris, x='sepal_length', y='sepal_width', color='species', symbol='species',
          hover_name='species', title='Scatter plot do comprimento x largura da sépala')

In [None]:
# Criando o mesmo scatter plot para os dados da pétala
px.scatter(iris, x='petal_length', y='petal_width', color='species', symbol='species',
          hover_name='species', title='Scatter plot do comprimento x largura da pétala')

Com o plotly, também é possível fazer uma grande variedade de plots 3D interativos, nesse exemplo, é possível fazer um scatter plot 3D para visualizar os clusters.

In [None]:
#Plot 3D
px.scatter_3d(iris, x='petal_length', z='petal_width', y='sepal_width',
              color='species', symbol='species', color_discrete_sequence=px.colors.qualitative.Set1,
              hover_data=['petal_length', 'petal_width', 'sepal_length', 'sepal_width'],
              hover_name='species',
              title='Scatter plot 3D do Dataset Iris')

## 3 - Gráficos para representar distribuições
Existem vários tipos de gráficos que podem ser utilizados para representar como os diferentes dados estão distribuídos no seu dataset. O Plotly possui diversos gráficos desse tipo. 

In [None]:
# Histograma
px.histogram(iris, x='petal_length', color='species', nbins=30,
             title='Distribuição dos comprimentos de pétala por espécie')

In [None]:
# Box plot
px.box(iris, x='species', y='petal_length', title='Distribuição dos comprimentos de pétala por espécie')

In [None]:
# Violin plot
px.violin(iris, x='species', y='petal_length', box=True, points='all',
          title='Distribuição dos comprimentos de pétala por espécie')

## 4 - Gráfico de pizza
Esse tipo de gráfico é muito conhecido, e pode ser útil para representar porcentagens de maneira visual.

In [None]:
netflix = pd.read_csv('../input/netflix-shows/netflix_titles.csv')
netflix.head()

In [None]:
px.pie(netflix, names='type', title='Porcentagem de cada tipo de conteúdo na Netflix',
       color_discrete_sequence=['#E50914', '#831010'])

In [None]:
px.pie(netflix.query('country=="Brazil"'), names='rating', color_discrete_sequence=px.colors.qualitative.Prism,
      title='Porcentagem de conteúdo brasileiro para cada classificação indicativa', hole=0.5)

## 5 - Gráficos geográficos

Com o Plotly, podemos gerar vários gráficos utilizando mapas. Um dos mais interessantes são os Scatter plots com mapa, no qual podemos usar um globo 3D para representar os dados.

In [None]:
gapminder_df = px.data.gapminder()
gapminder_df.head()

In [None]:
# Mapa 2D
fig = px.scatter_geo(
    gapminder_df.query('year == 2007'),
    locations='iso_alpha',
    color='continent',
    hover_name='country',
    size='pop',
    title='População mundial em 2007',
    projection='natural earth', #Esse parâmetro define o tipo de mapa
)

# Observe que podemos salvar a figura para mostra-la depois
fig

In [None]:
# Globo 3D
fig = px.scatter_geo(
    gapminder_df.query('year == 2007'),
    locations='iso_alpha',
    color='continent',
    hover_name='country',
    size='pop',
    title='População mundial em 2007',
    projection='orthographic' #Esse parâmetro define o tipo de mapa
)

# Essa é outra forma de mostrar a figura
fig.show()

## 6 - Animações
Utilizando os mesmos gráficos mostrados anteriormente, também podemos criar animações com facilidade. Para isso, devemos passar um conjunto de dados que será responsável pelos frames da animação, uma escolha comum para isso são dados relacionados à data.

In [None]:
px.scatter_geo(
    gapminder_df,
    locations='iso_alpha',
    color='continent',
    hover_name='country',
    size='pop',
    title='População mundial em 1952 e 2007',
    projection='natural earth',
    animation_frame='year' # Cada valor dessa coluna gerará um frame da animação
)

## 7 - Conclusão
Como foi visto nesse notebook, o Plotly pode ser uma ferramenta muito útil para a análise exploratória dos dados. Mas, apesar da sua versatilidade, ele não substitui totalmente outras bibliotecas, como matplotlib e seaborn. Afinal, essas ferramentas são muito úteis para gerar gráficos mais leves, onde a interatividade não é necessária.

Apesar disso, é notável a qualidade dos gráficos gerados pelo Plotly, logo ele pode ser utilizado para análises mais detalhadas, gráficos animados, e apresentações.

Outra observação importante são as diferentes formas como podemos utilizar o Plotly:
- plotly.express: Interface mais rápida e prática, parecida com o seaborn
- plotly.graph_objects: Interface que permite personalização mais extensa, parecida com o matplotlib

Para aprender mais, visite a documentação oficial do Plotly, ela contém exemplos detalhados dos gráficos apresentados nesse notebook, e muitos outros: https://plotly.com/python/