---
---
# Tutorial de Plotly

Este notebook apresenta um rápido tutorial sobre a biblioteca [Plotly](https://plotly.com/).

*Fonte: adaptado de https://paulovasconcellos.com.br/como-criar-gr%C3%A1ficos-interativos-utilizando-plotly-e-python-3eb6eda57a2b*

---
---





## Clona repositório de dados da disciplina hospedado no GitHUb

In [None]:
!git clone "https://github.com/malegopc/DSBD"

## Importando bibliotecas

In [None]:
import pandas as pd
import numpy as np
import plotly.offline as py
import plotly.graph_objs as go

In [None]:
# Devido o Plotly estar sendo utilizado no Google Colab é ncessário definir
# a função abaixo e chamá-la para exibir um gráfico
 
def enable_plotly_in_cell():
  import IPython
  from plotly.offline import init_notebook_mode
  display(IPython.core.display.HTML('''<script 
  src="/static/components/requirejs/require.js"></script>'''))
  init_notebook_mode(connected=False)

## Carregando dataset

Este conjunto de dados contém preços de venda de casas para King County, que inclui Seattle. Inclui casas vendidas entre maio de 2014 e maio de 2015.

É um ótimo conjunto de dados para avaliar modelos de regressão simples.

In [None]:
df = pd.read_csv('/content/DSBD/Datasets/KC_house/kc_house_data.csv')
df.head()

In [None]:
print('Esse dataset contém {} linhas'.format(df.shape[0]))

## Gráfico de dispersão simples

In [None]:
enable_plotly_in_cell()

trace = go.Scatter(x = df['yr_built'],
                   y = df['price'],
                   mode = 'markers')

data = [trace]

py.iplot(data)

## Gráfico com títulos
Vamos utilizar a função `go.Layout()` para definir alguns rótulos e títulos

In [None]:
enable_plotly_in_cell()

trace = go.Scatter(x = df['yr_built'],
                   y = df['price'],
                   mode = 'markers')

data = [trace]
layout = go.Layout(title='Preços por ano de construção',
                   yaxis={'title':'Preço da casa'},
                   xaxis={'title': 'Ano de construção'}, )
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

## Alterando cores do gráfico

In [None]:
enable_plotly_in_cell()
trace = go.Scatter(x = df['yr_built'],
                   y = df['price'],
                   mode = 'markers',
                   marker =  {'color' : '#e74c3c',
                              'line' : {'width': 1,
                                        'color': '#c0392b'}},
                   opacity=.8)

data = [trace]
layout = go.Layout(title='Preços por ano de construção',
                   yaxis={'title':'Preço da casa'},
                   xaxis={'title': 'Ano de construção'})
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

## Boxplot

In [None]:
enable_plotly_in_cell()

# Gerando gráficos para casas que tem 1 quarto
trace1 = go.Box(y = df.loc[df['bedrooms'] == 1, 'price'],
                name = 'Casas com 1 quarto',
                marker = {'color': '#f39c12'})
# Gráfico de caixa para casas com 2 quartos
trace2 = go.Box(y = df.loc[df['bedrooms'] == 2, 'price'],
                name = 'Casas com 2 quartos',
                marker = {'color': '#e67e22'})

# Gráfico de caixa para casas com 3 quartos
trace3 = go.Box(y = df.loc[df['bedrooms'] == 3, 'price'],
                name = 'Casas com 3 quartos',
                marker = {'color': '#d35400'})

# Gráfico para casas de quatro quartos
trace4 = go.Box(y = df.loc[df['bedrooms'] == 4, 'price'],
                name = 'Casas com 4 quartos',
                marker = {'color': '#e74c3c'})

data = [trace1, trace2, trace3, trace4]
layout = go.Layout(title = 'Dispersão de preços para casas com diferentes quartos',
                   titlefont = {'family': 'Arial',
                                'size': 22,
                                'color': '#7f7f7f'},
                   xaxis = {'title': 'Número de quartos'},
                   yaxis = {'title': 'Preço'},
                   paper_bgcolor = 'rgb(243, 243, 243)',
                   plot_bgcolor = 'rgb(243, 243, 243)')

fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

## Gráficos de linha

In [None]:
enable_plotly_in_cell()

# Gráfico usando apenas marcadores
trace1 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [1, 2, 3, 4, 5],
                    mode = 'markers',
                    name = 'Apenas marcadores')

# Gráfico de apenas linhas
trace2 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [11, 12, 13, 14, 15],
                    mode = 'lines',
                    name = 'Apenas linhas')

# Criando gráfico com marcadores e linhas
trace3 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [6, 7, 8, 9, 10],
                    mode = 'markers+lines',
                    name = 'Marcadores e Linhas')

data = [trace1, trace2, trace3]

py.iplot(data)

## Customizando linhas do gráfico

In [None]:
enable_plotly_in_cell()
# Gráfico usando apenas marcadores
trace1 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [10, 9, 11, 8, 12],
                    mode = 'lines',
                    name = 'Gráfico com linhas tracejadas',
                    line = {'color': '#ee5253',
                            'dash': 'dash'})

# Gráfico de apenas linhas
trace2 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [11, 12, 13, 14, 15],
                    mode = 'lines',
                    name = 'Gráfico com linha pontilhada',
                    line = {'color': '#341f97',
                            'dash': 'dot'})

data = [trace1, trace2]

py.iplot(data)

## Gráfico de barras simples

In [None]:
enable_plotly_in_cell()
trace = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
               y = [10, 20, 30])
data = [trace]
py.iplot(data)

## Múltiplos gráficos de barras

In [None]:
enable_plotly_in_cell()
trace1 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [10, 20, 30])

trace2 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [20, 30, 40])

data = [trace1, trace2]
py.iplot(data)

## Alterando cores e nomes de gráficas de barras

In [None]:
enable_plotly_in_cell()

trace1 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [10, 20, 30],
                name = 'Gráfico 1',
                marker = {'color': '#feca57'})

trace2 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [20, 30, 40],
                name = 'Gráfico 2',
                marker = {'color': '#ff9f43'})

data = [trace1, trace2]

py.iplot(data)

## Adicionando título

In [None]:
enable_plotly_in_cell()

trace1 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [10, 20, 30],
                name = 'Gráfico 1',
                marker = {'color': '#feca57'})

trace2 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [20, 30, 40],
                name = 'Gráfico 2',
                marker = {'color': '#ff9f43'})

data = [trace1, trace2]

layout = go.Layout(title = 'Gráfico de barras do <a href=\'https://plot.ly/\'>Plotly</a>',
                   xaxis = {'title': 'Nome da fruta'},
                   yaxis = {'title': 'Quantidade'}
                   )
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

## Criando um stacked bar plot

In [None]:
enable_plotly_in_cell()

trace1 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [10, 20, 30],
                name = 'Gráfico 1',
                marker = {'color': '#feca57'})

trace2 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [20, 30, 40],
                name = 'Gráfico 2',
                marker = {'color': '#ff9f43'})

data = [trace1, trace2]

layout = go.Layout(title = 'Gráfico de barras do <a href=\'https://plot.ly/\'>Plotly</a>',
                   xaxis = {'title': 'Nome da fruta'},
                   yaxis = {'title': 'Quantidade'},
                   barmode = 'stack')

fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

## Criando gráfico com mapas

###Lendo arquivo

In [None]:
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/2014_us_cities.csv')
df.head()

In [None]:
enable_plotly_in_cell()

trace = go.Scattergeo(
                     locationmode = 'USA-states',
                     lon = df['lon'],
                     lat = df['lat'],
                     text = df['name'] + '- População: ' + df['pop'].astype(str),
                     marker = dict(
                            size = df['pop']/5000,
                            color = '#e74c3c',
                            line = {'width': 0.5, 
                                    'color': '#2c3e50'},
                            sizemode = 'area')
                    )
data = [trace]

layout = go.Layout(
        title = '<b>População americana em 2014</b>',
        titlefont = {'family': 'Arial',
                     'size': 24},
        geo =  {'scope': 'usa',
                'projection': {'type': 'albers usa'},
                'showland': True,
                'landcolor': '#2ecc71',
                'showlakes': True,
                'lakecolor': '#3498db',
                'subunitwidth': 1,
                'subunitcolor': "rgb(255, 255, 255)"
                })

fig = go.Figure(data=data, layout=layout)
py.iplot(fig)