# Tutorial de Plotly

Esse tutorial foi [criado para meu blog](asd), onde ensino como utilizar a biblioteca Plotly para geração de gráficos interativos

# Importando bibliotecas
Importando as bibliotecas que utilizaremos e definindo funções iniciais

In [0]:
import pandas as pd
import numpy as np
import plotly.offline as py
import plotly.graph_objs as go

py.init_notebook_mode(connected=False)

In [0]:
# Devido o Plotly estar sendo utilizado no Google Collab, precisaremos definir
# a função abaixo e chamá-la sempre que quisermos exibir um gráfico

def configure_plotly_browser_state():
  import IPython
  display(IPython.core.display.HTML('''
        <script src="/static/components/requirejs/require.js"></script>
        <script>
          requirejs.config({
            paths: {
              base: '/static/base',
              plotly: 'https://cdn.plot.ly/plotly-1.5.1.min.js?noext',
            },
          });
        </script>
        '''))

# Lendo dataset

In [0]:
df = pd.read_csv('http://www.sharecsv.com/dl/c8128cebc4f69954d7fc911e8bb30fd9/kc_house_data.csv')
df.head()

Unnamed: 0,id,date,price,bedrooms,bathrooms,sqft_living,sqft_lot,floors,waterfront,view,...,grade,sqft_above,sqft_basement,yr_built,yr_renovated,zipcode,lat,long,sqft_living15,sqft_lot15
0,7129300520,20141013T000000,221900.0,3,1.0,1180,5650,1.0,0,0,...,7,1180,0,1955,0,98178,47.5112,-122.257,1340,5650
1,6414100192,20141209T000000,538000.0,3,2.25,2570,7242,2.0,0,0,...,7,2170,400,1951,1991,98125,47.721,-122.319,1690,7639
2,5631500400,20150225T000000,180000.0,2,1.0,770,10000,1.0,0,0,...,6,770,0,1933,0,98028,47.7379,-122.233,2720,8062
3,2487200875,20141209T000000,604000.0,4,3.0,1960,5000,1.0,0,0,...,7,1050,910,1965,0,98136,47.5208,-122.393,1360,5000
4,1954400510,20150218T000000,510000.0,3,2.0,1680,8080,1.0,0,0,...,8,1680,0,1987,0,98074,47.6168,-122.045,1800,7503


In [0]:
print('Esse dataset contém {} linhas'.format(df.shape[0]))

Esse dataset contém 21613 linhas


# Criando um gráfico de dispersão simples

In [0]:
configure_plotly_browser_state()

trace = go.Scatter(x = df['yr_built'],
                   y = df['price'],
                   mode = 'markers')

data = [trace]

py.iplot(data)

## Em caso de dúvidas, consulte a documentação da função

In [0]:
go.Scatter().help()

Valid attributes for 'scatter' at path [] under parents []:

    ['opacity', 'customdata', 'uid', 'stream', 'text', 'ycalendar', 'dy',
    'xsrc', 'visible', 'legendgroup', 'cliponaxis', 'transforms', 'marker',
    'y0', 'tsrc', 'x0', 'hoveron', 'fill', 'showlegend', 'error_x',
    'error_y', 'selected', 'rsrc', 'hoverinfosrc', 'xaxis', 'ysrc',
    'selectedpoints', 'hovertextsrc', 'type', 'mode', 'textposition',
    'textfont', 'xcalendar', 'textpositionsrc', 'hovertext', 'hoverlabel',
    'textsrc', 'dx', 'hoverinfo', 'line', 'name', 'yaxis', 'customdatasrc',
    'connectgaps', 'ids', 'idssrc', 'r', 't', 'y', 'x', 'unselected',
    'fillcolor']

Run `<scatter-object>.help('attribute')` on any of the above.
'<scatter-object>' is the object at []


# Criando um gráfico com títulos
Vamos utilizar a função `go.Layout()` para definir alguns rótulos e títulos

In [0]:
configure_plotly_browser_state()
trace = go.Scatter(x = df['yr_built'],
                   y = df['price'],
                   mode = 'markers')

data = [trace]
layout = go.Layout(title='Preços por ano de construção',
                   yaxis={'title':'Preço da casa'},
                   xaxis={'title': 'Ano de construção'})
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

# Alterando cores do gráfico

In [0]:
configure_plotly_browser_state()
trace = go.Scatter(x = df['yr_built'],
                   y = df['price'],
                   mode = 'markers',
                   marker =  {'color' : '#e74c3c',
                              'line' : {'width': 1,
                                        'color': '#c0392b'}},
                   opacity=.8)

data = [trace]
layout = go.Layout(title='Preços por ano de construção',
                   yaxis={'title':'Preço da casa'},
                   xaxis={'title': 'Ano de construção'})
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

# Gráfico de caixa (Boxplot)

In [0]:
configure_plotly_browser_state()

# Gerando gráficos para casas que tem 1 quarto
trace1 = go.Box(y = df.loc[df['bedrooms'] == 1, 'price'],
                name = 'Casas com 1 quarto',
                marker = {'color': '#f39c12'})
# Gráfico de caixa para casas com 2 quartos
trace2 = go.Box(y = df.loc[df['bedrooms'] == 2, 'price'],
                name = 'Casas com 2 quartos',
                marker = {'color': '#e67e22'})

# Gráfico de caixa para casas com 3 quartos
trace3 = go.Box(y = df.loc[df['bedrooms'] == 3, 'price'],
                name = 'Casas com 3 quartos',
                marker = {'color': '#d35400'})

# Gráfico para casas de quatro quartos
trace4 = go.Box(y = df.loc[df['bedrooms'] == 4, 'price'],
                name = 'Casas com 4 quartos',
                marker = {'color': '#e74c3c'})

data = [trace1, trace2, trace3, trace4]
layout = go.Layout(title = 'Dispersão de preços para casas com diferentes quartos',
                   titlefont = {'family': 'Arial',
                                'size': 22,
                                'color': '#7f7f7f'},
                   xaxis = {'title': 'Número de quartos'},
                   yaxis = {'title': 'Preço'},
                   paper_bgcolor = 'rgb(243, 243, 243)',
                   plot_bgcolor = 'rgb(243, 243, 243)')

fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

# Criando gráficos de linha

In [0]:
configure_plotly_browser_state()

# Gráfico usando apenas marcadores
trace1 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [1, 2, 3, 4, 5],
                    mode = 'markers',
                    name = 'Apenas marcadores')

# Gráfico de apenas linhas
trace2 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [11, 12, 13, 14, 15],
                    mode = 'lines',
                    name = 'Apenas linhas')

# Criando gráfico com marcadores e linhas
trace3 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [6, 7, 8, 9, 10],
                    mode = 'markers+lines',
                    name = 'Marcadores e Linhas')

data = [trace1, trace2, trace3]

py.iplot(data)

# Customizando linhas do gráfico

In [0]:
configure_plotly_browser_state()
# Gráfico usando apenas marcadores
trace1 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [10, 9, 11, 8, 12],
                    mode = 'lines',
                    name = 'Gráfico com linhas tracejadas',
                    line = {'color': '#ee5253',
                            'dash': 'dash'})

# Gráfico de apenas linhas
trace2 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [11, 12, 13, 14, 15],
                    mode = 'lines',
                    name = 'Gráfico com linha pontilhada',
                    line = {'color': '#341f97',
                            'dash': 'dot'})

data = [trace1, trace2]

py.iplot(data)

# Criando gráfico de barras simples

In [0]:
configure_plotly_browser_state()
trace = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
               y = [10, 20, 30])
data = [trace]
py.iplot(data)

# Múltiplos gráficos de barras

In [0]:
configure_plotly_browser_state()
trace1 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [10, 20, 30])

trace2 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [20, 30, 40])

data = [trace1, trace2]
py.iplot(data)

# Alterando cores e nomes de gráficas de barras

In [0]:
configure_plotly_browser_state()

trace1 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [10, 20, 30],
                name = 'Gráfico 1',
                marker = {'color': '#feca57'})

trace2 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [20, 30, 40],
                name = 'Gráfico 2',
                marker = {'color': '#ff9f43'})

data = [trace1, trace2]

py.iplot(data)

# Adicionando título

In [0]:
configure_plotly_browser_state()

trace1 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [10, 20, 30],
                name = 'Gráfico 1',
                marker = {'color': '#feca57'})

trace2 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [20, 30, 40],
                name = 'Gráfico 2',
                marker = {'color': '#ff9f43'})

data = [trace1, trace2]

layout = go.Layout(title = 'Gráfico de barras do <a href=\'https://plot.ly/\'>Plotly</a>',
                   xaxis = {'title': 'Nome da fruta'},
                   yaxis = {'title': 'Quantidade'}
                   )
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

# Criando um stacked bar plot

In [0]:
configure_plotly_browser_state()

trace1 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [10, 20, 30],
                name = 'Gráfico 1',
                marker = {'color': '#feca57'})

trace2 = go.Bar(x = ['Banana', 'Maçã', 'Uva'],
                y = [20, 30, 40],
                name = 'Gráfico 2',
                marker = {'color': '#ff9f43'})

data = [trace1, trace2]

layout = go.Layout(title = 'Gráfico de barras do <a href=\'https://plot.ly/\'>Plotly</a>',
                   xaxis = {'title': 'Nome da fruta'},
                   yaxis = {'title': 'Quantidade'},
                   barmode = 'stack')

fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

# Criando gráfico com mapas

## Lendo arquivo

In [0]:
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/2014_us_cities.csv')
df.head()

Unnamed: 0,name,pop,lat,lon
0,New York,8287238,40.730599,-73.986581
1,Los Angeles,3826423,34.053717,-118.242727
2,Chicago,2705627,41.875555,-87.624421
3,Houston,2129784,29.758938,-95.367697
4,Philadelphia,1539313,39.952335,-75.163789


In [0]:
configure_plotly_browser_state()

trace = go.Scattergeo(
                     locationmode = 'USA-states',
                     lon = df['lon'],
                     lat = df['lat'],
                     text = df['name'] + '- População: ' + df['pop'].astype(str),
                     marker = dict(
                            size = df['pop']/5000,
                            color = '#e74c3c',
                            line = {'width': 0.5, 
                                    'color': '#2c3e50'},
                            sizemode = 'area')
                    )
data = [trace]

layout = go.Layout(
        title = '<b>População americana em 2014</b>',
        titlefont = {'family': 'Arial',
                     'size': 24},
        geo =  {'scope': 'usa',
                'projection': {'type': 'albers usa'},
                'showland': True,
                'landcolor': '#2ecc71',
                'showlakes': True,
                'lakecolor': '#3498db',
                'subunitwidth': 1,
                'subunitcolor': "rgb(255, 255, 255)"
                })

fig = go.Figure(data=data, layout=layout)
py.iplot(fig)