## Visualização de dados com Plot.ly##

`Cufflinks conecta o pandas ao plot.ly`

`Instalação do Plot.ly e Cufflinks`

In [9]:
!pip install cufflinks
!pip install plotly





`Importando o cufflinks e o plot.ly`

In [1]:
import cufflinks as cf
from plotly.offline import plot, iplot
import pandas as pd
import numpy as np

**Cria um dataframe com dados aleatórios divididos por 4 colunas**

In [2]:
df = pd.DataFrame(np.random.randn(100,4), columns=['A','B','C','D'])

In [3]:
df.head()

Unnamed: 0,A,B,C,D
0,0.780272,0.152236,0.320002,1.081457
1,-0.090327,0.152209,0.284963,1.850857
2,-0.674573,1.848285,0.570968,-0.369201
3,-0.233034,0.727078,0.156248,0.954416
4,0.468613,-0.323476,-1.025888,-0.061055


**Ao tentar usar o Cufflinks veja o resultado**

In [5]:
# tenta realizar contato com uma conta no Plotly por isso tem que usar o mod offline
df.iplot()

PlotlyError: Because you didn't supply a 'file_id' in the call, we're assuming you're trying to snag a figure from a url. You supplied the url, 'https://plotly.com/~josecarlos10967/14/', we expected it to start with 'https://plot.ly'.
Run help on this function for more information.

**É preciso habilitar o modo offiline primeiramente**

In [None]:
cf.go_offline()

**Executando o iplot() novamente**
`Clique no link "Export to plot.ly"`

In [7]:
df.head()

Unnamed: 0,A,B,C,D
0,0.780272,0.152236,0.320002,1.081457
1,-0.090327,0.152209,0.284963,1.850857
2,-0.674573,1.848285,0.570968,-0.369201
3,-0.233034,0.727078,0.156248,0.954416
4,0.468613,-0.323476,-1.025888,-0.061055


In [8]:
df.iplot()

PlotlyError: Because you didn't supply a 'file_id' in the call, we're assuming you're trying to snag a figure from a url. You supplied the url, 'https://plotly.com/~josecarlos10967/18/', we expected it to start with 'https://plot.ly'.
Run help on this function for more information.

**Gráficos do tipo Scatter**

In [6]:
df.iplot(x='A', y='B', kind='scatter', mode='markers')

PlotlyError: Because you didn't supply a 'file_id' in the call, we're assuming you're trying to snag a figure from a url. You supplied the url, 'https://plotly.com/~josecarlos10967/16/', we expected it to start with 'https://plot.ly'.
Run help on this function for more information.

**Gráficos de Barras**

In [None]:
df.sum().iplot(kind='bar')

**Gráficos de Boxplots**

In [None]:
df.iplot(kind='box')

**Histogramas**<br>
`Compare com os histograsm padrões do matplotlib e seaborn`

In [None]:
df['A'].iplot(kind='hist')

`Histogramas de todas as colunas (mesmo tipo de dados)`

In [None]:
df.iplot(kind='hist')

**Spread Plots**

In [None]:
df.iplot(kind='spread')

**Bubble Plots**

In [None]:
df.iplot(kind='bubble', x='A', y='B', size='C', colors='antiquewhite')

**Scatter Matrix**

- `Similar ao pairplot do Seaborn`
-  `Se o dataframe for muito grande pode travar o seu notebook`

In [None]:
df.scatter_matrix()

## Visualização de dados reais ##

**Lembre-se de habilitar o modo offline do plotly**

In [None]:
import cufflinks as cf
cf.go_offline()

**Importe o Pandas**

In [None]:
import pandas as pd

In [None]:
df = pd.read_csv('Plotly-Materiais-de-Apoio/plotly/datasets/olist_classified_public_dataset.csv')

**Visualizando a base de dados**

In [None]:
df.head()

In [None]:
df.info()

**Informações do Dataset**

## Perguntas aos dados

- Quais a distribuicao dos status dos pedidos?
- Quais os meses do ano houve mais vendas?
- Qual a quantidade de items de um pedido? (medio)
- Qual a quantidade de vendedores em um pedido ? (medio)
- O valor do frete tende aumentar com o preco do produto?
- Qual o tempo medio de entrega?
- Como foi as vendas por mês?
- Quais meses superaram a meta de vendas?
- Como foi a venda por mês se comparado ao ano de 2016?

In [None]:
df.order_status.value_counts().iplot(kind='bar')

**Transformando as colunas do DF em datetime**

In [None]:
df.order_purchase_timestamp = pd.to_datetime(df.order_purchase_timestamp)

**Visualizando as colunas em datetime**

In [None]:
df.info()

- Use o metodo to_periodo() com o ´M´ para obter informações no formato de meses
- Criando a coluna order_purchase_month

In [None]:
df['order_purchase_month'] = df.order_purchase_timestamp.dt.to_period('M').astype(str)

In [None]:
df.order_purchase_month.head()

**Visualizando o Dataframe com a nova coluna**

In [None]:
df.head()

In [None]:
vendas_por_mes = df.groupby('order_purchase_month').order_products_value.sum()

In [None]:
type(vendas_por_mes)

In [None]:
vendas_por_mes.head()

In [None]:
vendas_por_mes.index.item

In [None]:
vendas_por_mes.values

**Pontos importantes a lembrar**

* init_notebook_mode()
* plotly.offline.iplot()

**Importando o Plotly**

In [None]:
import plotly 
import plotly.graph_objs as go
import plotly.offline as py

In [None]:
# Habilite o modo offiline
plotly.offline.init_notebook_mode(connected=True)

**Vendas por Mês**

* **Por Padrão o iplot() plota um gráfico de linha, da sentido de valor acumulado**

In [None]:
data = [go.Scatter(x=vendas_por_mes.index,
                   y=vendas_por_mes.values)]
py.iplot(data)

**Gráfico de Barras**

* **Customizando gráficos de barras: titulos e labels dos eixos**

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker={'color':'lightblue'}
              )]
# Criando Layout
configuracoes_layout = go.Layout(title='Vendas no Período',
                                 xaxis={'title': 'Período'},
                                 yaxis={'title': 'Valores de Vendas'})
# Objeto Figura
fig = go.Figure(data=data, layout=configuracoes_layout)

py.iplot(fig)

**Definindo ajustes em linhas e cores**

* **Parâmetros opacity e width**

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
              y=vendas_por_mes.values,
              marker={'color':'lightblue',
                      'line':{'color': '#333',
                              'width': 2}
                     },
              opacity=0.7)]

configuracoes_layout = go.Layout(title="Vendas por Período",
                                 xaxis={'title': 'Período'},
                                 yaxis={'title': 'Valores de Vendas'})

fig = go.Figure(data=data, layout=configuracoes_layout)

py.iplot(fig)

**Destacando uma Barra**

In [None]:
cores = []

In [None]:
vendas_por_mes.index

In [None]:
vendas_por_mes.values

**Variável Média**

In [None]:
media = vendas_por_mes.values.mean()

In [None]:
media

**Se o valor da barra for acima da média recebe a cor Azul se não recebe a cor vermelha**

In [None]:
cores = ['lightblue' if x > media  else 'red' for x in vendas_por_mes.values ]

**Visualizando a lista de cores**

In [None]:
cores

**Plotando o Gráfico**

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker={'color': cores,
                       'line':{'color': '#333',
                               'width': 2}
                      },
              opacity=0.7)]

layout = go.Layout(title='Vendas por Período',
                   xaxis={'title': 'Período'},
                   yaxis={'title': 'Valores de Vendas'})

fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Destaca a barra com maior valor e minimiza a visão de todas as outras**

In [None]:
maximo_vendas = vendas_por_mes.max()
media = media = vendas_por_mes.values.mean()

In [None]:
maximo_vendas

**Criando a lista de cores para passar para o gráfico**

In [None]:
cores = []
mes_maximo_vendas = ''
for x,y in zip(vendas_por_mes.values, vendas_por_mes.index):
    if x == maximo_vendas:
        mes_maximo_vendas = y
        cores.append('blue')
    elif x < media:
        cores.append('red')
    else:
        cores.append('lightgray')

In [None]:
cores

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

data = [ go.Bar(x=vendas_por_mes.index,
                    y=vendas_por_mes.values,
                    marker={'color':cores,
                            'line': {'color': '#333',
                                     'width': 2}
                           },
                    opacity=0.7
                   )
       ]

layout = go.Layout(title='Vendas por Período',
                   xaxis={'title': 'Período'},
                   yaxis={'title': 'Valores de Vendas'},
                   
                  # Anotação do Gráfico na Barra de Máximo Valoe
                  annotations=[{'text': 'Máximo de vendas',
                                'x':mes_maximo_vendas,
                                'y':maximo_vendas
                               }]
                  )

fig = go.Figure(data=data, layout= layout)

py.iplot(fig)

**Visualizando duas informações no mesmo gráfico**

* `Vamos definir alguns fictions para vendas do ano anterior`

In [None]:
vendas_ano_anterior = vendas_por_mes - 10000

**Gráfico de barrar aninhados**

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

data = [ go.Bar(x=vendas_por_mes.index,
                y=vendas_por_mes.values,
                marker={'color':cores,
                         'line':{'color':'#333',
                                 'width': 2}
                       },
                opacity=0.7,
                name='2017'
               ),
        
        # Definindo o outro plot do gráfico do ano passado.
         go.Bar(x=vendas_ano_anterior.index,
                y=vendas_ano_anterior.values,
                name='2016',
                marker={'color':'lightgreen',
                         'line':{'color':'#333',
                                 'width': 2}
                       },
                opacity=0.7
               )
       ]

layout = go.Layout(title='Vendas por Período',
                   xaxis={'title': 'Período'},
                   yaxis={'title': 'Valores de Vendas'},
                   
                  # Anotação do Gráfico na Barra de Máximo Valoe
                  annotations=[{'text': 'Máximo de vendas',
                                'x':mes_maximo_vendas,
                                'y':maximo_vendas
                               }]
                  )

fig = go.Figure(data=data, layout= layout)

py.iplot(fig)


**Vendas por Categorias de produtos**

- **Conta quantos produtos por categoria e coloca dentro da variável vendas_produto_por_categoria**

In [None]:
venda_produto_por_categoria = df.groupby(by='product_category_name').id.count()

In [None]:
venda_produto_por_categoria

**Filtrar as categorias que tem vendas maiores que 1**

In [None]:
venda_produto_por_categoria = venda_produto_por_categoria.loc[venda_produto_por_categoria.values > 10]

In [None]:
venda_produto_por_categoria

**Ordena valores do maior para o menor**

In [None]:
venda_produto_por_categoria.sort_values(ascending=False,inplace=True)

**Plota Gráfico de Barras verticais**

In [None]:
import plotly.offline as py
import plotly.graph_objs as go


trace0 = go.Bar(y=venda_produto_por_categoria.values,
                x=venda_produto_por_categoria.index,
                marker= {'color': '#00FF2a'},
                orientation='v' # Gráfico de Barra verticais.
               )

data = [trace0]

# Criando o Layout
configuracoes_layout = go.Layout(title='Vendas por Categoria',
                                 xaxis=dict(
                                     titlefont=dict(
                                         size=40,
                                         color='lightgrey'),
                                     tickangle=75),
                                 yaxis={'title':'Quantidade de Vendas'})

# Objeto de Figura
fig = go.Figure(data=data, layout=configuracoes_layout)

py.iplot(fig)

**Alterando a faixa de valores do eixo Y em 10%**

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

trace0 = go.Bar(x=venda_produto_por_categoria.index,
                y=venda_produto_por_categoria.values,
                marker=dict(
                            color='#00FF2a'
                            ),
                orientation='v'
               )
data = [trace0]

configuracoes_layout = go.Layout(title='Venda por Categoria',
                                  xaxis= dict(
                                                titlefont=dict(
                                                                size=40,
                                                                color='lightgrey'
                                                                ),
                                              tickangle=75
                                              ),
                                  yaxis= {'title':'Quantidade Vendida',
                                          'range': [0, max(venda_produto_por_categoria) * 1.10]}
                                 )
fig = go.Figure(data=data, layout=configuracoes_layout)

py.iplot(fig,filename="Vendas por Categoria de Produto")

**Existe tendência entre: Valor de Frete x Valor de Produto ?**

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Scatter(x=df.order_freight_value,
                   y=df.order_products_value,
                   mode='markers',
                   marker={'color':'green'},
                   )
       ]

layout = go.Layout(title='Valor de Frete x Valor de Produto',
                   xaxis={'title':'Valor de Produto'},
                   yaxis={'title':'Valor do Frete'})

# Exibição
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Usando o parâmetro text na visualização (Parâmetro hover)**

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

%matplotlib inline

# Criand
trace = go.Scatter(x=df.order_freight_value,
                  y=df.order_products_value,
                  mode='markers',
                  # Customização do texto a ser exibido no hover
                  text = 'Status do Pedido:' + df['order_status'] +
                         '<br>' + 'Classe: ' + df['most_voted_class'],
                  # Exibição do Hover
                  hoverinfo='text+x+y', # Texto concatenado com o valor de x e y
                  
                  # Cor do gráfico
                  marker = {'color':'#941229'}
          )
data = [trace]

layout = go.Layout(title='Valor de Frete x Valor de Produto',
                xaxis={'title':'Valor do Frete'},
                yaxis={'title':'Valor de Produto'})


fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

    


**Customização dos eixos com o formato em reais R$**

In [None]:
trace = go.Scatter(x=df.order_freight_value,
                   y=df.order_products_value,
                   mode='markers',
                   text = 'Status do Pedido:' + df['order_status'] +
                         '<br>' + 'Classe: ' + df['most_voted_class'],
                   hoverinfo='text+x+y',
                   marker={'color':'green'}
                  )
data = [trace]

layout = go.Layout(title='Valor de Frete x Valor de Produto',
                  
                   # Definindo Exibição do eixo X
                  yaxis={'title':'Valor de Produto',
                         'tickformat':'.',
                         'tickprefix':'R$'},
                  xaxis={'title':'Valor de Frete',
                         'tickformat':'.',
                         'tickprefix':'R$'})

fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Gráfico de Bolhas: Valor de Frete x Valor do Produto por numero de vendedores**

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

%matplotlib inline

# Criand
trace = go.Scatter(x=df.order_freight_value,
                  y=df.order_products_value,
                  mode='markers',
                  # Customização do texto a ser exibido no hover
                  text = 'Status do Pedido:' + df['order_status'] +
                         '<br>' + 'Classe: ' + df['most_voted_class'],
                  # Exibição do Hover
                  hoverinfo='text+x+y', # Texto concatenado com o valor de x e y
                  
                  # Cor do gráfico
                  marker = {'color':'green',
                            'size':df['order_sellers_qty'] * 10, # Tamanho dos pontos do gráfico.
                            'sizemode': 'area'} # Tipo do tamanho
          )
data = [trace]

layout = go.Layout(title='Valor de Frete x Valor de Produto',
                   
                # Definindo Exibição do eixo X
                  yaxis={'title':'Valor de Produto',
                         'tickformat':'.',
                         'tickprefix':'R$'},
                  xaxis={'title':'Valor de Frete',
                         'tickformat':'.',
                         'tickprefix':'R$'})


fig = go.Figure(data=data, layout=layout)

py.iplot(fig)



**Valor de Frete x Valor de Produto por Status de Entrega**

In [None]:
df.iplot(x='order_freight_value',
         y='order_products_value',
         categories='most_voted_subclass',
         title='Valor de Frete x Valor de Produto',
         xTitle='Valor de Frete',
         yTitle='Valor de Produto')

**Quantidade em média de Item de um pedido**

In [None]:
data = [go.Histogram(x=df.order_items_qty)]

layout = go.Layout(title='Quantidade em média de Item de um pedido')

fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Quantidade média de Vendedores de um pedido**

In [None]:
trace1 = go.Histogram(x=df.order_items_qty,
                     name='Itens',
                     opacity=0.75)

trace2 = go.Histogram(x=df.order_sellers_qty,
                     name='Vendedores',
                     opacity=0.75)

layout = go.Layout(title='Quande de itens e Vendedore por pedido',
                  barmode='overlay')
dados = [trace1, trace2]

fig = go.Figure(data=dados, layout=layout)

py.iplot(fig)

**Plotando um gráfico de pizza**

* **Qual a distribuição da classificação dos pedidos pelos clientes**

In [None]:
df.order_status.value_counts

In [None]:
classes_mais_votadas = df.groupby(by='most_voted_class').id.count()

In [None]:
# Mesmo resultado do codigo acima
classes_mais_votadas = df.most_voted_class.value_counts()

In [None]:
# Criando o gráfico
trace = go.Pie(labels=classes_mais_votadas.index,
               values=classes_mais_votadas.values)

# Armazanando o gráfico na lista
dados = [trace]

# Criando o Layout
layout =  go.Layout(title='Classificação de Clientes sobre Pedidos')

fig = go.Figure(data=dados, layout=layout)

py.iplot(fig)

**Parâmetro direction**

In [None]:
# Criando o gráfico
trace = go.Pie(labels=classes_mais_votadas.index,
               values=classes_mais_votadas.values,
              direction='clockwise') # Organiza as informações no formato de relógio

# Armazanando o gráfico na lista
dados = [trace]

# Criando o Layout
layout =  go.Layout(title='Classificação de Clientes sobre Pedidos')

fig = go.Figure(data=dados, layout=layout)

py.iplot(fig)

**Customizando gráficos de pizza**

In [None]:
# Criando o gráfico

cores = ['#96D38C', '#FEBFB3', '#E1396C']

trace = go.Pie(labels=classes_mais_votadas.index,
               values=classes_mais_votadas.values,
               marker={'colors':cores}, # Passa como parâmetro as cores que desejo para o Gráfico
               direction='clockwise') # Organiza as informações no formato de relógio

# Armazanando o gráfico na lista
dados = [trace]

# Criando o Layout
layout =  go.Layout(title='Classificação de Clientes sobre Pedidos')

fig = go.Figure(data=dados, layout=layout)

py.iplot(fig)

In [None]:
# Criando o gráfico

cores = ['#96D38C', '#FEBFB3', '#E1396C']

trace = go.Pie(labels=classes_mais_votadas.index,
               values=classes_mais_votadas.values,
               marker={'colors':cores,  # Passa como parâmetro as cores que desejo para o Gráfico
                       'line': {'color':'#000000', 'width':2}},
               hoverinfo='label+percent+value',
               direction='clockwise') # Organiza as informações no formato de relógio

# Armazanando o gráfico na lista
dados = [trace]

# Criando o Layout
layout =  go.Layout(title='Classificação de Clientes sobre Pedidos')

fig = go.Figure(data=dados, layout=layout)

py.iplot(fig)

**Destacando porções do gráfico**

In [None]:
# Criando o gráfico

cores = ['#96D38C', '#FEBFB3', '#E1396C']

trace = go.Pie(labels=classes_mais_votadas.index,
               values=classes_mais_votadas.values,
               marker={'colors':cores,  # Passa como parâmetro as cores que desejo para o Gráfico
                       'line': {'color':'#000000', 'width':2}},
               hoverinfo='label+percent+value',
               pull=[0,0,0.1], # Destacando uma parte do gráfico
               direction='clockwise') # Organiza as informações no formato de relógio

# Armazanando o gráfico na lista
dados = [trace]

# Criando o Layout
layout =  go.Layout(title='Classificação de Clientes sobre Pedidos')

fig = go.Figure(data=dados, layout=layout)

py.iplot(fig)

**Exportando nosso gráfico para conta do Plotly na nuvem**

**Importando método para plot online**

In [None]:
!pip install chart-studio

In [None]:
import chart_studio as cs

In [None]:
cs.tools.set_credentials_file(username='josecarlos10967', api_key='51Bb4cHJkmKPUiD2rIKU')

## Exercício ##

- Usando os conhecimentos adquiridos aqui, crie um dashboard na nuvem do Plot e compartilhe comigo :)
- Envie para o e-mail contato@minerandodados.com.br
- Lembre-se: Seu Dashboard deve ser usado como seu **portfólio profissional**.

In [None]:
# Criando o gráfico
import plotly.graph_objs as go

cores = ['#96D38C', '#FEBFB3', '#E1396C']

trace = go.Pie(labels=classes_mais_votadas.index,
               values=classes_mais_votadas.values,
               marker={'colors':cores,  # Passa como parâmetro as cores que desejo para o Gráfico
                       'line': {'color':'#000000', 'width':2}},
               hoverinfo='label+percent+value',
               pull=[0,0,0.1], # Destacando uma parte do gráfico
               direction='clockwise') # Organiza as informações no formato de relógio

# Armazanando o gráfico na lista
dados = [trace]

# Criando o Layout
layout =  go.Layout(title='Classificação de Clientes sobre Pedidos')

fig = go.Figure(data=dados, layout=layout)

cs.plotly.plot(fig)

In [None]:
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker={'color': cores,
                       'line':{'color': '#333',
                               'width': 2}
                      },
              opacity=0.7)]

layout = go.Layout(title='Vendas por Período',
                   xaxis={'title': 'Período'},
                   yaxis={'title': 'Valores de Vendas'})

fig = go.Figure(data=data, layout=layout)

cs.plotly.plot(fig)

In [None]:

data = [ go.Bar(x=vendas_por_mes.index,
                y=vendas_por_mes.values,
                marker={'color':cores,
                         'line':{'color':'#333',
                                 'width': 2}
                       },
                opacity=0.7,
                name='2017'
               ),
        
        # Definindo o outro plot do gráfico do ano passado.
         go.Bar(x=vendas_ano_anterior.index,
                y=vendas_ano_anterior.values,
                name='2016',
                marker={'color':'lightgreen',
                         'line':{'color':'#333',
                                 'width': 2}
                       },
                opacity=0.7
               )
       ]

layout = go.Layout(title='Vendas por Período',
                   xaxis={'title': 'Período'},
                   yaxis={'title': 'Valores de Vendas'},
                   
                  # Anotação do Gráfico na Barra de Máximo Valoe
                  annotations=[{'text': 'Máximo de vendas',
                                'x':mes_maximo_vendas,
                                'y':maximo_vendas
                               }]
                  )

fig = go.Figure(data=data, layout= layout)

cs.plotly.plot(fig)


In [None]:
import plotly.offline as py
import plotly.graph_objs as go


trace0 = go.Bar(y=venda_produto_por_categoria.values,
                x=venda_produto_por_categoria.index,
                marker= {'color': '#00FF2a'},
                orientation='v' # Gráfico de Barra verticais.
               )

data = [trace0]

# Criando o Layout
configuracoes_layout = go.Layout(title='Vendas por Categoria',
                                 xaxis=dict(
                                     titlefont=dict(
                                         size=40,
                                         color='lightgrey'),
                                     tickangle=75),
                                 yaxis={'title':'Quantidade de Vendas'})

# Objeto de Figura
fig = go.Figure(data=data, layout=configuracoes_layout)

cs.plotly.plot(fig)