## Visualização de dados com Plot.ly##

`Cufflinks conecta o pandas ao plot.ly`

`Instalação do Plot.ly e Cufflinks`

In [1]:
!pip install cufflinks
!pip install plotly # a exclamação é um comando de sistema operacional não do python. Pois não vem instalado por padrao no anaconda.

Collecting cufflinks
  Downloading cufflinks-0.17.0.tar.gz (81 kB)
Collecting plotly>=4.1.1
  Downloading plotly-4.5.2-py2.py3-none-any.whl (7.1 MB)
Collecting chart-studio>=1.0.0
  Downloading chart_studio-1.0.0-py3-none-any.whl (76 kB)
Collecting colorlover>=0.2.1
  Downloading colorlover-0.3.0-py3-none-any.whl (8.9 kB)
Collecting retrying>=1.3.3
  Downloading retrying-1.3.3.tar.gz (10 kB)
Building wheels for collected packages: cufflinks, retrying
  Building wheel for cufflinks (setup.py): started
  Building wheel for cufflinks (setup.py): finished with status 'done'
  Created wheel for cufflinks: filename=cufflinks-0.17.0-py3-none-any.whl size=68551 sha256=f70462205de39b491accdb2d891c179808bc4ffc6e8bcf6c82929bc398ddb1cb
  Stored in directory: c:\users\andre\appdata\local\pip\cache\wheels\16\22\f8\084326defc3fe232aacf4a4c855c58de34b62f35387acc1eda
  Building wheel for retrying (setup.py): started
  Building wheel for retrying (setup.py): finished with status 'done'
  Created wheel f



`Importando o cufflinks e o plot.ly`

In [1]:
import cufflinks as cf
from plotly.offline import plot, iplot
import pandas as pd
import numpy as np

**Cria um dataframe com dados aleatorios divididos em 4 colunas**

In [3]:
df = pd.DataFrame(np.random.randn(100,4), columns=['A','B','C','D'])

In [4]:
df.head()

Unnamed: 0,A,B,C,D
0,2.154788,0.290973,1.586381,-0.158044
1,1.760129,-0.282232,-0.319839,0.265287
2,0.608599,-1.019196,0.211962,-2.06068
3,0.445041,-0.434071,0.777331,-0.597962
4,-0.157885,0.108903,-0.327784,0.880013


**Ao tentar usar o Cufflinks veja o resultado**

In [5]:
df.iplot() #iplot é graficos offline

PlotlyRequestError: Authentication credentials were not provided.

**É preciso habilitar o modo offline primeiramente**

In [2]:
cf.go_offline()

**Executando o iplot() novamente**

`Clique no link "Export to plot.ly"`

In [7]:
df.head()

Unnamed: 0,A,B,C,D
0,2.154788,0.290973,1.586381,-0.158044
1,1.760129,-0.282232,-0.319839,0.265287
2,0.608599,-1.019196,0.211962,-2.06068
3,0.445041,-0.434071,0.777331,-0.597962
4,-0.157885,0.108903,-0.327784,0.880013


In [8]:
df.iplot()

**Gráficos do tipo scatter**

In [9]:
df.iplot(kind='scatter', x='A',y='B', mode='markers')

**Gráficos de Barras**

In [13]:
df.sum().iplot(kind='bar')

**Gráficos de Boxplots**

`Basta clicar no item da legenda a direita para habilitar ou desabilitar o dado da coluna`

In [11]:
df.iplot(kind='box')

**Histogramas**

`Compare com os histograsm padrões do matplotlib e seaborn`

In [14]:
df['A'].iplot(kind='hist')

`Histograma aninhado de todas as colunas (mesmo tipo de dados)`

In [15]:
df.iplot(kind='hist')

**Spread plots**

In [16]:
df[['A','D','C','B']].iplot(kind='spread')


The pandas.np module is deprecated and will be removed from pandas in a future version. Import numpy directly instead


The pandas.np module is deprecated and will be removed from pandas in a future version. Import numpy directly instead



**Bubble Plots**

In [19]:
df.iplot(kind='bubble', x='A',y='B', size='C', colors='seagreen')

**Scatter Matrix**

- `Similar ao pairplot do Seaborn`
-  `Se o dataframe for muito grande pode travar o seu notebook`

In [20]:
df.scatter_matrix()

## Visualização de dados reais ##

**Lembre-se de habilitar o modo offline do plotly**

In [3]:
import cufflinks as cf
cf.go_offline()

**Importe o pandas**

In [10]:
import pandas as pd

**Dataset de Vendas da Olist**

- O dataset já está disponível no diretório datasets. Não é necessário download.
- Se quiser conhecer mais sobre esse dataset, segue o link https://www.kaggle.com/olistbr/brazilian-ecommerce/version/2

In [11]:
df = pd.read_csv('datasets/olist_classified_public_dataset.csv')

**Visualizando a base de dados**

In [24]:
df.head()

Unnamed: 0.1,Unnamed: 0,id,order_status,order_products_value,order_freight_value,order_items_qty,order_sellers_qty,order_purchase_timestamp,order_aproved_at,order_estimated_delivery_date,...,votes_delayed,votes_low_quality,votes_return,votes_not_as_anounced,votes_partial_delivery,votes_other_delivery,votes_other_order,votes_satisfied,most_voted_subclass,most_voted_class
0,0,1,delivered,89.99,14.38,1,1,2017-08-30 11:41:01.000000,2017-08-30 11:55:08.970352,2017-09-21 00:00:00.000000,...,0,0,0,0,0,0,0,3,satisfeito,satisfeito_com_pedido
1,1,2,delivered,69.0,15.23,1,1,2017-09-26 09:13:36.000000,2017-09-26 09:28:10.922048,2017-10-24 00:00:00.000000,...,0,0,0,0,0,0,0,0,antes_prazo,satisfeito_com_pedido
2,2,3,delivered,99.8,15.86,2,4,2018-01-15 15:50:42.000000,2018-01-17 07:29:56.419769,2018-02-05 00:00:00.000000,...,0,0,0,0,3,0,0,0,entrega_parcial,problemas_de_entrega
3,3,4,delivered,87.0,12.74,1,1,2018-02-04 11:16:42.000000,2018-02-06 05:31:50.990164,2018-03-13 00:00:00.000000,...,3,0,0,0,0,0,0,0,atrasado,problemas_de_entrega
4,4,5,delivered,99.9,17.95,1,2,2017-12-07 11:58:42.000000,2017-12-08 02:36:49.587515,2018-01-03 00:00:00.000000,...,0,0,0,0,3,0,0,0,entrega_parcial,problemas_de_entrega


In [25]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3584 entries, 0 to 3583
Data columns (total 34 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   Unnamed: 0                     3584 non-null   int64  
 1   id                             3584 non-null   int64  
 2   order_status                   3584 non-null   object 
 3   order_products_value           3584 non-null   float64
 4   order_freight_value            3584 non-null   float64
 5   order_items_qty                3584 non-null   int64  
 6   order_sellers_qty              3584 non-null   int64  
 7   order_purchase_timestamp       3584 non-null   object 
 8   order_aproved_at               3584 non-null   object 
 9   order_estimated_delivery_date  3584 non-null   object 
 10  order_delivered_customer_date  3467 non-null   object 
 11  customer_city                  3584 non-null   object 
 12  customer_state                 3584 non-null   o

## Perguntas aos dados

- Quais a distribuicao dos status dos pedidos?
- Quais os meses do ano houve mais vendas?
- Qual a quantidade de items de um pedido? (medio)
- Qual a quantidade de vendedores em um pedido ? (medio)
- O valor do frete tende aumentar com o preco do produto?
- Qual o tempo medio de entrega?
- Como foi as vendas por mês?
- Quais meses superaram a meta de vendas?
- Como foi a venda por mês se comparado ao ano de 2016?

In [26]:
df.order_status.value_counts().iplot(kind='bar')

**Transformando colunas para o formato datetime**

In [12]:
df.order_purchase_timestamp = pd.to_datetime(df.order_purchase_timestamp)

**Visualizando as colunas agora em Datetime**

In [6]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3584 entries, 0 to 3583
Data columns (total 34 columns):
 #   Column                         Non-Null Count  Dtype         
---  ------                         --------------  -----         
 0   Unnamed: 0                     3584 non-null   int64         
 1   id                             3584 non-null   int64         
 2   order_status                   3584 non-null   object        
 3   order_products_value           3584 non-null   float64       
 4   order_freight_value            3584 non-null   float64       
 5   order_items_qty                3584 non-null   int64         
 6   order_sellers_qty              3584 non-null   int64         
 7   order_purchase_timestamp       3584 non-null   datetime64[ns]
 8   order_aproved_at               3584 non-null   object        
 9   order_estimated_delivery_date  3584 non-null   object        
 10  order_delivered_customer_date  3467 non-null   object        
 11  customer_city    

- Use o metodo to_periodo() com o ´M´ para obter informações no formato de meses
- Criando a coluna order_purchase_month

In [13]:
df['order_purchase_month'] = df.order_purchase_timestamp.dt.to_period('M').astype(str)

In [14]:
df.order_purchase_month.head()

0    2017-08
1    2017-09
2    2018-01
3    2018-02
4    2017-12
Name: order_purchase_month, dtype: object

**Visualizando a nova coluna no dataframe**

In [35]:
df.head()

Unnamed: 0.1,Unnamed: 0,id,order_status,order_products_value,order_freight_value,order_items_qty,order_sellers_qty,order_purchase_timestamp,order_aproved_at,order_estimated_delivery_date,...,votes_low_quality,votes_return,votes_not_as_anounced,votes_partial_delivery,votes_other_delivery,votes_other_order,votes_satisfied,most_voted_subclass,most_voted_class,order_purchase_month
0,0,1,delivered,89.99,14.38,1,1,2017-08-30 11:41:01,2017-08-30 11:55:08.970352,2017-09-21 00:00:00.000000,...,0,0,0,0,0,0,3,satisfeito,satisfeito_com_pedido,2017-08
1,1,2,delivered,69.0,15.23,1,1,2017-09-26 09:13:36,2017-09-26 09:28:10.922048,2017-10-24 00:00:00.000000,...,0,0,0,0,0,0,0,antes_prazo,satisfeito_com_pedido,2017-09
2,2,3,delivered,99.8,15.86,2,4,2018-01-15 15:50:42,2018-01-17 07:29:56.419769,2018-02-05 00:00:00.000000,...,0,0,0,3,0,0,0,entrega_parcial,problemas_de_entrega,2018-01
3,3,4,delivered,87.0,12.74,1,1,2018-02-04 11:16:42,2018-02-06 05:31:50.990164,2018-03-13 00:00:00.000000,...,0,0,0,0,0,0,0,atrasado,problemas_de_entrega,2018-02
4,4,5,delivered,99.9,17.95,1,2,2017-12-07 11:58:42,2017-12-08 02:36:49.587515,2018-01-03 00:00:00.000000,...,0,0,0,3,0,0,0,entrega_parcial,problemas_de_entrega,2017-12


**Cria a variável `vendas_por_mes` que é a soma do valor dos produtos agrupados por mês**

In [15]:
vendas_por_mes = df.groupby(by='order_purchase_month').order_products_value.sum()

In [16]:
type(vendas_por_mes)

pandas.core.series.Series

**visualizando os valores de vendas por mês**

In [10]:
vendas_por_mes.head()

order_purchase_month
2017-02        9.99
2017-03      902.86
2017-04    17654.19
2017-05    25556.23
2017-06    34172.86
Name: order_products_value, dtype: float64

In [36]:
vendas_por_mes.index.item

<bound method IndexOpsMixin.item of Index(['2017-02', '2017-03', '2017-04', '2017-05', '2017-06', '2017-07',
       '2017-08', '2017-09', '2017-10', '2017-11', '2017-12', '2018-01',
       '2018-02', '2018-03', '2018-04'],
      dtype='object', name='order_purchase_month')>

In [58]:
vendas_por_mes.values

array([9.990000e+00, 9.028600e+02, 1.765419e+04, 2.555623e+04,
       3.417286e+04, 4.728474e+04, 3.989885e+04, 4.546220e+04,
       4.091040e+04, 5.537392e+04, 4.380657e+04, 4.675556e+04,
       4.256054e+04, 3.343548e+04, 3.754330e+03])

**Pontos importantes a lembrar:**
- init_notebook_mode()
- plotly.offline.iplot()

**Importando o plotly**

In [9]:
import plotly
import plotly.graph_objs as go
import plotly.offline as py

In [12]:
# habilita o modo offline
plotly.offline.init_notebook_mode(connected=True)

**Vendas por mês**

- **por padrão o iplot() plota um gráfico de linha, da sentido de valor acumulado**

In [36]:
import plotly.graph_objs as go

data = [go.Scatter(x=vendas_por_mes.index,
                   y=vendas_por_mes.values)]

pyo.plot(data)

'https://plot.ly/~leocadio_andre/17'

**Gráfico de Barras**

- **Customizando graficos de barras: titulos e labels dos eixos**

In [14]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': 'lightblue'})]

# Criando Layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title': 'Período'})

# Objeto figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
py.iplot(fig)

**Definindo ajustes em linhas e cores**

- **Parâmetro opacity e width**

In [15]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': 'lightblue',
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7
              )
       ]

# Criando Layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title':'Periodo'})

# Objeto figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
py.iplot(fig)

**Destacando uma barras**

In [37]:
cores = []

In [38]:
vendas_por_mes.index

Index(['2017-02', '2017-03', '2017-04', '2017-05', '2017-06', '2017-07',
       '2017-08', '2017-09', '2017-10', '2017-11', '2017-12', '2018-01',
       '2018-02', '2018-03', '2018-04'],
      dtype='object', name='order_purchase_month')

In [39]:
vendas_por_mes

order_purchase_month
2017-02        9.99
2017-03      902.86
2017-04    17654.19
2017-05    25556.23
2017-06    34172.86
2017-07    47284.74
2017-08    39898.85
2017-09    45462.20
2017-10    40910.40
2017-11    55373.92
2017-12    43806.57
2018-01    46755.56
2018-02    42560.54
2018-03    33435.48
2018-04     3754.33
Name: order_products_value, dtype: float64

**Valor de média para ser testado**

In [40]:
media = vendas_por_mes.values.mean()

In [41]:
media

31835.914666666733

**Alimentando a lista de cores**

In [42]:
# se o valor de vendas do mês for menor que a média a lista de cor será vermelha, senão azul.
for x in vendas_por_mes.values:
    if x < media:
        cores.append('red')
    else:
        cores.append('lightblue')

**Visualizando a lista de cores**

In [50]:
cores

['red',
 'red',
 'red',
 'red',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'red']

**Gráficos de Vendas no Periodo**

In [44]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': cores,  #lista de cores
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7
              )
       ]

# Criando Layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title':'Periodo'})

# Objeto figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
pyo.plot(fig, filename='Meses que nao superaram a meta de vendas')

'https://plot.ly/~leocadio_andre/19'

**Destaca a barra com o maior valor e minimiza a visao de todas as outras**

In [45]:
maximo_de_vendas = vendas_por_mes.values.max()

In [46]:
maximo_de_vendas

55373.920000000086

**Alimenta a lista de cores**

In [21]:
cores = []
for x,y in zip(vendas_por_mes.values, vendas_por_mes.index):
    if x == maximo_de_vendas:
        mes_maximo_de_vendas = y
        cores.append('blue')
    else:
        cores.append('lightgray')

In [47]:
mes_maximo_de_vendas

'2017-11'

In [56]:
cores

['lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'blue',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray']

**Plota o gráfico de vendas com um destaque de cor e anotação para o mês que teve mais vendas**

In [48]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': cores,
                         'line': {'color': '#333',
                                 'width': 2}
                        },
               opacity= 0.7
              )
       ]

# Criando Layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title': 'Periodo'},
                                 # texto na barra de destaque
                                 annotations = [{'text':'Mês destaque de vendas',
                                                'x':mes_maximo_de_vendas,
                                                'y':maximo_de_vendas}
                                               ]
                                                                                              
                                )

# Objeto figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
pyo.plot(fig, filename='Mes destaque de vendas')

'https://plot.ly/~leocadio_andre/21'

**Visualizando duas informações no mesmo gráfico**

- `Vamos definir alguns valores ficticios para vendas do ano anterior`

In [49]:
vendas_ano_anterior = vendas_por_mes - 10000.00

**Gráfico de barras aninhadas**

In [50]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': cores,
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7,
               name='2017'
              ),
# definindo outro plot de barras com valores dos meses passados
        
        go.Bar(x=vendas_ano_anterior.index,
               y=vendas_ano_anterior.values,
               name='2016',
               marker = {'color': 'lightgreen',
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7
              )
              
       ]

# Criando Layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title': 'Periodo'},
                                 annotations = [{'text':'Mês destaque de vendas',
                                                'x':mes_maximo_de_vendas,
                                                'y':maximo_de_vendas}
                                               ]                       
                                
                                )

# Objeto figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
pyo.plot(fig, filename='Vendas no periodo 2017 e 2016')

'https://plot.ly/~leocadio_andre/23'

**Vendas por categorias de produtos**
- **Conta quantos produtos por categoria e coloca dentro da variável vendas_produto_por_categoria**

In [23]:
vendas_produto_por_categoria =  df.groupby(by='product_category_name').id.count()

In [51]:
vendas_produto_por_categoria

product_category_name
cama_mesa_banho                      471
moveis_decoracao                     302
beleza_saude                         253
esporte_lazer                        224
informatica_acessorios               215
utilidades_domesticas                199
ferramentas_jardim                   197
relogios_presentes                   196
cool_stuff                           152
perfumaria                           140
brinquedos                           137
automotivo                           134
fashion_bolsas_e_acessorios          125
telefonia                            118
bebes                                 83
moveis_escritorio                     77
papelaria                             65
eletronicos                           55
pet_shop                              52
malas_acessorios                      49
consoles_games                        32
casa_conforto                         31
eletrodomesticos                      29
eletroportateis                    

**Filtra categorias com quantidade de vendas maiores que 1**

In [52]:
vendas_produto_por_categoria = vendas_produto_por_categoria.loc[vendas_produto_por_categoria.values >5]

**Ordena valores do maior para o menor**

In [53]:
vendas_produto_por_categoria.sort_values(ascending=False,inplace=True)

**Plota gráfico de barras verticais**

In [54]:
import plotly.offline as py
import plotly.graph_objs as go

trace0 = go.Bar(y=vendas_produto_por_categoria.values,
                x=vendas_produto_por_categoria.index,
                marker = {'color': '#00FF2A'},
                orientation='v' #significa um gráfico de barras verticais
              )

data = [trace0]

# Criando Layout
configuracoes_layout = go.Layout(title='Vendas por categoria de Produtos',
                   xaxis=dict(
                         titlefont=dict(
                                   size=40,
                                   color='lightgrey'),
                   tickangle=75),
                   yaxis={'title': 'Quantidade vendida'})

# Objeto figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
pyo.plot(fig)

'https://plot.ly/~leocadio_andre/25'

**Alterando Faixa de valores dos eixos somando 10% ao valor máximo**

In [55]:
max(vendas_produto_por_categoria.values) * 1.10

518.1

In [56]:
import plotly.offline as py
import plotly.graph_objs as go

trace0 = go.Bar(y=vendas_produto_por_categoria.values,
                x=vendas_produto_por_categoria.index,
                marker = {'color': '#00FF2A'},
                orientation='v'
              )

data = [trace0]

# Criando Layout
configuracoes_layout = go.Layout(title='Vendas por categoria de Produtos',
                   xaxis=dict(
                         titlefont=dict(
                                   size=40,
                                   color='lightgrey'),
                                   tickangle=75),
                   
                   # valor maximo da faixa + 10%
                   yaxis={'title': 'Quantidade vendida',
                          'range':[0,max(vendas_produto_por_categoria.values) * 1.10]#uma lista que recebe do minimo ao maximo.
                         })

# Objeto figura

fig = go.Figure(data=data, layout=configuracoes_layout)
                   
# plotando o grafico
pyo.plot(fig, filename='Vendas por categoria de Produtos')

'https://plot.ly/~leocadio_andre/27'

**Valor de Frete vs Valor de Produto: Existe alguma tendencia?**

In [57]:
# Criando gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   marker = {'color':'#941229'}
                  )
# Armazenando gráfico em uma lista
data = [trace]

# Criando Layout
layout = go.Layout(title='Valor de Frete x Valor de Produto',
                   yaxis={'title':'Valor do Produto'},
                   xaxis={'title': 'Valor do Frete'})

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

pyo.plot(fig)

'https://plot.ly/~leocadio_andre/29'

**Usando o parâmetro text na visualização (parâmetro hover)**

In [42]:
# Criando gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   # customização do texto a ser exibido no hover
                   text = 'Status do pedido: '+ df['order_status'] +
                           '<br>' + 'Classe: '+ df['most_voted_class']
                   ,
                   # exibição do hover
                   hoverinfo='text+x+y',
                   marker = {'color':'#941229'}
                  )
# Armazenando gráfico em uma lista
data = [trace]

# Criando Layout
layout = go.Layout(title='Valor de Frete x Valor de Produto',
                   yaxis={'title':'Valor do Produto'},
                   xaxis={'title': 'Valor do Frete'})

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Customizacao dos eixos com formato em reais R$**

In [22]:
# Criando gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   # customização do texto a ser exibido no hover
                   text = 'Status do pedido: '+ df['order_status'] +
                           '<br>' + 'Classe: '+ df['most_voted_class']
                   ,
                   # exibição do hover
                   hoverinfo='text+x+y',
                   marker = {'color':'#941229'}
                  )
# Armazenando gráfico em uma lista
data = [trace]

# Criando Layout
layout = go.Layout(title='Valor de Frete x Valor de Produto',

                   # Definindo exibicao dos eixos x e y
                   yaxis={'title':'Valor do Produto', 
                          'tickformat':'.', 
                          'tickprefix':'R$ '},
                   xaxis={'title': 'Valor do Frete',
                          'tickformat':'.', 
                          'tickprefix':'R$ '})

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Grafico de Bolhas: Valor de Frete vs Valor do Produto por numero de vendedores**

In [44]:
# Criando gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   # customização do texto a ser exibido no hover
                   text = 'Status do pedido: '+ df['order_status'] +
                           '<br>' + 'Classe: '+ df['most_voted_class']
                   ,
                   # exibição do hover
                   hoverinfo='text+x+y',
                   
                   # parametro size e sizemode especifica o comportamento dos pontos
                   marker = {'color':'#941229',
                             'size': df['order_sellers_qty']*10,
                             'sizemode':'area'
                             }
                  )
# Armazenando gráfico em uma lista
data = [trace]

# Criando Layout
layout = go.Layout(title='Valor de Frete x Valor de Produto',

                   # Definindo exibicao dos eixos x e y
                   yaxis={'title':'Valor do Produto', 
                          'tickformat':'.', 
                          'tickprefix':'R$ '},
                   xaxis={'title': 'Valor do Frete',
                          'tickformat':'.', 
                          'tickprefix':'R$ '})

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig, filename='Valor de Frete por Valor de Produto')

**Valor de Frete vs Valor de Produto por status de entrega**

In [23]:
df.iplot(x='order_freight_value',
         y='order_products_value', 
         categories='most_voted_subclass',
         title='Valor de Frete vs Valor de Produto',
         xTitle='Valor de Frete',
         yTitle='Valor Produto')


The pandas.np module is deprecated and will be removed from pandas in a future version. Import numpy directly instead


The pandas.np module is deprecated and will be removed from pandas in a future version. Import numpy directly instead



**Quantidade em média de items de um pedido**

In [24]:
data = [go.Histogram(x=df.order_items_qty)]

layout = go.Layout(title='Quantidade média de itens de um pedido')

fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Quantidade média de vendedores de um pedido**

In [58]:
trace1 = go.Histogram(x=df.order_items_qty,
                     name='itens',
                     opacity=0.75)

trace2 = go.Histogram(x=df.order_sellers_qty,
                     name='vendedores',
                     opacity=0.75)

layout = go.Layout(title='Quantidade de itens e Vendedores por pedido',
                   barmode='overlay'
                  )

dados = [trace1, trace2]

fig = go.Figure(data=dados, layout=layout)

pyo.plot(fig, filename='Quantidade de itens e vendedores por pedido')

'https://plot.ly/~leocadio_andre/31'

**Plotando um gráfico de pizzaa**
- **Qual a distribuição da classificação dos pedidos pelos clientes?**

In [60]:
df.order_status.value_counts()

delivered     3467
shipped         48
canceled        25
invoiced        24
processing      20
Name: order_status, dtype: int64

In [59]:
classes_mais_votadas = df.groupby(by='most_voted_class').id.count()

In [29]:
classes_mais_votadas

most_voted_class
problemas_de_entrega       950
problemas_de_qualidade     480
satisfeito_com_pedido     1983
Name: id, dtype: int64

In [61]:
# mesmo resultado do codigo acima
classes_mais_votadas = df.most_voted_class.value_counts()

In [62]:
# Criando gráfico

trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values
              )

# Armazenando gráfico em uma lista

data = [trace]

# Criando Layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

pyo.plot(fig)

'https://plot.ly/~leocadio_andre/33'

**Parametro direction**

In [32]:
# Criando gráfico

trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               direction='clockwise'
              )

# Armazenando gráfico em uma lista

data = [trace]

# Criando Layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Customizando gráficos de pizza**

In [33]:
# Criando gráfico

cores = ['#96D38C','#FEBFB3','#E1396C'] #Codigo RGB.


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores},
               direction='clockwise'
              )

# Armazenando gráfico em uma lista

data = [trace]

# Criando Layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Adicionando linha de contorno, cores**

In [35]:
# Criando gráfico

cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores, 
                         'line' : {'color':'#000000','width':2}
                        },
               hoverinfo='label+value+percent',
               direction='clockwise'
              )

# Armazenando gráfico em uma lista

data = [trace]

# Criando Layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Destacando porções do gráfico**

In [37]:
# Criando gráfico

cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores, 
                         'line' : {'color':'#000000','width':2}
                        },
               hoverinfo='label+percent+value',
               pull=[0,0,0.2],
               direction='clockwise'
              )

# Armazenando gráfico em uma lista

data = [trace]

# Criando Layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

**Não se esqueça de habilitar o modo offline**

In [7]:
from plotly.offline import iplot
import plotly.offline as py
import plotly.graph_objs as go

**Definindo cores das partes do gráfico de pizza**

In [35]:
# Criando gráfico

cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores, 
                         'line' : {'color':'#000000','width':2}
                        },
               hoverinfo='label+percent+value',
               pull=[0,0,0.1]
              )

# Armazenando gráfico em uma lista

data = [trace]

# Criando Layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

pyo.plot(fig, filename='Classificação de Clientes sobre Pedidos')
#Para trabalhar em nuvem troca o py pelo pyo e o iplot por plot


'https://plot.ly/~leocadio_andre/15'

**Exportando nosso gráfico para conta do Plotly na nuvem**

- Criar conta no portal **plot.ly**
- Obter credenciais da API
- Importa método para plot **online**
- Substitua o método iplot() pelo método **plot()**

**Configurando credenciais**

In [32]:
import plotly
chart_studio.tools.set_credentials_file(username='leocadio_andre', api_key='uSwU4b23NXTr5cSlyEiA')

**Importando método para plot online**

In [33]:
import chart_studio.plotly as pyo

## Exercício ##

- Usando os conhecimentos adquiridos aqui, crie um dashboard na nuvem do Plot e compartilhe comigo :)
- Envie para o e-mail contato@minerandodados.com.br
- Lembre-se: Seu Dashboard deve ser usado como seu **portfólio profissional**.