<a href="https://colab.research.google.com/github/amadords/Projetos-Publicos/blob/master/Introdu%C3%A7%C3%A3o_ao_Plotly.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introdução ao Plotly
---

[![LinkedIn](https://img.shields.io/badge/LinkedIn-DanielSousaAmador-purple.svg)](https://www.linkedin.com/in/daniel-sousa-amador)
[![GitHub](https://img.shields.io/badge/GitHub-amadords-darkblue.svg)](https://github.com/amadords)
[![Medium](https://img.shields.io/badge/Medium-DanielSousaAmador-darkorange.svg)](https://medium.com/@daniel.s.amador)




![img](https://prismic-io.s3.amazonaws.com/plotly%2F6ea9b995-cdd8-49cb-b058-38bd44c1982d_plotly-logo-01-stripe%402x.png)

O **Plotly**, bem antes de uma biblioteca para algumas linguagens de programação, é uma empresa! Isso, junto a grandes profissionais que têm utilizado seus produtos nos leva a ter uma credibilidade maior em utilizá-los também.

Seu foco é criar ferramentas de análise e visualização de gráficos, bem como facilitar o front end modelos de Machine Learning e Data Science.

As linguagens-alvo do Plotly são Python, R, MATLAB, Julia, Perl, JavaScript, dentre outras.Trabalha também com Arduino e REST.

Suas ferramentas são várias, então para não listar todas, as mais utilizadas em Python para Data Science e Análise de Dados são o [Chart Studio](https://plotly.com/chart-studio/), [Plotly Express](https://plotly.com/python/plotly-express/) e [Dash](https://plotly.com/dash/). 

[Aqui](https://plotly.com/python/getting-started/) algumas configurações iniciais, caso sejam necessárias.

Os motivos de usarmos a biblioteca:
* Fácil manipulação
* Esteticamente agradável
* Interativa
* Permite ser usada de forma online e offline


Para visualizar como trabalhar com o **Plotly** em **séries temporais**, clique [aqui]().



In [None]:
import pandas as pd
import numpy as np
# bibliotecas para trabalhar offline com a biblioteca
import plotly
import plotly.offline as py
import plotly.graph_objs as go # criará de fato os gráficos
from plotly.offline import plot, iplot
import cufflinks as cf # para conectar o plotly ao pandas
cf.go_offline()
plotly.offline.init_notebook_mode(connected = True)

Como pode ser visto na documentação:

Use `connected = True` se desejar que seus blocos de anotações tenham tamanhos de arquivo menores.
No caso em que `connected = False`, toda a biblioteca plotly.js
será carregado no bloco de notas, o que resultará em um aumento no tamanho do arquivo
de alguns megabytes. Além disso, porque a biblioteca será baixada
da web, você e seus visualizadores devem estar conectados à int:ernet para serem capaz de visualizar gráficos dentro deste notebook.

### Não é complicado!

A última importação necessária é da plotly.io. 

Ela é quem nos permitirá renderizar gráficos no Colab.

`pio.renderers` nos mostra todas as opções de renderização.


In [None]:
import plotly.io as pio
pio.renderers

Renderers configuration
-----------------------
    Default renderer: 'plotly_mimetype+notebook_connected'
    Available renderers:
        ['plotly_mimetype', 'jupyterlab', 'nteract', 'vscode',
         'notebook', 'notebook_connected', 'kaggle', 'azure', 'colab',
         'cocalc', 'databricks', 'json', 'png', 'jpeg', 'jpg', 'svg',
         'pdf', 'browser', 'firefox', 'chrome', 'chromium', 'iframe',
         'iframe_connected', 'sphinx_gallery']

Como estamos no ambiente **colab** escolheremos o `renderers = 'colab'`.

In [None]:
pio.renderers.default = 'colab'

Para iniciar os exemplos, vamos criar alguns dados com a biblioteca **Numpy**.

Sim, eu sei que Creta não é uma letra do alfabeto grego, mas fica intuitivo, não?

In [None]:
df = pd.DataFrame(np.random.randn(50,4), columns=['Alfa','Beta','Creta','Delta'])
df.head()

Unnamed: 0,Alfa,Beta,Creta,Delta
0,-0.175584,-2.056866,-1.042252,0.841034
1,-0.305501,-0.487627,1.873617,-0.794838
2,0.903775,1.269543,-0.478512,-2.351416
3,-0.017658,2.592462,-1.878673,1.904265
4,1.153804,1.333872,-0.243175,0.293981


- Veja que, em todos os gráficos é possível habilitar e desabilitar qualquer uma das linhas pela legenda à direita, clicando em cima.

- Os gráficos são exemplificativos, para demonstrar a facilidade em plotar, logo não se assuste com os gráficos estranhos. A intenção é mostrar que pode o mais, logo o menos também conseguiremos.

### Line plot

É o gráfico padrão do Plotly.

In [None]:
df.iplot()

Vamos plotar agora os gráfico mais comuns de serem utilizados no dia-a-dia.

### Scatter plot

In [None]:
df.iplot(kind='scatter', x='Alfa',y='Beta', mode='markers')

### Bar plot

In [None]:
df.Alfa.iplot(kind='bar')

In [None]:
df.Alfa.iplot(kind='bar')

In [None]:
df.sum().iplot(kind='bar')

### Horizontal Bar Plot

In [None]:
df.iplot(kind='barh')

### Múltiplos Bar plots

Barra múltiplas são um tipo de gráfico muito bom para visualizarmos antes e depois quando tratamos, por exemplo, de volume de venda ou estoque ou pesquisa de opinião etc.

Por isso iremos criar alguns dados novos para visualizarmos esse antes e depois.

In [None]:
# criando dados
labels = ['Orientais', 'Amaderados', 'Frutais', 'Cítrico', 'Floral']
antes = [7, 6, 29, 23, 35]
depois = [5, 7, 20, 27, 41]

# configurações

antes = go.Bar(x = labels,
               y = antes,
               name = 'Antes')

depois = go.Bar(x = labels,
                y = depois,
                name = 'Depois')
# plotando

data = [antes, depois]
py.iplot(data)

In [None]:
# criando dados
labels = ['Orientais', 'Amaderados', 'Frutais', 'Cítrico', 'Floral']
antes = [7, 6, 29, 23, 35]
depois = [5, 7, 20, 27, 41]

# configurações, acrescentando cores

antes = go.Bar(x = labels,
               y = antes,
               name = 'Antes',
                marker = {'color': '#7ecfc9'})

depois = go.Bar(x = labels,
                y = depois,
                name = 'Depois',
                marker = {'color': '#04f7e3'})
# plotando

data = [antes, depois]
py.iplot(data)

### Stacked bar plot

In [None]:
# criando dados
labels = ['Orientais', 'Amaderados', 'Frutais', 'Cítrico', 'Floral']
antes = [7, 6, 29, 23, 35]
depois = [5, 7, 20, 27, 41]

# configurações

antes = go.Bar(x = labels,
               y = antes,
               name = 'Antes',
                marker = {'color': '#787878'})

depois = go.Bar(x = labels,
                y = depois,
                name = 'Depois',
                marker = {'color': '#04f7e3'})


data = [antes, depois]

# configurando layout

layout = go.Layout(title = 'Gráfico de barras Empilhados',
                   xaxis = {'title': 'Perfumes'},
                   yaxis = {'title': 'Antes e Depois'},
                   barmode = 'stack') # stack = pilha ou seja, barra empilhada
# plotando 

fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

#Scattergeo

Para mais [aqui](https://plotly.com/python/scatter-plots-on-maps/)

O código foi retirado do [artigo](https://paulovasconcellos.com.br/como-criar-gr%C3%A1ficos-interativos-utilizando-plotly-e-python-3eb6eda57a2b) do Paulo Vasconcellos no Medium.

Sempre que houve latitude e longitude é possível esse tipo de trabalho com mapas.

In [None]:
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/2014_us_cities.csv')
df.head()

Unnamed: 0,name,pop,lat,lon
0,New York,8287238,40.730599,-73.986581
1,Los Angeles,3826423,34.053717,-118.242727
2,Chicago,2705627,41.875555,-87.624421
3,Houston,2129784,29.758938,-95.367697
4,Philadelphia,1539313,39.952335,-75.163789


In [None]:
trace = go.Scattergeo(
                     locationmode = 'USA-states',
                     lon = df['lon'],
                     lat = df['lat'],
                     text = df['name'] + '- População: ' + df['pop'].astype(str),
                     marker = dict(
                            size = df['pop']/5000,
                            color = '#e74c3c',
                            line = {'width': 0.5, 
                                    'color': '#2c3e50'},
                            sizemode = 'area')
                    )
data = [trace]

layout = go.Layout(
        title = '<b>População americana em 2014</b>',
        titlefont = {'family': 'Arial',
                     'size': 24},
        geo =  {'scope': 'usa',
                'projection': {'type': 'albers usa'},
                'showland': True,
                'landcolor': '#2ecc71',
                'showlakes': True,
                'lakecolor': '#3498db',
                'subunitwidth': 1,
                'subunitcolor': "rgb(255, 255, 255)"
                })

fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

### Boxplot

In [None]:
df = pd.DataFrame(np.random.randn(50,4), columns=['Alfa','Beta','Creta','Delta'])
df.head()

Unnamed: 0,Alfa,Beta,Creta,Delta
0,-0.247462,-0.401321,2.162376,-1.210559
1,0.592001,-0.669858,0.406487,0.024813
2,-0.174851,0.213833,-0.646124,0.000959
3,-1.208074,1.010084,-0.556557,-1.879383
4,-0.193065,-0.992795,0.763223,0.522465


In [None]:
df.iplot(kind='box')

### Histograma

In [None]:
df['Beta'].iplot(kind='hist')

### Histogramas aninhados

In [None]:
df.Alfa.iplot(kind='hist')

In [None]:
df.iplot(kind='hist')

# Spread plots

*Spread* significa propagação. Um *spread plot* pode ser compreendido como um gráfico de propagação e mostra basicamente a dispersão dos dados.

In [None]:
df.iplot(kind='spread')


The pandas.np module is deprecated and will be removed from pandas in a future version. Import numpy directly instead


The pandas.np module is deprecated and will be removed from pandas in a future version. Import numpy directly instead



### Bubble Plots

In [None]:
df.iplot(kind='bubble', x='Alfa',y='Beta', size='Creta', colors='seagreen')

### Scatter Matrix

Semelhante ao [pairplot](https://seaborn.pydata.org/generated/seaborn.pairplot.html) da Seaborn.

In [None]:
df.scatter_matrix()

# Marcadores

In [None]:
# Gráfico usando apenas marcadores
trace1 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [1, 2, 3, 4, 5],
                    mode = 'markers',
                    name = 'Apenas marcadores')

# Gráfico de apenas linhas
trace2 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [7, 8, 9, 10, 11],
                    mode = 'lines',
                    name = 'Apenas linhas')

# Criando gráfico com marcadores e linhas
trace3 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [12, 13, 14, 15, 16],
                    mode = 'markers+lines',
                    name = 'Marcadores e Linhas')

data = [trace1, trace2, trace3]

py.iplot(data)

In [None]:
# Gráfico usando apenas marcadores
trace1 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [8, 9, 10, 11, 12],
                    mode = 'lines',
                    name = 'Gráfico com linhas tracejadas',
                    line = {'color': '#ee5253',
                            'dash': 'dash'})

# Gráfico de apenas linhas
trace2 = go.Scatter(x = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio'],
                    y = [10, 12, 11, 14, 15],
                    mode = 'lines',
                    name = 'Gráfico com linha pontilhada',
                    line = {'color': '#341f97',
                            'dash': 'dot'})

data = [trace1, trace2]

py.iplot(data)

# Trabalhando com Dados Reais
Disponibilizado pelo [Minerando Dados](https://minerandodados.com.br/)

In [None]:
df = pd.read_csv('olist_classified_public_dataset.csv')
df.head()

Unnamed: 0.1,Unnamed: 0,id,order_status,order_products_value,order_freight_value,order_items_qty,order_sellers_qty,order_purchase_timestamp,order_aproved_at,order_estimated_delivery_date,order_delivered_customer_date,customer_city,customer_state,customer_zip_code_prefix,product_category_name,product_name_lenght,product_description_lenght,product_photos_qty,review_score,review_comment_title,review_comment_message,review_creation_date,review_answer_timestamp,votes_before_estimate,votes_delayed,votes_low_quality,votes_return,votes_not_as_anounced,votes_partial_delivery,votes_other_delivery,votes_other_order,votes_satisfied,most_voted_subclass,most_voted_class
0,0,1,delivered,89.99,14.38,1,1,2017-08-30 11:41:01.000000,2017-08-30 11:55:08.970352,2017-09-21 00:00:00.000000,2017-09-08 20:35:27.276847,Belo Horizonte,MG,308,beleza_saude,59,492,3,5,,tudo certo,2017-09-09 00:00:00.000000,2017-09-10 03:27:54+00:00,0,0,0,0,0,0,0,0,3,satisfeito,satisfeito_com_pedido
1,1,2,delivered,69.0,15.23,1,1,2017-09-26 09:13:36.000000,2017-09-26 09:28:10.922048,2017-10-24 00:00:00.000000,2017-09-29 21:13:04.984841,Pocos de Caldas,MG,377,brinquedos,50,679,4,5,,o produto chegou antes de prazo parabens pela ...,2017-09-30 00:00:00.000000,2017-10-03 05:34:20+00:00,3,0,0,0,0,0,0,0,0,antes_prazo,satisfeito_com_pedido
2,2,3,delivered,99.8,15.86,2,4,2018-01-15 15:50:42.000000,2018-01-17 07:29:56.419769,2018-02-05 00:00:00.000000,2018-01-23 17:51:31.134866,Sao Jose dos Campos,SP,122,ferramentas_jardim,59,341,2,1,,foi adquirido 6 itens desta loja onde até o mo...,2018-01-24 00:00:00.000000,2018-02-02 17:42:43+00:00,0,0,0,0,0,3,0,0,0,entrega_parcial,problemas_de_entrega
3,3,4,delivered,87.0,12.74,1,1,2018-02-04 11:16:42.000000,2018-02-06 05:31:50.990164,2018-03-13 00:00:00.000000,2018-02-20 19:38:06.633080,Ribeirao Preto,SP,140,informatica_acessorios,45,411,1,4,,achei a entrega um pouco demorada,2018-02-21 00:00:00.000000,2018-02-22 02:09:12+00:00,0,3,0,0,0,0,0,0,0,atrasado,problemas_de_entrega
4,4,5,delivered,99.9,17.95,1,2,2017-12-07 11:58:42.000000,2017-12-08 02:36:49.587515,2018-01-03 00:00:00.000000,2017-12-19 22:33:18.952512,RIO DE JANEIRO,RJ,205,cama_mesa_banho,60,189,1,3,,comprei 02 jogos de lencois de cetim e uma col...,2017-12-20 00:00:00.000000,2017-12-23 04:17:03+00:00,0,0,0,0,0,3,0,0,0,entrega_parcial,problemas_de_entrega



Perguntas aos dados¶

- Quais a distribuição dos status dos pedidos?
- Quais os meses do ano houve mais vendas?
- Qual a quantidade de items de um pedido? (medio)
- Qual a quantidade de vendedores em um pedido ? (medio)
- O valor do frete tende aumentar com o preco do produto?
- Qual o tempo medio de entrega?
- Como foi as vendas por mês?
- Quais meses superaram a meta de vendas?
- Como foi a venda por mês se comparado ao ano de 2016?




In [None]:
df.order_status.value_counts().iplot(kind='bar')

In [None]:
# transformando colunas para datetime
df.order_purchase_timestamp = pd.to_datetime(df.order_purchase_timestamp)

In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3584 entries, 0 to 3583
Data columns (total 34 columns):
 #   Column                         Non-Null Count  Dtype         
---  ------                         --------------  -----         
 0   Unnamed: 0                     3584 non-null   int64         
 1   id                             3584 non-null   int64         
 2   order_status                   3584 non-null   object        
 3   order_products_value           3584 non-null   float64       
 4   order_freight_value            3584 non-null   float64       
 5   order_items_qty                3584 non-null   int64         
 6   order_sellers_qty              3584 non-null   int64         
 7   order_purchase_timestamp       3584 non-null   datetime64[ns]
 8   order_aproved_at               3584 non-null   object        
 9   order_estimated_delivery_date  3584 non-null   object        
 10  order_delivered_customer_date  3467 non-null   object        
 11  customer_city    

In [None]:
# metodo to_period('M') para pegar os meses
# criando colunas com os meses
df['order_purchase_month'] = df.order_purchase_timestamp.dt.to_period('M').astype(str)

In [None]:
df.order_purchase_month.head()

0    2017-08
1    2017-09
2    2018-01
3    2018-02
4    2017-12
Name: order_purchase_month, dtype: object

In [None]:
df.head()

Unnamed: 0.1,Unnamed: 0,id,order_status,order_products_value,order_freight_value,order_items_qty,order_sellers_qty,order_purchase_timestamp,order_aproved_at,order_estimated_delivery_date,order_delivered_customer_date,customer_city,customer_state,customer_zip_code_prefix,product_category_name,product_name_lenght,product_description_lenght,product_photos_qty,review_score,review_comment_title,review_comment_message,review_creation_date,review_answer_timestamp,votes_before_estimate,votes_delayed,votes_low_quality,votes_return,votes_not_as_anounced,votes_partial_delivery,votes_other_delivery,votes_other_order,votes_satisfied,most_voted_subclass,most_voted_class,order_purchase_month
0,0,1,delivered,89.99,14.38,1,1,2017-08-30 11:41:01,2017-08-30 11:55:08.970352,2017-09-21 00:00:00.000000,2017-09-08 20:35:27.276847,Belo Horizonte,MG,308,beleza_saude,59,492,3,5,,tudo certo,2017-09-09 00:00:00.000000,2017-09-10 03:27:54+00:00,0,0,0,0,0,0,0,0,3,satisfeito,satisfeito_com_pedido,2017-08
1,1,2,delivered,69.0,15.23,1,1,2017-09-26 09:13:36,2017-09-26 09:28:10.922048,2017-10-24 00:00:00.000000,2017-09-29 21:13:04.984841,Pocos de Caldas,MG,377,brinquedos,50,679,4,5,,o produto chegou antes de prazo parabens pela ...,2017-09-30 00:00:00.000000,2017-10-03 05:34:20+00:00,3,0,0,0,0,0,0,0,0,antes_prazo,satisfeito_com_pedido,2017-09
2,2,3,delivered,99.8,15.86,2,4,2018-01-15 15:50:42,2018-01-17 07:29:56.419769,2018-02-05 00:00:00.000000,2018-01-23 17:51:31.134866,Sao Jose dos Campos,SP,122,ferramentas_jardim,59,341,2,1,,foi adquirido 6 itens desta loja onde até o mo...,2018-01-24 00:00:00.000000,2018-02-02 17:42:43+00:00,0,0,0,0,0,3,0,0,0,entrega_parcial,problemas_de_entrega,2018-01
3,3,4,delivered,87.0,12.74,1,1,2018-02-04 11:16:42,2018-02-06 05:31:50.990164,2018-03-13 00:00:00.000000,2018-02-20 19:38:06.633080,Ribeirao Preto,SP,140,informatica_acessorios,45,411,1,4,,achei a entrega um pouco demorada,2018-02-21 00:00:00.000000,2018-02-22 02:09:12+00:00,0,3,0,0,0,0,0,0,0,atrasado,problemas_de_entrega,2018-02
4,4,5,delivered,99.9,17.95,1,2,2017-12-07 11:58:42,2017-12-08 02:36:49.587515,2018-01-03 00:00:00.000000,2017-12-19 22:33:18.952512,RIO DE JANEIRO,RJ,205,cama_mesa_banho,60,189,1,3,,comprei 02 jogos de lencois de cetim e uma col...,2017-12-20 00:00:00.000000,2017-12-23 04:17:03+00:00,0,0,0,0,0,3,0,0,0,entrega_parcial,problemas_de_entrega,2017-12


In [None]:
# criando a variável vendas_por_mes (soma dos produtos agrupados por mes)
vendas_por_mes = df.groupby(by='order_purchase_month').order_products_value.sum()

In [None]:
type(vendas_por_mes)

pandas.core.series.Series

In [None]:
# visualizando os valores de vendas por mes
vendas_por_mes.head()

order_purchase_month
2017-02        9.99
2017-03      902.86
2017-04    17654.19
2017-05    25556.23
2017-06    34172.86
Name: order_products_value, dtype: float64

In [None]:
vendas_por_mes.index

Index(['2017-02', '2017-03', '2017-04', '2017-05', '2017-06', '2017-07',
       '2017-08', '2017-09', '2017-10', '2017-11', '2017-12', '2018-01',
       '2018-02', '2018-03', '2018-04'],
      dtype='object', name='order_purchase_month')

In [None]:
vendas_por_mes.values

array([9.990000e+00, 9.028600e+02, 1.765419e+04, 2.555623e+04,
       3.417286e+04, 4.728474e+04, 3.989885e+04, 4.546220e+04,
       4.091040e+04, 5.537392e+04, 4.380657e+04, 4.675556e+04,
       4.256054e+04, 3.343548e+04, 3.754330e+03])

In [None]:
# gráfico de linha - padrão do Plotly
data = [go.Scatter(x=vendas_por_mes.index,
                   y=vendas_por_mes.values)]

py.iplot(data)

In [None]:
data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': 'lightblue'})]

# layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title': 'Periodo'})

# figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
py.iplot(fig)

In [None]:
# ajustes em linhas e cores
# parâmetros opacity e width
data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': 'lightblue',
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7
              )
       ]

# layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title':'Periodo'})

# figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
py.iplot(fig)

Destacando cores

In [None]:
vendas_por_mes.values

array([9.990000e+00, 9.028600e+02, 1.765419e+04, 2.555623e+04,
       3.417286e+04, 4.728474e+04, 3.989885e+04, 4.546220e+04,
       4.091040e+04, 5.537392e+04, 4.380657e+04, 4.675556e+04,
       4.256054e+04, 3.343548e+04, 3.754330e+03])

In [None]:
# media 
vendas_por_mes.values.mean()

31835.914666666733

In [None]:
cores = []
media = vendas_por_mes.values.mean()

for x in vendas_por_mes.values:
    if x < media:
        cores.append('red')
    else:
        cores.append('lightblue')

In [None]:
cores

['red',
 'red',
 'red',
 'red',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'lightblue',
 'red']

In [None]:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': cores,  #lista de cores
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7
              )
       ]

# layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title':'Periodo'})

# figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
py.iplot(fig, filename='Meses que nao superaram a meta de vendas')

In [None]:
# Destaca a barra com o maior valor e minimiza a visao de todas as outras
maximo_de_vendas = vendas_por_mes.values.max()
maximo_de_vendas

55373.920000000086

In [None]:
cores = []
for x,y in zip(vendas_por_mes.values, vendas_por_mes.index):
    if x == maximo_de_vendas:
        mes_maximo_de_vendas = y
        cores.append('blue')
    else:
        cores.append('lightgray')

In [None]:
mes_maximo_de_vendas

'2017-11'

In [None]:
cores

['lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'blue',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray',
 'lightgray']

In [None]:
data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': cores,
                         'line': {'color': '#333',
                                 'width': 2}
                        },
               opacity= 0.7
              )
       ]

# layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title': 'Periodo'},
                                 # texto na barra de destaque
                                 annotations = [{'text':'Mês destaque de vendas',
                                                'x':mes_maximo_de_vendas,
                                                'y':maximo_de_vendas}
                                               ]
                                                                                              
                                )

# figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
py.iplot(fig, filename='Mes destaque de vendas')



In [None]:
# criando valores ficticios
vendas_ano_anterior = vendas_por_mes - 10000.00

In [None]:
data = [go.Bar(x=vendas_por_mes.index,
               y=vendas_por_mes.values,
               marker = {'color': cores,
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7,
               name='2017'
              ),
# definindo outro plot de barras com valores dos meses passados
        
        go.Bar(x=vendas_ano_anterior.index,
               y=vendas_ano_anterior.values,
               name='2018',
               marker = {'color': 'lightgreen',
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7
              )
              
       ]

# layout
configuracoes_layout = go.Layout(title='Vendas no Periodo',
                                 yaxis={'title':'Valores em Vendas'},
                                 xaxis={'title': 'Periodo'},
                                 annotations = [{'text':'Mês destaque de vendas',
                                                'x':mes_maximo_de_vendas,
                                                'y':maximo_de_vendas}
                                               ]                       
                                
                                )

# figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
py.iplot(fig, filename='Vendas no periodo 2017 e 2018')

Vendas por categorias de produtos

In [None]:
vendas_produto_por_categoria =  df.groupby(by='product_category_name').id.count()

In [None]:
vendas_produto_por_categoria

product_category_name
agro_industria_e_comercio                           3
alimentos                                           6
alimentos_bebidas                                   9
artes                                               8
artigos_de_festas                                   2
artigos_de_natal                                    5
audio                                               4
automotivo                                        134
bebes                                              83
bebidas                                             6
beleza_saude                                      253
brinquedos                                        137
cama_mesa_banho                                   471
casa_conforto                                      31
casa_construcao                                     2
climatizacao                                        7
consoles_games                                     32
construcao_ferramentas_construcao                  12
constr

In [None]:
# filtrando categorias com quantidade de vendas maiores que 1
vendas_produto_por_categoria = vendas_produto_por_categoria.loc[vendas_produto_por_categoria.values >1]

In [None]:
# ordenando valores do maior para o menor
vendas_produto_por_categoria.sort_values(ascending=False,inplace=True)

In [None]:
# plotando gráfico de barras verticais
trace0 = go.Bar(y=vendas_produto_por_categoria.values,
                x=vendas_produto_por_categoria.index,
                marker = {'color': '#00FF2A'},
                orientation='v'
              )

data = [trace0]

# criando layout
configuracoes_layout = go.Layout(title='Vendas por categoria de Produtos',
                   xaxis=dict(
                         titlefont=dict(
                                   size=40,
                                   color='lightgrey'),
                   tickangle=90),
                   yaxis={'title': 'Quantidade vendida'})

# figura

fig = go.Figure(data=data, layout=configuracoes_layout)

# plotando o grafico
py.iplot(fig)

Somando 10% ao Valor máximo

In [None]:
max(vendas_produto_por_categoria.values) * 1.10

518.1

In [None]:
trace0 = go.Bar(y=vendas_produto_por_categoria.values,
                x=vendas_produto_por_categoria.index,
                marker = {'color': '#00FF2A'},
                orientation='v'
              )

data = [trace0]

# layout
configuracoes_layout = go.Layout(title='Vendas por categoria de Produtos',
                   xaxis=dict(
                         titlefont=dict(
                                   size=40,
                                   color='lightgrey'),
                                   tickangle=90),
                   
                   # valor maximo da faixa + 10%
                   yaxis={'title': 'Quantidade vendida',
                          'range':[0,max(vendas_produto_por_categoria.values) * 1.10]
                         })

# figura

fig = go.Figure(data=data, layout=configuracoes_layout)
                   
# plotando o grafico
py.iplot(fig, filename='Vendas por categoria de Produtos')

In [None]:
# valor de Frete vs Valor de Produto: Existe alguma tendencia?

# criando gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   marker = {'color':'#941229'}
                  )
# armazenando gráfico em uma lista
data = [trace]

# criando Layout
layout = go.Layout(title='Valor de Frete x Valor de Produto',
                   yaxis={'title':'Valor do Produto'},
                   xaxis={'title': 'Valor do Frete'})

# criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

In [None]:
# usando o parâmetro text na visualização (parâmetro hover)
# criando gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   # customização do texto a ser exibido no hover
                   text = 'Status do pedido: '+ df['order_status'] +
                           '<br>' + 'Classe: '+ df['most_voted_class']
                   ,
                   # exibição do hover
                   hoverinfo='text+x+y',
                   marker = {'color':'#941229'}
                  )
# armazenando gráfico em uma lista
data = [trace]

# layout
layout = go.Layout(title='Valor de Frete x Valor de Produto',
                   yaxis={'title':'Valor do Produto'},
                   xaxis={'title': 'Valor do Frete'})

# figura
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

In [None]:
# costumizando os eixos em reais
# configurações
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   # customização do texto a ser exibido no hover
                   text = 'Status do pedido: '+ df['order_status'] +
                           '<br>' + 'Classe: '+ df['most_voted_class']
                   ,
                   # exibição do hover
                   hoverinfo='text+x+y',
                   marker = {'color':'#941229'}
                  )
# armazenando gráfico em uma lista
data = [trace]

# layout
layout = go.Layout(title='Valor de Frete x Valor de Produto',

                   # Definindo exibicao dos eixos x e y
                   yaxis={'title':'Valor do Produto', 
                          'tickformat':'.', 
                          'tickprefix':'R$ '},
                   xaxis={'title': 'Valor do Frete',
                          'tickformat':'.', 
                          'tickprefix':'R$ '})

# figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

In [None]:
# Grafico de Bolhas: Valor de Frete vs Valor do Produto por numero de vendedores

# criando o gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   # customização do texto a ser exibido no hover
                   text = 'Status do pedido: '+ df['order_status'] +
                           '<br>' + 'Classe: '+ df['most_voted_class']
                   ,
                   # exibição do hover
                   hoverinfo='text+x+y',
                   
                   # parametro size e sizemode especifica o comportamento dos pontos
                   marker = {'color':'#941229',
                             'size': df['order_sellers_qty']*10,
                             'sizemode':'area'
                             }
                  )
# armazenando gráfico em uma lista
data = [trace]

# criando layout
layout = go.Layout(title='Valor de Frete x Valor de Produto',

                   # Definindo exibicao dos eixos x e y
                   yaxis={'title':'Valor do Produto', 
                          'tickformat':'.', 
                          'tickprefix':'R$ '},
                   xaxis={'title': 'Valor do Frete',
                          'tickformat':'.', 
                          'tickprefix':'R$ '})

# criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig, filename='Valor de Frete por Valor de Produto')

In [None]:
# Valor de Frete vs Valor de Produto por status de entrega


df.iplot(x='order_freight_value',
         y='order_products_value', 
         categories='most_voted_subclass',
         title='Valor de Frete vs Valor de Produto',
         xTitle='Valor de Frete',
         yTitle='Valor Produto')




The pandas.np module is deprecated and will be removed from pandas in a future version. Import numpy directly instead


The pandas.np module is deprecated and will be removed from pandas in a future version. Import numpy directly instead



In [None]:
# quantidade em média de items de um pedido
data = [go.Histogram(x=df.order_items_qty)]

layout = go.Layout(title='Quantidade média de itens de um pedido')

fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

In [None]:
# quantidade média de vendedores de um pedido

trace1 = go.Histogram(x=df.order_items_qty,
                     name='itens',
                     opacity=0.75)

trace2 = go.Histogram(x=df.order_sellers_qty,
                     name='vendedores',
                     opacity=0.75)

layout = go.Layout(title='Quantidade de itens e Vendedores por pedido',
                   barmode='overlay'
                  )

dados = [trace1, trace2]

fig = go.Figure(data=dados, layout=layout)

py.iplot(fig, filename='Quantidade de itens e vendedores por pedido')


Qual a distribuição da classificação dos pedidos pelos clientes?


In [None]:
df.order_status.value_counts()

delivered     3467
shipped         48
canceled        25
invoiced        24
processing      20
Name: order_status, dtype: int64

In [None]:
classes_mais_votadas = df.groupby(by='most_voted_class').id.count()

In [None]:
classes_mais_votadas

most_voted_class
problemas_de_entrega       950
problemas_de_qualidade     480
satisfeito_com_pedido     1983
Name: id, dtype: int64

In [None]:
# mesmo resultado do codigo acima
classes_mais_votadas = df.most_voted_class.value_counts()

In [None]:
# criando o gráfico

trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values
              )

# armazenando gráfico em uma lista

data = [trace]

# criando Layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

In [None]:
# parametro direction
# criando gráfico

trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               direction='clockwise'
              )

# armazenando gráfico em uma lista

data = [trace]

# criando layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)



In [None]:
# customizando
# criando gráfico

cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores},
               direction='clockwise'
              )

# armazenando gráfico em uma lista

data = [trace]

# criando Layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

In [None]:
# adicionando linha de contorno, cores
# criando gráfico

cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores, 
                         'line' : {'color':'#000000','width':2}
                        },
               hoverinfo='label+percent+value',
               direction='clockwise'
              )

# armazenando gráfico em uma lista

data = [trace]

# criando layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)

In [None]:
# criando gráfico

cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores, 
                         'line' : {'color':'#000000','width':2}
                        },
               hoverinfo='label+percent+value',
               pull=[0,0,0.1],
               direction='clockwise'
              )

# armazenando gráfico em uma lista

data = [trace]

# criando layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig)



In [None]:
# criando gráfico

cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores, 
                         'line' : {'color':'#000000','width':2}
                        },
               hoverinfo='label+percent+value',
               pull=[0,0,0.1]
              )

# armazenando gráfico em uma lista

data = [trace]

# criando layout

layout = go.Layout(title='Classificação de Clientes sobre Pedidos')

# criando figura que será exibida
fig = go.Figure(data=data, layout=layout)

py.iplot(fig, filename='Classificação de Clientes sobre Pedidos')

Para ser possível exportar qualquer um dos gráficos para a nuvem é necessário:

  -  Criar conta no [plotly](https://plotly.com/)
  -  Obter credenciais da API
  -  Importar o método para plot online
  -  Substituir o método iplot() pelo método plot()



In [None]:
# trabalhando online
import plotly
#plotly.tools.set_credentials_file(username='daniel.amador', api_key='0jXkDAS57ibh12xbbmrJ')

In [None]:
!pip install chart_studio -q

[?25l[K     |█████                           | 10kB 29.2MB/s eta 0:00:01[K     |██████████▏                     | 20kB 2.1MB/s eta 0:00:01[K     |███████████████▎                | 30kB 2.7MB/s eta 0:00:01[K     |████████████████████▍           | 40kB 3.0MB/s eta 0:00:01[K     |█████████████████████████▍      | 51kB 2.5MB/s eta 0:00:01[K     |██████████████████████████████▌ | 61kB 2.8MB/s eta 0:00:01[K     |████████████████████████████████| 71kB 2.5MB/s 
[?25h

In [None]:
import chart_studio.plotly as py

# Obrigado!

Obrigado por ter disponibilizado um pouco do seu tempo e atenção aqui. Espero que, de alguma forma, tenha sido útil para seu crescimento. Se houver qualquer dúvida ou sugestão, não hesite em entrar em contato no [LinkedIn](https://www.linkedin.com/in/daniel-sousa-amador) e verificar meus outros projetos no [GitHub](https://github.com/amadords).

[![LinkedIn](https://img.shields.io/badge/LinkedIn-DanielSousaAmador-purple.svg)](https://www.linkedin.com/in/daniel-sousa-amador)
[![GitHub](https://img.shields.io/badge/GitHub-amadords-darkblue.svg)](https://github.com/amadords)
[![Medium](https://img.shields.io/badge/Medium-DanielSousaAmador-darkorange.svg)](https://medium.com/@daniel.s.amador)



<center><img width="90%" src="https://raw.githubusercontent.com/danielamador12/Portfolio/master/github.png"></center>