<a href="https://colab.research.google.com/github/FGalvao77/VISUALIZACAO-DA-INFORMACAO/blob/main/Como_criar_Dashboards_em_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Como criar Dashboards em Python**

Quando estamos fazendo a análise dos dados uma das práticas mais comuns e plotar gráficos para observar e entender melhor como os dados estão distribuídos. O Plotly é uma biblioteca do Python que é utilizada para gerar gráficos, melhor que isso ela nos permite visualizar esses gráficos de forma interativa.

Vamos ver como isso funciona!

In [36]:
# instalando o Plotly e o Cufflinks
# o CUfflinks conecta o Pandas ao Plotly
!pip install cufflinks
!pip install plotly



In [49]:
# para ignorar mensagens de erros
import warnings
warnings.filterwarnings('ignore')

In [39]:
# importando os módulos
import cufflinks as cf 
from plotly.offline import iplot 
import pandas as pd
import numpy as np

In [37]:
# criando um dataframe com dados aleatórios divididos em 4 colunas 
df = pd.DataFrame(np.random.randn(100, 4),
                  columns = ['A', 'B', 'C', 'D'])

In [38]:
# visualizando as 5 primeiras linhas
df.head()

Unnamed: 0,A,B,C,D
0,-0.531703,1.743082,-0.22427,0.441461
1,-0.790124,-1.617559,0.169135,0.442932
2,1.353334,-0.22106,0.019569,1.118522
3,-0.397887,0.279848,-1.124897,0.63413
4,-0.264867,-0.792291,-1.352985,-0.423271


Para que os gráficos sejam gerados dentro do Jupyter Notebook (localmente) precisamos habilitar o modo offline.

In [113]:
cf.go_offline()

**Gerando um gráfico de linhas para cada coluna do DataFrame**

In [114]:
df.iplot()

> Podemos desabilitar a visualização de algumas colunas.

**Gráfico do tipo Scatter**

Conhecidos como gráficos de dispersão, são utilizados para representar a relação (positiva ou negativa) entre duas ou mais variáveis. No parâmetro color definimos as cores para os pontos.

In [43]:
df.iplot(kind='scatter', 
         x='A', y='B', 
         title='Disperssão entre a coluna A e B', 
         color='red', mode='markers')

> Entre parênteses temos os valores do eixo x e do eixo y respectivamente.

**Gráfico de Barras**

O tamanho das barras é proporcional a contagem de registro de cada coluna. A contagem é feita com o método sum().

In [42]:
df.sum().iplot(kind='bar', title='Gráfico de barras')

> Os valores podem ser diferentes, pois estamos gerando dados aleatórios.

**Histogramas**

Com o histograma conseguimos visualizar a frequência dos dados da coluna A.

In [44]:
df['A'].iplot(kind='hist', bins=50, 
              title='Histograma da coluna A')

> Por padrão tenta definir a quantidade de bins ideais.

**Histogramas aninhados**

Como as colunas têm o mesmo tipo de dados podemos plotar um histograma para cada coluna.

In [45]:
df.iplot(kind='hist',
         title='Histograma aninhado')

**Bubble Plots (gráfico de bolhas)**

Permite a visualização de 3 variáveis. O parâmetro size define o tamanho da bolha. No nosso exemplo o tamanho das bolhas é de acordo com os valores da coluna C.

In [46]:
df.iplot(kind='bubble', 
         x='A',y='B', 
         size='C', colors='seagreen')

> Quanto maior o número, maior são as bolhas.

**Scatter Matrix**

Semelhante ao pairplot do Seaborn ele plota um histograma e um gráfico de dispersão para cada coluna numérica do DataFrame. Se o DataFrame for muito grande ele pode travar seu Jupyter Notebook.

In [47]:
df.scatter_matrix()

**Visualizando dados de vendas**

O dataset utilizado será o Olist uma base de dados de um E-commerce brasileiro, se quiser conhecer mais sobre esse dataset, segue o link https://www.kaggle.com/olistbr/brazilian-ecommerce/version/2 

O dataset em questão consegui no github:
  - https://github.com/DeepakKumarGS/E-Commerce-Data-Analysis-/blob/master/olist_classified_public_dataset.csv

In [48]:
# importando a bases de dados para o google colab
# para isso, utilizarei a biblioteca fornecida pela google
from google.colab import files
uploaded = files.upload()

Saving olist_classified_public_dataset.csv to olist_classified_public_dataset.csv


In [115]:
# leitura da base de dados:
df = pd.read_csv('olist_classified_public_dataset.csv')

In [116]:
# visualizando uma parte dos dados
df.head().T

Unnamed: 0,0,1,2,3,4
Unnamed: 0,0,1,2,3,4
id,1,2,3,4,5
order_status,delivered,delivered,delivered,delivered,delivered
order_products_value,89.99,69,99.8,87,99.9
order_freight_value,14.38,15.23,15.86,12.74,17.95
order_items_qty,1,1,2,1,1
order_sellers_qty,1,1,4,1,2
order_purchase_timestamp,2017-08-30 11:41:01.000000,2017-09-26 09:13:36.000000,2018-01-15 15:50:42.000000,2018-02-04 11:16:42.000000,2017-12-07 11:58:42.000000
order_aproved_at,2017-08-30 11:55:08.970352,2017-09-26 09:28:10.922048,2018-01-17 07:29:56.419769,2018-02-06 05:31:50.990164,2017-12-08 02:36:49.587515
order_estimated_delivery_date,2017-09-21 00:00:00.000000,2017-10-24 00:00:00.000000,2018-02-05 00:00:00.000000,2018-03-13 00:00:00.000000,2018-01-03 00:00:00.000000


> Na imagem acima só temos algumas colunas (no total são 34 colunas)

In [55]:
# quantidade de linhas e colunas
df.shape

(3584, 34)

In [53]:
# informações gerais
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3584 entries, 0 to 3583
Data columns (total 34 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   Unnamed: 0                     3584 non-null   int64  
 1   id                             3584 non-null   int64  
 2   order_status                   3584 non-null   object 
 3   order_products_value           3584 non-null   float64
 4   order_freight_value            3584 non-null   float64
 5   order_items_qty                3584 non-null   int64  
 6   order_sellers_qty              3584 non-null   int64  
 7   order_purchase_timestamp       3584 non-null   object 
 8   order_aproved_at               3584 non-null   object 
 9   order_estimated_delivery_date  3584 non-null   object 
 10  order_delivered_customer_date  3467 non-null   object 
 11  customer_city                  3584 non-null   object 
 12  customer_state                 3584 non-null   o

> Uma forma clara é objetiva de obter insights é fazendo algumas perguntas ao nosso conjunto de dados. Então vamos as nossas perguntas!

**Qual a distribuição dos status dos pedidos?**

In [56]:
df.order_status.value_counts().iplot(kind='bar', 
                                     title='Status dos pedidos')

> A maior concentração se encontra nos pedidos entregues.

**Quais os meses do ano houve mais vendas?**

Para trabalhar com dados de Data precisamos primeiro transformar o tipo desse dado para datetime.

In [57]:
df.order_purchase_timestamp = pd.to_datetime(df.order_purchase_timestamp)

Nossos dados estão no formato diário, para responder a nossa pergunta precisamos formatar esses dados para meses.

In [58]:
# criando uma nova coluna
# e usando o método to_periodo() com o ´M´ para formatar os dados
df['order_purchase_month'] = df.order_purchase_timestamp.dt.to_period('M').astype(str)

In [59]:
# visualizando as 5 primeiras linhas da coluna
df.order_purchase_month.head()

0    2017-08
1    2017-09
2    2018-01
3    2018-02
4    2017-12
Name: order_purchase_month, dtype: object

Vamos criar a variável vendas_por_mes que será a soma do valor dos produtos agrupados por mês.

In [60]:
vendas_por_mes = df.groupby(by='order_purchase_month').order_products_value.sum()

In [61]:
# visualizando os valores de vendas por mês
vendas_por_mes.head()

order_purchase_month
2017-02        9.99
2017-03      902.86
2017-04    17654.19
2017-05    25556.23
2017-06    34172.86
Name: order_products_value, dtype: float64

Anteriormente usamos o Cufflinks para fazer a integração com o Pandas, a partir de agora vamos trabalhar somente com o Plotly.

In [117]:
# importando os módulos
import plotly
import plotly.graph_objs as go

In [118]:
# habilitando o modo offline
plotly.offline.init_notebook_mode(connected=True)

O plotly.graph_objs é o responsável por manipular todos os métodos dos gráficos.

**Estrutura da criação dos gráficos com Plotly**

Definição dos dados:

- Eixos (x e y)
- Marcadores (marker)

    data = [go.Bar(x = X, y = Y, marker = {'color': 'lightblue'})]

Definições de layout

- Título (title)
- Layout de eixos (yaxis, xaxis)

    configuracoes_layout = go.Layout( title ='Vendas no Período', 
                                    yaxis={'title':'Valores em vendas'},
                                    xaxis={'title':'Período'})

Objeto figura

- Definição de subplots
- Dados e layout

    fig = go.Figure(data =data, layout=configuracoes_layout)

Plota o gráfico

    py.iplot(fig)

**A seguir alguns gráficos de acordo com essa estrutura**

In [119]:
# por padrão o iplot() plota um gráfico de linha, da sentido de valor acumulado:
import plotly.offline as py
import plotly.graph_objs as go

data = [go.Scatter(x = vendas_por_mes.index,
                   y = vendas_por_mes.values)]

# py.iplot(data)
pyo.iplot(data)

**Customizando o gráficos de barras**

Vamos colocar um título para esse gráfico e uma descrição para os eixos (x e y).

In [120]:
data = [go.Bar(x = vendas_por_mes.index,
               y = vendas_por_mes.values,
               marker = {'color': 'lightblue'})]

# criando o layout
configuracoes_layout = go.Layout(title = 'Vendas no Periodo',
                                 yaxis = {'title':'Valores em Vendas'},
                                 xaxis = {'title': 'Periodo'})

# objeto da figura
fig = go.Figure(data = data, layout = configuracoes_layout)

# plotando o grafico
# py.iplot(fig)
pyo.iplot(fig)

> Nosso gráfico agora tem as barras da cor azul e definimos e um título, além de uma descrição nos eixos.

**Definindo ajustes em linhas e cores**

Colocando um contorno para destacar mais as barras do gráfico.

In [122]:
#  parâmetro opacity e width
data = [go.Bar(x = vendas_por_mes.index,
               y = vendas_por_mes.values,
               marker = {'color': 'lightblue',
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7
              )
       ]

# criando layout
configuracoes_layout = go.Layout(title = 'Vendas no Periodo',
                                 yaxis = {'title':'Valores em Vendas'},
                                 xaxis = {'title':'Periodo'})

# objeto da figura
fig = go.Figure(data = data, 
                layout = configuracoes_layout)

# plotando o grafico
# py.iplot(fig)
pyo.iplot(fig)

> Veja como houve uma melhora na visualização.

**Destacando uma barra**


Seria interessante verificar quais foram os meses que tiveram as vendas abaixo da média.

In [123]:
cores = []
# valor de média para ser testado
media = vendas_por_mes.values.mean()
media

31835.914666666733

In [124]:
# se o valor de vendas do mês for menor que a média 
# a lista de cor será vermelha, senão azul
for x in vendas_por_mes.values:
    if x < media:
        cores.append('red')
    else:
        cores.append('lightblue')

In [125]:
# gerando o gráfico de vendas no período
data = [go.Bar(x = vendas_por_mes.index,
               y = vendas_por_mes.values,
               marker = {'color': cores,  # lista de cores
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity= 0.7
              )
       ]

# criando o layout
configuracoes_layout = go.Layout(title = 'Vendas no Periodo',
                                 yaxis = {'title':'Valores em Vendas'},
                                 xaxis = {'title':'Periodo'})

# objeto da figura
fig = go.Figure(data = data, 
                layout = configuracoes_layout)

# plotando o gráfico
# py.iplot(fig, filename = 'Meses que nao superaram a meta de vendas')
pyo.iplot(fig, filename = 'Meses que nao superaram a meta de vendas')

> Em vermelho temos os meses em que os valores das vendas foi abaixo da média.

No parâmetro color passamos a nossa lista de cores criada anteriormente.

**Destacar a barra com o maior valor de venda e minimizando a visão de todas as outras**

Que tal visualizar o mês que teve o maior número de vendas.

In [126]:
# visualizando o valor máximo
maximo_de_vendas = vendas_por_mes.values.max()
maximo_de_vendas

55373.920000000086

In [127]:
# alimentando a lista de cores
cores = []

for x, y in zip(vendas_por_mes.values, vendas_por_mes.index):
    if x == maximo_de_vendas:
        mes_maximo_de_vendas = y
        cores.append('blue')
    else:
        cores.append('lightgray')


# plota o gráfico de vendas com um destaque de cor e anotação para o mês que teve mais vendas
data = [go.Bar(x = vendas_por_mes.index,
               y = vendas_por_mes.values,
               marker = {'color': cores,
                         'line': {'color': '#333',
                                 'width': 2}
                        },
               opacity= 0.7
              )
       ]

# criando o layout
configuracoes_layout = go.Layout(title = 'Vendas no Periodo',
                                 yaxis = {'title': 'Valores em Vendas'},
                                 xaxis = {'title': 'Periodo'},
                                 # texto na barra de destaque
                                 annotations = [{'text':'Mês destaque de vendas',
                                                'x': mes_maximo_de_vendas,
                                                'y': maximo_de_vendas}
                                               ]
                                                                                              
                                )

# objeto da figura
fig = go.Figure(data = data, 
                layout = configuracoes_layout)

# plotando o gráfico
# py.plot(fig, filename = 'Mes destaque de vendas')
pyo.plot(fig, filename = 'Mes destaque de vendas')

'https://plotly.com/~FGalvao77/11/'

> Novembro foi o mês que teve mais vendas.


**Visualizando duas informações no mesmo gráfico**

Comparando as vendas entre dois anos.

In [128]:
# vamos definir alguns valores ficticios para vendas do ano anterior
vendas_ano_anterior = vendas_por_mes - 10000.00
vendas_ano_anterior

order_purchase_month
2017-02    -9990.01
2017-03    -9097.14
2017-04     7654.19
2017-05    15556.23
2017-06    24172.86
2017-07    37284.74
2017-08    29898.85
2017-09    35462.20
2017-10    30910.40
2017-11    45373.92
2017-12    33806.57
2018-01    36755.56
2018-02    32560.54
2018-03    23435.48
2018-04    -6245.67
Name: order_products_value, dtype: float64

In [129]:
# gráfico de barras aninhadas
data = [go.Bar(x = vendas_por_mes.index,
               y = vendas_por_mes.values,
               marker = {'color': cores,
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity = 0.7,
               name='2017'
              ),
# definindo outro plot de barras com valores dos meses passados        
        go.Bar(x = vendas_ano_anterior.index,
               y = vendas_ano_anterior.values,
               name = '2016',
               marker = {'color': 'lightgreen',
                         'line': {'color': '#333',
                                  'width': 2}
                        },
               opacity = 0.7
              )
              
       ]

# criando o layout
configuracoes_layout = go.Layout(title = 'Vendas no Periodo',
                                 yaxis = {'title':'Valores em Vendas'},
                                 xaxis = {'title': 'Periodo'},
                                 annotations = [{'text':'Mês destaque de vendas',
                                                'x': mes_maximo_de_vendas,
                                                'y': maximo_de_vendas}
                                               ]                       
                                
                                )

# objeto da figura
fig = go.Figure(data = data, 
                layout = configuracoes_layout)

# plotando o gráfico
# py.plot(fig, filename = 'Vendas no periodo 2017 e 2018')
pyo.plot(fig, filename = 'Vendas no periodo 2017 e 2018')

'https://plotly.com/~FGalvao77/13/'

> De verde temos os dados de 2018 e de cinza os dados de 2017.

**Vendas por categorias de produtos**

Vamos visualizar quais foram os produtos mais vendidos.

In [130]:
# conta quantos produtos por categoria e coloca dentro da variável vendas_produto_por_categoria
vendas_produto_por_categoria =  df.groupby(by='product_category_name').id.count()
vendas_produto_por_categoria

product_category_name
agro_industria_e_comercio                           3
alimentos                                           6
alimentos_bebidas                                   9
artes                                               8
artigos_de_festas                                   2
artigos_de_natal                                    5
audio                                               4
automotivo                                        134
bebes                                              83
bebidas                                             6
beleza_saude                                      253
brinquedos                                        137
cama_mesa_banho                                   471
casa_conforto                                      31
casa_construcao                                     2
climatizacao                                        7
consoles_games                                     32
construcao_ferramentas_construcao                  12
constr

In [131]:
# vamos filtrar e pegar somente as categorias com quantidade de vendas maiores que 1
vendas_produto_por_categoria = vendas_produto_por_categoria.loc[vendas_produto_por_categoria.values > 1]
vendas_produto_por_categoria

product_category_name
agro_industria_e_comercio                           3
alimentos                                           6
alimentos_bebidas                                   9
artes                                               8
artigos_de_festas                                   2
artigos_de_natal                                    5
audio                                               4
automotivo                                        134
bebes                                              83
bebidas                                             6
beleza_saude                                      253
brinquedos                                        137
cama_mesa_banho                                   471
casa_conforto                                      31
casa_construcao                                     2
climatizacao                                        7
consoles_games                                     32
construcao_ferramentas_construcao                  12
constr

In [132]:
# ordenando os valores do maior para o menor
vendas_produto_por_categoria.sort_values(ascending=False,inplace=True)
vendas_produto_por_categoria

product_category_name
cama_mesa_banho                                   471
moveis_decoracao                                  302
beleza_saude                                      253
esporte_lazer                                     224
informatica_acessorios                            215
utilidades_domesticas                             199
ferramentas_jardim                                197
relogios_presentes                                196
cool_stuff                                        152
perfumaria                                        140
brinquedos                                        137
automotivo                                        134
fashion_bolsas_e_acessorios                       125
telefonia                                         118
bebes                                              83
moveis_escritorio                                  77
papelaria                                          65
eletronicos                                        55
pet_sh

In [133]:
trace0 = go.Bar(y = vendas_produto_por_categoria.values,
                x = vendas_produto_por_categoria.index,
                marker = {'color': '#00FF2A'},
                orientation = 'v'
              )

data = [trace0]

# criando o layout
configuracoes_layout = go.Layout(title = 'Vendas por categoria de Produtos',
                   xaxis = dict(titlefont = dict(size = 20,
                                               color = 'lightgrey'),
                                tickangle = 55),
                   yaxis = {'title': 'Quantidade vendida'})

# objeto da figura
fig = go.Figure(data = data, 
                layout = configuracoes_layout)

# plotando o gráfico
# py.iplot(fig)
pyo.iplot(fig)

**Alterando Faixa de valores dos eixos**

Observe que temos um erro no eixo y, a barra passa do limite referente a quantidade, pra corrigir isso adicionamos 10% ao valor máximo.

In [134]:
# obtendo o valor máximo
max(vendas_produto_por_categoria.values)

471

In [136]:
# adicionando os 10%
max(vendas_produto_por_categoria.values) * 1.10

518.1

In [137]:
trace0 = go.Bar(y = vendas_produto_por_categoria.values,
                x = vendas_produto_por_categoria.index,
                marker = {'color': '#00FF2A'},
                orientation = 'v'
              )

data = [trace0]

# criando o layout
configuracoes_layout = go.Layout(title = 'Vendas por categoria de Produtos',
                   xaxis=dict(
                         titlefont = dict(
                                   size = 15,
                                   color = 'lightgrey'),
                                   tickangle = 45),
                   
                   # valor maximo da faixa + 10%
                   yaxis = {'title': 'Quantidade vendida',
                          'range': [0,max(vendas_produto_por_categoria.values) * 1.10]
                         })

# objeto da figura
fig = go.Figure(data = data, 
                layout  =configuracoes_layout)
                   
# plotando o gráfico
# py.plot(fig, filename = 'Vendas por categoria de Produtos')
pyo.plot(fig, filename = 'Vendas por categoria de Produtos')

'https://plotly.com/~FGalvao77/17/'

> A faixa de valores começa em 0 e vai até 500.

**Valor de Frete vs Valor de Produto. Existe alguma tendência?**

Podemos verificar se o valor do frete aumenta de acordo com o valor do produto.

In [138]:
# criando gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   marker = {'color':'#941229'}
                  )
# armazenando gráfico em uma lista
data = [trace]

# criando o layout
layout = go.Layout(title = 'Valor de Frete x Valor de Produto',
                   yaxis = {'title':'Valor do Produto'},
                   xaxis ={ 'title': 'Valor do Frete'})

# criando a figura que será exibida
fig = go.Figure(data = data, 
                layout = layout)

# py.iplot(fig)
pyo.iplot(fig)

> Temos alguns valores discrepantes apenas.

**Usando o parâmetro text na visualização (parâmetro hover)**

Acrescentamos uma descrição ao pontos de dados, isso ajuda a entender melhor o que queremos representar nesse gráfico.

In [139]:
# criando gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   # customização do texto a ser exibido no hover
                   text = 'Status do pedido: '+ df['order_status'] +
                           '<br>' + 'Classe: '+ df['most_voted_class']
                   ,
                   # exibição do hover
                   hoverinfo = 'text+x+y',
                   marker = {'color':'#941229'}
                  )

# armazenando gráfico em uma lista
data = [trace]

# criando o layout
layout = go.Layout(title = 'Valor de Frete x Valor de Produto',
                   yaxis = {'title':'Valor do Produto'},
                   xaxis = {'title': 'Valor do Frete'})

# criando a figura que será exibida 
fig = go.Figure(data = data, 
                layout = layout)

# py.iplot(fig)
pyo.iplot(fig)

**Customização dos eixos com formato em reais R$**

Como estamos falando de valores, é interessante customizar os eixos e usar o R$, especificando que esses valores estão em reais.

In [140]:
# criando gráfico
trace = go.Scatter(x = df['order_freight_value'],
                   y = df['order_products_value'],
                   mode = 'markers',
                   # customização do texto a ser exibido no hover
                   text = 'Status do pedido: '+ df['order_status'] +
                           '<br>' + 'Classe: '+ df['most_voted_class']
                   ,
                   # exibição do hover
                   hoverinfo = 'text+x+y',
                   marker = {'color':'#941229'}
                  )

# armazenando gráfico em uma lista
data = [trace]

# criando o layout
layout = go.Layout(title = 'Valor de Frete x Valor de Produto',

                   # definindo exibicao dos eixos x e y
                   yaxis = {'title':'Valor do Produto', 
                          'tickformat':'.', 
                          'tickprefix':'R$ '},
                   xaxis = {'title': 'Valor do Frete',
                          'tickformat':'.', 
                          'tickprefix':'R$ '})

# criando a figura que será exibida
fig = go.Figure(data=data, 
                layout = layout)

# py.plot(fig)
pyo.plot(fig)

'https://plotly.com/~FGalvao77/23/'

**Plotando um gráfico de pizza**

Qual a distribuição da classificação dos pedidos pelos clientes?

In [141]:
# contando os valores das classes mais votadas
classes_mais_votadas = df.most_voted_class.value_counts()

# criando 0 gráfico
trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values
              )

# armazenando gráfico em uma lista
data = [trace]

# criando o layout
layout = go.Layout(title = 'Classificação de Clientes sobre Pedidos')

# criando a figura que será exibida 
fig = go.Figure(data = data, 
                layout = layout)

# py.iplot(fig)
pyo.iplot(fig)

**Parametro direction**

Coloca a visualização dos valores do maior para o menor.

In [142]:
# criando o gráfico
trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               direction='clockwise'
              )

# armazenando gráfico em uma lista
data = [trace]

# criando o layout
layout = go.Layout(title = 'Classificação de Clientes sobre Pedidos')

# criando a figura que será exibida
fig = go.Figure(data = data, 
                layout = layout)

# py.iplot(fig)
pyo.iplot(fig)

**Customizando gráficos de pizza**

Alterando as cores do gráfico.

In [143]:
# criando o gráfico
# ordem do maior valor para o menor:
cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores},
               direction='clockwise'
              )

# armazenando o gráfico em uma lista
data = [trace]

# criando o layout
layout = go.Layout(title = 'Classificação de Clientes sobre Pedidos')

# criando a figura que será exibida
fig = go.Figure(data = data, 
                layout = layout)

# py.iplot(fig)
pyo.iplot(fig)

**Adicionando linha de contorno**

Ajuda destacar mais as porções e melhora a visualização.

In [144]:
# criando o gráfico
# ordem do maior valor para o menor:
cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores, 
                         'line' : {'color':'#000000','width':2}
                        },
               hoverinfo = 'label+percent+value',
               direction = 'clockwise'
              )

# armazenando o gráfico em uma lista
data = [trace]

# criando o layout
layout = go.Layout(title = 'Classificação de Clientes sobre Pedidos')

# criando a figura que será exibida 
fig = go.Figure(data = data, 
                layout = layout)

# py.iplot(fig)
pyo.iplot(fig)

**Destacando porções do gráfico**

Vamos destacar a porção que contém problemas de qualidade.

In [145]:
# criando o gráfico
# ordem do maior valor para o menor:
cores = ['#96D38C','#FEBFB3','#E1396C']


trace = go.Pie(labels = classes_mais_votadas.index,
               values = classes_mais_votadas.values,
               marker = {'colors': cores, 
                         'line' : {'color':'#000000','width':2}
                        },
               hoverinfo = 'label+percent+value',
               pull = [0,0,0.1],
               direction = 'clockwise'
              )

# armazenando o gráfico em uma lista
data = [trace]

# criando o layout:
layout = go.Layout(title = 'Classificação de Clientes sobre Pedidos')

# criando a figura que será exibida
fig = go.Figure(data = data, 
                layout = layout)

# py.plot(fig)
pyo.plot(fig)

'https://plotly.com/~FGalvao77/33/'

**Trabalhando com dados financeiros**

São dados de séries temporais (dados sequenciais ao longo do tempo), podem ser dados de ações ou ativos do mercado financeiro.

In [146]:
# base de dados
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/finance-charts-apple.csv')

# visualizando as 5 primeiras linhas:
df.head().T

Unnamed: 0,0,1,2,3,4
Date,2015-02-17,2015-02-18,2015-02-19,2015-02-20,2015-02-23
AAPL.Open,127.49,127.63,128.48,128.62,130.02
AAPL.High,128.88,128.78,129.03,129.5,133
AAPL.Low,126.92,127.45,128.33,128.05,129.66
AAPL.Close,127.83,128.72,128.45,129.5,133
AAPL.Volume,63152400,44891700,37362400,48948400,70974100
AAPL.Adjusted,122.905,123.761,123.501,124.511,127.876
dn,106.741,107.842,108.894,109.785,110.373
mavg,117.928,118.94,119.889,120.764,121.72
up,129.114,130.038,130.884,131.742,133.068


Vamos plotar um gráfico de linhas para visualizar o preço de fechamento da ação de 2015 a 2017.

In [147]:
data = [go.Scatter(
          x = df.Date,
          y = df['AAPL.Close'])]

py.iplot(data)
pyo.iplot(data)

**Customizando Faixas de Eixos (range)**

Podemos visualizar o preço de alta e de baixa dessas ações em um mesmo gráfico.

In [148]:
trace_high = go.Scatter(
    x = df.Date,
    y = df['AAPL.High'],
    name = "AAPL High",
    line = dict(color = '#17BECF'),
    opacity = 0.8)

trace_low = go.Scatter(
    x = df.Date,
    y = df['AAPL.Low'],
    name = "AAPL Low",
    line = dict(color = '#7F7F7F'),
    opacity = 0.8)

data = [trace_high,trace_low]

layout = dict(
    title = "Série com Rangeslider e Botoes",
    xaxis = dict(
        rangeselector = dict(
            buttons = list([
                dict(count = 1,
                     label = '1m',
                     step = 'month',
                     stepmode = 'backward'),
                dict(count = 6,
                     label = '6m',
                     step='month',
                     stepmode = 'backward'),
                dict(step = 'all')
            ])
        ),
        rangeslider = dict(
            visible = True
        ),
        type = 'date'
    )
)

fig = dict(data = data, 
           layout = layout)

# py.iplot(fig)
pyo.iplot(fig)

Com Rangeslider você pode selecionar a faixa de data que deseja visualizar, já o Rangeselector são botões que você pode criar para uma visualização agrupada dos dados. No exemplo estamos visualizando os dados agrupados de 6 meses.

**Inserindo anotações**

Quando o valor de fechamento da ação é menor que o valor de abertura temos uma vela vermelha, se o valor fechar acima do preço de abertura a vela é verde. Esse gráfico é chamado de Candlestick, cada vela contém os valores de abertura, alta, baixa e fechamento. Outro detalhe é que quanto maior o corpo da vela, maior foi o número de variação dessa ação no dia.

In [149]:
from datetime import datetime

trace = go.Candlestick(x = df['Date'],
                open = df['AAPL.Open'],
                high = df['AAPL.High'],
                low = df['AAPL.Low'],
                close = df['AAPL.Close'])
data = [trace]

layout = {
    'title': 'Apple Preços no Periodo',
    'yaxis': {'title': 'AAPL Stock'},
    'shapes': [{
        'x0': '2016-12-09', 'x1': '2016-12-09',
        'y0': 0, 'y1': 1, 'xref': 'x', 'yref': 'paper',
        'line': {'color': 'rgb(30,30,30)', 'width': 2}
    }],
    'annotations': [{
        'x': '2016-12-09', 'y': 0.05, 'xref': 'x', 'yref': 'paper',
        'showarrow': False, 'xanchor': 'left',
        'text': 'Inicio do ciclo de alta'
    }]
}

fig = dict(data = data, 
           layout = layout)

# py.iplot(fig)
pyo.iplot(fig)

**Exportando nosso gráfico para conta do Plotly na nuvem**

- Criar conta no portal plot.ly
- Obter credenciais da API
- Importa método para plot ``online``
- Substitua o método iplot() pelo método ``plot()__

**Importando método para plot online**

    import chart_studio.plotly as pyo

    import chart_studio
    chart_studio.tools.set_credentials_file(username=’abcsd’, api_key=’xxxxx’)

Definimos que os gráficos seriam mostrados somente no Jupyter Notebook, para enviar esses gráficos para a nuvem precisamos alterar isso. Para enviar os gráficos para criar o dashboard, você precisa alterar o py.iplot(fig) de cada gráfico para pyo.plot(fig). Você será redirecionado automaticamente para a plataforma do Plotly onde será mostrado os gráficos que você selecionou.

Na parte superior direita ao lado do seu nome de usuário clique em create, dashboard, depois clique em plot em seguida your files. Escolha seu gráfico e logo ele será renderizado e mostrado na tela, selecione quantos gráficos quiser. Feito isso você tem a opção de salvar seu trabalho ou compartilha com outras pessoas (elas não precisam ter uma conta no Plotly).

In [108]:
# instalando as bibliotecas necessárias
!pip install plotly
!pip install chart_studio

Collecting chart_studio
[?25l  Downloading https://files.pythonhosted.org/packages/ca/ce/330794a6b6ca4b9182c38fc69dd2a9cbff60fd49421cb8648ee5fee352dc/chart_studio-1.1.0-py3-none-any.whl (64kB)
[K     |████████████████████████████████| 71kB 6.6MB/s 
Installing collected packages: chart-studio
Successfully installed chart-studio-1.1.0


In [109]:
import chart_studio.plotly as pyo

In [111]:
import chart_studio
chart_studio.tools.set_credentials_file(username='XXXXX', api_key='XXXXXX')

In [112]:
from datetime import datetime

trace = go.Candlestick(x = df['Date'],
                open = df['AAPL.Open'],
                high = df['AAPL.High'],
                low = df['AAPL.Low'],
                close = df['AAPL.Close'])
data = [trace]

layout = {
    'title': 'Apple Preços no Periodo',
    'yaxis': {'title': 'AAPL Stock'},
    'shapes': [{
        'x0': '2016-12-09', 'x1': '2016-12-09',
        'y0': 0, 'y1': 1, 'xref': 'x', 'yref': 'paper',
        'line': {'color': 'rgb(30,30,30)', 'width': 2}
    }],
    'annotations': [{
        'x': '2016-12-09', 'y': 0.05, 'xref': 'x', 'yref': 'paper',
        'showarrow': False, 'xanchor': 'left',
        'text': 'Inicio do ciclo de alta'
    }]
}

fig = dict(data = data, 
           layout = layout)

pyo.iplot(fig)

Link do ``chart-studio``
  - https://chart-studio.plotly.com/organize/home/