In [1]:
import pandas as pd
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
import plotly.graph_objs as go

In [2]:
init_notebook_mode(connected=True)

In [3]:
pesquisa = pd.read_csv("../data/raw/pesquisa_preco_2018.csv", dtype={'valor_compra': float, 'valor_venda': float}, error_bad_lines=False, encoding='latin-1', warn_bad_lines=False)
pesquisa.head(5)

Unnamed: 0,valor_compra,valor_venda,unidade,municipio,regiao,estado,bandeira,produto,razao_social_revenda,data_coleta
0,,3.579,R$ / litro,BRASILIA,CO,DF,BRANCA,DIESEL,EUROGAS-POSTOS DE SERVIÇOS LTDA,03/01/2018
1,,3.59,R$ / litro,BRASILIA,CO,DF,BRANCA,DIESEL,JARJOUR VEICULOS E PETRÓLEO LTDA.,03/01/2018
2,,3.699,R$ / litro,BRASILIA,CO,DF,IPIRANGA,DIESEL,AUTO POSTO BRAGA LTDA,03/01/2018
3,,3.199,R$ / litro,BRASILIA,CO,DF,IPIRANGA,DIESEL,AUTO POSTO SAO JUDAS TADEU LTDA,03/01/2018
4,3.218,3.559,R$ / litro,BRASILIA,CO,DF,PETROBRAS DISTRIBUIDORA S.A.,DIESEL,AUTO POSTO CHAVES LTDA,03/01/2018


In [4]:
pesquisa['data_coleta'] = pd.to_datetime(pesquisa['data_coleta'], format='%d/%m/%Y')
#modifica o index do dataframe para data de cadastro
pesquisa.set_index('data_coleta', inplace=True)
#ordena em forma ascendente o index
pesquisa.sort_index(inplace=True, ascending=True)

#transforma o dataset para ver os preços por região e por data
unstack_serie_produto_regiao = pesquisa.groupby('regiao')['valor_venda'].resample('W').mean().unstack(level=0)
unstack_serie_produto_regiao.columns = ['Centrooeste', 'Norte', 'Nordeste', 'Sul', 'Sudeste']
unstack_serie_produto_regiao.head(5)

Unnamed: 0_level_0,Centrooeste,Norte,Nordeste,Sul,Sudeste
data_coleta,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2018-01-07,3.56714,3.6,3.339748,3.224946,3.362675
2018-01-14,3.585876,3.622564,3.353091,3.237576,3.369008
2018-01-21,3.587215,3.628758,3.392695,3.244406,3.380961
2018-01-28,3.586277,3.636516,3.389892,3.249832,3.381619
2018-02-04,3.599469,3.644167,3.40366,3.261563,3.388592


In [5]:
# Create a trace
trace = go.Bar(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Norte
)
data = [trace]

iplot(data)

In [6]:
precos_norte = go.Bar(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Norte,
    name = "norte"
)

precos_nordeste = go.Bar(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Nordeste,
    name = "nordeste"
)

precos_centrooeste = go.Bar(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Centrooeste,
    name = "centro-oeste"
)

precos_sudeste = go.Bar(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Sudeste,
    name = "sudeste"
)

precos_sul = go.Bar(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Sul,
    name = "sul"
)

data = [precos_norte, precos_nordeste, precos_centrooeste, precos_sudeste, precos_sul]

iplot(data)

In [7]:
# Create a trace
trace = go.Scatter(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Norte
)

data = [trace]

iplot(data)

In [8]:
# Create a trace
precos_norte = go.Scatter(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Norte,
    name = "norte"
)

precos_nordeste = go.Scatter(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Nordeste,
    name = "nordeste"
)

precos_centrooeste = go.Scatter(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Centrooeste,
    name = "centro-oeste"
)

precos_sudeste = go.Scatter(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Sudeste,
    name = "sudeste"
)

precos_sul = go.Scatter(
    x = unstack_serie_produto_regiao.index,
    y = unstack_serie_produto_regiao.Sul,
    name = "sul"
)

data = [precos_norte, precos_nordeste, precos_centrooeste, precos_sudeste, precos_sul]

iplot(data)

In [9]:
trace = go.Bar(
    x = pesquisa.estado.unique(),
    y = pesquisa.groupby('estado')['valor_venda'].mean(),
    marker=dict(
        color=['rgba(222,45,38,0.8)', 
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)', 
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)', 
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)', 
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)', 
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)', 
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)',
               'rgba(222,45,38,0.8)', 
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)', 
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)', 
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)',
               'rgba(204,204,204,1)'])
)
layout = go.Layout(
    title='Média de preço por estado')

data = [trace]

fig = go.Figure(data=data, layout=layout)

iplot(fig)