In [63]:
import pandas as pd
import numpy as np
import plotly.express as px

Fiscalizações: https://www.gov.br/anp/pt-br/centrais-de-conteudo/paineis-dinamicos-da-anp/painel-dinamico-da-fiscalizacao-do-abastecimento

Dados cadastrais: https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/dados-cadastrais-dos-revendedores-varejistas-de-combustiveis-automotivos


In [64]:
# leitura dos arquivos
fiscalizacoes = pd.read_csv("../data/dados-fiscalizacoes.csv", sep=";")
cadastros = pd.read_csv("../data/dados-cadastrais.csv", sep=";")


Columns (4) have mixed types. Specify dtype option on import or set low_memory=False.



In [68]:
fiscalizacoes = fiscalizacoes.query("`Segmento Fiscalizado` == 'Revenda de Combustíveis'")

In [69]:
colunas_fiscalizacoes = ["UF", "Município", "CNPJ/CPF", "Agente Econômico", "Segmento Fiscalizado", "Data DF", "Procedimento de Fiscalização", "Resultado"]
fiscalizacoes = fiscalizacoes[colunas_fiscalizacoes]
fiscalizacoes.head()

Unnamed: 0,UF,Município,CNPJ/CPF,Agente Econômico,Segmento Fiscalizado,Data DF,Procedimento de Fiscalização,Resultado
0,AC,ACRELANDIA,7481893000183,AUTO POSTO CAMARINI EIRELI,Revenda de Combustíveis,08/07/2020,Boletim de Fiscalização,Ação de fiscalização em campo
1,AC,ACRELANDIA,7481893000183,AUTO POSTO CAMARINI EIRELI,Revenda de Combustíveis,08/07/2020,Medida Reparadora de Conduta,MRC - PR Comb - Afixação de aviso sobre o Óleo...
2,AC,ACRELANDIA,7481893000183,AUTO POSTO CAMARINI EIRELI,Revenda de Combustíveis,08/07/2020,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações
3,AC,ACRELANDIA,7481893000183,AUTO POSTO CAMARINI EIRELI,Revenda de Combustíveis,08/07/2020,Notificação,Notificação - Prazo 30 dias
4,AC,ACRELANDIA,7481893000183,AUTO POSTO CAMARINI EIRELI,Revenda de Combustíveis,08/07/2020,Boletim de Fiscalização,ATIV ECON - Revenda de Combustíveis


In [70]:
colunas_cadastros = ["CNPJ", "BANDEIRA"]
cadastros = cadastros[colunas_cadastros]
cadastros.head()

Unnamed: 0,CNPJ,BANDEIRA
0,49051667000102,VIBRA
1,19052407000190,BANDEIRA BRANCA
2,3188000474,BANDEIRA BRANCA
3,5678449000127,RAIZEN
4,88587589000621,BANDEIRA BRANCA


In [71]:
df = pd.merge(fiscalizacoes, cadastros, left_on="CNPJ/CPF", right_on="CNPJ", how="inner")
df.head()

Unnamed: 0,UF,Município,CNPJ/CPF,Agente Econômico,Segmento Fiscalizado,Data DF,Procedimento de Fiscalização,Resultado,CNPJ,BANDEIRA
0,DF,BRASILIA,38076089000142,AUTO POSTO ÁGUAS CLARAS LTDA,Revenda de Combustíveis,20/09/2019,Notificação,Notificação - Prazo 05 dias,38076089000142,IPIRANGA
1,DF,BRASILIA,38076089000142,AUTO POSTO AGUAS CLARAS LTDA,Revenda de Combustíveis,20/09/2019,Boletim de Fiscalização,ATIV ECON - Revenda de Combustíveis,38076089000142,IPIRANGA
2,DF,BRASILIA,38076089000142,AUTO POSTO AGUAS CLARAS LTDA,Revenda de Combustíveis,20/09/2019,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações,38076089000142,IPIRANGA
3,DF,BRASILIA,38076089000142,AUTO POSTO AGUAS CLARAS LTDA,Revenda de Combustíveis,12/12/2019,Boletim de Fiscalização,ATIV ECON - Revenda de Combustíveis,38076089000142,IPIRANGA
4,DF,BRASILIA,38076089000142,AUTO POSTO AGUAS CLARAS LTDA,Revenda de Combustíveis,12/12/2019,Boletim de Fiscalização,Ação de Fiscalização - Cumprimento de Notificação,38076089000142,IPIRANGA


In [72]:
def binaryzation(x):
    if x == "BANDEIRA BRANCA":
        return x
    else:
        return "EMBANDEIRADO"
    
df["BANDEIRA"] = df["BANDEIRA"].apply(binaryzation)

In [73]:
df["Data DF"] = pd.to_datetime(df["Data DF"], format="%d/%m/%Y")

In [74]:
df.head()

Unnamed: 0,UF,Município,CNPJ/CPF,Agente Econômico,Segmento Fiscalizado,Data DF,Procedimento de Fiscalização,Resultado,CNPJ,BANDEIRA
0,DF,BRASILIA,38076089000142,AUTO POSTO ÁGUAS CLARAS LTDA,Revenda de Combustíveis,2019-09-20,Notificação,Notificação - Prazo 05 dias,38076089000142,EMBANDEIRADO
1,DF,BRASILIA,38076089000142,AUTO POSTO AGUAS CLARAS LTDA,Revenda de Combustíveis,2019-09-20,Boletim de Fiscalização,ATIV ECON - Revenda de Combustíveis,38076089000142,EMBANDEIRADO
2,DF,BRASILIA,38076089000142,AUTO POSTO AGUAS CLARAS LTDA,Revenda de Combustíveis,2019-09-20,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações,38076089000142,EMBANDEIRADO
3,DF,BRASILIA,38076089000142,AUTO POSTO AGUAS CLARAS LTDA,Revenda de Combustíveis,2019-12-12,Boletim de Fiscalização,ATIV ECON - Revenda de Combustíveis,38076089000142,EMBANDEIRADO
4,DF,BRASILIA,38076089000142,AUTO POSTO AGUAS CLARAS LTDA,Revenda de Combustíveis,2019-12-12,Boletim de Fiscalização,Ação de Fiscalização - Cumprimento de Notificação,38076089000142,EMBANDEIRADO


In [75]:
percent_bandeira = df["BANDEIRA"].value_counts(normalize=True).reset_index()
percent_bandeira

Unnamed: 0,BANDEIRA,proportion
0,EMBANDEIRADO,0.550313
1,BANDEIRA BRANCA,0.449687


In [76]:
df["Data DF"].max()

Timestamp('2023-06-30 00:00:00')

In [77]:
df["Data DF"].min()

Timestamp('2018-01-01 00:00:00')

In [78]:
fig = px.bar(percent_bandeira,
              x = 'BANDEIRA',
              y = 'proportion',
              color = 'BANDEIRA',
              color_discrete_sequence=['rgb(29,60,67)', 'rgb(84,116,117)'],
              text = 'proportion',
              labels = {'proportion': 'Proporção', 'BANDEIRA': 'Posto'})

fig.update_layout({
    'plot_bgcolor': 'rgba(255, 255, 255, 255)',
    'paper_bgcolor': 'rgba(255, 255, 255, 255)',
    'yaxis':{'visible': True},
    'xaxis':{'type':'category'}
})

# increase top margin
fig.update_layout(margin=dict(t=110))

# add title
fig.update_layout(title_text="<b>Proporção de fiscalizações, por tipo de posto</b><br>(01/2018 - 06/2023)", 
                  font=dict(size=11.5, color='black'))

#fig.for_each_annotation(lambda a: a.update(text=a.text.split("=")[-1]))

fig.add_annotation(x=-0.17, 
                   y=1.07,
                   xref='paper', 
                   yref='paper', 
                   text='<b>Fonte:</b> ANP / <b>Elaboração:</b> Felipe Lamarca', 
                   showarrow=False, 
                   font=dict(size=12, color='black'))

fig.update_yaxes(ticksuffix = "    ",  
                 linecolor = 'black', 
                 gridcolor = 'white', 
                 mirror = True, 
                 color = 'black',
                 showticklabels = False,
                 title_font=dict(size=12, color='black'),
                 range=[0, 0.7])

fig.update_xaxes(ticksuffix = "    ",  
                 linecolor = 'black', 
                 gridcolor = 'white', 
                 mirror = True, 
                 color = 'black',
                 title_font=dict(size=12, color='black'))

fig.update_layout(width=500, 
                  height=600, 
                  showlegend=False)

fig.update_traces(texttemplate='%{text:.2%}', 
                  textposition='outside', 
                  textfont = {'color': 'black', 'size': 13})

fig.show()

fig.write_image("../images/prop-fiscalizacao.png", scale=1)

In [79]:
por_municipio = df.groupby(["BANDEIRA", "Município"]).size().reset_index(name="count")
por_municipio = por_municipio.query("Município.isin(['SAO PAULO', 'RIO DE JANEIRO', 'BRASILIA'])")

total_fiscalizacoes = por_municipio.groupby("Município")["count"].sum().reset_index(name = "total")

por_municipio = pd.merge(por_municipio, total_fiscalizacoes, on="Município", how="inner")

por_municipio["proportion"] = por_municipio["count"] / por_municipio["total"]

por_municipio

Unnamed: 0,BANDEIRA,Município,count,total,proportion
0,BANDEIRA BRANCA,BRASILIA,904,5047,0.179116
1,EMBANDEIRADO,BRASILIA,4143,5047,0.820884
2,BANDEIRA BRANCA,RIO DE JANEIRO,3949,9383,0.420868
3,EMBANDEIRADO,RIO DE JANEIRO,5434,9383,0.579132
4,BANDEIRA BRANCA,SAO PAULO,6544,16879,0.387701
5,EMBANDEIRADO,SAO PAULO,10335,16879,0.612299


In [80]:
fig = px.bar(por_municipio,
              x = 'BANDEIRA',
              y = 'proportion',
              color = 'BANDEIRA',
              color_discrete_sequence=['rgb(84,116,117)', 'rgb(29,60,67)'],
              text = 'proportion',
              facet_col='Município',
              facet_col_wrap=3,
              labels = {'proportion': 'Proporção', 'BANDEIRA': 'Posto'})

fig.update_layout({
    'plot_bgcolor': 'rgba(255, 255, 255, 255)',
    'paper_bgcolor': 'rgba(255, 255, 255, 255)',
    'yaxis':{'visible': True},
    'xaxis':{'type':'category'}
})

# increase top margin
fig.update_layout(margin=dict(t=150))

# add title
fig.update_layout(title_text="<b>Proporção de fiscalizações, por tipo de posto</b> (01/2018 - 06/2023)", 
                  font=dict(size=11.5, color='black'))

fig.for_each_annotation(lambda a: a.update(text=a.text.split("=")[-1]))

fig.add_annotation(x=-0.04, 
                   y=1.26,
                   xref='paper', 
                   yref='paper', 
                   text='Brasília, Rio de Janeiro e São Paulo', 
                   showarrow=False, 
                   font=dict(size=14, color='black'))

fig.add_annotation(x=-0.04, 
                   y=1.17,
                   xref='paper', 
                   yref='paper', 
                   text='<b>Fonte:</b> ANP | <b>Elaboração:</b> Felipe Lamarca', 
                   showarrow=False, 
                   font=dict(size=12, color='black'))

fig.update_yaxes(ticksuffix = "    ",  
                 linecolor = 'black', 
                 gridcolor = 'white', 
                 mirror = True, 
                 color = 'black',
                 showticklabels = False,
                 title_font=dict(size=12, color='black'),
                 range=[0, 1])

fig.update_xaxes(ticksuffix = "    ",  
                 linecolor = 'black', 
                 gridcolor = 'white', 
                 mirror = True, 
                 color = 'black',
                 title_font=dict(size=12, color='black'))

fig.update_layout(width=1000, 
                  height=500, 
                  showlegend=False)

fig.update_traces(texttemplate='%{text:.2%}', 
                  textposition='outside', 
                  textfont = {'color': 'black', 'size': 13})

fig.show()

fig.write_image("../images/prop-fiscalizacao-municipio.png", scale=1)

In [81]:
# turn Data DF into moth-year
df["Data DF"] = pd.to_datetime(df["Data DF"], format="%m-%Y").dt.to_period('M')
df["Data DF"] = df["Data DF"].astype(str)

In [82]:
por_mes = df.groupby(["Data DF", "BANDEIRA"]).size().reset_index(name="count")
por_mes = por_mes.sort_values(by="Data DF")

In [83]:
fig = px.line(por_mes,
              x = 'Data DF',
              y = 'count',
              color = 'BANDEIRA',
              color_discrete_sequence=['rgb(84,116,117)', 'rgb(29,60,67)'],
              labels = {'count': '# Fiscalizações', 'Data DF': 'Mês-Ano', 'BANDEIRA': 'Posto'})

fig.update_layout({
    'plot_bgcolor': 'rgba(255, 255, 255, 255)',
    'paper_bgcolor': 'rgba(255, 255, 255, 255)'
})

# increase top margin
fig.update_layout(margin=dict(t=100))

# add title
fig.update_layout(title_text="<b>Número de fiscalizações, por tipo de posto</b> (01/2018 - 06/2023)", 
                  font=dict(size=12, color='black'))

fig.add_annotation(x=-0.055, 
                   y=1.11,
                   xref='paper', 
                   yref='paper', 
                   text='<b>Fonte:</b> ANP | <b>Elaboração:</b> Felipe Lamarca', 
                   showarrow=False, 
                   font=dict(size=12, color='black'))

fig.update_yaxes(ticksuffix = "    ",  
                 linecolor = 'black', 
                 gridcolor = 'white', 
                 mirror = True, 
                 color = 'black',
                 showticklabels = True,
                 title_font=dict(size=12, color='black'))

fig.update_xaxes(ticksuffix = "    ",  
                 linecolor = 'black', 
                 gridcolor = 'white', 
                 mirror = True, 
                 color = 'black',
                 title_font=dict(size=12, color='black'),
                 type="category")

fig.update_layout(width=900, 
                  height=600, 
                  showlegend=True)

fig.show()

fig.write_image("../images/n-fiscalizacao-mes.png", scale=1)