# Análise ANP

# Introdução

### Problema

No mercado de revenda de combustíveis, há uma distinção entre postos embandeirados, aqueles
que celebram contrato de exclusividade com uma distribuidora específica e podem explorar sua
marca comercial, e postos bandeira branca, que são independentes e não possuem essas restrições
contratuais, podendo adquirir combustível de qualquer distribuidora.


Um cliente solicitou uma análise da frequência de ações de fiscalização da Agência Nacional do
Petróleo, Gás Natural e Biocombustíveis (ANP). Utilizando os dados abertos disponibilizados pela
ANP, responda o primeiro questionamento: **é possível indicar que postos bandeira branca são mais
fiscalizados que postos embandeirados?**


Considerando que a maioria do mercado de revenda é dominada por postos embandeirados, a
análise estatística deve ser ajustada para refletir essa proporção. Ou seja, qual é a relação entre a
fiscalização de postos bandeira branca e postos embandeirados, levando em consideração que
existem mais postos embandeirados? Esse cálculo afeta a análise anterior?

### Dados:
**Dados Cadastrais dos Revendedores Varejistas de Combustíveis Automotivos**


https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/dados-cadastrais-dos-revendedores-varejistas-de-combustiveis-automotivos

**metadados**:

https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/arquivos/arquivos-dados-cadastrais-dos-revendedores-varejistas-de-combustiveis-automotivos/metadados-revendedores-varejistas-combustiveis-automoveis.pdf

**Ações de Fiscalização**

https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/acoes-de-fiscalizacao

**metadados**:

https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/arquivos/arquivos-acoes-de-fiscalizacao/metadados-acoes-fiscalizacao.pdf


**Bandeira Branca** - postos que são independentes e não possuem essas restrições contratuais, podendo adquirir combustível de qualquer distribuidora

**Embandeirados** - Postos com contrato de exclusividade com uma distribuidora específica

In [1]:
# isntalando libs
!pip install pandas
!pip install openpyxl



In [2]:
# importando dependências
import pandas as pd

## Seção 1

**Objetivo**: Quantificar a relação entre postos de Bandeira Branca e Embandeirados conforme a relação da ANP

**Descrição**: Obtidos os dados, busca-se a compreensão da quantidade de postos Bandeira Branca e Embandeirados cadastrados pela ANP e a proporção entre elas e para com o total de postos. Embora não seja um fim em si mesmo, esta etapa é fundamental para a completude da análise.

In [4]:
# lendo dados de postos cadastrados
df = pd.read_excel('dados_anp.xlsx', engine='openpyxl')

In [5]:
# visualizando dados
df.head()

Unnamed: 0,CODIGOISIMP,AUTORIZACAO,DATAPUBLICACAO,RAZAOSOCIAL,CNPJ,ENDERECO,COMPLEMENTO,BAIRRO,CEP,UF,MUNICIPIO,BANDEIRA,DATAVINCULACAO
0,1022007,PR/SP0019777,2002-01-23,AUTO POSTO SAKAMOTO LTDA,49051667000102,"RODOVIA PRESIDENTE DUTRA, S/N","KM 210,5-SENT SP/RJ",BONSUCESSO,7178580,SP,GUARULHOS,VIBRA,2002-01-23
1,1227493,PR/PI0177467,2016-09-28,POSTO RAMALEY LTDA,19052407000190,"R SAO NICOLAU, 940",,CENTRO,64315000,PI,SANTA CRUZ DOS MILAGRES,BANDEIRA BRANCA,2016-09-28
2,1000022,PR/SP0021686,2002-02-28,COMPETRO COMERCIO E DISTRIBUICAO DE DERIVADOS ...,3188000474,"AVENIDA SANTOS DUMONT, 701",,AEROPORTO,18065290,SP,SOROCABA,BANDEIRA BRANCA,2018-07-27
3,1175475,AV/SP0088382,2011-07-12,M & J COMÃ‰RCIO DE COMBUSTÃVEIS E LUBRIFICANT...,5678449000127,"AVENIDA EMILIO ANTONON, S/N",,CHACARA AEROPORTO,13212010,SP,JUNDIAI,RAIZEN,2011-07-12
4,1226945,PR/RS0177246,2016-09-14,METROPOLITANO COMERCIO DE COMBUSTIVEIS LTDA,88587589000621,"RUA BOQUEIRAO, 1401",,IGARA,92410350,RS,CANOAS,BANDEIRA BRANCA,2016-09-14


In [6]:
df.shape

(44018, 13)

In [7]:
df.dtypes

CODIGOISIMP                int64
AUTORIZACAO               object
DATAPUBLICACAO    datetime64[ns]
RAZAOSOCIAL               object
CNPJ                       int64
ENDERECO                  object
COMPLEMENTO               object
BAIRRO                    object
CEP                        int64
UF                        object
MUNICIPIO                 object
BANDEIRA                  object
DATAVINCULACAO    datetime64[ns]
dtype: object

Verificamos que temos 15 colunas e 44.018 instancias, no caso, postos cadastrados

Primeiro passo é criar uma coluna nova que diga se o posto é bandeira branca ou embandeirado, visto que na coluna bandeira os dados vem com o nome da distribuidora.

In [8]:
df['BANDEIRA_BRANCA'] = df['BANDEIRA'].apply(lambda x: 'sim' if x == 'BANDEIRA BRANCA' else 'não')

In [9]:
df['BANDEIRA_BRANCA_NUM'] = df['BANDEIRA'].apply(lambda x: 1 if x == 'BANDEIRA BRANCA' else 0)

In [10]:
df

Unnamed: 0,CODIGOISIMP,AUTORIZACAO,DATAPUBLICACAO,RAZAOSOCIAL,CNPJ,ENDERECO,COMPLEMENTO,BAIRRO,CEP,UF,MUNICIPIO,BANDEIRA,DATAVINCULACAO,BANDEIRA_BRANCA,BANDEIRA_BRANCA_NUM
0,1022007,PR/SP0019777,2002-01-23,AUTO POSTO SAKAMOTO LTDA,49051667000102,"RODOVIA PRESIDENTE DUTRA, S/N","KM 210,5-SENT SP/RJ",BONSUCESSO,7178580,SP,GUARULHOS,VIBRA,2002-01-23,não,0
1,1227493,PR/PI0177467,2016-09-28,POSTO RAMALEY LTDA,19052407000190,"R SAO NICOLAU, 940",,CENTRO,64315000,PI,SANTA CRUZ DOS MILAGRES,BANDEIRA BRANCA,2016-09-28,sim,1
2,1000022,PR/SP0021686,2002-02-28,COMPETRO COMERCIO E DISTRIBUICAO DE DERIVADOS ...,3188000474,"AVENIDA SANTOS DUMONT, 701",,AEROPORTO,18065290,SP,SOROCABA,BANDEIRA BRANCA,2018-07-27,sim,1
3,1175475,AV/SP0088382,2011-07-12,M & J COMÃ‰RCIO DE COMBUSTÃVEIS E LUBRIFICANT...,5678449000127,"AVENIDA EMILIO ANTONON, S/N",,CHACARA AEROPORTO,13212010,SP,JUNDIAI,RAIZEN,2011-07-12,não,0
4,1226945,PR/RS0177246,2016-09-14,METROPOLITANO COMERCIO DE COMBUSTIVEIS LTDA,88587589000621,"RUA BOQUEIRAO, 1401",,IGARA,92410350,RS,CANOAS,BANDEIRA BRANCA,2016-09-14,sim,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
44013,1296304,PR/MG0244049,2023-10-18,POSTO FIRME NOSSA SENHORA APARECIDA LTDA,50508806000163,"PRACA JOSE MACIEL, 39",,CENTRO,36568000,MG,PORTO FIRME,ALESAT,2023-10-18,não,0
44014,1296307,PR/GO0244057,2023-10-18,AURILENE DOS SANTOS PEREIRA LTDA,42656379000132,"AVENIDA 02, S/N",QUADRA108 LOTE 34 A,PARQUE ALVORADA I,72836200,GO,LUZIANIA,BANDEIRA BRANCA,2023-10-18,sim,1
44015,1296297,PR/SP0244060,2023-10-18,AUTO POSTO 3 IRMAOS LTDA,51881887000105,"RUA FREI MANOEL BRAGDIA, 506",,CENTRO,19960029,SP,CAMPOS NOVOS PAULISTA,BANDEIRA BRANCA,2023-10-18,sim,1
44016,1296308,PR/BA0244073,2023-10-18,LAGOA DO GUEDES COMERCIO DE COMBUSTIVEIS LTDA,48049179000106,"COMUNIDADE LAGOA DO GUEDES, S/N",MARGEM DA ROD BA 220KM 128,ZONA RURAL,48500000,BA,EUCLIDES DA CUNHA,BANDEIRA BRANCA,2023-10-18,sim,1


In [11]:
total_postos = df.shape[0]
print(total_postos)

44018


In [13]:
# Criando um dataframe apenas com os dados relevantes para a análise
df_postos = df[['CNPJ', 'BANDEIRA_BRANCA']]
df_postos.head()

Unnamed: 0,CNPJ,BANDEIRA_BRANCA
0,49051667000102,não
1,19052407000190,sim
2,3188000474,sim
3,5678449000127,não
4,88587589000621,sim


In [14]:
# Quantidade de postos com Bandeira Branca
contagem_bandeira_branca = df['BANDEIRA_BRANCA'].value_counts().get('sim', 0)
print(contagem_bandeira_branca)

20765


In [15]:
# Quantidade de postos com Bandeira  Branca
contagem_embandeirados = df['BANDEIRA_BRANCA'].value_counts().get('não', 0)
print(contagem_embandeirados)

23253


- São 44.018 postos cadastrados no registro da ANP
- Destes, 20.765 são postos com Bandeira Branca.
- Naturalmente, temos 23.253 postos embandeirados

In [17]:
# Calculando a dimensão de postos bandeira branca em termos percentuais
porcentagem_bandeira_branca = (contagem_bandeira_branca / total_postos) * 100
porcentagem_bandeira_branca = round(porcentagem_bandeira_branca, 2)
print(porcentagem_bandeira_branca)

47.17


**Podemos verificar que os postos bandeira branca representam 47.17% da totalidade de postos**

In [16]:
porcentagem_embandeirados = (contagem_embandeirados / total_postos) * 100
porcentagem_embandeirados = round(porcentagem_embandeirados, 2)
print(porcentagem_embandeirados)

52.83


**Podemos verificar que os postos embandeirados representam 52.83% da totalidade de postos**

In [120]:
# calculando a proporção de postos bandeira branca em relação aos postos embandeirados

print(f"Se temos {contagem_bandeira_branca} postos com bandeira branca")
print(f"e {contagem_embandeirados} postos embandeirados.")

proporcao_bandeira_branca = round(contagem_bandeira_branca / contagem_embandeirados *100, 2)
print(f"Tem-se uma proporção entre postos de bandeira branca e embandeirados de {proporcao_bandeira_branca}%")

Se temos 20765 postos com bandeira branca
e 23253 postos embandeirados.
Tem-se uma proporção entre postos de bandeira branca e embandeirados de 89.3%


É uma medida que indica quantos postos "Bandeira Branca" existem para cada posto "Embandeirado" no conjunto de dados

A proporção calculada, 0.893 (ou 89.3%), indica que a proporção de postos "Bandeira Branca" em relação aos "Embandeirados" é de aproximadamente 0.893 (ou 89.3%).

Isso significa que há 89.3% mais postos "Embandeirados" do que "Bandeira Branca".
Portanto, a maioria dos postos no conjunto de dados são classificados como "Embandeirados". 


In [29]:
# Assim, invertendo a relação de proporção
proporcao_embandeirados = contagem_embandeirados / contagem_bandeira_branca
print(proporcao_embandeirados)

1.1198169997592102


Significa que há aproximadamente 1.12 vezes mais postos "Embandeirados" do que postos "Bandeira Branca". 

Indicando que os postos "Embandeirados" são ligeiramente mais comuns em relação aos postos "Bandeira Branca" no conjunto de dados.

O valor da razão indica a relação de prevalência entre os dois tipos de postos.

Significa dizer que a cada 10 postos analisados, teríamos aproximadamente:

**4 postos seriam "Bandeira Branca" e os outros 6 seriam "Embandeirados".**

e que a cada 100 postos analisados, teríamos aproximadamente:

**47 postos seriam "Bandeira Branca" e os outros 53 seriam "Embandeirados".**

##  Conclusão Seção 1

Ainda que aparentemente diminuta, essa desproporção entre postos embandeirados e postos de bandeira branca deve ser considerada ao analisar as frequências de fiscalizações.

# Seção 2

**Objetivo**: Quantificar a relação de fiscalizações da ANP sob a ótica das bandeiras de postos.

**Descrição**: Para continuar a análise, buscamos dados da ANP que apresentem a lista de fiscalizações realizadas pela agência. Será necessário filtrar os dados e cruza-los com os dados vistos na seção 1 para que possamos atribuir a cada instância da tabela o rótulo de bandeira branca ou embandeirado. Somente assim, poderemos analisar as fiscalizações e se elas ocorrem em maior número em postos de Bandeira Branca ou Embandeirados.

In [52]:
# lendo dados de fiscalizações realizadas
df_fiscalizacoes = pd.read_excel('dados_brutos.xlsx', engine="openpyxl")

In [53]:
# visualizando dados
df_fiscalizacoes.head()

Unnamed: 0,UF,Município,Bairro,Endereço,CNPJ/CPF,Agente Econômico,Codigo_Componente,Segmento Fiscalizado,Data DF,Número do Documento,Procedimento de Fiscalização,Resultado
0,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização em campo
1,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,9.0,Revenda de Combustíveis,2020-07-08,575385,Medida Reparadora de Conduta,MRC - PR Comb - Afixação de aviso sobre o Óleo...
2,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações
3,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,ATIV ECON - Revenda de Combustíveis
4,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,9.0,Revenda de Combustíveis,2020-07-08,575385,Medida Reparadora de Conduta,MRC - PR Comb - Preços de combustíveis com 03 ...


In [60]:
# contabilizando a quantidade de fiscalizações realizadas pela a ANP
print(f"Total de fiscalizações realizadas: {df_fiscalizacoes.shape[0]}")

Total de fiscalizações realizadas: 395945


Como podemos quantificar, foram realizadas 395.945 fiscalizações da ANP. Entretanto, nos interessam apenas os dados referentes a fiscalizações realizadas no segmento de revenda e, sobretudo, dos postos dos quais temos a informação sobre o tipo de bandeira. 

In [74]:
print("Segmentos de fiscalização: ")
df_fiscalizacoes['Segmento Fiscalizado'].unique().tolist()

Segmentos de fiscalização: 


['Revenda de Combustíveis',
 'Revenda de GLP',
 'Distribuidor de Combustíveis Líquidos',
 'Revenda de Aviação',
 'Distribuidor de Aviação',
 'Agente Não Regulado',
 'TRRNI',
 'Ponto de Abastecimento',
 'TRR',
 nan,
 'Produtor de Óleo Acabado',
 'Refinaria',
 'Terminal',
 'Consumidor Industrial de Solventes',
 'Distribuidor de GLP']

In [77]:
df_fiscalizacoes = df_fiscalizacoes[df_fiscalizacoes["Segmento Fiscalizado"] == "Revenda de Combustíveis"]
print(f"Fiscalizações no segmento de revenda: {df_revenda.shape[0]}")
print(f"Percentual de fiscalizações no segmento de revendas em relação ao total de fiscalizações: {round(df_revenda.shape[0]/df_fiscalizacoes.shape[0] *100, 2)}%")

Fiscalizações no segmento de revenda: 195113
Percentual de fiscalizações no segmento de revendas em relação ao total de fiscalizações: 79.24%


Filtrando os dados de fiscalizações para obtermos apenas os dados com revenda de combustíveis, podemos perceber que este é justamente o segmento mais fiscalizado.

Ademais, nossa análise possui enfoque apenas nos procedimentos de fiscalização que gerem boletim de Fiscalização

In [78]:
print("Tipos de Procedimentos de Fiscalização: ")
df_fiscalizacoes['Procedimento de Fiscalização'].unique().tolist()

Tipos de Procedimentos de Fiscalização: 


['Boletim de Fiscalização',
 'Medida Reparadora de Conduta',
 'Notificação',
 'Auto de Infração',
 'Termo de Coleta de Amostra',
 'Certidão',
 'Auto de Interdição',
 'Termo Final de Medida Cautelar',
 'Ato de Término de Suspensão',
 'Auto de Apreensão',
 'Termo Fiel Depositário',
 'Ato de Início de Suspensão']

In [80]:
df_fiscalizacoes = df_fiscalizacoes[df_fiscalizacoes["Procedimento de Fiscalização"] == "Boletim de Fiscalização"]
df_fiscalizacoes.head()

Unnamed: 0,UF,Município,Bairro,Endereço,CNPJ/CPF,Agente Econômico,Codigo_Componente,Segmento Fiscalizado,Data DF,Número do Documento,Procedimento de Fiscalização,Resultado
0,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização em campo
2,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações
3,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,ATIV ECON - Revenda de Combustíveis
5,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização conjunta com outros órgão...
6,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização realizada em Força Tarefa


In [81]:
df_fiscalizacoes.shape[0]

159800

Assim, temos 159.800 boletins de fiscalização no segmento de revenda de Combustíveis

In [83]:
# verificando se temos os dados corretos
df_revenda = df_fiscalizacoes[df_fiscalizacoes['CNPJ/CPF'].isin(df['CNPJ'])]
df_revenda

Unnamed: 0,UF,Município,Bairro,Endereço,CNPJ/CPF,Agente Econômico,Codigo_Componente,Segmento Fiscalizado,Data DF,Número do Documento,Procedimento de Fiscalização,Resultado
0,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização em campo
2,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações
3,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,ATIV ECON - Revenda de Combustíveis
5,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização conjunta com outros órgão...
6,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização realizada em Força Tarefa
...,...,...,...,...,...,...,...,...,...,...,...,...
395923,TO,WANDERLANDIA,Setor Central,"AVENIDA GOMES FERREIRA, sn",2280133005153,POSTO ICCAR LTDA,1.0,Revenda de Combustíveis,2019-10-31,558063,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações
395924,TO,WANDERLANDIA,Setor Central,"AVENIDA GOMES FERREIRA, sn",2280133005153,POSTO ICCAR LTDA,1.0,Revenda de Combustíveis,2019-10-31,558063,Boletim de Fiscalização,Ação de fiscalização em campo
395926,TO,XAMBIOA,Centro,R Sete De Setembro C/ Rua Joao Saraiva Dos San...,24375589000170,Matos & Navarro Ltda - ME,,Revenda de Combustíveis,2018-05-17,533297,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações
395933,TO,XAMBIOA,CENTRO,"RUA ANTONIO MARANHÃO, 434",9429072000123,AUTO POSTO SANTA LUZIA LTDA,,Revenda de Combustíveis,2018-05-17,533298,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações


De fato, temos a informação sobre se cada posto é bandeira branca ou não para todos os registros do dataframe. 

Então vamos agregar esta informação:

In [90]:
# fazemos um merge(famoso procv) para unir ambos os dataframes utilizados na análise baseados no CNPJ como interseção 
df_final = pd.merge(df_fiscalizacoes, df_postos, left_on='CNPJ/CPF', right_on='CNPJ', how='left')

In [91]:
df_final

Unnamed: 0,UF,Município,Bairro,Endereço,CNPJ/CPF,Agente Econômico,Codigo_Componente,Segmento Fiscalizado,Data DF,Número do Documento,Procedimento de Fiscalização,Resultado,CNPJ,BANDEIRA_BRANCA
0,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização em campo,7481893000183,não
1,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações,7481893000183,não
2,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,ATIV ECON - Revenda de Combustíveis,7481893000183,não
3,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização conjunta com outros órgão...,7481893000183,não
4,AC,ACRELANDIA,ZONA RURAL,"RODOVIA BR 364 KM 96, M. DIREITA SENTIDO RIO B...",7481893000183,AUTO POSTO CAMARINI EIRELI,1.0,Revenda de Combustíveis,2020-07-08,575385,Boletim de Fiscalização,Ação de fiscalização realizada em Força Tarefa,7481893000183,não
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
159795,TO,WANDERLANDIA,Setor Central,"AVENIDA GOMES FERREIRA, sn",2280133005153,POSTO ICCAR LTDA,1.0,Revenda de Combustíveis,2019-10-31,558063,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações,2280133005153,sim
159796,TO,WANDERLANDIA,Setor Central,"AVENIDA GOMES FERREIRA, sn",2280133005153,POSTO ICCAR LTDA,1.0,Revenda de Combustíveis,2019-10-31,558063,Boletim de Fiscalização,Ação de fiscalização em campo,2280133005153,sim
159797,TO,XAMBIOA,Centro,R Sete De Setembro C/ Rua Joao Saraiva Dos San...,24375589000170,Matos & Navarro Ltda - ME,,Revenda de Combustíveis,2018-05-17,533297,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações,24375589000170,sim
159798,TO,XAMBIOA,CENTRO,"RUA ANTONIO MARANHÃO, 434",9429072000123,AUTO POSTO SANTA LUZIA LTDA,,Revenda de Combustíveis,2018-05-17,533298,Boletim de Fiscalização,Ação de Fiscalização - Outras Situações,9429072000123,sim


In [92]:
# pegando apenas o que interessa no momento
df_final = df_final[["CNPJ","BANDEIRA_BRANCA"]]

In [93]:
df_final.head()

Unnamed: 0,CNPJ,BANDEIRA_BRANCA
0,7481893000183,não
1,7481893000183,não
2,7481893000183,não
3,7481893000183,não
4,7481893000183,não


In [99]:
postos = df_final.shape[0]
print(postos)

159800


In [94]:
contagem_fiscalizacoes_branca = df_final[df_final['BANDEIRA_BRANCA'] == 'sim'].shape[0]
print(contagem_fiscalizacoes_branca)
contagem_fiscalizacoes_embandeirado = df_final[df_final['BANDEIRA_BRANCA'] == 'não'].shape[0]
print(contagem_fiscalizacoes_embandeirado)

67628
92172


Logo, podemos contabilizar **67628** fiscalizações em postos de bandeira branca.

Ao tempo, que observamos **92172** fiscalizações em postos embandeirados.

In [107]:
porcentagem_fiscalizacoes_branca = round(contagem_fiscalizacoes_branca / postos * 100, 2)
print(f"{porcentagem_fiscalizacoes_branca}%")

42.32%


As fiscalizações em postos de bandeira branca representam 42,32% do total de fiscalizações

In [108]:
porcentagem_fiscalizacao_embandeirados = round(contagem_fiscalizacoes_embandeirado / postos * 100, 2)
print(f"{porcentagem_fiscalizacao_embandeirados}%")

57.68%


As fiscalizações em postos embandeirados representam 57,68% do total de fiscalizações

In [116]:
proporcao_fiscalizacao_bandeira_branca =  contagem_fiscalizacoes_branca / contagem_fiscalizacoes_embandeirado
print(f"Observa-se uma propoção de fiscalização em postos de bandeira branca de {round(proporcao_fiscalizacao_bandeira_branca,2)}%")

Observa-se uma propoção de fiscalização em postos de bandeira branca de 0.73%


In [117]:
proporcao_fiscalizacao_embandeirados = contagem_fiscalizacoes_embandeirado / contagem_fiscalizacoes_branca
print(f"Observa-se uma proporção de fiscalização em postos embandeirados de {round(proporcao_fiscalizacao_embandeirados,2)}%")

Observa-se uma proporção de fiscalização em postos embandeirados de 1.36%


A proporção de fiscalizações entre postos bandeira branca e embandeirados é de 0.73. Isso indica que, em média, os postos bandeira branca recebem menos fiscalizações do que os embandeirados.

A proporção de fiscalizações entre postos embandeirados e bandeira branca é de 1.36. Isso sugere que, em média, os postos embandeirados recebem 1.36 vezes mais fiscalizações do que os de bandeira branca.

## Conclusão - seção 2

Após filtrar os dados para obtermos as fiscalizações que tenham como segmento fiscalizado o segmento de revendas e que tenham como Procedimento de fiscalização apenas o Boletim de Fiscalização, Cruzamos os dados obtidos da seção 1 a fim de agregar a informação quanto a bandeira do posto a partir do CNPJ. 

Assim, podemos constatar que, ao menos em numeros brutos, as fiscalizações são mais frequentes em postos embandeirados.

Entretanto, para conclusões mais sólidas, faz-se necessário a análise estatística baseada na proporção observada ainda na seção 1, tendo em vista que numericamente os postos embandeirados são encontrados em maior quantidade.

## Seção 3

**objetivo**: análise estatística baseada na proporção 

**Descrição**: Para alçar o objetivo devemos realizar a contagem de fiscalizações ajustada pela proporção e a comparação de Frequências Ajustadas

**Contagem de Fiscalizações Ajustada pela Proporção**:

ajustar os números levando em consideração a proporção de postos bandeira branca e embandeirados e assim ponderar as frequências de fiscalizações de acordo com essa proporção.

In [118]:
# Calculando a proporção de postos bandeira branca em relação aos embandeirados
proporcao_bandeira_branca = contagem_bandeira_branca / total_postos
print(proporcao_bandeira_branca)

# Ajustando a contagem de fiscalizações para considerar a proporção
contagem_fiscalizacoes_branca_ajustada = contagem_fiscalizacoes_branca * proporcao_bandeira_branca
print(contagem_fiscalizacoes_branca_ajustada)
contagem_fiscalizacoes_embandeirado_ajustada = contagem_fiscalizacoes_embandeirado * (1 - proporcao_bandeira_branca)
print(contagem_fiscalizacoes_embandeirado_ajustada)

0.4717388341133173
31902.753873415422
48690.888182107316


**Comparação de Frequências Ajustadas**:

Comparando as frequências de fiscalizações ajustadas para determinar se os postos bandeira branca são mais ou menos fiscalizados do que os postos embandeirados, levando em conta a proporção de postos.

In [119]:
# Comparando as frequências de fiscalizações ajustadas
if contagem_fiscalizacoes_branca_ajustada > contagem_fiscalizacoes_embandeirado_ajustada:
    print("Os postos bandeira branca são mais fiscalizados.")
elif contagem_fiscalizacoes_branca_ajustada < contagem_fiscalizacoes_embandeirado_ajustada:
    print("Os postos embandeirados são mais fiscalizados.")
else:
    print("A frequência de fiscalização é a mesma para ambos os grupos.")

Os postos embandeirados são mais fiscalizados.


## Conclusão:

- A análise estatística considerando a proporção de postos bandeira branca em relação aos embandeirados, demonstra que os postos embandeirados tendem a ser mais fiscalizados.
- Uma nova análise levando em conta as localidades geográficas pode trazer novos insights.
- Ademais, se considerarmos os diferentes tipos de fiscalização como uma forma de "histórico de conformidade" poderemos obter novos resultados ao ampliar o escopo da análise para além de boletins de fiscalização. 