# Análise de Tabelas da ALESP

Esse notebook contém um estudo exploratório da base de dados da ALESP que está disponível publicamente [neste link](https://www.al.sp.gov.br/dados-abertos/).

## Instalando bibliotecas

In [1]:
# instalando pandera
!pip install pandera

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


## Importando bibliotecas

In [2]:
# importando bibliotecas
import pandas as pd
import pandera as pa
import numpy as np

In [3]:
pd.set_option('display.max_columns',100)
#pd.set_option('display.max_rows')

## Extraindo a base de dados

In [4]:
# extraindo base de dados
df1 = pd.read_csv('https://storage.googleapis.com/aulas-bc26-dados-gbs/alesp/despesa_alesp.csv')
df2 = pd.read_csv('https://storage.googleapis.com/aulas-bc26-dados-gbs/alesp/cadastro_alesp.csv')

In [5]:
# vendo se está tudo certo com a base de dados
df1.head(3)

Unnamed: 0,Ano,Matricula,Mes,Valor,CNPJ,Tipo,Fornecedor
0,2013,300098,1,575.53,504970000000.0,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO VANUTRE LTDA
1,2013,300098,1,1650.76,48814500000000.0,A - COMBUSTÍVEIS E LUBRIFICANTES,S.D.LUIZARI & CIA. LTDA.
2,2013,300098,1,1799.29,65862910000000.0,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO EXECUTIVO LTDA


In [6]:
df1.tail(3)

Unnamed: 0,Ano,Matricula,Mes,Valor,CNPJ,Tipo,Fornecedor
118414,2022,300655,9,599.29,46392130000000.0,"M - MANUTENÇÃO DE BENS MÓVEIS, IMÓVEIS, CONDO...",SECRETARIA MUNICIPAL DA FAZENDA
118415,2022,300655,9,1836.13,61063910000000.0,"M - MANUTENÇÃO DE BENS MÓVEIS, IMÓVEIS, CONDO...",CONDOMINIO EDIF IBIRAPUERA PLAZA CENTER
118416,2022,300655,9,2835.9,2491558000000.0,O - LOCAÇÃO DE VEÍCULO,UNIDAS VEÍCULOS ESPECIAIS S.A.


In [7]:
df2.head(3)

Unnamed: 0,IdDeputado,IdSPL,IdUA,Situacao,Andar,Aniversario,Biografia,Email,Matricula,NomeParlamentar,PathFoto,Sala,Partido,Telefone,Fax,PlacaVeiculo
0,549,1000000330,20377,EXE,3º andar,01/11,"<p style=""margin: 0cm 0cm 0.0001pt; background...",adalbertofreitas@al.sp.gov.br,300605,Adalberto Freitas,http://www3.al.sp.gov.br/repositorio/deputadoP...,305,PSDB,(11) 3886-6557 / 6559,,
1,548,1000000332,20370,EXE,Térreo,09/07,"<p class=""MsoNormal"">Com uma hist&oacute;ria d...",adrianaborgo@al.sp.gov.br,300606,Adriana Borgo,http://www3.al.sp.gov.br/repositorio/deputadoP...,T. 45,AGIR,(11) 3886-6567/8770,,
2,547,1000000335,20455,EXE,2º andar,26/08,<p>Danilo Mascarenhas de Balas nasceu na cidad...,apfdanilobalas@al.sp.gov.br,300607,Agente Federal Danilo Balas,http://www3.al.sp.gov.br/repositorio/deputadoP...,255,PL,(11)3886-6052/6054,,


In [8]:
df2.tail(3)

Unnamed: 0,IdDeputado,IdSPL,IdUA,Situacao,Andar,Aniversario,Biografia,Email,Matricula,NomeParlamentar,PathFoto,Sala,Partido,Telefone,Fax,PlacaVeiculo
90,503,1000000374,20447,EXE,Térreo,16/09,"<div style=""outline: none; color: #121212; fon...",ValeriaBolsonaro@al.sp.gov.br,300649,Valeria Bolsonaro,http://www3.al.sp.gov.br/repositorio/deputadoP...,T. 06,PL,(011)3886-6222 / 6223,,
91,13,448,20394,EXE,Térreo,06/11,"<p class=""WordSection1"" style=""text-align: jus...",depviniciuscamarinha@al.sp.gov.br,300430,Vinícius Camarinha,http://www3.al.sp.gov.br/repositorio/deputadoP...,T. 55,PSDB,3886-6366/6365/6494,,
92,290,13098,20405,EXE,2º andar,22/01,"<p>Nascido em 1979, na cidade de Santos (litor...",wmoura@al.sp.gov.br,300589,Wellington Moura,http://www3.al.sp.gov.br/repositorio/deputadoP...,238,REPUBLICANOS,(011)3886-6096 / 6139,,


## Iniciando pré-análise

In [9]:
# vendo se tipos de dados batem com os tipos das colunas
df1.info()
# aqui vemos que podemos mudar tipo de dados do ano, mes, cnpj
# vemos também que faltam dados na coluna cnpj
# vamos juntar as colunas ano e mes e transformá-la em datetime

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 118417 entries, 0 to 118416
Data columns (total 7 columns):
 #   Column      Non-Null Count   Dtype  
---  ------      --------------   -----  
 0   Ano         118417 non-null  int64  
 1   Matricula   118417 non-null  int64  
 2   Mes         118417 non-null  int64  
 3   Valor       118417 non-null  float64
 4   CNPJ        116563 non-null  float64
 5   Tipo        118417 non-null  object 
 6   Fornecedor  118417 non-null  object 
dtypes: float64(2), int64(3), object(2)
memory usage: 6.3+ MB


In [10]:
df2.info()
# analiso que podemos dar drop nas colunas Fax e PlacaVeiculo por não terem dados suficientes
# as colunas Biografia, Email, PathFoto e Telefone também não terão uso em nossa análise e serão excluidas
# a coluna Situacao tem apenas um dado EXE e será excluida 
# o aniversário não está como data, porém não como não consta o ano de nascimento 

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93 entries, 0 to 92
Data columns (total 16 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   IdDeputado       93 non-null     int64 
 1   IdSPL            93 non-null     int64 
 2   IdUA             93 non-null     int64 
 3   Situacao         93 non-null     object
 4   Andar            92 non-null     object
 5   Aniversario      93 non-null     object
 6   Biografia        93 non-null     object
 7   Email            93 non-null     object
 8   Matricula        93 non-null     int64 
 9   NomeParlamentar  93 non-null     object
 10  PathFoto         93 non-null     object
 11  Sala             93 non-null     object
 12  Partido          93 non-null     object
 13  Telefone         93 non-null     object
 14  Fax              11 non-null     object
 15  PlacaVeiculo     1 non-null      object
dtypes: int64(4), object(12)
memory usage: 11.8+ KB


In [11]:
sorted(df2['Situacao'].unique())

['EXE']

In [12]:
#consulta valores ausentes
df1.isna().sum()
#inconsistencias encontradas: CNPJS zerados

Ano              0
Matricula        0
Mes              0
Valor            0
CNPJ          1854
Tipo             0
Fornecedor       0
dtype: int64

In [13]:
df2.isna().sum()

IdDeputado          0
IdSPL               0
IdUA                0
Situacao            0
Andar               1
Aniversario         0
Biografia           0
Email               0
Matricula           0
NomeParlamentar     0
PathFoto            0
Sala                0
Partido             0
Telefone            0
Fax                82
PlacaVeiculo       92
dtype: int64

In [14]:
# vendo os valores de qual coluna são únicos
print(df1.Ano.is_unique) 
print(df1.Matricula.is_unique) 
print(df1.Mes.is_unique)
print(df1.Valor.is_unique)
print(df1.CNPJ.is_unique)
print(df1.Tipo.is_unique)
print(df1.Fornecedor.is_unique)
# não podemos usar nenhuma dessas colunas como rótulo, pois todas tem valores repetidos

False
False
False
False
False
False
False


In [15]:
print(df2.IdDeputado .is_unique) 
print(df2.IdSPL.is_unique) 
print(df2.IdUA.is_unique)
print(df2.Situacao.is_unique)
print(df2.Andar.is_unique)
print(df2.Biografia.is_unique)
print(df2.Email.is_unique)
print(df2.Matricula.is_unique)
print(df2.NomeParlamentar.is_unique)
print(df2.PathFoto.is_unique)
print(df2.Sala.is_unique)
print(df2.Partido.is_unique)
print(df2.Telefone.is_unique)
print(df2.Fax.is_unique)
print(df2.PlacaVeiculo.is_unique)
# temos várias colunas com valores únicos, porém não searei nenhuma como rótulo, para facilitar nossa análise

True
True
True
False
False
True
True
True
True
True
True
False
True
False
False


In [16]:
# analisando valor mínimo gasto
df1.Valor.min()

0.0

In [17]:
# analisando valor máximo gasto
df1.Valor.max()

18040.78

In [18]:
# analisando quantidade de entradas de valor
df1.Valor.count()

118417

## Tratamento Inicial de Dados (depesa_alesp.csv)

### Back-up

In [19]:
# backup do dataframe original
dfback1 = df1.copy()

In [20]:
dfback1.dtypes

Ano             int64
Matricula       int64
Mes             int64
Valor         float64
CNPJ          float64
Tipo           object
Fornecedor     object
dtype: object

### Renomeando Colunas

In [21]:
# renomeando as colunas 
df1.rename(columns={
    'Ano':'ano',
    'Matricula':'matricula',
    'Mes':'mes',
    'Valor':'valor',
    'CNPJ':'cnpj',
    'Tipo':'tipo',
    'Fornecedor':'fornecedor'
    }, inplace=True)

In [22]:
df1.dtypes

ano             int64
matricula       int64
mes             int64
valor         float64
cnpj          float64
tipo           object
fornecedor     object
dtype: object

In [23]:
# trasformando type para string
df1['mes'] = df1['mes'].astype(str)
df1['ano'] = df1['ano'].astype(str)

In [24]:
df1.dtypes

ano            object
matricula       int64
mes            object
valor         float64
cnpj          float64
tipo           object
fornecedor     object
dtype: object

In [25]:
# criando coluna concatenando mês com ano
df1['data'] = df1['mes'] + '/' + df1['ano']

In [26]:
# trasformando type para datetime
df1['data'] = pd.to_datetime(df1['data'], dayfirst=True)

In [27]:
df1.dtypes

ano                   object
matricula              int64
mes                   object
valor                float64
cnpj                 float64
tipo                  object
fornecedor            object
data          datetime64[ns]
dtype: object

In [28]:
# criando novo df tirando colunas de ano e mes
df1 = df1[['matricula', 'data', 'valor', 'cnpj', 'tipo', 'fornecedor']]

In [29]:
df1

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
0,300098,2013-01-01,575.53,5.049700e+11,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO VANUTRE LTDA
1,300098,2013-01-01,1650.76,4.881450e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,S.D.LUIZARI & CIA. LTDA.
2,300098,2013-01-01,1799.29,6.586291e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO EXECUTIVO LTDA
3,300098,2013-01-01,36.40,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
4,300098,2013-01-01,3100.00,9.904660e+11,"D - MATERIAIS E SERVIÇOS GRÁFICOS, DE CÓPIAS ...",CROMOGRAF GRAFICA DE PRESIDENTE PRUDENTE LTDA ...
...,...,...,...,...,...,...
118412,300655,2022-09-01,1250.00,1.531481e+13,K - LOCAÇÃO DE BENS MÓVEIS,FYIVAS SOLUÇÕES EM TECNOLOGIA LTDA ME
118413,300655,2022-09-01,2500.00,6.729494e+10,L - LOCAÇÃO DE BENS IMÓVEIS,MARIA INES SINISGALLI
118414,300655,2022-09-01,599.29,4.639213e+13,"M - MANUTENÇÃO DE BENS MÓVEIS, IMÓVEIS, CONDO...",SECRETARIA MUNICIPAL DA FAZENDA
118415,300655,2022-09-01,1836.13,6.106391e+13,"M - MANUTENÇÃO DE BENS MÓVEIS, IMÓVEIS, CONDO...",CONDOMINIO EDIF IBIRAPUERA PLAZA CENTER


### Procurando Mais Inconsistências

In [30]:
valores_estranhos = []
for i in range(len(df1)):
  try:
    int(df1.loc[i,'cnpj'])
  except Exception:
    valores_estranhos.append(df1.loc[i,'cnpj'])
print(valores_estranhos)
# valores encontrados: NaN

[nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan,

In [31]:
# procurando dados inconsistentes
sorted(pd.unique(df1['fornecedor']))
# inconsistencias encontradas: nomes diferentes para um mesmo tipo de fornecedor

['1 OFICIAL DE REGISTRO DE IMOVEIS DA COMARCA DE ARARAQUARA',
 '1 OFICIAL DE REGISTRO DE IMOVEIS DE SAO PAULO',
 '1 TABELIAO DE NOTAS DA CAPITAL',
 '1 TABELIONATO DE NOTAS',
 '1 TABELIONATO DE NOTAS E ANEXOS',
 '1010 ARTESANATO EM PIZZAS LTDA',
 '1088 COND.IBIRAPUERA CENTRAL PARK',
 '11º TABELIÃO DE NOTAS',
 '123 MILHAS',
 '123 VIAGENS E TURISMO',
 '123 VIAGENS E TURISMO LTDA',
 '13 A INFORMATICA E MATERIAL DE ESCRITÓRIO LTDA.',
 '14º TABELIONATO DE NOTAS',
 '1857 COMERCEIO E EXPORTAÇÃO DE CAFÉ LTDA',
 '1857 COMERCIO E EXPORTAÇAO DE CAFE',
 '19 CARTORIO DE REGISTRO CIVIL',
 '1º OFICIAL DE REGISTRO DE IMÓVEIS DE MOGI DAS CRUZES-SP',
 '1º TABELIAO DE NOTAS E DE PROTESTOS - BEL. DENILSON DANIEL',
 '1º TABELIAO DE NOTAS E PROTESTO DE SUZANO',
 '2 AMIGOS COM. DE COMBUST. DE MONTE APRAZIVEL LTDA.',
 '2 AMIGOS COMERCIO DE COMBUSTIVEIS LTDA',
 '2 M MARKETING E PLANEJAMENTO LTDA ME',
 '2 OFICIAL DE REGISTRO DE IMOVEIS, TITULOS E DOCUMENTOS E CIVIL DE PESSOA JURIDICA DE GUARULHOS',
 '2 TABELIAO 

## Tratamento Inicial de Dados (cadastro_alesp.csv)

### Back-up

In [32]:
# backup do dataframe original
dfback2 = df2.copy()

In [33]:
dfback2.dtypes

IdDeputado          int64
IdSPL               int64
IdUA                int64
Situacao           object
Andar              object
Aniversario        object
Biografia          object
Email              object
Matricula           int64
NomeParlamentar    object
PathFoto           object
Sala               object
Partido            object
Telefone           object
Fax                object
PlacaVeiculo       object
dtype: object

### Limpeza dos Dados

In [37]:
# drop colunas que não serão utilizadas da df
df2.drop(['Fax', 'PlacaVeiculo', 'Biografia', 'Email', 'PathFoto', 'Telefone', 'Situacao'], axis=1, inplace=True)

### Renomeando Colunas

In [38]:
df2.dtypes

IdDeputado          int64
IdSPL               int64
IdUA                int64
Andar              object
Aniversario        object
Matricula           int64
NomeParlamentar    object
Sala               object
Partido            object
dtype: object

In [42]:
# renomeando as colunas 
df2.rename(columns={
    'IdDeputado':'id_deputado',
    'IdSPL':'id_spl',
    'IdUA':'id_ua',
    'Andar':'andar',
    'Aniversario':'aniversario',
    'Matricula':'matricula',
    'NomeParlamentar':'nome_parlamentar',
    'Sala':'sala',
    'Partido':'partido'
    }, inplace=True)

In [44]:
df2.head(1)

Unnamed: 0,id_deputado,id_spl,id_ua,andar,aniversario,matricula,nome_parlamentar,sala,partido
0,549,1000000330,20377,3º andar,01/11,300605,Adalberto Freitas,305,PSDB


### Procurando Mais Inconsistências

In [45]:
# dados ok
sorted(pd.unique(df2['id_deputado'])) 

[6,
 11,
 13,
 28,
 38,
 49,
 58,
 70,
 71,
 74,
 78,
 84,
 87,
 90,
 91,
 95,
 110,
 112,
 126,
 128,
 141,
 142,
 148,
 158,
 163,
 173,
 175,
 177,
 180,
 261,
 263,
 267,
 270,
 274,
 276,
 279,
 281,
 283,
 284,
 285,
 286,
 287,
 288,
 289,
 290,
 503,
 504,
 505,
 506,
 507,
 508,
 509,
 510,
 511,
 512,
 513,
 514,
 515,
 516,
 517,
 518,
 519,
 520,
 521,
 523,
 524,
 525,
 526,
 527,
 528,
 529,
 530,
 531,
 532,
 533,
 534,
 535,
 536,
 537,
 538,
 539,
 540,
 541,
 542,
 545,
 546,
 547,
 548,
 549,
 561,
 1521,
 1541,
 1561]

In [46]:
# inconsistência: valor zerado
sorted(pd.unique(df2['id_spl'])) 

[0,
 39,
 40,
 58,
 64,
 68,
 70,
 78,
 82,
 94,
 180,
 197,
 232,
 268,
 291,
 431,
 434,
 448,
 454,
 4926,
 10592,
 10597,
 10603,
 10611,
 10613,
 10619,
 12380,
 12381,
 12392,
 12396,
 12414,
 12419,
 12420,
 13076,
 13077,
 13080,
 13082,
 13085,
 13086,
 13089,
 13091,
 13093,
 13094,
 13095,
 13096,
 13097,
 13098,
 13109,
 1000000330,
 1000000332,
 1000000334,
 1000000335,
 1000000337,
 1000000338,
 1000000339,
 1000000340,
 1000000342,
 1000000346,
 1000000347,
 1000000348,
 1000000349,
 1000000350,
 1000000351,
 1000000352,
 1000000354,
 1000000355,
 1000000358,
 1000000360,
 1000000362,
 1000000363,
 1000000365,
 1000000366,
 1000000367,
 1000000369,
 1000000370,
 1000000372,
 1000000373,
 1000000374,
 1000000376,
 1000000378,
 1000000397,
 1000000399,
 1000000400,
 1000000401,
 1000000406,
 1000000408,
 1000000410,
 1000000413,
 1000000419,
 1000000420,
 1000000426,
 1000000610,
 1000000723]

In [47]:
# verificando id zerada
ftidspl = df2.id_spl == 0
df2.loc[ftidspl]
# os dados existem, então deixamos como está

Unnamed: 0,id_deputado,id_spl,id_ua,andar,aniversario,matricula,nome_parlamentar,sala,partido
65,1541,0,20398,Térreo,28/01,300654,Murilo Felix,T. 48,PODE


In [48]:
# dados ok
sorted(pd.unique(df2['id_ua'])) 

[20365,
 20366,
 20368,
 20369,
 20370,
 20371,
 20372,
 20373,
 20374,
 20375,
 20376,
 20377,
 20378,
 20379,
 20380,
 20381,
 20382,
 20383,
 20384,
 20385,
 20386,
 20387,
 20388,
 20389,
 20390,
 20391,
 20392,
 20393,
 20394,
 20395,
 20396,
 20397,
 20398,
 20399,
 20400,
 20401,
 20402,
 20403,
 20404,
 20405,
 20406,
 20407,
 20408,
 20409,
 20410,
 20411,
 20412,
 20413,
 20414,
 20415,
 20416,
 20417,
 20418,
 20419,
 20420,
 20421,
 20422,
 20423,
 20424,
 20425,
 20426,
 20427,
 20428,
 20429,
 20430,
 20431,
 20432,
 20433,
 20434,
 20435,
 20436,
 20437,
 20438,
 20439,
 20440,
 20441,
 20442,
 20443,
 20444,
 20445,
 20446,
 20447,
 20448,
 20449,
 20450,
 20451,
 20452,
 20453,
 20454,
 20455,
 20456,
 20457,
 20458]

In [50]:
# inconsistência: valor NaN e valores iguais escritos diferentes
pd.unique(df2['andar'])

array(['3º andar', 'Térreo', '2º andar', '3º', '1º', '4º', '2º',
       '1º Andar', '3º Andar', 'Téreo', nan, '2°', '4º Andar', '1º andar'],
      dtype=object)

In [51]:
# compatibilizando valores
df2.andar.replace(['4º', '4º Andar'],'4º andar',inplace=True) 
df2.andar.replace(['3º', '3º Andar'],'3º andar',inplace=True) 
df2.andar.replace(['2°', '2º'],'2º andar',inplace=True) 
df2.andar.replace(['1º', '1º Andar'],'1º andar',inplace=True) 
df2.andar.replace(['Térreo', 'Téreo'],'térreo',inplace=True) 

In [52]:
pd.unique(df2['andar'])

array(['3º andar', 'térreo', '2º andar', '1º andar', '4º andar', nan],
      dtype=object)

In [53]:
# inconsistência: aniversário 'null/null'
sorted(pd.unique(df2['aniversario'])) 

['01/02',
 '01/04',
 '01/05',
 '01/08',
 '01/10',
 '01/11',
 '02/07',
 '02/10',
 '02/11',
 '03/08',
 '03/09',
 '04/01',
 '05/03',
 '05/09',
 '06/01',
 '06/04',
 '06/08',
 '06/10',
 '06/11',
 '07/01',
 '07/05',
 '07/06',
 '07/09',
 '08/01',
 '08/07',
 '08/10',
 '08/12',
 '09/02',
 '09/04',
 '09/07',
 '09/08',
 '10/09',
 '10/10',
 '10/11',
 '11/09',
 '12/09',
 '13/06',
 '13/07',
 '14/02',
 '14/05',
 '14/07',
 '15/05',
 '15/08',
 '15/09',
 '15/12',
 '16/01',
 '16/03',
 '16/05',
 '16/06',
 '16/08',
 '16/09',
 '17/03',
 '17/06',
 '17/09',
 '18/01',
 '18/06',
 '19/01',
 '19/06',
 '20/05',
 '20/11',
 '21/04',
 '21/12',
 '22/01',
 '22/05',
 '22/12',
 '23/04',
 '24/04',
 '25/01',
 '25/06',
 '25/08',
 '25/09',
 '26/05',
 '26/08',
 '26/10',
 '28/01',
 '28/03',
 '28/07',
 '28/10',
 '29/01',
 '29/03',
 '29/07',
 '29/12',
 '30/10',
 '31/10',
 'null/null']

In [54]:
# transformando valor null/null para NaN
df2.replace('null/null', np.NaN, inplace=True)

In [56]:
pd.unique(df2['aniversario'])

array(['01/11', '09/07', '26/08', '04/01', '17/09', '02/07', '25/09',
       '09/04', '07/06', '19/06', '26/10', '15/09', '01/08', '31/10',
       '08/10', '13/07', '15/12', '10/11', '14/05', '07/01', '10/10',
       '14/02', '19/01', '08/07', '25/08', '11/09', '13/06', nan, '16/06',
       '21/04', '06/08', '01/04', '06/04', '22/05', '20/05', '20/11',
       '15/08', '26/05', '02/11', '16/03', '29/01', '28/03', '21/12',
       '25/06', '16/01', '07/09', '22/12', '12/09', '16/05', '10/09',
       '29/12', '06/10', '17/06', '07/05', '18/01', '30/10', '15/05',
       '08/12', '03/08', '28/01', '09/02', '02/10', '24/04', '25/01',
       '14/07', '01/05', '28/07', '05/09', '06/01', '05/03', '09/08',
       '29/07', '17/03', '03/09', '29/03', '16/08', '28/10', '01/10',
       '18/06', '08/01', '01/02', '23/04', '16/09', '06/11', '22/01'],
      dtype=object)

In [57]:
# dados ok
sorted(pd.unique(df2['matricula'])) 

[300098,
 300188,
 300205,
 300217,
 300260,
 300264,
 300267,
 300288,
 300292,
 300303,
 300318,
 300344,
 300367,
 300382,
 300395,
 300407,
 300430,
 300431,
 300440,
 300449,
 300450,
 300470,
 300471,
 300483,
 300485,
 300497,
 300499,
 300501,
 300510,
 300513,
 300519,
 300520,
 300533,
 300534,
 300536,
 300539,
 300540,
 300543,
 300544,
 300545,
 300548,
 300549,
 300552,
 300553,
 300583,
 300584,
 300589,
 300605,
 300606,
 300607,
 300608,
 300609,
 300612,
 300613,
 300614,
 300615,
 300616,
 300617,
 300618,
 300619,
 300620,
 300621,
 300622,
 300623,
 300624,
 300625,
 300626,
 300627,
 300628,
 300629,
 300630,
 300631,
 300633,
 300634,
 300635,
 300636,
 300637,
 300638,
 300639,
 300640,
 300641,
 300642,
 300643,
 300644,
 300645,
 300646,
 300647,
 300648,
 300649,
 300650,
 300653,
 300654,
 300655]

In [58]:
# dados ok
sorted(pd.unique(df2['nome_parlamentar'])) 

['Adalberto Freitas',
 'Adriana Borgo',
 'Agente Federal Danilo Balas',
 'Aldo Demarchi',
 'Alex de Madureira',
 'Alexandre Pereira',
 'Altair Moraes',
 'Analice Fernandes',
 'André do Prado',
 'Ataide Teruel',
 'Barros Munhoz',
 'Bruno Ganem',
 'Caio França',
 'Campos Machado',
 'Carla Morando',
 'Carlos Cezar',
 'Carlos Giannazi',
 'Carlão Pignatari',
 'Castello Branco',
 'Cezar',
 'Conte Lopes',
 'Coronel Nishikawa',
 'Coronel Telhada',
 'Daniel José',
 'Daniel Soares',
 'Delegada Graciela',
 'Delegado Bruno Lima',
 'Delegado Olim',
 'Dirceu Dalben',
 'Douglas Garcia',
 'Dr. Jorge do Carmo',
 'Dra. Damaris Moura',
 'Edmir Chedid',
 'Edna Macedo',
 'Edson Giriboni',
 'Emidio de Souza',
 'Enio Tatto',
 'Erica Malunguinho',
 'Estevam Galvão',
 'Fernando Cury',
 "Frederico d'Avila",
 'Gil Diniz',
 'Gilmaci Santos',
 'Heni Ozi Cukier',
 'Isa Penna',
 'Itamar Borges',
 'Janaina Paschoal',
 'Jorge Caruso',
 'Jorge Wilson Xerife do Consumidor',
 'José Américo',
 'Leci Brandão',
 'Leticia Ag

In [59]:
# inconsistências: valores com T, espaços, traços e pontos
sorted(pd.unique(df2['sala'])) 

['103',
 '104',
 '105',
 '106',
 '107',
 '108',
 '110',
 '111',
 '112',
 '148',
 '156',
 '157',
 '158',
 '161',
 '162',
 '163',
 '164',
 '165',
 '166',
 '167',
 '168',
 '169',
 '170',
 '171',
 '173',
 '203',
 '204',
 '205',
 '206',
 '207',
 '208',
 '209',
 '210',
 '211',
 '238',
 '247',
 '251',
 '252',
 '253',
 '254',
 '255',
 '256',
 '257',
 '258',
 '259',
 '260',
 '261',
 '3033',
 '304',
 '305',
 '306',
 '307',
 '308',
 '313',
 '346',
 '347',
 '350',
 '351',
 '352',
 '353',
 '354',
 '355',
 '356',
 '357',
 '358',
 '359',
 '360',
 '361',
 '401',
 '405',
 '410',
 'T 05',
 'T 44',
 'T-03',
 'T-39',
 'T-47',
 'T-50',
 'T. 04',
 'T. 06',
 'T. 40',
 'T. 45',
 'T. 46',
 'T. 48',
 'T. 53',
 'T. 55',
 'T.02',
 'T.08',
 'T.10',
 'T.12',
 'T.41',
 'T.49',
 'T.52',
 'T54']

In [62]:
# arrumando salas com T
df2.replace('T 05','T-05', inplace=True)
df2.replace('T 44','T-44', inplace=True)
df2.replace('T. 04','T-04', inplace=True)
df2.replace('T. 06','T-06', inplace=True)
df2.replace('T. 40','T-40', inplace=True)
df2.replace('T. 45','T-45', inplace=True)
df2.replace('T. 46','T-46', inplace=True)
df2.replace('T. 48','T-48', inplace=True)
df2.replace('T. 53','T-53', inplace=True)
df2.replace('T. 55','T-55', inplace=True)
df2.replace('T.02','T-02', inplace=True)
df2.replace('T.08','T-08', inplace=True)
df2.replace('T.10','T-10', inplace=True)
df2.replace('T.41','T-41', inplace=True)
df2.replace('T.12','T-12', inplace=True)
df2.replace('T.49','T-49', inplace=True)
df2.replace('T.52','T-52', inplace=True)
df2.replace('T54','T-54', inplace=True)

In [63]:
sorted(pd.unique(df2['sala'])) 

['103',
 '104',
 '105',
 '106',
 '107',
 '108',
 '110',
 '111',
 '112',
 '148',
 '156',
 '157',
 '158',
 '161',
 '162',
 '163',
 '164',
 '165',
 '166',
 '167',
 '168',
 '169',
 '170',
 '171',
 '173',
 '203',
 '204',
 '205',
 '206',
 '207',
 '208',
 '209',
 '210',
 '211',
 '238',
 '247',
 '251',
 '252',
 '253',
 '254',
 '255',
 '256',
 '257',
 '258',
 '259',
 '260',
 '261',
 '3033',
 '304',
 '305',
 '306',
 '307',
 '308',
 '313',
 '346',
 '347',
 '350',
 '351',
 '352',
 '353',
 '354',
 '355',
 '356',
 '357',
 '358',
 '359',
 '360',
 '361',
 '401',
 '405',
 '410',
 'T-02',
 'T-03',
 'T-04',
 'T-05',
 'T-06',
 'T-08',
 'T-10',
 'T-12',
 'T-39',
 'T-40',
 'T-41',
 'T-44',
 'T-45',
 'T-46',
 'T-47',
 'T-48',
 'T-49',
 'T-50',
 'T-52',
 'T-53',
 'T-54',
 'T-55']

In [60]:
# dados ok
sorted(pd.unique(df2['partido'])) 

['AGIR',
 'AVANTE',
 'CIDADANIA',
 'MDB',
 'NOVO',
 'PATRI',
 'PC do B',
 'PDT',
 'PL',
 'PODE',
 'PP',
 'PRTB',
 'PSB',
 'PSD',
 'PSDB',
 'PSOL',
 'PT',
 'REDE',
 'REPUBLICANOS',
 'SD',
 'UNIÃO']

## Validando os Dados de Cada DF

In [64]:
df1.dtypes

matricula              int64
data          datetime64[ns]
valor                float64
cnpj                 float64
tipo                  object
fornecedor            object
dtype: object

In [65]:
# criação do schema de validação dos dados
schema1 = pa.DataFrameSchema(
    columns = {
      'matricula':pa.Column(pa.Int),
      'data':pa.Column(pa.DateTime),
      'valor':pa.Column(pa.Float),
      'cnpj':pa.Column(pa.Float,nullable=True),
      'tipo':pa.Column(pa.String),
      'fornecedor':pa.Column(pa.String)
    }
)

In [66]:
# validador do DF
schema1.validate(df1)

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
0,300098,2013-01-01,575.53,5.049700e+11,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO VANUTRE LTDA
1,300098,2013-01-01,1650.76,4.881450e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,S.D.LUIZARI & CIA. LTDA.
2,300098,2013-01-01,1799.29,6.586291e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO EXECUTIVO LTDA
3,300098,2013-01-01,36.40,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
4,300098,2013-01-01,3100.00,9.904660e+11,"D - MATERIAIS E SERVIÇOS GRÁFICOS, DE CÓPIAS ...",CROMOGRAF GRAFICA DE PRESIDENTE PRUDENTE LTDA ...
...,...,...,...,...,...,...
118412,300655,2022-09-01,1250.00,1.531481e+13,K - LOCAÇÃO DE BENS MÓVEIS,FYIVAS SOLUÇÕES EM TECNOLOGIA LTDA ME
118413,300655,2022-09-01,2500.00,6.729494e+10,L - LOCAÇÃO DE BENS IMÓVEIS,MARIA INES SINISGALLI
118414,300655,2022-09-01,599.29,4.639213e+13,"M - MANUTENÇÃO DE BENS MÓVEIS, IMÓVEIS, CONDO...",SECRETARIA MUNICIPAL DA FAZENDA
118415,300655,2022-09-01,1836.13,6.106391e+13,"M - MANUTENÇÃO DE BENS MÓVEIS, IMÓVEIS, CONDO...",CONDOMINIO EDIF IBIRAPUERA PLAZA CENTER


In [67]:
df1.loc[[3,27,77,111]] 

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
3,300098,2013-01-01,36.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
27,300098,2013-02-01,10.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
77,300098,2013-03-01,29.0,,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",TAXI
111,300098,2013-04-01,203.5,,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",TAXI


In [68]:
#contagem de valores "válidos"
df1.count()

matricula     118417
data          118417
valor         118417
cnpj          116563
tipo          118417
fornecedor    118417
dtype: int64

In [69]:
df2.dtypes

id_deputado          int64
id_spl               int64
id_ua                int64
andar               object
aniversario         object
matricula            int64
nome_parlamentar    object
sala                object
partido             object
dtype: object

In [74]:
# criação do schema de validação dos dados
schema2 = pa.DataFrameSchema(
    columns = {
      'id_deputado':pa.Column(pa.Int),
      'id_spl':pa.Column(pa.Int),
      'id_ua':pa.Column(pa.Int),
      'andar':pa.Column(pa.String, nullable=True),
      'aniversario':pa.Column(pa.String, nullable=True),
      'matricula':pa.Column(pa.Int),
      'nome_parlamentar':pa.Column(pa.String),
      'sala':pa.Column(pa.String),
      'partido':pa.Column(pa.String)
    }
)

In [75]:
# validador do DF
schema2.validate(df2)

Unnamed: 0,id_deputado,id_spl,id_ua,andar,aniversario,matricula,nome_parlamentar,sala,partido
0,549,1000000330,20377,3º andar,01/11,300605,Adalberto Freitas,305,PSDB
1,548,1000000332,20370,térreo,09/07,300606,Adriana Borgo,T-45,AGIR
2,547,1000000335,20455,2º andar,26/08,300607,Agente Federal Danilo Balas,255,PL
3,128,39,20369,3º andar,04/01,300288,Aldo Demarchi,356,UNIÃO
4,546,1000000342,20399,1º andar,17/09,300608,Alex de Madureira,173,PL
...,...,...,...,...,...,...,...,...,...
88,289,13109,20414,1º andar,08/07,300584,Teonilio Barba,103,PT
89,504,1000000373,20400,3º andar,23/04,300648,Thiago Auricchio,353,PL
90,503,1000000374,20447,térreo,16/09,300649,Valeria Bolsonaro,T-06,PL
91,13,448,20394,térreo,06/11,300430,Vinícius Camarinha,T-55,PSDB


## Filtros para Limpeza de Dados 

In [76]:
# para criar um filtro, começamos procurando uma coluna com menos tipos de dados
# para faciliar a análise
sorted(pd.unique(df1['tipo']))

['A - COMBUSTÍVEIS E LUBRIFICANTES',
 'C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE VEÍCULOS ; PEDÁGIOS',
 'D - MATERIAIS E SERVIÇOS GRÁFICOS, DE CÓPIAS  E REPRODUÇÃO DE DOCS',
 'E - MATERIAIS DE ESCRITÓRIO E OUTROS MATERIAIS DE CONSUMO',
 'F - SERVIÇOS TÉCNICOS PROFISSIONAIS (CONSULTORIA, PESQUISAS ETC)',
 'G - ASSINATURAS DE PERIÓDICOS, PUBLICAÇÕES, INTERNET E SOFTWARES',
 'H - SERV.UTIL.PÚBLICA (TELEF.MÓVEL/FIXA, ENERGIA, ÁGUA, GÁS ETC)',
 'I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCOMOÇÃO',
 'J - SERVIÇOS DE COMUNICAÇÃO',
 'K - LOCAÇÃO DE BENS MÓVEIS',
 'L - LOCAÇÃO DE BENS IMÓVEIS',
 'M - MANUTENÇÃO DE BENS MÓVEIS,  IMÓVEIS, CONDOMÍNIOS E OUTROS',
 'N - MORADIA',
 'O - LOCAÇÃO DE VEÍCULO',
 'P - DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR']

### Filtro C

In [77]:
# criando um filtro para tipo C
filtroc = df1.tipo == 'C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE VEÍCULOS ; PEDÁGIOS'

In [78]:
# cria um df filtrado com as informações da categoria C
dpedagio = df1.loc[filtroc]

In [79]:
dpedagio

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
3,300098,2013-01-01,36.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
26,300098,2013-02-01,30.0,6.116149e+13,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,A Z COMERCIO DE COMBUSTIVEIS LTDA
27,300098,2013-02-01,10.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
60,300098,2013-03-01,374.4,1.845323e+12,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,AUTOESTE VEÍCULOS E PEÇAS LTDA.
61,300098,2013-03-01,230.0,6.553230e+13,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,J. L. AUTO ELÉTRICA LTDA. - ME
...,...,...,...,...,...,...
117309,300650,2021-11-01,115.2,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
117374,300650,2022-01-01,30.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
117433,300650,2022-03-01,53.0,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
117590,300650,2022-08-01,398.9,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO


In [80]:
# cria um filtro para pegar partes de string que podem estar nos dados relacionados a pedagio
filtroped = dpedagio.fornecedor.str.contains('PED|PEG|SEM')

In [81]:
# cria um novo df com base no df filtrado, passando mais um filtro de parametro
dfpedagio = dpedagio.loc[filtroped]

In [82]:
dfpedagio

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
3,300098,2013-01-01,36.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
27,300098,2013-02-01,10.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
97,300098,2013-04-01,38.6,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
128,300098,2013-05-01,5.2,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
161,300098,2013-06-01,13.7,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
...,...,...,...,...,...,...
117270,300650,2021-10-01,75.6,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
117309,300650,2021-11-01,115.2,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
117374,300650,2022-01-01,30.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO
117433,300650,2022-03-01,53.0,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,PEDÁGIO


In [83]:
# encontra dos nomes de fornecedor que querem dizer a mesma coisa
sorted(pd.unique(dfpedagio['fornecedor']))

['CUPONS DE PEDÁGIO',
 'PEDAGIO',
 'PEDAGIO DE ELISIARIO',
 'PEDÁGIO',
 'PEDÁGIOS',
 'PEGAGIO',
 'PRAÇA DE PEDÁGIO DE GUARUJÁ',
 'SEM PARAR',
 'SEM PARAR - CENTRO DE GESTÃO DE MEIOS DE PGTO. LTDA.',
 'SEM PARAR CENTRO DE GESTÃ&#131;O DE MEIOS DE PGTO. LTDA',
 'SEM PARAR INSTITUIÇÃO DE PAGAMENTO LTDA',
 'SEM PARAR INSTITUIÇÃO DE PAGAMENTO LTDA.']

In [84]:
# compatibilizando dados de fornecedor para todos ficarem iguais
df1.replace(['CUPONS DE PEDÁGIO',
            'PEDAGIO',
            'PEDAGIO DE ELISIARIO',
            'PEDÁGIO',
            'PEDÁGIOS',
            'PEGAGIO',
            'PRAÇA DE PEDÁGIO DE GUARUJÁ',
            'SEM PARAR',
            'SEM PARAR - CENTRO DE GESTÃO DE MEIOS DE PGTO. LTDA.',
            'SEM PARAR CENTRO DE GESTÃ&#131;O DE MEIOS DE PGTO. LTDA',
            'SEM PARAR INSTITUIÇÃO DE PAGAMENTO LTDA',
            'SEM PARAR INSTITUIÇÃO DE PAGAMENTO LTDA.'], 
            'pedagio', inplace=True)

In [85]:
ftpedagio = df1.fornecedor == 'pedagio'
dtfpedagio = df1.loc[ftpedagio]
dtfpedagio

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
3,300098,2013-01-01,36.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,pedagio
27,300098,2013-02-01,10.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,pedagio
97,300098,2013-04-01,38.6,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,pedagio
128,300098,2013-05-01,5.2,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,pedagio
161,300098,2013-06-01,13.7,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,pedagio
...,...,...,...,...,...,...
117270,300650,2021-10-01,75.6,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,pedagio
117309,300650,2021-11-01,115.2,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,pedagio
117374,300650,2022-01-01,30.4,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,pedagio
117433,300650,2022-03-01,53.0,,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,pedagio


### Filtro I

In [86]:
# criando um filtro para o tipo I
filtroi = df1.tipo == 'I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCOMOÇÃO'

In [87]:
# criando um df filtrado com informações apenas do tipo I
dhospedagem = df1.loc[filtroi]

In [88]:
dhospedagem

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
14,300098,2013-01-01,3824.11,6.164253e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",GOL LINHAS AREAS INTELIGENTES
15,300098,2013-01-01,193.93,6.476508e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",CHOPERIA E LANCHONETE H2 LTDA - EPP
42,300098,2013-02-01,18.00,2.530487e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",INSTITUTO MENSAGEIROS
43,300098,2013-02-01,2377.43,6.164253e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",GOL LINHAS AREAS INTELIGENTES
44,300098,2013-02-01,139.48,6.476508e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",CHOPERIA E LANCHONETE H2 LTDA - EPP
...,...,...,...,...,...,...
118405,300655,2022-09-01,73.50,7.313854e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",RESTAURANTE PAPAGAIUS LTDA
118406,300655,2022-09-01,190.00,1.132508e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",PER TE AMORE PIZZAS LTDA
118407,300655,2022-09-01,16.60,1.700949e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",GRAO DO IPIRANGA PAES E DOCES LTDA
118408,300655,2022-09-01,819.00,2.919185e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",PERSONALITE ADMINISTRADORA DE HOTEIS E CONDOMI...


In [89]:
# criando um filtro para procurar dados da coluna fornecedor que tenham HOT no nome
filtrohot = dhospedagem.fornecedor.str.contains('HOT')

In [90]:
# criando um df com base no df filtrado pro tipo I 
# e passando de parametro o filtro para procurar strings que contenham HOT
dfhospedagem = dhospedagem.loc[filtrohot]

In [91]:
dfhospedagem

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
1909,300098,2022-02-01,196.00,1.061991e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",CASTOR ADMINISTRACAO DE HOTELARIA LTDA
1910,300098,2022-02-01,225.63,3.471411e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",HD PLAZA HOTEL LTDA EPP
1911,300098,2022-02-01,248.17,9.632945e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",JR PARK HOTEL LTDA.
1934,300098,2022-03-01,315.00,3.471411e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",HD PLAZA HOTEL LTDA EPP
1936,300098,2022-03-01,468.00,9.632945e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",JR PARK HOTEL LTDA.
...,...,...,...,...,...,...
118336,300655,2022-07-01,1080.00,5.211653e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",JR MARILIA HOTEIS EIRELI-EPP
118337,300655,2022-07-01,1638.00,2.919185e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",PERSONALITE ADMINISTRADORA DE HOTEIS E CONDOMI...
118338,300655,2022-07-01,1212.00,3.430618e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",SMART ADMINISTRADORA HOTELEIRA LTDA
118369,300655,2022-08-01,1085.76,5.949818e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",LE PREVILEGE ADMINISTRADORA DE HOTEIS E CONDOM...


In [92]:
# encontra dos nomes de fornecedor que querem dizer a mesma coisa
sorted(pd.unique(dfhospedagem['fornecedor']))

['2.0 HOTEIS BAURU',
 '2.0 HOTEIS BAURU LTDA',
 '2.0 HOTEIS BIRIGUI LTDA',
 '2.0 HOTEIS FRANCA LTDA',
 '2.0 HOTEIS RIBEIRAO PRETO LTDA.',
 '2.0 HOTEIS RIO PRETO LTDA',
 '2.O HOTÉIS PIRACICABA LTDA',
 '994502-2.0HOTEIS ARAÇATUBA LTDA',
 'A FAZENDA HOTEIS E CONVENÇOES LTDA',
 'AB2 SERVICOS DE HOTELARIA EIRELI',
 'ABACO HOTELARIA E SERVICOS S.A.',
 'ABACO HOTELARIA E SERVIÇO S.A',
 'ABACO HOTELARIA E SERVIÇOS S.A',
 'ABAPORU HOTEIS LTDA',
 'ABAPORU HOTEIS LTDA - ME',
 'ABAPORU HOTEIS LTDA ME',
 'AGUA BRANCA PARK HOTEL EIRELI',
 'AGUERA HOTEL LTDA',
 'AGUILLAR & SOUZA HOTEL LTDA - ME',
 'ALFONSO HOTEL LTDA ME',
 'ALFONSOS HOTEL LTDA ME',
 'ALJA HOTELARIA & SERVIÇOS LTDA',
 'ALVES HOTEL LTDA - EPP',
 'ALVES HOTEL LTDA ME EPP',
 'ALVORADA HOTEL DE NOVO HORIZONTE LTDA ME',
 'AMANDALINE HOTEL LTDA',
 'ANGELO PALACE HOTEL LTDA',
 'ANNA HOTEL LTDA',
 'ANTONIO CESAR LOPES HOTEL EIRELI',
 'ANTONIOLLI HOTEIS E TURISMO LTDA',
 'APART HOTEL OLAVO BILAC LTDA - ME',
 'APART HOTEL OLAVO BILAC LTDA ME',


In [93]:
# compatibilizando dados de fornecedor
df1.replace(['2.0 HOTEIS BAURU',
            '2.0 HOTEIS BAURU LTDA',
            '2.0 HOTEIS BIRIGUI LTDA',
            '2.0 HOTEIS FRANCA LTDA',
            '2.0 HOTEIS RIBEIRAO PRETO LTDA.',
            '2.0 HOTEIS RIO PRETO LTDA',
            '2.O HOTÉIS PIRACICABA LTDA',
            '994502-2.0HOTEIS ARAÇATUBA LTDA',
            'A FAZENDA HOTEIS E CONVENÇOES LTDA',
            'AB2 SERVICOS DE HOTELARIA EIRELI',
            'ABACO HOTELARIA E SERVICOS S.A.',
            'ABACO HOTELARIA E SERVIÇO S.A',
            'ABACO HOTELARIA E SERVIÇOS S.A',
            'ABAPORU HOTEIS LTDA',
            'ABAPORU HOTEIS LTDA - ME',
            'ABAPORU HOTEIS LTDA ME',
            'AGUA BRANCA PARK HOTEL EIRELI',
            'AGUERA HOTEL LTDA',
            'AGUILLAR & SOUZA HOTEL LTDA - ME',
            'ALFONSO HOTEL LTDA ME',
            'ALFONSOS HOTEL LTDA ME',
            'ALJA HOTELARIA & SERVIÇOS LTDA',
            'ALVES HOTEL LTDA - EPP',
            'ALVES HOTEL LTDA ME EPP',
            'ALVORADA HOTEL DE NOVO HORIZONTE LTDA ME',
            'AMANDALINE HOTEL LTDA',
            'ANGELO PALACE HOTEL LTDA',
            'ANNA HOTEL LTDA',
            'ANTONIO CESAR LOPES HOTEL EIRELI',
            'ANTONIOLLI HOTEIS E TURISMO LTDA',
            'APART HOTEL OLAVO BILAC LTDA - ME',
            'APART HOTEL OLAVO BILAC LTDA ME',
            'APIACAS HOTEL LTDA',
            'APRT HOTEL OLAVO BILAC LTDA  ME',
            'APS HOTEL LTDA  ME',
            'AR & M PALACE HOTEL LTDA',
            'ARCA HOTEL LTDA ME',
            'ARCO EXPRESS HOTEL LTDA',
            'ARCO HOTEIS ECONOMICOS LTDA.',
            'ARCO HOTEIS INTELIGENTES LTDA',
            'ARUA HOTEL LTDA',
            'ARUA HOTEL LTDA EPP',
            'ARUÁ - HOTEL LTDA - EPP',
            'ASAKUSA HOTEIS LTDA',
            'ASSET ATIVIDADES HOTELEIRAS LTDA',
            'ASSI PALACE HOTEL LTDA',
            'ASTORGA HOTEL LTDA',
            'ASTRO HOTEL LTDA',
            'ATA HOTEIS E TURISMO LTDA-EPP',
            'ATHANASE SARANTOPOULOS HOTEIS E TURISMO',
            'ATHANASE SARANTOPOULOS HOTEIS E TURISMO LTDA',
            'ATHANASE SARANTOPOULOS HOTÉIS E TURISMO LTDA',
            'ATIQUE HOTEIS LTDA - EPP',
            'ATIQUE HOTEIS LTDA EPP',
            'ATLANTIA HOTELS INTERNATIONAL (BRASIL) LTDA',
            'ATLANTICA HOTELS INTERNACIONAL BRASIL LTDA',
            'ATLANTICA HOTELS INTERNACTIONAL BRASIL LTDA',
            'ATLANTICA HOTELS INTERNATIONAL BRASIL',
            'ATLANTICA HOTELS INTERNATIONAL BRASIL LTDA',
            'ATLANTICA HOTELS INTERNATIONAL BRASIL LTDA.',
            'ATLANTICA HOTRELS INTERNATIONAL BRASIL LTDA',
            'ATLANTICO GOLDEN APART HOTEL LTDA',
            'ATRIO HOTEIS',
            'ATRIO HOTEIS S A',
            'ATRIO HOTEIS S.A',
            'ATRIO HOTEIS S.A.',
            'ATRIO HOTEIS S.A. IBIS HOTELS',
            'ATRIO HOTEIS S/A',
            'ATRIO HOTEIS SA',
            'ATRIO HOTEIS SA.',
            'ATRIO HOTEL S/A',
            'ATRIOS HOTEL S A',
            'ATTILIOS APRT HOTEL LTDA',
            'AVARE PLAZA HOTEL PLUS LTDA',
            'AVARE PLAZA HOTEL SLIM LTDA',
            'AVENIDA HOTEL SS LTDA ME',
            'AVENIDA HOTELS S LTDA ME',
            'B.A. RAYMUNDO HOTEL ME',
            'BARCELONA HOTEL SC LTDA',
            'BAURU OFFICE HOTEL LTDA ME',
            'BC DA ROCHA HOTEL EIRELLI ME',
            'BCA TURISMO E HOTELARIA LTDA ME',
            'BCA TURISMO E HOTELARIA LTDA.- ME',
            'BEIRA RIO HOTELARIA DE TURISMO LTDA',
            'BEIRA RIO HOTELARIA DE TURISMO LTDA - ME',
            'BEIRA RIO PALACE HOTEL LTDA',
            'BEKASSIN BOTUCATU HOTEIS LTDA',
            'BIAZI PLAZA HOTEL LTDA',
            'BIAZI PLAZA HOTEL LTDA.',
            'BL HOTEL DO LADO LTDA ME',
            'BLACK STREAM HOTEL LTDA - EPP',
            'BLACK STREAM HOTEL LTDA- EPP',
            'BOA TURISMO E HOTELARIA LTDA ME',
            'BONAPARTE HOTEL RESIDENCE - HOTEIS',
            'BRASIL 21 EVENTOS E HOTELARIA LTDA',
            'BRISAMAR PRAIA HOTEL LTDA EPP',
            'BRISTOL HOTEL LTDA',
            'BT BAURU HOTEIS',
            'BT BAURU HOTEIS LTDA',
            'BT FARIA LIMA HOTEIS LTDA.',
            'BT VALINHOS HOTEIS LTDA',
            'BT VALINHOS HOTÉIS LTDA',
            'C A HOTELARIA LTDA',
            'C D A DA SILVA HOTEL ME',
            'C.C. DE MENDONÇA HOTEL - EPP',
            'C.C.DEMENDONÇA HOTEL EPP',
            'CALANDRE HOTEL LTDA ME',
            'CALI HOTEL CASTILHO LTDA',
            'CALIGIO HOTEL EIRELI - ME',
            'CAMPESATO E RODRIGUES HOTEL LTDA ME',
            'CAMPINAS AEROPORTO HOTEL LTDA',
            'CAMPUS HOTEL ELOAH LTDA - ME',
            'CANHEO & PEREIRA SERV. DE HOTELARIA LTDA - EPP',
            'CANHEO & PEREIRA SERVIÇOS DE HOTELARIA LTDA -EPP',
            'CANHOTO & CANHADO RESTAURANTES LTDA - ME',
            'CARDUM PALACE HOTEL LTDA EPP',
            'CARNEIRO DE MELO HOTEIS EIRELI EPP',
            'CARVALHO E RODRIGUES HOTEL LTDA',
            'CASA GRANDE HOTEL S/A',
            'CASA GRANDE HOTEL SA',
            'CASA GRANDE OLIMPIA HOTEL LTDA',
            'CASA GRANDE PLIMPIA HOTEL LTDA',
            'CASAS NOVAS HOTEL EIRELI ME',
            'CASTOR - ADMINISTRACAO DE HOTELARIA LTDA',
            'CASTOR ADMINISTRACAO DE HOTELARIA LTDA',
            'CASTOR ADMINISTRAÇAO DE HOTELARIA LTDA',
            'CASTOR ADMINISTRAÇÃO DE HOTELARIA LTDA',
            'CAZUZA PALACE HOTEL DE TUPA LTDA',
            'CAZUZA PALACE HOTEL DE TUPA LTDA ME',
            'CENTRAL PLAZA DE TUPA HOTEL LTDA ME',
            'CENTRAL PLAZA DE TUPÃ HOTEL LTDA ME',
            'CENTRO COMERCIAL ANTICO PLAZA HOTEL LTDA EPP',
            'CHALÉ BRASIL HOTEL LTDA',
            'CHIQUINHO SERVIÇOS DE HOTELARIA LTDA - ME',
            'CHIQUINHO SERVS DE HOTELARIA',
            'CIVITAS COMPLEXO SUL HOTEIS  E CONDOMINIOS LTDA.',
            'CIVITAS COMPLEXO SUL HOTEIS E CONDOMINIOS LDTA',
            'CIVITAS COMPLEXO SUL HOTEIS E CONDOMINIOS LTDA',
            'CLAMAIS HOTELARIA LTDA ME',
            'CLASS HOTEL',
            'CLAUDIO BISPO HOTEIS EIRELI',
            'CLEZIO DE PAULA GALDIANO-ME - HOTEL MARAJOARA',
            'COLONIAL HOTEL CATANDUVA LTDA - ME',
            'COMFORT HOTEL SERTÃOZINHO',
            'CONFIANCE HOTEL & LAZER LTDA',
            'CONFIANCE HOTEL E LAZER LTDA',
            'CONSTRUSOLA CONSTRUÇAO E HOTEL LTDA',
            'CRETA EXECUTIVE HOTEL LTDA',
            'CRRINI HOTELARIA LTDA',
            'D MARCO HOTEL LTDA ME',
            'D.M. SISMEIRO HOTEL ME',
            'DAN INN HOTEL ARARAQUARA',
            'DAN INN HOTEL ARARAQUARA LTDA',
            'DAN INN HOTEL FRANCA LTDA',
            'DAN INN HOTEL FRANCA LTDA ME',
            'DAN INN HOTEL FRANCA LTDA.',
            'DAN INN HOTEL LTDA',
            'DAN INN HOTEL RIBEIRAO PRETO LTDA',
            'DAN INN HOTEL RIBEIRÃO PRETO LTDA',
            'DAV INN HOTEL FRANCA LTDA',
            'DOM APART HOTEL LORENA LTDA ME',
            'DUMONT PARK HOTEL LTDA ME',
            'E.S. GINIS - OLIMPIA HOTEL',
            'EBH HOTEL LTDA',
            'ECONOMIC INN HOTEL LDA EPP',
            'ECONOMIC INN HOTEL LTDA.',
            'EMPREENDI. HOTEL E TURIST BANDEIRAS LTDA - ANGATU HOTEL',
            'EMPREENDIMENTO HOTELEIRO RIO PRETO LTDA',
            'EMPREENDIMENTOS HOTELEIROS E TUR BANDEIRAS LTDA',
            'EMPREENDIMENTOS HOTELEIROS E TURISTICOS BANDEIRAS LTDA',
            'EMPRESA RIOPRETENSE DE HOTEIS E TURISMO LTDA',
            'EMPRESA RIOPRETENSE DE HOTÉIS E TURISMO LTDA',
            'ERDAL HOTELARIA LTDA',
            'ESTANCIA AVARE HOTEL LTDA',
            'ESTANCIA AVARE HOTEL LTDA ME',
            'ESTORIAL APART HOTEL LTDA ME',
            'ESTORIL APART HOTEL',
            'ESTORIL APART HOTEL LTDA - ME',
            'ESTORIL APART HOTEL LTDA ME',
            'ESTORILAPART HOTEL LTDA ME',
            'EURO SUIT HOTEL CAMPINAS LTDA',
            'EUROPA HOTEL',
            'EXCELLENCE PLAZA HOTEL LTDA ME',
            'EXCLUSIVA PROPRIETARIA DE HOTEL LTDA',
            'EZ HOTEIS LTDA',
            'FARO SAO TOME HOTE LTDA',
            'FARO SAO TOME HOTEL LTDA',
            'FARO SAO TOME HOTEL LTDA.',
            'FARO SÃO TOME HOTEL LTDA',
            'FENIX HOTEL CAMPINAS EIRELI - EPP',
            'FENIX HOTEL CAMPINAS EIRELI EPP',
            'FENIX HOTEL CAMPINAS EIRELI-EPP',
            'FERIAN PLAZA HOTEL LTDA. EPP',
            'FILDI HOTEL LTDA',
            'FIRENZE HOTEL EIRELI',
            'FIRENZE HOTEL EIRELI ME',
            'FLORENCA HOTEL LTDA',
            'FLORIDA HOTEL PERUÍBE NELSI CARLOT ME',
            'FRAGATA APART HOTEL LTDA EPP',
            'FREITAS & DONADI PARK HOTEL LTDA ME',
            'GABHEN FERNANDEZ HOTEL LTDA',
            'GABIRA HOTEL EIRELE ME',
            'GARDEN HOTELS EMPREENDIMENTOS LTDA',
            'GARPELLI & BATTAGLINI LTDA - VALE VERDE PALACE HOTEL',
            'GATTIS HOTEL LTDA',
            'GEPE EMPREENDIMENTO DE HOTELARIA LTDA',
            'GEPE EMPREENDIMENTOS DE HOTELARIA LTDA',
            'GEPE EMPREENDIMENTOS DE HOTELARIA LTDA.',
            'GERALDELLI CENTER HOTEL LTDA',
            'GERALDELLI PARK HOTEL LTDA-ME',
            'GMENDES HOTEIS E PARTICIPAÇÕES LTDA',
            'GMENDES HOTEIS E PARTICIPÇOES LTDA',
            'GONÇALVES & SISMEIRO HOTEL LTDA',
            'GONÇALVES E SISMEIRO HOTEL LTDA',
            'GRALHA AZUL HOTEL LTDA ME',
            'GRAN CONTINENTAL HOTEL LTDA',
            'GRAN HOTEL MINA LTDA',
            'GRAN HOTEL MORADA DO SOL',
            'GRAN HOTEL NINA LTDA',
            'GRAN RIO HOTEL DAN INN LTDA',
            'GRAN RIO PARK HOTEL LTDA',
            'GRAN TOUR HOTEL DE CAPIVARI LTDA',
            'GRAND BITTAR - LB1 HOTELARIA EIRELI',
            'GRAND HOTEL ROYAL SOROCABA LTDA',
            'GRANDE HOTEL CUITELO LTDA.',
            'GRANDE HOTEL TONON LTDA',
            'GRANDES LAGOS PARK HOTEL',
            'GRANDES LAGOS PARK HOTEL LTDA - ME',
            'GRINBERG EMPREENDIMENTOS HOTELEIROS LTDA',
            "GRINGO'S HOTEL E RESTAURANTE LTDA",
            "GRINGO'S HOTEL E RESTAURANTE LTDA.",
            'GRINGOS HOTEL E RESTAURANTE LTDA ME',
            'GRINGOS S HOTEL E RESTAURANTE LTDA ME',
            'GRINGO´S HOTEL E RESTAURANTE LTDA - ME',
            'GRINGO´S HOTEL E RESTAURANTE LTDA-ME',
            'H DE M JIMENEZ HOTELARIA - EPP',
            'H PLUS ADMINISTRAÇÃO E HOTELARIA LTDA',
            'H PLUS ADMINISTRAÇÃO E HOTELARIA LTDA - SCP ATHOS BULCÃO',
            'H PLUS ADMINISTRAÇÃO E HOTELARIA LTDA - SCP ATHOS BULCÃO - HPLUS ATHOS BULCAO',
            'H PLUS ADMINISTRAÇÃO E HOTELARIA LTDA - SCP CULLINAN',
            'H PLUS ADMINISTRAÇÃO E HOTELARIA LTDA - SCP FUSION',
            'H PLUS ADMINISTRAÇÃO E HOTELARIA LTDA - SCP VISION',
            'H PLUS ADMINISTRAÇÃO E HOTELARIA LTDA SCP CULLINAN',
            'H PLUS ADMINISTRAÇÃO E HOTELARIA LTDA SCP FUSION',
            'H PLUS ADMINSTRAÇÃO E HOTELARIA LTDA',
            'H.T.S. EMPREENDIMENTOS HOTELEIROS LTDA- EPP',
            'HABITAT HOTEL DE LEME LTDA',
            'HABITAT HOTEL DE PIRASSUNUNGA LTDA EPP',
            'HABITAT PRIME HOTEL EPP',
            'HC HOTEL LTDA',
            'HD PLAZA HOTEL EPP',
            'HD PLAZA HOTEL LTDA - EPP',
            'HD PLAZA HOTEL LTDA APP',
            'HD PLAZA HOTEL LTDA EPP',
            'HD PLAZA HOTEL LTDA-EPP',
            'HELOU HOTELARIA EIRELI ME',
            'HERCULANO GOMES RIBEIRO FILHO (TABOCAS HOTEL)',
            'HI ARARAQUARA HOTEIS E CONDOMINIOS LTDA',
            'HI ARARAQUARA HOTÉIS E CONDOMÍNIOS LTDA',
            'HI CATANDUVA HOTEIS E COND. LTDA',
            'HI CATANDUVA HOTEIS E CONDOMINIOS LTDA',
            'HI MARILIA HOTEIS E CONDOMINIOS LTDA',
            'HI MARILIA HOTEIS E CONDOMÍNIO LTDA',
            'HI RIBEIRAO PRETO HOTEIS E CONDOMINIOS LTDA',
            'HI RIBEIRÃO PRETO HOTEIS E CONDOMINIOS LTDA',
            'HI SAO JOSE DO RIO PRETO HOTEIS E CONDOMINIOS LTDA',
            'HI SÃO JOSÉ DO RIO PRETO HOTEIS E CONDOMINIOS',
            'HI SÃO JOSÉ DO RIO PRETO HOTEIS E CONDOMINIOS LTDA',
            'HIB ADMINISTRATORA DE HOTEIS E CONDOMINIOS LTDA',
            'HIB HOTEIS E CONDOMINIOS LTDA',
            'HIJ HOTEIS E CONDOMINIOS LTDA',
            'HIJ HOTÉIS E CONDOMÍNIOS LTDA',
            'HIS HOTEIS E CONDOMINIOS LTDA',
            'HIS HOTEL E CONDOMINIOS LTDA',
            'HITS PANTANAL HOTEL',
            'HN HOTEIS E TURISMO LTDA',
            'HOTEIS DE TURISMO SA HOTEISTUR',
            'HOTEIS DE TURISMO SA- HOTEISTUR',
            'HOTEIS EVEREST S.A.',
            'HOTEIS FRANCA LTDA',
            'HOTEIS RIBEIRAO PRETO LTDA',
            'HOTEIS ROYAL PALM PLAZA LTDA',
            'HOTEIS SAO CARLOS LTDA',
            'HOTEL ACCOR BRASIL S/A',
            'HOTEL ACCOR BRASIL SA',
            'HOTEL AGAPITO EIRELI',
            'HOTEL ALJI SALTO LTDA.',
            'HOTEL AQUARIUS DE MARILIA LTDA',
            'HOTEL ARARAQUARA SUITES LTDA',
            'HOTEL ARAÇARI EIRELI - EPP',
            'HOTEL ARAÇATUBA PLAZA EIRELI - EPI',
            'HOTEL ARAÇATUBA PLAZA LTDA',
            'HOTEL AREIA BRANCA LTDA',
            'HOTEL AREIA DOURADA LTDA',
            'HOTEL ARRASTAO LTDA',
            'HOTEL ARUJÁ LTDA',
            'HOTEL ASSAY LTDA ME',
            'HOTEL BARRETOS EIRELI',
            'HOTEL BEIRA RIO S/C LTDA',
            'HOTEL BELA VISTA VOTORANTIM LTDA-ME',
            'HOTEL BELLAVISTA LTDA.',
            'HOTEL BIMD EIRELI - ME',
            'HOTEL BIRIGUI PALACE LTDA - EPP',
            'HOTEL BIRIGUI PALACE LTDA EPP',
            'HOTEL BOCAIUVA LTDA',
            'HOTEL BRASIL',
            'HOTEL BRISA RIO DE JACAREÍ LTDA',
            'HOTEL C.A. DE MARILIA EIRELI',
            'HOTEL CAMARGO LTDA ME',
            'HOTEL CAMARGO LTDA.-ME',
            'HOTEL CAPRICCIO II LTDA',
            'HOTEL CASTRO MENDES LTDA',
            'HOTEL CAZOTTI & VASCONCELLOS LT EPP',
            'HOTEL CENTRAL LINS',
            'HOTEL CHAILLOT EIRELI EPP',
            'HOTEL CHALES GRAMADO',
            'HOTEL CHAMONIX ARAÇATUBA LTDA',
            'HOTEL CHAMONIX RECREIO LTDA EPP',
            'HOTEL CIDADE DE MOGI MIRIM LTDA -ME',
            'HOTEL COLINAS LTDA',
            'HOTEL COLONIAL PORTO FERREIRA LTDA - ME',
            'HOTEL COLUMBIA BTU LTDA',
            'HOTEL COLUMBIA PIRASSUNUNGA LTDA',
            'HOTEL COLUMBIA PIRASSUNUNGA LTDA - EPP',
            'HOTEL COQUILLE LTDA ME',
            'HOTEL CORDILHEIRA LTDA',
            'HOTEL COSTA NORTE MASSAGUAÇU LDTA - ME',
            'HOTEL CRISTAL PALACE DE LINS LTDA',
            'HOTEL DAN INN BARRETOS LTDA',
            'HOTEL DAN INN PREMIUM LTDA',
            'HOTEL DAN INN SAO CARLOS LTDA',
            'HOTEL DAN INN SAO JOSE LTDA - EPP',
            'HOTEL DAN INN SÃO CARLOS LTDA',
            'HOTEL DAN NINN SAO JOSE LTDA EPP',
            'HOTEL DANI LTDA ME',
            'HOTEL DANN INN BARRETOS LTDA',
            'HOTEL DAS DRACENAS LTDA',
            'HOTEL DECK RIO LTDA',
            'HOTEL DEL FIOL LTDA',
            'HOTEL DEL FIOL LTDA.',
            'HOTEL DI GIULIO',
            'HOTEL DRACENAS LTDA.',
            'HOTEL E CHURRASCARIA 41 LTDA - EPP',
            'HOTEL E POUSADA BELA MANHÃ',
            'HOTEL E RESTAURANTE ADOLFO IRMAOS RUSSA LTDA ME',
            'HOTEL E RESTAURANTE CORONA ME',
            'HOTEL E RESTAURANTE PILAO',
            'HOTEL E RESTAURANTE PILÃO',
            'HOTEL E RESTAURANTE PILÃO LTDA.ME',
            'HOTEL E RESTAURANTE RECANTO ELDORADO',
            'HOTEL E RESTAURANTE RIOPEDRENSE LTDA',
            'HOTEL E RESTAURANTE UNIAO LTDA - ME',
            'HOTEL E RESTAURANTE UNIÃO LTDA - ME',
            'HOTEL E RESTAURANTE UNIÃO LTDA ME',
            'HOTEL E RESTAURANTE WAIKIKI LTDA',
            'HOTEL E. F. FIUSA LTDA - ME',
            'HOTEL E.F. FIUSA LTDA',
            'HOTEL E.F.FIUSA LTDA.-ME',
            'HOTEL ELIGI LTDA ME',
            'HOTEL ELITHI S/S LTDA-ME',
            'HOTEL ESPLANADA DE PROMISSAO LTDA',
            'HOTEL F S GIORDANO LTDA EPP',
            'HOTEL FAROL LTDA ME',
            'HOTEL FARTURA PLAZA LTDA - ME',
            'HOTEL FERNANDOPOLIS S.A',
            'HOTEL FERNANDOPOLIS SA',
            'HOTEL FLORENCA LTDA',
            'HOTEL FORMULA 1 EIRELI ME',
            'HOTEL FRAQUITO LTDA',
            'HOTEL FREDY LTDA - EPP',
            'HOTEL GALDIANO NOGUEIRA LTDA - ME',
            'HOTEL GALDIANO NOGUEIRA LTDA ME',
            'HOTEL GALDINO NOGUEIRA LTDA - ME',
            'HOTEL GLOBO RIO LTDA',
            'HOTEL GRAN VALLE LTDA ME',
            'HOTEL GRAUNAS LTDA',
            'HOTEL GUARDA MOR LTDA',
            'HOTEL IBIS BUDGET',
            'HOTEL IBIZA DE ITAPEVA LTDA',
            'HOTEL IBIZA DE ITAPEVA LTDA ME',
            'HOTEL IBIZA DE ITAPEVA LTDA-ME',
            'HOTEL ILHAS DA GRECIA LTDA',
            'HOTEL IPORA ITAPETININGA LTDA EPP',
            'HOTEL IRMAOS RAHAL LTDA ME',
            'HOTEL JAU LTDA',
            'HOTEL JAU LTDA - EPP',
            'HOTEL JWF LIMEIRA LTDA',
            'HOTEL LAREIRA LTDA - ME',
            'HOTEL LETOH MOCOCA LTDA EPP',
            'HOTEL LETOH MOCOCA LTDA-EPP',
            'HOTEL LICATELLI LTDA ME',
            'HOTEL LINDA POUSADA DE SALTO LTDA - ME',
            "HOTEL LIRIO D'AGUA LTDA - EPP",
            'HOTEL LITORAL NORTE EIRELI ME',
            'HOTEL LUCATELLI LTDA ME',
            'HOTEL MARBOR',
            'HOTEL MARCO INTERNACIONAL S/A',
            'HOTEL MARINHO LTDA',
            'HOTEL MARQUES LTDA',
            'HOTEL MATAO SUITES LTDA',
            'HOTEL MAX PLAZA DE MARILIA LTDA',
            'HOTEL MAX PLAZA DE MARÍLIA LTDA',
            'HOTEL MELIA BRASIL XXI',
            'HOTEL MONREALE CLASSIC CAMPINAS LTDA',
            'HOTEL MONREALE RIBEIRAO PRETO LTDA',
            'HOTEL MONREALE RIBEIRÃO PRETO LTDA',
            'HOTEL MORADA DO SOL LTDA - ME',
            'HOTEL NACIIONAL DE RIO PRETO LTDA',
            'HOTEL NACIONAL DE RIO PRETO LTDA',
            'HOTEL NACIONAL DO BRASIL LTDA',
            'HOTEL NACIONAL DUTRA',
            'HOTEL NACIONAL DUTRA LTDA',
            'HOTEL NACIONAL INN ARACATUBA LTDA',
            'HOTEL NACIONAL INN ARAÇATUBA LTDA',
            'HOTEL NACIONAL INN C J LTDA',
            'HOTEL NACIONAL INN CAMPINAS LTDA',
            'HOTEL NACIONAL INN LTDA EPP',
            'HOTEL NACIONAL INN RIBEIRAO PRETO LTDA',
            'HOTEL NACIONAL INN RIBEIRÃO PRETO LTDA',
            'HOTEL NACIONAL INN SAO CARLOS LTDA',
            'HOTEL NACIONAL INN SOROCABA LTDA',
            'HOTEL NACIONAL INN SÃO CARLOS LTDA',
            'HOTEL NACIONAL INN SÃO CARLOS LTDA.',
            'HOTEL NACIONAL RIO PRETO LTDA',
            'HOTEL NACIONAL RIO PRETO LTDA.',
            'HOTEL NACIONAL S.A',
            'HOTEL NACIONAL S/A',
            'HOTEL NETWORK MARKETING SALES EIRELI',
            'HOTEL NINA  LTDA',
            'HOTEL NINA LTDA',
            'HOTEL NINÁ LTDA',
            'HOTEL NOVO HORIZONTE LTDA',
            'HOTEL NOVO HORIZONTE LTDA ME',
            'HOTEL NOVO LIMEIRA',
            'HOTEL NOVO LIMEIRA EIRELI EPP',
            'HOTEL O ESTRADEIRO PRESIDENTE VENCESLAU LTDA EPP',
            'HOTEL ORION JWF ITATIBA LTDA ME',
            'HOTEL PALACE CRISTAL',
            'HOTEL PASSARIM LTDA',
            'HOTEL PHENICIA',
            'HOTEL PHENICIA LTDA',
            'HOTEL PHENICIA LTDA GRAND BITTAR',
            'HOTEL PLAZA LTDA EPP',
            'HOTEL POLO CUESTA LTDA EPP',
            'HOTEL PORTAL D OESTE LTDA',
            'HOTEL PORTAL D OSTE LTDA',
            "HOTEL PORTAL D'OESTE LTDA",
            "HOTEL PORTAL D'OESTE LTDA.",
            'HOTEL PORTAL DÓESTE LTDA',
            'HOTEL PORTO DO RIBEIRÃO',
            'HOTEL POUSADA BARRAVENTO LTDA ME',
            'HOTEL POUSADA CAMPOS VERDEI LTDA ME',
            'HOTEL POUSADA E RESTAURANTE JRC LTDA ME',
            'HOTEL POUSADA GAROUPAS',
            'HOTEL POUSADA MARAZUL',
            'HOTEL POUSADA OURINHOS',
            'HOTEL POUSADA TAQUARIVAÍ LTDA.- EPP',
            'HOTEL PREMIUM FLAT OURINHOS EIRELI',
            'HOTEL PREMIUM NORTE LTDA',
            'HOTEL PRIMAVERA DE ARAMINA LTDA',
            'HOTEL PRIMAVERA IRMÃOS SILVEIRA LTDA.',
            'HOTEL PRUDENTAO LTDA',
            'HOTEL PRUDENTAO LTDA ME',
            'HOTEL PRUDENTÃO LTDA',
            'HOTEL PRUDENTÃO LTDA ME',
            'HOTEL PRUDENTÃO LTDA-ME',
            'HOTEL RAFAELI EIRELI',
            'HOTEL RAFELI EIRELI',
            'HOTEL REAL DE MARACAI LTDA',
            'HOTEL REAL MARACAI LTDA',
            'HOTEL RECANTO DOS PASSAROS DE SÃO SEBASTIÃO LTDA - EPP',
            'HOTEL REDENTODA PLAZA LTDA',
            'HOTEL REGINA C BONITO LTDA / ME',
            'HOTEL REGINA C BONITO LTDA/ME',
            'HOTEL RESORT AGUA DAS ARARAS LTDA',
            'HOTEL ROMANINI & PEREIRA LTDA',
            'HOTEL ROMANINI E PEREIRA LTDA',
            'HOTEL ROTA DO PANTANAL',
            'HOTEL ROTA DO SOL LTDA',
            'HOTEL SABIONE LTDA',
            'HOTEL SAINT MARTIN LIMITADA EPP',
            'HOTEL SANTO SONO LTDA - ME',
            'HOTEL SANTOS',
            'HOTEL SAO MARCOS',
            'HOTEL SAO MARCOS ORLANDIA',
            'HOTEL SERRA DA ESTRELA LTDA-ME',
            'HOTEL SOLARIS LTDA ME',
            'HOTEL SONHO MEU LTDA ME',
            'HOTEL STELATI LTDA.',
            'HOTEL SÃO CHARBEL',
            'HOTEL SÃO CHARBEL LTDA EPP',
            'HOTEL TENDA LTDA',
            'HOTEL TERRANOVA',
            'HOTEL TOSCANO E RESTAURANTE',
            'HOTEL TROPICAL CAJURU LTDA ME',
            'HOTEL TURISMO PARQUE BALNEARIO LTDA',
            'HOTEL TURISMO PARQUE BALNEÁRIO',
            'HOTEL UNIVERSITARIO DE ITAPETININGA LTDA - ME',
            'HOTEL UNIVERSITARIO DE ITAPETININGA LTDA ME',
            'HOTEL URUBUPUNGA LTDA',
            'HOTEL VALE DO SOL LTDA-EPP',
            'HOTEL VALENTIM FLORIANOPOLIS LTDA',
            'HOTEL VALLE SUL LTDA',
            'HOTEL VARANDAS ARARAQUARA LTDA -ME',
            'HOTEL VAZ LOBO LTDA',
            'HOTEL VENTURA INN',
            'HOTEL VILA DO CONDE LTDA ME',
            'HOTEL VILA VERDE PENAPOLIS',
            'HOTEL VILA VERDE PENAPOLIS EIRELI',
            'HOTEL VILA VERDE PENAPOLIS EIRELI ME',
            'HOTEL VILA VERDE PENÁPOLIS EIRELE ME',
            'HOTEL VILLA BRITES.',
            'HOTEL VILLA DI RIMINI LTDA EPP',
            'HOTEL VILLA REBELLATO LTDA ME',
            'HOTEL VIVENDAS RIO CLARO LTDA',
            'HOTEL ÁGUA DAS ARARAS EIRELI',
            'HOTEL ÁGUA DAS ROSAS EIRELI',
            'HOTELARIA  ACCOR BRASIL S/A',
            'HOTELARIA ACCOR BARSIL S.A',
            'HOTELARIA ACCOR BRAASIL TDA',
            'HOTELARIA ACCOR BRASIL',
            'HOTELARIA ACCOR BRASIL  S/A',
            'HOTELARIA ACCOR BRASIL S.A',
            'HOTELARIA ACCOR BRASIL S.A.',
            'HOTELARIA ACCOR BRASIL S/A',
            'HOTELARIA ACCOR BRASIL S/A - SCPLE CORSIER FLAT SERVICE',
            'HOTELARIA ACCOR BRASIL SA',
            'HOTELARIA ACCOR BRASIL SA - SCP STELLA VEGA',
            'HOTELARIA ACCORINVEST BRASIL S.A',
            'HOTELARIA ACCORINVEST BRASIL S.A.',
            'HOTELARIA ACCORINVEST BRASIL S/A',
            'HOTELARIA ACCORINVEST BRASIL SA',
            'HOTELARIA ACCORRINVEST BRASIL S/A',
            'HOTELARIA AGISOL LTDA',
            'HOTELARIA AGISOL LTDA - EPP.',
            'HOTELARIA BRASIL LTDA',
            'HOTELARIA BRASIL LTDA.',
            'HOTELARIA CASTRO DE MARILIA LTDA ME',
            'HOTELARIA CASTRO DE MARÍLIA LTDA ME',
            'HOTELARIA ECO VALLE SFA LORENA LTDA',
            'HOTELARIA RIO S/C LTDA',
            'HOTELARIA WATERMANN LTDA ME',
            'HOTELEO HOTEIS E TURISMO LTDA',
            'HOTELS ADMINISTRAÇÃO HOTELEIRA LTDA',
            'HSP GONÇALVES HOTEL ME',
            'HTS EMPREENDIMENTOS HOTELEIROS LTDA- EPP',
            'HUESCA PALACE HOTEL LTDA EPP',
            'IBERICA S PRAIA HOTEL LIMITADA - EPP',
            'IBERICA S PRAIA HOTEL LTDA EPP',
            'IBIRAPUERA HOTEL & CONVENTION CENTER LTDA',
            'IBIRAPUERA HOTEL E CONVENTION CENTER LTDA',
            'IBIS BUDGET TAMBORÉ HOTELARIA ACCOR BRASIL S A',
            'IBIS HOTEL',
            'IBIS HOTELS',
            'IBIUNA TURISMO HOTEL EIRELI ME',
            'ICH ADMINISTRACAO DE HOTEIS S.A',
            'ICH ADMINISTRAÇÃO DE HOTEIS S.A',
            'ICH ADMINISTRAÇÃO DE HOTEIS S.A.',
            'ICH ADMINISTRAÇÃO DE HOTEIS SA',
            'IDEALI HOTEL LTDA - EPP',
            'IIB HOTELARIA E TURISMO LTDA',
            'IKEDA PROJETOS & HOTELARIA LTDA',
            'ILB HOTELARIA E TURISMO LTDA',
            'ILB HOTELARIA EIRELI -EPP',
            'ILHA PALACE HOTEL - ME',
            'ILHA PALACE HOTEL LTDA ME',
            'ILHA PORCHAT HOTEL LTDA',
            'ILHA PORCHAT HOTEL LTDA.',
            'ILHAFLET SERVIÇOS HOTELEIROS',
            'IMPERADOR PALACE HOTEL',
            'IMPERADOR PALACE HOTEL LTDA',
            'IND DE HOTEIS GUZZONI S.A.',
            'INDEPENDENCIA PLAZA HOTEL LTDA EPP',
            'INTERCITY ADMINISTRAÇÃO HOTELEIRA SE LTDA',
            'IPE CENTER HOTEL LTDA',
            'IPE PARK HOTEL LTDA',
            'IPÊ CENTER HOTEL LTDA',
            'IPÊ PARK HOTEL LTDA EPP',
            'IRMAOS PINA HOTEL E RESTAURANTE LTDA ME',
            'IRMAOS PINA HOTEL E RESTAURANTE LTDA-ME',
            'IRMÃOS PINA HOTEL E RESTAURANTE LTDA ME',
            'ITA PARK HOTEL LTDA - ME',
            'ITA PARK HOTEL LTDA ME',
            'ITAMARATI HOTEL E RESTAURANTE LTDA ME',
            'ITAPETINGA PLAZA HOTEL LTDA',
            'ITARARE HOTEL LIMITADA - ME',
            'ITARARE HOTEL LIMITADA ME',
            'ITARARÉ HOTEL ME',
            'ITU PLAZA HOTEL LTDA',
            'J C GOES HOTEL LTDA - ME',
            'J G HOTEIS E TURISMO LTDA',
            'J J HOTEIS E TURISMO LTDA',
            'J R PARK HOTEL',
            'J R PARK HOTEL LTDA EPP',
            'J. L. FERNANDES ADMINISTRAÇÃO HOTELARIA EIRELI',
            'J. P. PALACE HOTEL LTDA ME',
            'J.C.DE SÁ HOTEL - ME',
            'J.R. PARK HOTEL LTDA EPP',
            'JALES CENTER HOTEL LTDA',
            'JALES CENTER HOTELLTDA.-EPP',
            'JARUCHE HOTEIS LTDA',
            'JF DE GOUVEIA HOTEL ME',
            'JKLM HOTEL LTDA- EPP',
            'JOAO DE JESUS RODRIGUES BRAGANÇA PAULISTA HOTEL ME',
            'JOTARES HOTEIS E TURISMO LTDA',
            'JOÃO PAULINO DA SILVA HOTEL ME',
            'JOÃO RICARDO DONIZETE PELEGRINA ME BURKNER HOTEL',
            'JP PARK HOTEL LTDA EPP',
            'JR MARILIA HOTEIS EIRELI - EPP',
            'JR MARILIA HOTEIS EIRELI EPP',
            'JR MARILIA HOTEIS EIRELI-EPP',
            'JR MARILIA HOTEIS EIRELLI',
            'JR MARILIA HOTEIS LTDA EPP',
            'JR PARK HOTEL LTDA EPP',
            'JR PARK HOTEL LTDA.',
            'JR RIBEIRAO HOTEIS LTDA - EPP',
            'JR RIBEIRÃO HOTEIS LTDA EPP',
            'K. HOTEL LTDA - EPP',
            'KAFE HOTEL LTDA',
            'KATIA A. ALEXANDRE HOTEL-ME',
            'KK HOTEIS E TURISMO LTDA EPP',
            'KLINN HOTEL LTDA ME',
            'L. T. C. ADMINISTRAÇÃO DE HOTEIS LTDA EPP',
            'L.B. ADMINISTRAÇÃO DE HOTEIS LTDA-EPP',
            'L.F DESTEFANO HOTEL ME',
            'L.T.C. ADMINISTRAÇAO DE HOTEIS LTDA EPP',
            'LA HOTEIS EMPREENDIMENTOS 1 LTDA',
            'LA HOTELS EMPREENDIMENTOS 1 LTDA',
            'LA HOTELS EMPREENDIMENTOS 1 LTDA - (GT BRASILIA ALVORADA)',
            'LA HOTELS EMPRENDIMENTOS 1 LTDA',
            'LADY LAURA HOTEL LTDA. - ME',
            'LAF HOTEL LTDA - ME',
            'LAF HOTEL LTDA ME',
            'LAGOA SERENA FLAT HOTEL ADMINISTRADORA LTDA',
            'LAZARO ANGELO BALAN HOTEL ME',
            'LE PREMIER ADM DE HOTEIS E CONDOMINIOS LTDA',
            'LE PREMIER ADMINISTRADORA DE HOTÈIS E CONDOMÍNIOS LTDA',
            'LE PREMIER ADMINISTRATORA DE HOTEIS E CONDOMINIOS LTDAA',
            'LE PREVILEGE ADMINISTRADORA DE HOTEIS E CONDOMINIOS LTDA',
            'LE PREVILEGE ADMN DE HOTEIS E CONDOMINIOS LTDA',
            'LELIS HOTEL - BERENICE DO CARMO ALBANO FERIAN HOTEL - ME',
            'LEME´PLAZA HOTEL LTDA ME',
            'LIBANO EMPRESA PRESTADORA DE SERVICOS DE HOTELARIA EIREL',
            'LIDER HOTEL LTDA - EPP',
            'LIDIANE RODRIGUES PEREIRA HOTEL - ME',
            'LIETH LELLIS DE ASSIS CRUZ ME - HOTEL SÃO BENTO',
            'LILIAN CRISTINA FORTE LOPES HOTEL ME',
            'LIMA HOTEIS E TURISMO LTDA',
            'LITANI PARK HOTEL',
            'LITANI PARK HOTEL LTDA - EPP',
            'LITO PALACE HOTEL LTDA',
            'LIV HOTEL LTDA',
            'LIVIA CORREA LOPES EPP - OESTE PLAZA HOTEL',
            'LONDON HOTEL LTDA -ME',
            'LP HOTEIS LTDA',
            'LTC ADMINISTRAÇAO DE HOTEIS LTDA EPP',
            'M E DE OLIVEIRA DIAS HOTEL',
            'M F N DE LIMA EIRELI - GRAND HOTEL GUARUJA',
            'M. E. DE OLIVEIRA DIAS HOTEL',
            'M. E. DE OLIVEIRA DIAS HOTEL -ME',
            'M. E. DE OLIVEIRA DIAS HOTEL ME',
            'M.E. DE OLIVEIRA DIAS HOTEL',
            'M.E.DE OLIVEIRA DIAS HOTEL',
            'M.P.F. SERVICOS DE HOTELARIA LTDA-ME',
            'M.P.F. SERVIÇOS DE HOTELARIA LTDA',
            'MABRUK BARRETOS APART HOTEL LTDA',
            'MADUGA PALACE HOTEL LTDA.',
            'MAGA PLAZA HOTEL E TURISMO LTDA',
            'MANHATAN HOTEIS E TURISMO LTDA',
            'MANHATTAN HOTEIS E TURISMO LTDA',
            'MARCELO RICARDO DE SOUZA HOTELARIA',
            'MARCO MARCHETTI S/A HOTEIS',
            'MARDUY HOTEL LTDA',
            'MARIA PLAZA  HOTEL LTDA ME',
            'MARLENE APARECIDA DE OLIVEIRA BISPO HOTEL - ME',
            'MAURO COSTA DE OLIVEIRA HOTEL',
            'MAZZAROPI HOTELARIA LTDA',
            'MEILIA BRASIL 21 ADMINISTRAÇAO HOTELEIRA E COMERCIAL LTDA',
            'MELIA BRASIL ADMINISTRAÇÃO HOTELEIRA E COMERCIAL LTDA.',
            'MENDES HOTEIS TURISMO E ADMINISTRADORA LTDA',
            'MENDES HOTEIS TURISMO E ADMINISTRAÇÃO LTDA',
            'MENDES HOTEIS TURISMOS E ADMINISTRADORA LTDA.',
            'MEU HOTEL BOITUVA EIRELI',
            'MIRANTE PRAIA HOTEL',
            'MITSUKO HOTEL LIMITADA',
            'MONDRIAN SUITE HOTEL LTDA ME',
            'MONREALE HOTEL RIBEIRÃO PRETO',
            'MONTE SERRAT HOTEL LTDA-EPP',
            'MONTES & BROLEZE HOTEL E REFERIÇÃO LTDA',
            'MONTES E BROLEZE HOTEL E REFEICAO LTDA',
            'MPY HOTELARIA LTDA',
            'MUCHIUTT PARK HOTEL LTDA',
            'MULTIPLA ADM.DE HOTEIS EIRELI EPP',
            'MULTIPLA ADMI. DE HOTEIS EIRELLI EPP',
            'MULTIPLA ADMINISTRACAO DE HOTEIS LTDA',
            'MULTIPLA ADMINISTRAÇÃO DE HOTEIS EIRELI - EPP',
            'MULTIPLA ADMINISTRAÇÃO DE HOTEIS EIRELI-EPP',
            'MULTIPLA ADMINISTRAÇÃO DE HOTEIS EIRELLI - EPP.',
            'MULTIPLA ADMINISTRAÇÃO DE HOTÉIS EIRELI EPP',
            'N&A ADMINISTRAÇAO HOTELEIRA LTDA ME',
            'N&N HOTELARIA LTDA ME',
            'NAÇÕES PARK HOTEL LTDA',
            'NMOA POLLASTRINI HOTEL LTDA',
            'NOHOTEL AMERICANA LTDA',
            'NOHOTEL LTDA',
            'NOVO HORIZONTE HOTEIS E TURISMO LTDA',
            'NOVO HOTEL CARLTON SJCAMPOS LTDA',
            'NOVO HOTEL CARLTON SJCAMPOS LTDA EPP',
            'NOVO HOTEL CARLTON SJCAMPOS LTDA-EPP',
            'NOVO HOTEL PLAZA SJCAMPOS LTDA',
            'O MOINHO ITALIA HOTEL LTDA',
            'OASIS TOWER HOTEL LTDA',
            'OASIS TOWER HOTEL LTDA - ME',
            'OASIS TOWER HOTEL LTDA ME',
            'OBRAS SOCIAIS DA ARQUIDIOCESE DE APARECIDA HOTEL RAINHA DO BRASIL',
            'OESTE TURISMO E HOTELARIA LTDA - EPP',
            'OPTIMIM HOTEIS LTDA EPP',
            'ORG.HOTELEIRA ITAPETININGA LTDA',
            'ORGANIZAÇAO HOTELEIRA ITAPETININGA LTDA',
            'ORGANIZAÇÃO HOTELEIRA ITAPETININGA LTDA',
            'OROFINO HOTEL LTDA ME',
            'OURO HOTEL OURINHOS LTDA ME',
            'OURO HOTEL OURINHOS LTDA. - ME',
            'P & B HOTELARIA LTDA',
            'PAGURUS HOTELARIA EIRELI - EPP',
            'PALMARES HOTEL DE GUAIRA LTDA ME',
            'PANEGOSSI & PONTES HOTELARIA LTDA',
            'PANORAMA HOTEIS LTDA EPP',
            'PARADISE INN HOTEL CATANDUVA LTDA ME',
            'PARADISE INN HOTEL DE CATANDUVA LTDA ME',
            'PARAGEM HOTEL LTDA - EPP',
            'PARK TOWER HOTEL E CONVENCOES LTDA',
            'PASSER HOTEL LTDA',
            'PAULISTA NOVOESTE HOTEL E RESTAURANTE LTDA',
            'PAULISTA NOVOESTE HOTEL E RESTAURANTE LTDA ME',
            'PAULO OCTAVIO HOTEIS E TUR LTDA',
            'PAULO OCTAVIO HOTEIS E TUR. LTDA',
            'PAULO OCTAVIO HOTEIS E TUR. LTDA.',
            'PAULO OCTAVIO HOTEIS E TUR.LTDA',
            'PEKIN PALACE HOTEL LTDA',
            'PEKIN PALACE HOTEL LTDA.',
            'PELEGRINA E BRANDÃO LTDA GOLD INN HOTEL',
            'PERSONALITE ADMINISTRADORA DE HOTEIS E CONDOMINIOS LTDA',
            'PEVÊ-TUR HOTEIS LTDA',
            'PINDA PALACE HOTEL LTDA',
            'PIRAJUI PLAZA HOTEL LTDA - ME',
            'PIRAJUI PLAZA HOTEL LTDA ME',
            'PLAZA BRASILIA HOTEIS E TURISMO LTDA',
            'PLEASANT PLACE HOTEL LTDA EPP',
            'POLO HOTEL SJCAMPOS EIRELI',
            'POLO HOTEL SJCAMPOS LTDA',
            'PORTAL HOTEL MOGI MIRIM LTDA EPP',
            'PORTICO HOTEL E RESTAURANTE LTDA',
            'PORTO SEGURO HOTEL SALTO LTDA',
            'POUSADA HOTEIS LTDA',
            'POUSADA HOTEIS LTDA - EPP',
            'POUSADA HOTEIS LTDA EPP',
            'POUSADA HOTEIS LTDA.',
            'PREMIUM ADMINISTRAÇAO HOTELEIRA LTDA',
            'PRIMAR PLAZA HOTEL LDTA EPP',
            'PRIMAR PLAZA HOTEL LTDA EPP',
            'PRISMA PLAZA HOTEL',
            'PROJETA HOTEL E EMPREENDIMENTOS IMOBILIARIOS LTDA',
            'PROJETA HOTEL E EMPREENDIMENTOS IMOBILIÁRIOS LTDA',
            'QUILIMANJARO COMERCIO DE ALIMENTOS E HOTELARIA LTDA',
            'R DE CARVALHO HOTEL LTDA ME',
            'R MASSON HOTEIS LTDA',
            'R MASSON HOTEIS LTDA  ME',
            'R. MASSONI HOTEIS LTDA - ME',
            'RANCHO DAS PEDRAS HOTEL LTDA',
            'RB3 HOTELARIA LTDA',
            'RCA SERV DE HOTELARIA LTDA EPP',
            'REAL GARDEN HOTEL LTDA - ME',
            'REAL GARDEN HOTEL LTDA ME',
            'REAL HOTEL SUD MENNUCCI LTDA.-ME',
            'REAL PALACE HOTEL BEBEDOURO LTDA',
            'REAL PALACE HOTEL PREMIUM GOLD LTDA-ME',
            'REALCE HOTEL & EVENTOS LTDA',
            'REDE HOTELEIRA BAOBA LTDA',
            'REGIONAL PLAZA HOTEL',
            'REGIONAL PLAZA HOTEL & EVENTOS',
            'REGIONAL PLAZA HOTEL & EVENTOS OLICIO BOCCHI',
            'RENATA BONVENTI MACHADO HOTEL LTDA',
            'RENATO A. BUSQUETE SERVIÇOS DE HOTELARIA - ME',
            'REQUINTS HOTEL LTDA-ME',
            'RESIDENCIAL HOTEL BOTUCATU LTDA EPP',
            'RESTAURANTE HOTEL COUNTRY',
            'RIBEIRO & ROCHA HOTEL LTDA',
            'RIELLIS CENTER HOTEL LTDA',
            'RIO PRETO PARTNERS HOTEIS LTDA',
            'RIVIBAU HOTEIS E TURISMO LTDA',
            'RIVIBAU HOTEIS E TURISMO LTDA.',
            'ROBUSTI PLAZZA HOTEL',
            'ROCHA PALACE HOTEL LTDA,.-ME',
            'ROHEDAMA HOTEL E LANCHONETE LTDA',
            'S.G.P. HOTEL LTDA',
            'SA HOTEL LTDA',
            'SAFE ADMINISTRAÇAO HOTELARIA LTDA',
            'SAFE ADMINISTRAÇÃO HOTELARIA CAPÃO BONITO LTDA',
            'SAFE ADMINISTRAÇÃO HOTELEIRA LTDA.',
            'SAKR HOTEL LTDA',
            'SAKR HOTEL RIO PRETO LTDA EPP',
            'SAN FRANCISCO PARK HOTEL EIRELI',
            'SAN JUAN PALACE HOTEL',
            'SAN JUAN PALACE HOTEL - EIRELI ME',
            'SAN JUAN PALACE HOTEL - EIRELLI - ME',
            'SAN JUAN PALACE HOTEL EIRELI ME',
            'SAN MARCO HOTEL',
            'SAN MICHEL PALACE HOTEL',
            'SAN MICHEL PALACE HOTEL LTDA',
            'SAN MICHEL PALACE HOTEL LTDA - EPP',
            'SANBRU - HOTEL E RESTAURANTE LTDA ME',
            'SANDRA H. GRITTI MARQUES E CIA LTDA EPP - ONIX HOTEL',
            'SANTA FELICIDADE HOTEL EVENTOS LTDA - ME',
            'SANTOS & CAPEL HOTEL LTDA',
            'SANTOS E CITADINI SERVIÇOS DE HOTELARIA E AGROPECUARIA LTDA',
            'SANTUÁRIO PALACE HOTEL LTDA',
            'SAO ROQUE PARK HOTEL',
            'SAO ROQUE PARK HOTEL LTDA ME',
            'SERGIO LUIS ROLA - HOTEL ME',
            'SERRA NEGRA PALADIUM HOTEL LTDA',
            'SHAFIRA HOTEL LTDA',
            'SIND. DOS EMP. NO COM. HOTELEIRO E SIMILARES SP.',
            'SLAVIERO EMPREENDIMENTOS HOTELEIROS LTDA',
            'SMART ADMINISTRADORA HOTELEIRA LTDA',
            'SOCIEDADE HOTEL PALACE LTDA',
            'SOCIEDADE HOTEL PALACE LTDA EPP',
            'SOLAR DE PEDRA HOTEL',
            'SONOTEL HOTEL LTDA',
            'SORAYA CAHIME - HOTEL - EPP',
            'SOTAM HOTEL LTDA',
            'SPAN HOTELARIA LTDA',
            'ST PAUL PLAZA HOTEIS E TURISMO LTDA',
            'ST. PAUL PLAZA HOTEIS E TURISMO LTDA',
            'SUELI T. E. ERAS ADMINISTRAÇÃO HOTELEIRA - ME',
            'SUMMIT HOTELARIA LTDA',
            'SÃO ROQUE PARK HOTEL LTDA-ME',
            'TANIA MARIA CERNIAUKAS HOTELARIA',
            'TANIA MARIA CERNIAUKAS HOTELARIA ME',
            'TANIA MARIA CERNIAUKAS HOTELARIA-ME',
            'TAU FLATS EMPREENDIMENTOS DE HOTELARIA E PARTICIPAÇÕES LTDA',
            'TECNOFLAT GESTAO E HOTELARIA S/C LTDA',
            'TEIXEIRA & VIZENTINI HOTEL LTDA ME',
            'TERRAÇO PEREA HOTEL LTDA - ME',
            'THE HILL EMPREENDIMENTO HOTELEIROS LTDA',
            'THERMAS PARK HOTEL',
            'TIFFANY HOTEL LTDA',
            'TIFFANY HOTEL LTDA.',
            'TORRE HOTEL EIRELI',
            'TOWER FRANCA HOTEL',
            'TOWER FRANCA HOTEL LTDA',
            'TRAJANO PALACE HOTEL LTDA',
            'TREVIS & BRAGATO HOTEL LTDA',
            'TREVISI & BRAGATO HOTEL LTDA',
            'TUTU HOTEL LTDA ME',
            'UBATUBA PRAIA GRANDE HOTEL LTDA',
            'UNIQUE SERV HOT E ALIM S/A',
            'UNIQUE SERV.DE HOTELARIA ALIM.COM PART.S/A',
            'V.E.C.HOTEIS LTDA',
            'VALE RESIDENCE HOTEL LTDA - ME',
            'VALE SERRA MAR HOTEL E SERVIÇOS LTDA',
            'VALE VERDE PALACE HOTEL GARDELLI & BATTAGLINI LTDA EPP',
            'VALENTIM PALACE HOTEL',
            'VICTORIA PARK HOTEL HOTELARIA E TURISMO LTDA',
            'VICTORIA PARK HOTEL HOTELARIA E TURISMO LTDA.',
            'VILLA DE HOLANDA HOTEL LTDA',
            'VILLA MAIOR HOTEL LTDA - ME',
            'VILLAGE PALACE HOTEL LTDA ME',
            'VILLAS BOAS HOTEL LTDA - ME',
            'VILLE ATLANTICO HOTEIS E TURISMO LTDA',
            'VILLE HOTEL GRAMADAO',
            'VILLE HOTEL GRAMADAO DE VOTUPORANGA LTDA',
            'VILLE HOTEL GRAMADAO DE VOTUPORANGA LTDA ME',
            'VILLE HOTEL GRAMADAO DE VOTUPORANGA LTDA-ME',
            'VILLE HOTEL GRAMADO DE VOTUPORANGA LTDA',
            'VILLE PARK HOTEL LTDA',
            'VILLE PARK HOTEL LTDA - ME',
            'VILLE PARK HOTEL LTDA ME',
            'VILLE PARK HOTEL ME',
            'VITORIA HOTEIS LTDA',
            'VITORIA HOTEL CAMPINAS LTDA',
            'VITORIA REGIA HOTEL LIMITADA',
            'VITORIA REGIA HOTEL LTDA',
            'VIVENDA HOTEL LTDA',
            'W-TUR HOTEIS E SIMILARES LTDA',
            'WANNA HOTEL LTDA - ME',
            'WINDSOR ADMINISTRAÇÃO DE HOTÉIS E SERVIÇOS LTDA'], 
            'hospedagem', inplace=True)

In [94]:
fthotel = df1.fornecedor == 'hospedagem'
dfhotel = df1.loc[fthotel]
dfhotel

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
1909,300098,2022-02-01,196.00,1.061991e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
1910,300098,2022-02-01,225.63,3.471411e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
1911,300098,2022-02-01,248.17,9.632945e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
1934,300098,2022-03-01,315.00,3.471411e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
1936,300098,2022-03-01,468.00,9.632945e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
...,...,...,...,...,...,...
118336,300655,2022-07-01,1080.00,5.211653e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
118337,300655,2022-07-01,1638.00,2.919185e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
118338,300655,2022-07-01,1212.00,3.430618e+13,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
118369,300655,2022-08-01,1085.76,5.949818e+12,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem


### Filtro A

In [95]:
# criando um filtro para tipo A
filtroa = df1.tipo == 'A - COMBUSTÍVEIS E LUBRIFICANTES'

In [96]:
# cria um df filtrado com as informações da categoria A
dcombustivel = df1.loc[filtroa]

In [97]:
dcombustivel 

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
0,300098,2013-01-01,575.53,5.049700e+11,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO VANUTRE LTDA
1,300098,2013-01-01,1650.76,4.881450e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,S.D.LUIZARI & CIA. LTDA.
2,300098,2013-01-01,1799.29,6.586291e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO EXECUTIVO LTDA
21,300098,2013-02-01,602.34,5.049700e+11,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO VANUTRE LTDA
22,300098,2013-02-01,20.00,1.462152e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,B J COM DE COMBUSTIVEIS E LUBR DE OURINHOS LTDA
...,...,...,...,...,...,...
118394,300655,2022-09-01,161.85,4.751503e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,POSTO BRIGADEIRO LTDA
118395,300655,2022-09-01,189.00,5.100008e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,AUTO POSTO MICHELE LTDA
118396,300655,2022-09-01,126.00,5.928040e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,POSTO DE GASOLINA SAO FRANCISCO LT
118397,300655,2022-09-01,206.77,6.192941e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,POSTO PRESIDENTE J K LT


In [98]:
# cria um filtro para pegar partes de string que podem estar nos dados relacionados a combustivel
filtrocomb = dcombustivel.fornecedor.str.contains('COMB')

In [99]:
# cria um novo df com base no df filtrado, passando mais um filtro de parametro
dfcombustivel = dcombustivel.loc[filtrocomb]

In [100]:
dfcombustivel

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
22,300098,2013-02-01,20.00,1.462152e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,B J COM DE COMBUSTIVEIS E LUBR DE OURINHOS LTDA
24,300098,2013-02-01,722.00,6.116149e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,A Z COMERCIO DE COMBUSTIVEIS LTDA
58,300098,2013-03-01,1282.26,6.116149e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,A Z COMERCIO DE COMBUSTIVEIS LTDA
93,300098,2013-04-01,1364.28,6.116149e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,A Z COMERCIO DE COMBUSTIVEIS LTDA
124,300098,2013-05-01,1221.00,6.116149e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,A Z COMERCIO DE COMBUSTIVEIS LTDA
...,...,...,...,...,...,...
118353,300655,2022-08-01,44.00,1.052947e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,POSTO DE SERVICOS AUTOMOTIVOS E COMERCIO DE COMBU
118356,300655,2022-08-01,137.13,1.291150e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,CONQUISTA DE MAIRIPORA COMERCIO VAREJISTA DE COMB
118358,300655,2022-08-01,183.34,3.519484e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,F G NOVO CENTRO POSTO DE COMBUSTIVEIS LTDA
118384,300655,2022-09-01,100.00,4.750757e+12,A - COMBUSTÍVEIS E LUBRIFICANTES,CHAPARRAL COMERCIO DE COMBUSTIVEIS AUTOMOTIVOS LT


In [101]:
# encontra dos nomes de fornecedor que querem dizer a mesma coisa
sorted(pd.unique(dfcombustivel['fornecedor']))

['2 AMIGOS COM. DE COMBUST. DE MONTE APRAZIVEL LTDA.',
 '2 AMIGOS COMERCIO DE COMBUSTIVEIS LTDA',
 'A T GARCIA COMBUSTIVEIS',
 'A Z COMERCIO DE COMBUSTIVEIS LTDA',
 'A Z COMERCIO DE COMBUSTÍVEIS LTDA.',
 'A Z COMÉRCIO DE COMBUSTÍVEIS LTDA.',
 'ABDELNOR COMERCIO DE COMBUSTIVEIS LTDA',
 'ABDELNOR II COM DE COMBUSTIVEIS LTDA',
 'ABDELNOR III COMERCIO COMBUSTIVEIS LTDA',
 'ABDELNOR III COMERCIO DE COMBUSTIVEIS LTDA',
 'ABDELNOR VI COMERCIO DE COMBUSTIVEIS LTDA',
 'ABUDABI COMERCIO COMBUSTIVEL LTDA',
 'ADG COMERCIO DE COMBUSTIVEIS LTDA',
 'AEROCAR COMÉRCIO VAREJISTA DE COMBUSTÍVEIS LTDA',
 'AGILE COMBUSTIVEIS E CONVENIENCIA LTDA',
 'AGROCOMB COMBUSTIVEIS LTDA EPP',
 'ALCATRAZ COMBUSTIVEIS E CONVENIENCIA LTDA',
 'ALCATRAZ COMBUSTÍVEIS E CONVENIÊNCIA LTDA',
 'ALEXANDRE ROBERTI COMBUSTIVEIS EPP',
 'ALTERNATIVA COM DE COMBUSTIVEIS LTDA',
 'ALTERNATIVA COMERCIO DE COMBUSTÍVEIS LTDA EPP',
 'ALVARENGA COMERCIO VAREJISTA DE COMBUSTIVEL LTDA',
 'ALVES D ABREU E SALGADO COMB. COM. EE',
 'ALVES D ABRE

In [102]:
# compatibilizando dados de fornecedor para eles terem o mesmo nomes
df1.replace(['2 AMIGOS COM. DE COMBUST. DE MONTE APRAZIVEL LTDA.',
            '2 AMIGOS COMERCIO DE COMBUSTIVEIS LTDA',
            'A T GARCIA COMBUSTIVEIS',
            'A Z COMERCIO DE COMBUSTIVEIS LTDA',
            'A Z COMERCIO DE COMBUSTÍVEIS LTDA.',
            'A Z COMÉRCIO DE COMBUSTÍVEIS LTDA.',
            'ABDELNOR COMERCIO DE COMBUSTIVEIS LTDA',
            'ABDELNOR II COM DE COMBUSTIVEIS LTDA',
            'ABDELNOR III COMERCIO COMBUSTIVEIS LTDA',
            'ABDELNOR III COMERCIO DE COMBUSTIVEIS LTDA',
            'ABDELNOR VI COMERCIO DE COMBUSTIVEIS LTDA',
            'ABUDABI COMERCIO COMBUSTIVEL LTDA',
            'ADG COMERCIO DE COMBUSTIVEIS LTDA',
            'AEROCAR COMÉRCIO VAREJISTA DE COMBUSTÍVEIS LTDA',
            'AGILE COMBUSTIVEIS E CONVENIENCIA LTDA',
            'AGROCOMB COMBUSTIVEIS LTDA EPP',
            'ALCATRAZ COMBUSTIVEIS E CONVENIENCIA LTDA',
            'ALCATRAZ COMBUSTÍVEIS E CONVENIÊNCIA LTDA',
            'ALEXANDRE ROBERTI COMBUSTIVEIS EPP',
            'ALTERNATIVA COM DE COMBUSTIVEIS LTDA',
            'ALTERNATIVA COMERCIO DE COMBUSTÍVEIS LTDA EPP',
            'ALVARENGA COMERCIO VAREJISTA DE COMBUSTIVEL LTDA',
            'ALVES D ABREU E SALGADO COMB. COM. EE',
            'ALVES D ABREU E SALGADO COMBUSTÍVEIS COMÉRCIO E E',
            'ALVES D ABREU E SALGADO-COMBUS.COM.E ESTAC.LTDA',
            'ALVES D ABREU E SALGADO-COMBUST COM E ESTAC LTDA',
            'AMERICA CEN DE ABAS DE COMB LTDA',
            'AMERICA CENTRO DE ABAST DE COMBUSTÍVEIS LTDA',
            'AMERICA CENTRO DE ABASTECIMENTO DE COMBUSTIVEIS',
            'AMERICA CENTRO DE ABASTECIMENTO DE COMBUSTIVEIS LTDA',
            'AMERICAMANIA COM. VAREJISTA DE COMBUSTIVEIS LTDA',
            'AMERICAMANIA COMÉRCIO VAREJISTA DE COMBUSTÍVEIS LTDA',
            'AMERICANA COMERCIO VAREJISTA DE COMBUSTIVEL L',
            'AMF AEROPORTO COM VAREJISTA DE COMBUSTÍVEIS LTDA',
            'AMF AEROPORTO COMERCIO VAREJISTA DE COMBUST LTDA',
            'AMF AEROPORTO COMERCIO VAREJISTA DE COMBUSTIVEL LTDA',
            'AMP COMBUSTIVEIS MAGNOLIA LTDA',
            'ANDRADE BEBEDOURO COMERCIO DE COMBUSTIVEIS LTDA',
            'ANTONIO BISPO-COMBUSTIVEIS.',
            'AQUARIUS COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'ARIELLA IMIGRANTES COMERCIO VAREJISTA DE COMBUST',
            'ARINELA IMIGRANTES COMERCIO VAREJISTA COMBUSTIVEL',
            'ARINELLA BANDEIRANTES COMERCIO VAREJISTA DE COMBU',
            'ARINELLA BANDEIRANTES COMERCIO VAREJISTA DE COMBUSTIVEIS',
            'ARINELLA BANDEIRANTES COMERCIO VAREJISTA DE COMBUSTÍVEIS LTDA',
            'ARINELLA IMIGRANTES COM. VAR.COMBUST. LTDA',
            'ARINELLA IMIGRANTES COM.VAR.DE COMB.LTDA',
            'ARINELLA IMIGRANTES COMERCIO VAREJISTA DE COMBUST',
            'ARINELLA IMIGRANTES COMERCIO VAREJISTA DE COMBUSTIVEL.',
            'ARINELLA IMIGRANTES COMÉRCIO VAREJISTA DE COMBUSTÍVEL',
            'ARTAM ARARAQUARA COMERCIO DE COMBUSTIVEIS LTDA',
            'ARTAM ARARAQUARA COMÉRCIO DE COMBUSTÍVEIS LTDA',
            'ARTAM ARARAQUARA DE COMBUSTIVEL LTDA',
            'ARTAM COMERCIO DE COMBUSTIVEIS LTDA',
            'ARTAM SAO CARLOS COMERCIO DE COMBUSTIVEIS LTDA',
            'ARTAM SAO CARLOS COMERCIO DE COMBUSTIVEIS LTDA.',
            'ASTR0 SUL POSTO DE COMBUSTIVEIS LTDA',
            'ASTRO COMERCIO DE COMBUSTIVEIS  LTDA',
            'ASTRO COMERCIO DE COMBUSTIVEIS LTDA',
            'ASTRO COMERCIO DE COMBUSTÍVEIS LTDA',
            'ASTRO COMÉRCIO DE COMBUSTIVEIS  LTDA',
            'ASTRO SUL POSTO DE COMBUSTIVEIS LTDA',
            'ASTRO SUL POSTO DE COMBUSTIVEL LTDA',
            'ATLANTA ROTA SHOPPING COMERCIO DE COMBUSTÍVEIS EIRELI',
            'AUTO POSTO ALMIRANTE RANGEL COMÉRCIO DE COMBUSTÍVEIS E DERIVADOS DE PETRÓLEO',
            'AUTO POSTO BARAO SUPERVE COMBUSTIVEIS LTDA',
            'AUTO POSTO DE COMB. DE SUZ. LTDA',
            'AUTO POSTO DE COMBUSTÍVEIS V2 LTDA',
            'AUTO POSTO DELEVATTI COMERCIO DE COMBUSTIVEIS LTDA',
            'AUTO POSTO E SERVIÇO CENTRAL COMBUSTIVEIS LTDA',
            'AUTO POSTO EMIRADOS COMBUSTÍVEIS',
            'AUTO POSTO J S A COMBUSTIVEIS LTDA',
            'AUTO POSTO LUPUS COMBUSTÍVEIS LTDA',
            'AUTO POSTO MALHEIROS COM. DE COMB. LTDA.',
            'AUTO POSTO MALHEIROS COMERCIO DE COMBUSTÍVEIS LTDA',
            'AUTO POSTO NOVO HORIZONTE II - ALMEIDA E OLIVEIRA COMERCIO DE COMBUSTIVEIS E DERIVADOS DE P',
            'AUTO POSTO SUZUKI COMÉRCIO DE COMBUSTÍVEIS LTDA',
            'AUTO POSTO SÃO SEBASTIÃO COMÉRCIO DE COMBUSTÍVEIS',
            'AUTO POSTO TATUIMAR LTDA - POSTO COMBOIO',
            'AUTO POSTO VILA FLORIANO XAVIER E XAVIER COMERCIO DE COMBUSTIVEIS E LUBRIF',
            'AUTO POSTO VILA NOVA COMERCIO DE COMBUSTIVEIS EIRELI',
            'AVIGNON COM. VAREJISTA DE COMBUSTIVEIS LTDA',
            'AZ COMERCIO DE COMBUSTIVEIS LTDA',
            'B J COM DE COMB E LUBR DE OURINHOS LTDA',
            'B J COM DE COMBUSTIVEIS E LUBR DE OURINHOS LTDA',
            'B2F COM. DE COMBUSTÍVEL LTDA',
            'B2F COMERCIO DE COMBUSTIVEL',
            'BASSO E ADANI COMERCIO DE COMBUSTIVEL E TRANSPORTE',
            'BEIRA MINHO COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'BEIRA MINHO COMERCIO VAREJISTA DE COMBUSTÍVEIS LTDA',
            'BEIRA MINHO COMERCIO VERJISTA DE COMBUSTIVEIS',
            'BELA VISTA COM VAREJO DE COMBUSTIVEIS LTDA ME',
            'BELA VISTA COMERCIO VAREJISTA DE COMBUSTÍVEIS LTD',
            'BELA VISTA COMERCIO VAREJISTA DE COMBUSTÍVEIS LTDA',
            'BERNARDO & ROSSINI COM. DE COMBUSTIVEIS LTDA',
            'BERNARDO E ROSSINI COMERCIO DE COMBUSTIVEIS LTDA',
            'BIRI PETRO COM. DE COMBUSTIVEIS LTDA',
            'BLV COMÉRCIO DE COMBUSTIVEIS LTDA',
            'BLW COMERCIO DE COMBUSTÍVEIS LTDA',
            'BLW COMÉRCIO DE COMBUSTÍVEIS LTDA.',
            'BOITUVA COM. DE COMBUSTIVEIS LTDA',
            'BOITUVA COMERCIO DE COMBUSTIVEIS LTDA',
            'BOITUVA COMÉRCIO DE COMBUSTÍVEIS LTDA',
            'BOM JESUS AUTO POSTO 3F COMERCIO DE COMBUSTIVEIS LTDA',
            'BORELI CENTER PETRO COM. DE COMBUSTIVEIS EIRELI',
            'CABRAL§LOCATELLI COM DE COMBUSTIVEIS LTDA',
            'CAETES COMERCIO DE COMBUSTIVEIS LTDA',
            'CALOPSYTA COMERCIO DE COMBUSTIVEIS E DERIVADOS DE',
            'CALUANA COMBUSTIVEIS E SERVICOS LTDA',
            'CALUANA COMBUSTIVEIS E SERVIÇOS LTDA',
            'CALUANA COMBUSTÍVEIS E SERVIÇOS',
            'CANABRAVA III COM DE COMB DE GARÇA LTDA',
            'CARMEL COM. DE COMBUSTÍVEIS E SERVIÇOS LTDA',
            'CARONI COMERCIO DE COMBUSTIVEIS LTDA',
            'CASA AVENIDA COM DE COMBUSTIVEL LTDA',
            'CASA AVENIDA COM. DE COMBUST. LTDA',
            'CASA AVENIDA COMERCIO DE COMBUSTIVEIS LTDA',
            'CASA AVENIDA COMERCIO DE COMBUSTIVEL LTDA',
            'CASSIANO COMERCIO DE COMBUSTÍVEIS E CONVENIENCIAS',
            'CENTRO ALTO CONVENIENCIA E COMBUSTIVEIS LTDA',
            'CENTRO AUTOMOTIVO DE COMBUSTIVEIS AMERICANA',
            'CENTRO AUTOMOTIVO DE COMBUSTIVEIS AMERICANA LTDA',
            'CENTRO AUTOMOTIVO E COM DE COMBUSTIVEIS MAXX',
            'CENTRO AUTOMOTIVO E COMERCIO DE COMBUSTIVEIS MAXX',
            'CENTRO AUTOMOTIVO E COMERCIO DE COMBUSTÍVEIS MAXX',
            'CENTRO AUTOMOTIVO E COMÉRCIO DE COMBUSTIVEIS MAXX',
            'CENTRO COMERCIAL DE COMBUSTIVEIS HORTOLANDIA LTDA',
            'CENTRO DE COMBUSTIVEIS E SERVIÇOS VENEZA LTDA',
            'CHACARA DO QUIRIRI COM VAREJ DE COMBUSTIVEL',
            'CHACARA DO QUIRIRI COMERCIO VAREJISTA DE COMBUSTI',
            'CHAPARRAL COMERCIO DE COMBUSTIVEIS AUTOMOTIVOS LT',
            'CHIESA PARQUE INDUSTRIAL COMBUSTIVEIS LTDA',
            'CHORAO COMBUSTIVEIS LTDA',
            'CHORORAO COMBUSTIVEIS LTDA',
            'CIDADE DO VINHO COM. VAREJ. DE COMB. LTDA',
            'CINADIS REVENDEDORA DE COMBUSTIVEIS LTDA',
            'CINADIS REVENDEDORA DE COMBUSTÍVEIS LTDA',
            'CINTRA COM COMBUSTÍVEIS LTDA',
            'COLISEU COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'COLUMBUS COMERCIO DE COMBUSTIVEIS LTDA',
            'COM DE COMB BRAUNA LTDA',
            'COM DE COMB. OLIVEIRA E RAMOS LTDA EPP',
            'COM.VAR. DE COMB. LUMAR TAIPAS EIRELI',
            'COMBOIO POSTO DE SERVIÇO LTDA',
            'COMBOY AUTO POSTO LTDA',
            'COMERCIAL DE COMBUSTISTVEIS APOLLO PIRACICABA LTDA',
            'COMERCIAL DE COMBUSTIVEIS ALPHAPOLLO LTDA',
            'COMERCIAL DE COMBUSTIVEIS BOA VISTA LTDA',
            'COMERCIAL DE COMBUSTIVEIS OUROESTE',
            'COMERCIAL DE COMBUSTIVEIS PENA VERDE LTDA',
            'COMERCIAL DE COMBUSTIVEIS VALPETRO LTDA',
            'COMERCIAL DE COMBUSTIVEIS VISCONDE US LTDA',
            'COMERCIAL DE COMBUSTIVEL APOLLO RIO CLARO LTDA',
            'COMERCIAL DE COMBUSTÍVEIS GUARANI US LTDA ME',
            'COMERCIAL DE COMBUSTÍVEIS GUARANI US LTDA.',
            'COMERCIAL NOGUEIRENSE DE COMBUSTIVEL LTDA',
            'COMERCIAL NOROESTE DE COMBUSTIVEIS LTDA',
            'COMERCIAL R B COMBUSTIVEIS LTDA',
            'COMERCIAL R B R DE COMBUSTÍVEIS LTDA',
            'COMERCIAL RBR DE COMBUSTIVEIS LTDA',
            'COMERCIO DE COMBUSTIVEIS AFC LTDA',
            'COMERCIO DE COMBUSTIVEIS E TRANSP BORTOLINI LTDA',
            'COMERCIO DE COMBUSTIVEIS GENESIS LTDA',
            'COMERCIO DE COMBUSTIVEIS MIRANTE LTDA',
            'COMERCIO DE COMBUSTIVEIS MORAES SALES LTDA',
            'COMERCIO DE COMBUSTIVEIS PASTORELLO LTDA.',
            'COMERCIO DE COMBUSTIVEIS RUY RODRIGUES LTDA',
            'COMERCIO DE COMBUSTIVEIS SANTO EXPEDITO LTDA',
            'COMERCIO DE COMBUSTIVEIS SAO FRANCISCO LTDA',
            'COMERCIO DE COMBUSTIVEIS VALE DO R. PRETO LTDA-EPP',
            'COMERCIO DE COMBUSTIVEL GRANADO LTDA',
            'COMERCIO DE COMBUSTIVEL RUY RODRIGUES KTDA',
            'COMERCIO DE COMBUSTÍVEIS MORAES SALES LTDA',
            'COMERCIO DE COMBUSTÍVEIS SANTO EXPEDITO LTDA',
            'COMERCIO VAREGISTA DE COMBUSTIVEIS PINHO DO GRAJA',
            'COMERCIO VAREGISTA DE COMBUSTIVEIS RT DEZOITO E M',
            'COMERCIO VAREJISTA DE COMBUSTIVEIS FOLENA CURVAO',
            'COMERCIO VAREJISTA DE COMBUSTIVEIS JARDIM RIVIERA LTDA',
            'COMERCIO VAREJISTA DE COMBUSTIVEIS PINHO DO GRAJAU',
            'COMERCIO VAREJISTA DE COMBUSTIVEIS RT DEZOITO E M',
            'COMERCIO VAREJISTA DE COMBUSTIVEIS VIA SUL LTDA',
            'COMERCIO VAREJISTA DE COMBUSTÍVEIS FIG LTDA',
            'COMERCIO VAREJISTA DE COMBUSTÍVEIS PINHO DO GRAJA',
            'COMERCIOVAREJISTA DE COMBUSTIVEIS PARAISO DE BARUERI LTDA',
            'COML PHILADELPHIA DE COMBUSTIVEIS LT',
            'COML PHILADELPHIA DE COMBUSTÍVEIS LT',
            'COMÉRCIO DE COMBUSTIVEIS E TRANSPORTES BORTOLINI LTDA.',
            'COMÉRCIO DE COMBUSTÍVEIS BONFIM LTDA.',
            'CONCORDIA POSTO DE COMBUST E LUBRIFICANTES',
            'CONQUISTA DE MAIRIPORA COMERCIO VAREGISTA DE COMBUSTIVEL',
            'CONQUISTA DE MAIRIPORA COMERCIO VAREJISTA DE COMB',
            'COSTA & COSTA COM DE COMB. LTDA',
            'COSTA & COSTA COM DE COMBUSTÃ\x8dVEIS LTDA',
            'COSTA E JORDAO COMBUSTIVEIS LTDA',
            'CUESTA PETRO COMERCIO DE COMBUSTIVEIS LTDA',
            'CV COMERCIO DE COMBUSTIVEIS',
            'CV COMERCIO DE COMBUSTÍVEIS LTDA',
            'DEBORA COM COMBUST DERIVADOS PETROLEO LTDA',
            'DEBORA COMERCIO DE COMBUSTIVEIS E DERI DE PETROLEO LTDA',
            'DEL REY COMBUSTIVEIS LTDA',
            'DELEVATTI COMERCIO DE COMBUSTIVEIS LTDA',
            'DELEVATTI COMERCIO DE COMBUSTIVEIS NOVO HORIZONTE',
            'E A TUSCHI COMBUSTIVEIS',
            'E C E ZANELLA COMERCIO DE COMBUSTIVEIS LTDA',
            'E. GARCIA COMERCIO DE COMBUSTIVEIS LTDA.',
            'ECO KLABIN COMÉRCIO VAREJISTA DE COMBUSTÍVEIS LTDA.',
            'ECO POSTO DE COMBUSTIVEIS JARDIM LTDA',
            'ECO POSTO W F COMBUSTIVEL E RESTAURANTE LTDA',
            'ECO POSTO W F COMBUSTÍVEL E RESTAURANTE LTDA',
            'ECO POSTO W. F. COMBUSTÍVEIS E RESTAURANTE LTDA.',
            'ECONOPETRO COMBUSTÍVEIS E SERVIÇOS EIRELI',
            'ECRX COMERCIO DE COMBUSTIVEIS',
            'EDIVALDO FERNADO CABRAL COMBUSTIVEIS LTDA',
            'EDUCANDARIO COM DE COMBUSTIVEIS LTDA',
            'EDUCANDARIO COMERCIO DE COMBUSTIVEIS LTDA',
            'EJ COMERCIO DE COMBUSTIVEIS EIRELI',
            'ESPACIAL COMERCIO DE COMBUSTIVEIS LTDA',
            'ESPIGAO COMERCIO DE COMBUSTIVEIS LTDA',
            'ESPIGÃO COMERCIO DE COMB. LTDA',
            'ESPIGÃO COMERCIO DE COMBUSTÍVEL LTDA',
            'EUROPA COMERCIO DE COMBUSTIVEIS LTDA',
            'EXPRESS COMERCIO DE COMBUSTIVES E LUBRIFICANTES',
            'F G NOVO CENTRO POSTO DE COMBUSTIVEIS LTDA',
            'F J R COMERCIO DE COMBUSTIVEIS LTDA',
            'FARIA LIMA COMERCIO DE COMBUSTÍVEL LTDA',
            'FAROL DA AGUA FRIA COMERCIO VAREJISTA DE COMBUSTÍVEL',
            'FASE QUATRO COMERCIO DE COMBUSTIVEIS LTDA',
            'FASE QUATTRO COMERCIO DE COMBUSTIVEIS LTDA',
            'FG NOVO CENTRO POSTO DE COMBUSTIVEIS',
            'FIBRA POSTO DE COMBUSTIVEIS LTDA',
            'FLMA DIADEMA COMERCIO VAREJISTA DE COMBUSTIVEIS',
            'FMJA COMERCIO DE COMB.LTDA',
            'FMJA COMERCIO DE COMBUSTIVEIS LTDA',
            'FORMIGAO COMERCIO DE COMB.LTDA',
            'FORMIGAO COMERCIO DE COMBUSTIVEIS E LUBRIFICANTES',
            'FORMIGÃO COM. DE COMBUST. E LUBRIFICANTES - LTDA',
            'FOX MILENIUM COMERCIO DE COMBUSTIVEIS LTDA',
            'FRANPETRO COMERCIO DE COMBUSTIVEIS LTDA',
            'FRASCHETTI COMERCIO DE COMBUSTIVEIS LTDA',
            'FT COMERCIO DE COMBUSTIVEIS LTDA',
            'G A COMERCIO DE COMBUSTIVEIS LTDA',
            'G M ABBADE COMBUSTIVEIS',
            'G S COMERCIO DE COMBUSTIVEIS LTDA',
            'GABRIELLA GAS STATION COM DE COMBUSTIVEIS LTDA',
            'GASPER COMBUSTIVEIS LTDA',
            'GAT POSTO DE COMBUSTIVEIS LTDA',
            'GAT POSTO DE COMBUSTÍVEIS LTDA',
            'GENERAL COMERCIO DE COMBUSTIVEIS LTDA',
            'GENERAL COMERCIO DE COMBUSTIVEL LTDA',
            'GF COMERCIO VAREJISTA DE COMBUSTIVEL LTDA',
            'GRAMINHA COMERCIO DE COMBUSTIVEIS LTDA',
            'GRAMINHA COMERCIO DE COMBUSTÍVEIS',
            'GRANADA POSTO DE COMBUSTIVEIS LTDA',
            'GS POSTO DE COMBUSTIVEL LTDA',
            'GUAIRA COMERCIO DE COMBUSTIVEIS LTDA',
            'IGNOTTI COM COMBUST E LUBRIFICANTES LT',
            'IGNOTTI COM COMBUSTIVEIS E LUBRIFICANTES LTDA',
            'IGNOTTI COM. COMBUST. E LUBRIFICANTES - LTDA',
            'IGNOTTI COM. COMBUSTIVEIS',
            'IGO COM. VAREJISTA DE COMBUSTÍVEL',
            'IGO COMÉRCIO VAREJISTA DE COMBUSTÍVEIS',
            'IGO-COMERCIO VAREJISTA DE COMBUSTIVEL LTDA',
            'IMIGRANTE COMERCIO DE COMBUSTIVEIS',
            'IMIGRANTES COM. DE COMB. E DER. DE PETRÓLEO LTDA',
            'IMIGRANTES COMÉRCIO DE COMB. E DERIV.PETR.LTDA.',
            'IPE COMERCIO COMBUSTIVEIS LTDA',
            'IRMAOS GUERRERO POSTOS DE COMBUSTIVEIS LTDA',
            'ITAPIRENSE COMBUSTÍVEIS LTDA.',
            'J L C COMERCIO DE COMBUSTIVEIS E DERIVADOS DE PET',
            'J M COMERCIO DE COMBUSTIVEIS LTDA',
            'J P LEAL COMBUSTÍVEIS E POSTOS DE SERVIÇOS LTDA',
            'J S COMERCIO DE COMBUSTIVEIS LTDA',
            'JAPÃO COMERCIO DE COMBUSTIVEIS LTDA',
            'JJ PETRO COMBUSTIVEIS LTDA',
            'JLC COMERCIO DE COMBUSTIVEL E DERIVADOS DE PET',
            'JN COMERCIO DE COMBUSTIVEIS E LUBRIFICANTES LTDA',
            'JN COMERCIO DE COMBUSTÍVEIS E LUBRIFICANTE',
            'JN COMERCIO DE COMBUSTÍVEIS E LUBRIFICANTES',
            'JOAO MANTOVANI COMBUSTIVEIS EPP',
            'JOAO ROBERTO RODRIGUES COMBUSTIVEIS',
            'JORGE S ASADA COMB E TRANSP EPP',
            'JUVENAL PARADA COM.VAREJ.DE COMB.LTDA',
            'JUVENAL PARADA COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'JUVENTOS COMÉRCIO VAREGISTA DE COMBUSTIVEIS LTDA',
            'KRAFTECK COMERCIO DE COMBUSTIVEL',
            'L & M MATOS COMBUSTIVEIS LTDA',
            'L E M MATOS COMBUSTIVEIS',
            'L E M MATOS COMBUSTIVEIS LTDA',
            'L E M MATOS COMBÚSTIVEIS LTDA',
            'L F J COMERCIODE COMBUSTIVEL LTDA',
            'L.BERTANHA COMBUSTIVEIS EPP',
            'LEANDRINI AL POSTO COMBUSTÍVEL LTDA',
            'LIDERCOM COMERCIO COMBUSTIVEIS RIBEIRÃO PRETO LTDA',
            'LION COMERCIO DE COMBUSTIVEIS LTDA',
            'LION COMERCIO DE COMBUSTÍVEIS LTDA',
            'LION E LION COMERCIO DE COMBUSTIVEIS LTDA',
            'LJ  COM DE COMBUSTIVEIS LTDA',
            'LLA IMIGRANTES COMERCIO VAREJISTA DE COMB',
            'LORENPOSTO COM DE COMB E SERV LTDA',
            'LUMAR COMBUSTIVEL PIQUEERI LTDA',
            'LUMMAR COMBUSTIVEIS JANDIRA LTDA',
            'LUMMAR COMBUSTIVEIS TAMBORE LTDA',
            'LUMMAR COMBUSTÍVEIS PIQUERI LTDA.',
            'LUSAN COM DE COMBUSTIVEL LTDA',
            'M MAROUBO COMERCIO DE COMBUSTIVEIS EIRELLI',
            'MAGALHAES E MAGALHAES COM COMB LUB LTDA',
            'MAGALHÃES & MAGALHÃES COM. COMBUSTÍVEIS',
            'MAGALHÃES E MAGALHÃES COMERCIO DE COMBUSTÍVEL LTDA',
            'MALAGUETA COM. VAREJISTA DE COMBUSTIVEIS LTDA',
            'MALAGUETA COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'MALAGUETA COMERCIO VAREJISTA DE COMBUSTÍVEIS LTDA',
            'MALHADAL COMERCIO VAREJISTA DE COMBUSTIVEIS',
            'MAPHIGUTTI COMERCIO DE COMBUSTIVEL E DERIVADOS LTDA',
            'MARE ALTA - COMERCIO DE COMBUSTIVEIS LTDA',
            'MARE ALTA - COMERCIO DE COMBUSTIVEIS LTDA.',
            'MARE ALTA - COMERCIO DE COMBUSTÍVEIS LTDA',
            'MARE ALTA - COMERCIO DE COMBUSTÍVEL LTDA',
            'MARE ALTA COMERCIO DE COMBUSTIVEIS EIRELI',
            'MARE ALTA COMERCIO DE COMBUSTÍVEIS EIRELI',
            'MARQUES & LEÃO COM. DE COMBUST LTDA',
            'MARTINEZ & MOLINA COMERCIO DE COMBUSTIVEIS LTDA',
            'MARTINEZ E MARTINEZ COM. DE COMBUSTIVEIS LTDA.',
            'MARZOLA & FELTRIN COMERCIO DE COMBUSTÍVEL LTDA',
            'MB COMERCIO DE COMBUSTIVEIS LTDA',
            'MB COMERCIO DE COMBUSTIVEL LTDA',
            'MEDITERRANEO DO SUL COMERCIO DE COMBUSTIVEIS LTDA',
            'MILENA ELOISA POSTO DE COMBUSTIVEIS EI',
            'MILENA ELOISA VILLAVERDE POSTO DE COMBUSTIVEIS EI',
            'MILENA ELOISA VILLAVERDE POSTO DE COMBUSTÍVEIS -EI',
            'MIRAGE COMERCIO DE COMBUSTIVEIS LTDA',
            'MM COMERCIO DE COMBUSTÍVEL EIRELI',
            'MODELINHO COMERCIO DE COMBUSTIVEIS E LUBRIFICANTE',
            'MODELINHO COMERCIO DE COMBUSTIVEIS E LUBRIFICANTES',
            'MONACO BONFIM COMERCIO DE COMBUSTIVEIS LTDA',
            'MONACO COMERCIO DE COMBUSTIVEIS LTDA',
            'MONTE SANTO COMBUSTIVEIS LTDA.',
            'MONTE SANTO COMBUSTÍVEIS LTDA',
            'MONTEMOS DIST. DE COMBUSTIVEIS',
            'MR COMERCIO DE COMBUSTIVEIS EIRELI',
            'MT BATATAIS COMERCIO DE COMBUSTÍVEL LTDA',
            'NACOES COMERCIO DE COMBUSTIVEIS',
            'NAMO COMERCIO DE COMBUSTIVEIS LTDA',
            'NARDI-COM. COMBUST. DERIV. PETROLEO LTDA',
            'NAÇÕES COMERCIO DE COMBUSTIVEIS LTDA',
            'NAÇÕES COMERCIO DE COMBUSTIVEIS LTDA ME',
            'NB COM. DE COMBUSTIVEIS LTDA',
            'NOROESTE POSTO DE COMBUSTIVEIS DE VALPARAÍSO',
            'NOVA CAMPINAS COMERCIO DE COMBUSTIVEIS LTDA',
            'O BEM AMADO POSTO DE SERVIÇOS AUTOMOTIVOS E COMERCIO DE COMBU',
            'OCEANO BLUE COM. DE COMBUSTIVEIS LTDA',
            'OCEANO BLUE COM. DE COMBUSTIVEIS LTDA.',
            'OCEANO BLUE COMERCIO DE COMBUSTÍVEIS LTDA.',
            'ODALETE NATALINA MARTINS PIVA COMB.ME',
            'ODALETE NATALINA MARTINS PIVA COMBUSTÍVEIS ME',
            'OK CENTRO DE ABAST DE COMBUST LTDA',
            'OLIVEIRA E CLAUDINO COMBUSTIVEIS LTDA',
            'ORALDO JOSE TRAZZI - COMBUSTIVEIS - EPP',
            'OSTI COMERCIO DE COMBUSTIVEIS',
            'P S O COMERCIO DE COMBUSTIVEIS LTDA',
            'P S O COMERCIO DE COMBUSTÍVEIS LTDA',
            'P S U COMERCIO DE COMBUSTIVEIS LTDA',
            'P S U COMERCIO DE COMBUSTÍVEIS LTDA',
            'P V BANDEIRANTES COMERCIO DE COMB.LTDA',
            'P V BANDEIRANTES COMERCIO DE COMBUSTIVEIS LTDA',
            'P. S. COM DE COMB MALBEC LTDA',
            'P. SERV AUTO. E COM. DE COMB. BORDO LTDA',
            'P. SERV. AUTO E COM. DE COMB. BORDO LTDA.',
            'P. SERV. E CON. DE COMB. TOURIGA LTDA',
            'P.V. BANDEIRANTES COM DE COMBUSTÍVEIS LTDA',
            'P.V.BANDEIRANTES COM. DE COMBUSTIVEIS LTDA',
            'P.V.BANDEIRANTES COM. DE COMBUSTÍVEIS LTDA',
            'PACKER COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'PALACIO COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'PAX COMERCIO DE COMBUSTIVEIS EIRELI',
            'PAX COMERCIO DE COMBUSTIVEIS EIRELLI',
            'PESSEGO COM E SERV DE COMB LUB LTDA',
            'PETRO BADY COM. DE COMBUSTIVEIS LTDA',
            'PETRONEWS COMERCIO DE COMBUSTIVEIS LTDA',
            'PETRONEWS COMERCIO DE COMBUSTIVEL LTDA',
            'PETROUNI COMERCIO DE COMBUSTÍVEIS LTDA',
            'PINHO COM DE COMBUSTIVEL LTDA',
            'PINHO COM. DE COMBUSTIVEIS E DERIVADOS LTDA',
            'PINHO COMERCIO DE COMBUSTÍCEIS E DERIVADOS LTDA',
            'PINHO DE COMBUSTIVEIS E DERIVADOS LTDA',
            'POLARIS COMERCIO DE COMBUSTIVEIS LTDA',
            'PORTAL DOIS COM VAR DE COMBUSTÍVEIS LTDA',
            'PORTO ALEGRE COMERCIO DE COMBUSTIVEIS LTDA',
            'POSTAO GETULINA COMERCIO DE COMBUSTÍVEIS LTDA',
            'POSTO ASTRO COMERCIO DE COMBUSTIVEIS LTDA',
            'POSTO BRAS COMERCIO DE COMBUSTIVEIS E LUBRIFICANTES',
            'POSTO BRAS. COMERCIO DE COMBUSTIVEIS E LUBRIFICANTES',
            'POSTO CLARET RPA COMERCIO DE COMBUSTIVEIS RIO CLARO II LTDA',
            'POSTO COMBOIO - AUTO POSTO TATUIMAR LTDA',
            'POSTO COMBUSTIVEIS VERDE BRASIL LTDA',
            'POSTO DAS FIGUEIRAS DE COMBUSTIVEIS',
            'POSTO DAS FIGUEIRAS DE COMBUSTIVEIS DE RIBEIRÃO PRETO',
            'POSTO DAS FIGUEIRAS DE COMBUSTIVEIS DE RIBEIRÃO PRETO PRETO',
            'POSTO DE COMBUSTIVEIS DIBETH',
            'POSTO DE COMBUSTIVEIS DIBETH LTDA',
            'POSTO DE COMBUSTIVEIS E DERIVADOS DE PETROLEO  A 1 S',
            'POSTO DE COMBUSTIVEIS JEMAR LTDA',
            'POSTO DE COMBUSTIVEIS VERDE BRASILLTDA',
            'POSTO DE COMBUSTIVEIS VIA MODELO LTDA',
            'POSTO DE COMBUSTIVEL ATIBAIA SP LTDA',
            'POSTO DE COMBUSTIVEL NGM EIRELI',
            'POSTO DE COMBUSTÍVEIS SERINGUEIRAS',
            'POSTO DE COMBUSTÍVEIS VERDE BRASIL',
            'POSTO DE SERV AUTOM E COM DE COMB AEROPORTO LTDA',
            'POSTO DE SERV. AUTO E COM. DE COMB. PARIS LTDA-ME',
            'POSTO DE SERV. AUTO. E COM. DE COMB. PARIS LTDA',
            'POSTO DE SERV. AUTOMOTIV. COM. COMB. MADRI. LTDA',
            'POSTO DE SERVI.AUT.E COMB. CABERNET LTDA',
            'POSTO DE SERVICOS AUTOMOTIVOS E COMERCIO DE COMBU',
            'POSTO DE SERVICOS AUTOMOTIVOS E COMERCIO DE COMBUSTIVEIS MAD',
            'POSTO DE SERVIÇOS AUTO COM DE COMB MADRI',
            'POSTO DE SERVIÇOS AUTOMOTIVOS E COM COMBU',
            'POSTO DE SERVIÇOS AUTOMOTIVOS E COMERCIO DE COMBUSTIVEIS ALI',
            'POSTO DE SERVIÇOS AUTOMOTIVOS E COMERCIO DE COMBUSTIVEIS AMARULA LTDA',
            'POSTO DE SERVIÇOS AUTOMOTIVOS E COMERCIO DE COMBUSTÍVEL',
            'POSTO DE SERVIÇOS AUTOMOTIVOS E COMÉRCIO DE COMBU',
            'POSTO DE SERVIÇOS AUTOMOTIVOS E COMÉRCIO DE COMBUSTÍVEIS PARIS - EIRELI',
            'POSTO DE SERVIÇOS GENESIS COMERCIO DE COMBUSTIVEIS GENESIS LTDA',
            'POSTO HIROCHI & JULIA KITAGAWA COMERCIO COMBUSTIVEL',
            'POSTO KADAR COMERCIO DE COMBUSTÍVEIS LTDA',
            'POSTO MANIA REDE MM COMBUSTIVEL EIRELI',
            'POSTO MARTINELLI COMÉRCIO VAREJISTA DE COMBUSTÍVEIS',
            'POSTO MATINHA COMBUSTIVEIS - MIRASSOL LTDA',
            'POSTO MATINHA COMBUSTIVEIS - MIRASSOL LTDA.',
            'POSTO MATINHA COMBUSTIVEIS MIRASSOL LTDA',
            'POSTO MATINHA COMBUSTIVEIS MITASSOL LTDA',
            'POSTO OLIVEIRA E LIMA- POSTO DE SERVIÇOS AUTOMOTIVOS E COMÉRCIO DE COMBUSTÍVEIS',
            'POSTO PACAEMBU COMERCIO DE COMBUSTIVEIS LTDA',
            'POSTO PALESTRA COMBUSTIVEIS - RIO PRETO LTDA',
            'POSTO PALESTRA COMBUSTÍVEIS RIO PRETO LTDA',
            'POSTO POMPEIA COMERCIO DE COMBUSTIVEIS LTDA',
            'POSTO PONTAL DISTRIBUIDORA DE COMBUSTIVEIS LTDA',
            'POSTO PONTUAL DESTRIBUIDORA DE COMBUSTIVEL EIREL',
            'POSTO PONTUAL DISTRIBUIDORA DE COMBUSTIVEIS LTDA',
            'POSTO RECANTO ITAICI COMERCIO DE COMBUSTIVEIS LTDA',
            'POSTO SANTA FELICIA DE COMBUSTIVEIS SÃO CARLOS LT',
            'POSTO SANTO EXPEDITO 2 IRMAOS COMERCIO DE COMBUSTIVEIS LTDA.',
            'POSTO SAO FRANCISCO VALDEMARIN 5 COM. COMB. E DER.',
            'POSTO TOTAL 9 DE JULHO COMB E CONVENIENCIA LTDA',
            'POSTO TOTAL HENRIQUE LUPO COMBUSTIVEL LTDA',
            "POSTO TRUCK'S - COMERCIO E TRANSPORTE DE COMBUSTIVEIS LTDA",
            'POSTO VENI COM DE COMBUSTÍVEIS LT',
            'POSTO VITORIA - VITORIA COMERCIO DE COMBUSTÍVEIS DE VOTUPORANGA LTDA',
            'POSTO VITORIA COMERCIO DE COMBUSTIVEIS LTDA',
            'POSTO VITORIA US COM. COMB. LTDA',
            'POSTO XV 3 HIROCHI E LUCIANA KITAGAWA COMERCIO DE COMBUSTIVE',
            'POSTO ZIL - CHAVES E TANABE REVENDA DE COMBUSTÍVEL E LUBRIFICANTES',
            'PRIMEIRO DA MALUF COMERCIO VAREJISTA DE COMBUSTIV',
            'PSG  BARRETOS COMERCIO DE COMBUSTIVEIS LTDA',
            'PSJ ANHANGUERA COMERCIO DE COMBUSTIVEIS LTDA',
            'PSJ BARRETOS COMERCIO DE COMBUSTÍVEIS LTDA',
            'PSJ GUARIBA COMERCIO DE COMBUSTIVEIS LTDA',
            'PSJ SAO SIMAO COMERCIO DE COMBUSTIVEIS LTDA',
            'PSJ SIMAO COMERCIO DE COMBUSTIVEIS LTDA',
            'PSJ SÃO SIMAO COMERCIO DE COMBUSTIVEL LTDA',
            'PSJGUARIBA COMERCIO DE COMBUSTIVEIS LTDA',
            'R C P OPERADORA DE COMBUSTIVEIS LTDA',
            'R C P OPERADORA DE COMBUSTIVEL LTDA',
            'R R COMBUSTÍVEIS LTDA',
            'R S COMERCIAL DE COMBUSTIVEIS LTDA',
            'R S COMERCIAL DE COMBUSTÍVEIS LTDA',
            'R.C.P.OPERADORA DE COMBUSTIVEIS LTDA',
            'R.S. COMERCIAL DE COMBUSTIVEIS LTDA',
            'RA COMERCIO DE COMBUSTIVEIS E DERIVADOS LTDA',
            'RADIAL LESTE COMERCIO VAREJISTA DE COMBUSTIVEL',
            'RADIAL LESTE COMERCIO VAREJISTA DE COMBUSTIVEL L',
            'RANGER COMERCIO DE COMBUSTÍVEIS LTDA',
            'RDE VIP COMÃ¿RCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'REAL COMERCIO DE COMBUSTIVEIS LTDA',
            'REAL COMERCIO DE COMBUSTIVEIS LTDA EPP',
            'REDE ATIVA SBR DE COMBUSTIVEIS LTDA',
            'REDE B B PETRO COM. DE COMBUSTIVEIS LTDA',
            'REDE BRISAS CLASS COMERCIO DE COMBUSTÁVEIS LTDA',
            'REDE BRISAS PREMIUM COMERCIO DE COMBUSTÍVEL',
            'REDE DITO COM DE COMB E DERIV DE PETROLEO LTDA',
            'REDE MARTHA COM COMBUSTIVEIS LTDA',
            'REDE MARTHA COM. COMBUSTIVEIS LT',
            'REDE MARTHA COMBUSTÍVEIS',
            'REDE MARTHA COMERCIO DE COMBUSTIVEIS LTDA',
            'REDE N BRASIL DE POSTOS DE COMBUSTIVEIS LTDA',
            'REDE ROGER DE POSTOS DE COMBUSTIVEIS LTDA',
            'REDEPOSTO BROTAS COMERCIO DE COMBUSTIVEIS LTDA',
            'REDEPOSTO QUINTANA COMERCIO DE COMBUSTIVEIS LTDA',
            'RELUDIVI JK - RIO PRETO COM DE COMBUSTIVEIS LTDA',
            'RELUDIVI LOGIST. DISTR.COM. COMBUSTIVEIS LTDA',
            'RF COMERCIO DE COMBUSTIVEIS LTDA',
            'RIBEIRO & SOUZA COMERCIO DE COMBUSTIVEIS LTDA',
            'RODO100  COMÉRCIO  DE COMBUSTIVEIS LTDA',
            'RODOANEL SUL COMERCIO VAREJISTA DE COMBUSTIVEIS',
            'RODOANEL SUL COMERCIO VAREJISTA DE COMBUSTIVEIS L',
            'RODOVIA COM. COMBUSTÍVEIS E DER. LTDA.',
            'RODOVIA COMÉRCIO DE COMBUSTIVEIS E DERIVADOS LTDA',
            'RODRIGUES & CORTEZ COMERCIAL DE COMB. LTDA',
            'RODRIGUES & CORTEZ COMERCIAL DE COMB. LTDA.',
            'RONDINELLI COMERCIO DE COMBUSTIVEIS LTDA',
            'ROSA DE SARON COMERCIO DE COMBUSTIVEIS LTDA',
            'ROSSO COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'ROSSO COMERCIO VAREJISTA DE COMBUSTÍVEIS',
            'ROSSO COMÉRCIO VAREJISTA DE COMBUSTÍVEIS LTDA',
            'ROZILENI E ROZINELU COMERCIO DE COMBUSTÍVEL LTDA.',
            'ROZINELI E ROZINELI COMERCIO DE COMBUSTIVEL LTDA',
            'ROZINELI E ROZINELI COMERCIO DE COMBUSTÍVEL LTDA',
            'S A CAVALHEIRO COMBUSTIVEIS EIRELI',
            'SANGIARDI COMERCI VAREJISTA DE COMBUSTIVEIS LTD',
            'SANGIRARDI COMERCIO DE COMBUSTIVEIS LTDA',
            'SANGIRARDI COMERCIO VAREJISTA DE COMBUSTIVEIS LTD',
            'SANGIRARDI COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'SANTA BARBARA COMERCIO VAREJISTA DE COMBUSTIVEIS LTD',
            'SANTOS E ABRAO COM DE COMBUSTIVEIS LTDA',
            'SANTOS E QUEIROZ COMERCIO DE COMBUSTIVEIS LTDA',
            'SANTOS PETROL COMERCIO DE COMBUSTIVEL LTDA',
            'SAO PAULO DOIS COM VAREJO DE COMBUSTIVEIS LTDA',
            'SAO PAULO DOIS COMERIO VAREJISTA DE COMBUSTIVEIS',
            'SHEKYNAH COMERCIO DE COMBUSTIVEIS LTDA',
            'SM COMBUSTIVEIS GUARARAPES LTDA',
            'SOARES E SOARES COMERCIO DE COMBUSTIVEIS LTDA',
            'SOCIEDADE RD DE COMBUSTIVEIS E DERIVADOS LTDA',
            'SOMAR COM DE COMBUST E LUBRIFICANTES LTDA',
            'SUPER POSTO REDE ATIVA COM. COMB. LTDA.',
            'SUPORTE COM COMBUSTIVEIS E SERVICOS LTDA',
            'SUPORTE COM COMBUSTIVEIS E SERVIÇOS LTDA',
            'SUPORTE COMERCIO DE COMBUSTIVEIS E SERVIÇOS LTDA',
            'T M COM DE COMBUSTIVEIS LT',
            'TASCA MARTE COMERCIO DE COMBUSTIVEIS LTDA',
            'TASCA MARTE COMERCIO DE COMBUSTIVEL LTDA',
            'TIETE COMERCIO DE COMBUSTIVEIS E DERIVADOS LTDA',
            'TITA DA IMIGRANTES COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA M',
            'TORQUE COM VAREJISTA COMBUSTÍVEIS',
            'TORTORELLO COM. DE COMBUSTIVEIS LTDA',
            'TREVO DO PESSEGO COM SERV COMB LUB LT',
            'TREVO DO PESSEGO COMERCIO SERV COMB LTDA',
            'TRUCAO CENTRO DE ABASTECIMENTO DE COMBUSTIVEIS',
            'TRUCAO CENTRO DE ABASTECIMENTO DE COMBUSTIVEIS LTDA',
            'TRUCAO CENTRO DE ABASTECIMENTO DE COMBUSTÍVEIS LTDA',
            'TUIM COMERCIO DE COMBUSTIVEIS',
            'TUTOIA COM VERJ DE COMBUSTIVEIS LTDA',
            'TUTOIA COM. VAREJISTA DE COMBUSTIVEIS LTDA',
            'TUTOIA COM. VAREJISTA DE COMBUSTÍVEIS',
            'TUTOIA COMERCIO VAREJ. DE COMBUSTIVEIS LTDA',
            'TUTOIA COMERCIO VAREJ. DE COMBUSTIVEL',
            'TUTOIA COMERCIO VAREJISTA DE COMBUSTIVEIS',
            'TUTOIA COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'TUTOIA COMERCIO VAREJISTA DE COMBUSTIVES LTDA.',
            'TUTOIA COMERCIO VAREJISTA DE COMBUSTÍVEIS LTDA',
            'URUPES COM DE COMBUSTIVEIS E TRANSP LTDA',
            'URUPES COM. DE COMBUSTIVEIS E TRASPORT. LTDA.',
            'VALDEMARIN COM DE COMB E DER DE PETROLEO LTDA',
            'VALDEMARIN4 COM. DE COMBUSTIVEIS E DERIVADOS',
            'VALTER GAVASSA COMBUSTIVEIS LTDA',
            'VANESSA NEZZO VOLPATTI COMBUSTIVEL EIRELI',
            'VENI COM DE COMBUSTIVEIS LT',
            'VENI COM DE COMBUSTÍVEIS LTDA',
            'VENI COM. DE COMBUSTIVEIS LT',
            'VIA INDEPENDENCIA COMERCIO VAREJISTA DE COMBUSTIVEL',
            'VIA INDEPENDÊNCIA COM VAREJISTA DE COMBUSTIVEL',
            'VILELA COMERCIO DE COMBUSTÍVEIS LTDA',
            'VILLAGE COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'VITORIA COMERCIO DE COMBUSTIVEIS LTDA',
            'VITRINE COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'W R D POSTO DE COMBUSTIVEIS LTDA',
            'WERSAN COMERCIO DE COMBUSTIVEIS LTDA',
            'WINNER COMERCIO VAREJISTA DE COMBUSTIVEIS LTDA',
            'WRD POSTO DE COMBUSTIVEIS LTDA',
            'XINGU COMERCIO DE COMBUSTIVEIS LTDA',
            'XINGU COMERCIO DE COMBUSTIVEL LTDA',
            'YOSHIOKA COMERCIO DE COMBUSTIVIS LTDA',
            'ZAMBIASI COMERCIO DE COMBUSTIVEIS LTDA',
            'ZAMPOLI E ZANPOLI COM. DE COMBUSTUVEIS LTDA.',
            'ZANELLA E MATUELLA COMERCIO DE COMBUSTIVEIS LTDA'], 
            'combustivel', inplace=True)

In [103]:
ftcombustivel = df1.fornecedor == 'combustivel'
dtfcombustivel = df1.loc[ftcombustivel]
dtfcombustivel

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
22,300098,2013-02-01,20.00,1.462152e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,combustivel
24,300098,2013-02-01,722.00,6.116149e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,combustivel
26,300098,2013-02-01,30.00,6.116149e+13,C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE...,combustivel
58,300098,2013-03-01,1282.26,6.116149e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,combustivel
93,300098,2013-04-01,1364.28,6.116149e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,combustivel
...,...,...,...,...,...,...
118353,300655,2022-08-01,44.00,1.052947e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,combustivel
118356,300655,2022-08-01,137.13,1.291150e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,combustivel
118358,300655,2022-08-01,183.34,3.519484e+13,A - COMBUSTÍVEIS E LUBRIFICANTES,combustivel
118384,300655,2022-09-01,100.00,4.750757e+12,A - COMBUSTÍVEIS E LUBRIFICANTES,combustivel


## Merge

In [None]:
# criando data frame agregado
# outer = o que encontrar de relação ele adiciona, e o que não encontrar ele repete 
# inner = usar quando você quer todas as colunas preenchidas
# df = df1.merge(df2, how='outer')
# df.head(5)

## Criando DFs Específicos com Filtros

In [105]:
# criando filtros
ftfornecedor = df1.fornecedor == 'hospedagem'
ftano = df1.data.dt.year == 2018
ftmes = df1.data.dt.month == 8

In [106]:
# criando um novo df apenas com informações filtradas
dfhospago2018 = df1.loc[ftfornecedor & ftmes & ftano]

In [107]:
dfhospago2018

Unnamed: 0,matricula,data,valor,cnpj,tipo,fornecedor
4332,300188,2018-08-01,336.0,5327487000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
4335,300188,2018-08-01,138.0,11013200000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
28190,300440,2018-08-01,264.0,3471411000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
38112,300470,2018-08-01,80.0,12326900000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
55079,300519,2018-08-01,295.9,59737840000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
59108,300520,2018-08-01,336.0,6263718000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
59127,300520,2018-08-01,129.0,57687020000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
59132,300520,2018-08-01,445.5,96329450000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
66030,300534,2018-08-01,14.0,14868990000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem
66031,300534,2018-08-01,716.0,15541790000000.0,"I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCO...",hospedagem


In [108]:
# descobrir valor gasto com hospedagem em agosto de 2018
sum(dfhospago2018.valor)

7227.2

In [110]:
# filtro por matricula
ftmatricula = df1.matricula == 300098
dfmatricula = df1.loc[ftmatricula]
# filtro por ano 
ft2020 = df1.data.dt.year == 2020
df2020 = df1.loc[ft2020]
# filtro por range de valor 
ftvalor = (df1.valor > 25) & (df1.valor < 100)
dfvalor = df1.loc[ftvalor]
# filtro por tipo
fttipo = df1.tipo == 'C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE VEÍCULOS ; PEDÁGIOS'
dftipo = df1.loc[fttipo]
# filtro por fornecedor
ftfornecedor = df1.fornecedor.isin(['pedagio', 'hospedagem', 'combustivel'])
dffornecedor = df1.loc[ftfornecedor]

In [112]:
# criando novo df que veja os gastos da categoria C no range de valor 25-100 do ano 2020
dfgeral1 = df1.loc[ft2020 & ftvalor & fttipo]
# filtrando para ver apenas as referidas colunas
dfgeral1[['data', 'valor', 'fornecedor']]

Unnamed: 0,data,valor,fornecedor
4786,2020-03-01,31.2,pedagio
4807,2020-04-01,62.4,pedagio
4935,2020-10-01,78.8,pedagio
9183,2020-03-01,39.4,pedagio
9203,2020-04-01,54.5,pedagio
18655,2020-03-01,63.56,CENTRO DE GESTÃO DE MEIOS DE PAGAMENTO S/A
22135,2020-02-01,50.0,pedagio
38626,2020-01-01,68.8,CENTRO DE GESTÃO DE MEIOS DE PGTO. S/A
38758,2020-05-01,63.4,CENTRO DE GESTÃO DE MEIOS DE PGTO. S/A
38790,2020-07-01,32.0,CENTRO DE GESTÃO DE MEIOS DE PGTO. S/A


In [113]:
# criando novo df que veja os gastos da categoria C no range de valor 25-100 do ano 2020
dfgeral2 = df1.loc[ftmatricula & ftvalor & fttipo]
# filtrando para ver apenas as referidas colunas
dfgeral2[['matricula', 'valor', 'fornecedor']]

Unnamed: 0,matricula,valor,fornecedor
3,300098,36.4,pedagio
26,300098,30.0,combustivel
62,300098,31.0,AUTO ELETRICA SOARES E SILVA LTDA - EPP
96,300098,60.0,combustivel
97,300098,38.6,pedagio
127,300098,30.0,combustivel
221,300098,43.0,pedagio
309,300098,34.0,combustivel
381,300098,68.0,combustivel
410,300098,80.0,NORTE SUL AUTO VIDROS LTDA


## GROUP BY


In [115]:
# quantidade de entradas de gastos da matricula 300098 por ano
dfmatricula.groupby(['data']).size()

data
2013-01-01    21
2013-02-01    30
2013-03-01    33
2013-04-01    34
2013-05-01    31
              ..
2022-05-01    31
2022-06-01    22
2022-07-01    22
2022-08-01    18
2022-09-01    12
Length: 85, dtype: int64

In [116]:
# criando df com vários filtros
dfanovalor = df1.loc[ft2020 & ftvalor]

# agrupando as matriculas que mais tiveram quantidade de compras 
# entre range de 25 a 100 reais no ano 2020
dfanovalor.groupby(['matricula']).size().sort_values(ascending=False).head(10)

matricula
300534    149
300520    135
300631     92
300607     82
300470     77
300609     72
300499     71
300615     64
300644     59
300626     56
dtype: int64

In [117]:
# agrupando quantidades de entradas de gastos por tipo no ano de 2020
df2020.groupby(['tipo']).size()

tipo
A - COMBUSTÍVEIS E LUBRIFICANTES                                      2140
C - MATERIAIS E SERVIÇOS DE MANUT E CONSERV DE VEÍCULOS ; PEDÁGIOS     188
D - MATERIAIS E SERVIÇOS GRÁFICOS, DE CÓPIAS  E REPRODUÇÃO DE DOCS     356
E - MATERIAIS DE ESCRITÓRIO E OUTROS MATERIAIS DE CONSUMO             1159
F - SERVIÇOS TÉCNICOS PROFISSIONAIS (CONSULTORIA, PESQUISAS ETC)       432
G - ASSINATURAS DE PERIÓDICOS, PUBLICAÇÕES, INTERNET E SOFTWARES      1006
H - SERV.UTIL.PÚBLICA (TELEF.MÓVEL/FIXA, ENERGIA, ÁGUA, GÁS ETC)      2031
I - HOSPEDAGEM, ALIMENTAÇÃO E DESPESAS DE LOCOMOÇÃO                   1463
J - SERVIÇOS DE COMUNICAÇÃO                                            226
K - LOCAÇÃO DE BENS MÓVEIS                                            1174
L - LOCAÇÃO DE BENS IMÓVEIS                                            898
M - MANUTENÇÃO DE BENS MÓVEIS,  IMÓVEIS, CONDOMÍNIOS E OUTROS         1338
N - MORADIA                                                            200
O - LOCAÇÃO DE VEÍCU

In [118]:
# as 10 matriculas que mais tiveram entradas de dados 
#de fornecedores pedagio, hospedagem e combustivel
dffornecedor.groupby(['matricula']).size().sort_values(ascending=False).head(10)

matricula
300520    539
300534    380
300470    329
300260    189
300188    181
300583    167
300499    166
300431    148
300449    146
300589    146
dtype: int64

In [119]:
# quantidades de entradas por cnpj (incluindo as entradas que não constam cnpj)
df1.groupby(['cnpj'], dropna=False).size().sort_values(ascending=False)

cnpj
2.558157e+12    5511
4.043254e+13    2787
NaN             1854
4.377652e+13    1644
6.169523e+13    1132
                ... 
1.926974e+13       1
1.926681e+13       1
1.926000e+13       1
1.925057e+13       1
1.726983e+13       1
Length: 13127, dtype: int64

## Plotagem

In [None]:
# plotagem de gráfico de barra
# df.groupby(['uf'], dropna=False).size().sort_values(ascending=False).head(5).plot.bar(figsize=(12,8), xlabel='ESTADO', ylabel='QUANTIDADE DE OCORRÊNCIAS')

In [None]:
# usar linha em variações temporais
# dfquinz.groupby(['dia'], dropna=False).size().sort_values(ascending=False).plot.line(figsize=(12,8))

In [None]:
# usar pizza quando tem no máximo 3 itens (categorias)
# df.groupby(['saida_pista'], dropna=False).size().sort_values(ascending=False).plot.pie(figsize=(8,8))

## Load

In [None]:
#df2.to_csv('cenipa_geral_correto.csv',index=False)