# Relatório de Análises
O seguinte projeto visa obter dados da transparência governamental, focados nos últimos quatro anos do Senado brasileiro (CEAP - Cota para Exercício da Atividade Parlamentar). O objetivo deste projeto é praticar as principais ferramentas envolvendo Ciência de Dados e produzir um relatório completo através da linguagem de programação Python, do programa de DataViz Power BI e aplicar conceitos introdutórios de Machine Learning.

A ideia por trás é simular a Operação Serenata de Amor, que utilizou-se do algoritmo Rosie, uma inteligência artificial capaz de analisar os gastos reembolsados pela CEAP, de deputados federais e senadores, feitos em exercício de sua função, identificando suspeitas e incentivando a população a questioná-los.

In [None]:
# Importando pacotes de Análise de Dados

import pandas as pd
import numpy as np

In [None]:
# Importação de dados

url = 'https://www.senado.gov.br/transparencia/LAI/verba/despesa_ceaps_'

# Aqui estamos agrupando as planilhas de 2010 a 2023, através do método concat e codificando a leitura do arquivo para facilitar a manipulação dos dados
dados_ceaps = pd.concat(pd.read_csv(url+str(ano)+'.csv', encoding='ISO-8859-1', sep=';', skiprows=1) for ano in range(2010,2023))
dados_ceaps.reset_index(drop=True, inplace=True) # Nessa linha corrigimos o índice com o método reset_index

In [None]:
dados_ceaps.head(10)

Unnamed: 0,ANO,MES,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DOCUMENTO,DATA,DETALHAMENTO,VALOR_REEMBOLSADO,COD_DOCUMENTO
0,2010,1,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA,045216-3,19/01/2010,,5908,277219.0
1,2010,1,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDônia,0454206-1,19/01/2010,,4047,277218.0
2,2010,1,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",004.948.028-63,GILBERTO PISELO DO NASCIMENTO,,12/01/2010,,5000,229109.0
3,2010,1,ACIR GURGACZ,Divulgação da atividade parlamentar,09.040.457/0001-02,CENTRAL RONDÔNIA.COM,000003,05/01/2010,,1500,268264.0
4,2010,1,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",15.896.509/0001-31,POSTO FORTALEZA,018215,07/01/2010,,30,268265.0
5,2010,1,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",15.896.509/0001-31,POSTO FORTALEZA,018884,27/01/2010,,111,268266.0
6,2010,1,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",63.755.391/0001-74,VICENTE & TESTONI LTDA,050501,07/01/2010,,100,268268.0
7,2010,1,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",63.755.391/0001-74,vicente & testoni ltda,050201,02/01/2010,,50,268267.0
8,2010,2,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA - CERON,0452163-3,19/02/2010,,4027,277223.0
9,2010,2,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA - CERON,0454206-1,19/02/2010,,6927,277222.0


In [None]:
dados_ceaps.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 298962 entries, 0 to 298961
Data columns (total 11 columns):
 #   Column             Non-Null Count   Dtype  
---  ------             --------------   -----  
 0   ANO                298962 non-null  int64  
 1   MES                298962 non-null  int64  
 2   SENADOR            298962 non-null  object 
 3   TIPO_DESPESA       298962 non-null  object 
 4   CNPJ_CPF           298962 non-null  object 
 5   FORNECEDOR         298962 non-null  object 
 6   DOCUMENTO          278736 non-null  object 
 7   DATA               298962 non-null  object 
 8   DETALHAMENTO       180616 non-null  object 
 9   VALOR_REEMBOLSADO  298962 non-null  object 
 10  COD_DOCUMENTO      298960 non-null  float64
dtypes: float64(1), int64(2), object(8)
memory usage: 25.1+ MB


In [None]:
dados_ceaps.tail()

Unnamed: 0,ANO,MES,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DOCUMENTO,DATA,DETALHAMENTO,VALOR_REEMBOLSADO,COD_DOCUMENTO
298957,2022,12,ZEQUINHA MARINHO,"Passagens aéreas, aquáticas e terrestres nacio...",22.052.777/0001-32,Exceller Tour,WIXHAI,06/12/2022,"Companhia Aérea: LATAM, Localizador: WIXHAI. P...",289304,2191398.0
298958,2022,12,ZEQUINHA MARINHO,"Passagens aéreas, aquáticas e terrestres nacio...",22.052.777/0001-32,Exceller Tour,WITOLM,09/12/2022,"Companhia Aérea: GOL, Localizador: WITOLM. Pas...",118019,2192272.0
298959,2022,12,ZEQUINHA MARINHO,"Passagens aéreas, aquáticas e terrestres nacio...",22.052.777/0001-32,Exceller Tour,THPKVQ,20/12/2022,"Companhia Aérea: TAM, Localizador: THPKVQ. Pas...",26719,2192274.0
298960,2022,12,ZEQUINHA MARINHO,"Passagens aéreas, aquáticas e terrestres nacio...",22.052.777/0001-32,Exceller Tour,QNN9HX,21/12/2022,"Companhia Aérea: AZUL, Localizador: QNN9HX. Pa...",133431,2192244.0
298961,2022,12,ZEQUINHA MARINHO,"Passagens aéreas, aquáticas e terrestres nacio...",22.052.777/0001-32,Exceller Tour,WMQWBX,30/12/2022,"Companhia Aérea: TAM, Localizador: WMQWBX. Pas...",225072,2193622.0


In [None]:
dados_ceaps.isnull().sum()

ANO                       0
MES                       0
SENADOR                   0
TIPO_DESPESA              0
CNPJ_CPF                  0
FORNECEDOR                0
DOCUMENTO             20226
DATA                      0
DETALHAMENTO         118346
VALOR_REEMBOLSADO         0
COD_DOCUMENTO             2
dtype: int64

In [None]:
dados_ceaps.isnull().sum()/dados_ceaps.shape[0]*100

ANO                   0.000000
MES                   0.000000
SENADOR               0.000000
TIPO_DESPESA          0.000000
CNPJ_CPF              0.000000
FORNECEDOR            0.000000
DOCUMENTO             6.765408
DATA                  0.000000
DETALHAMENTO         39.585633
VALOR_REEMBOLSADO     0.000000
COD_DOCUMENTO         0.000669
dtype: float64

In [None]:
dados_ceaps[dados_ceaps['COD_DOCUMENTO'].duplicated(keep = False)]

Unnamed: 0,ANO,MES,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DOCUMENTO,DATA,DETALHAMENTO,VALOR_REEMBOLSADO,COD_DOCUMENTO
131284,2015,8,EDUARDO AMORIM,"Passagens aéreas, aquáticas e terrestres nacio...",13.353.495/0001-84,PROPAGTUR - Propag Turismo Ltda,"SEM FATURA"";02/08/2015""","Companhia Aérea: TAM, Localizador: YXGDSJ. Pas...",46953,2014675,
131291,2015,8,EDUARDO AMORIM,"Passagens aéreas, aquáticas e terrestres nacio...",13.353.495/0001-84,PROPAGTUR - Propag Turismo Ltda,"¨¨SEM FATURA"";17/08/2015""","Companhia Aérea: AVIANCA, Localizador: ZNEU9F....",46045,2016557,


In [None]:
duplicado1 = 131284

dados_ceaps.loc[duplicado1, 'COD_DOCUMENTO'] = dados_ceaps.loc[duplicado1, 'VALOR_REEMBOLSADO']
dados_ceaps.loc[duplicado1, 'VALOR_REEMBOLSADO'] = dados_ceaps.loc[duplicado1, 'DETALHAMENTO']
dados_ceaps.loc[duplicado1, 'DETALHAMENTO'] = dados_ceaps.loc[duplicado1, 'DATA']
dados_ceaps.loc[duplicado1, 'DATA'] = '02/08/2015'
dados_ceaps.loc[duplicado1, 'DOCUMENTO'] = 'SEM FATURA'
dados_ceaps.loc[duplicado1, 'VALOR_REEMBOLSADO'] = 469.53

duplicado2 = 131291

dados_ceaps.loc[duplicado2, 'COD_DOCUMENTO'] = dados_ceaps.loc[duplicado2, 'VALOR_REEMBOLSADO']
dados_ceaps.loc[duplicado2, 'VALOR_REEMBOLSADO'] = dados_ceaps.loc[duplicado2, 'DETALHAMENTO']
dados_ceaps.loc[duplicado2, 'DETALHAMENTO'] = dados_ceaps.loc[duplicado2, 'DATA']
dados_ceaps.loc[duplicado2, 'DATA'] = '17/08/2015'
dados_ceaps.loc[duplicado2, 'DOCUMENTO'] = 'SEM FATURA'
dados_ceaps.loc[duplicado2, 'VALOR_REEMBOLSADO'] = 460.45

dados_ceaps.loc[[duplicado1 ,duplicado2]]

Unnamed: 0,ANO,MES,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DOCUMENTO,DATA,DETALHAMENTO,VALOR_REEMBOLSADO,COD_DOCUMENTO
131284,2015,8,EDUARDO AMORIM,"Passagens aéreas, aquáticas e terrestres nacio...",13.353.495/0001-84,PROPAGTUR - Propag Turismo Ltda,SEM FATURA,02/08/2015,"Companhia Aérea: TAM, Localizador: YXGDSJ. Pas...",469.53,2014675
131291,2015,8,EDUARDO AMORIM,"Passagens aéreas, aquáticas e terrestres nacio...",13.353.495/0001-84,PROPAGTUR - Propag Turismo Ltda,SEM FATURA,17/08/2015,"Companhia Aérea: AVIANCA, Localizador: ZNEU9F....",460.45,2016557


In [None]:
dados_ceaps[dados_ceaps['COD_DOCUMENTO'].duplicated(keep = False)]

Unnamed: 0,ANO,MES,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DOCUMENTO,DATA,DETALHAMENTO,VALOR_REEMBOLSADO,COD_DOCUMENTO


In [None]:
dados_ceaps['DETALHAMENTO'].unique()

array([nan,
       'BILHETE UTILIZADO PELO SENADOR ACIR GURGACZ. TRECHO: BRASÍLIA/ CUIABÁ. TAM-VOO-JJ-3648. DIA22/JUN/2011.',
       'BILHETE UTILIZADO PELO SENADOR ACIR GURGACZ. TRECHO: PORTO VELHO/BRASÍLIA. TAM-VOO-JJ-3687. DIA-27/JUN/2011.',
       ...,
       'Companhia Aérea: TAM, Localizador: THPKVQ. Passageiros: JOSÉ DA CRUZ MARINHO (Matrícula 341141, PARLAMENTAR), Voo: 3608 - BSB/BELÉM - 22/12/2022;',
       'Companhia Aérea: AZUL, Localizador: QNN9HX. Passageiros: JOSÉ DA CRUZ MARINHO (Matrícula 341141, PARLAMENTAR), Voo: 4112 - BEL/MAB - 23/12/2022;',
       'Companhia Aérea: TAM, Localizador: WMQWBX. Passageiros: YURI PEREIRA CARNEIRO AGE (Matrícula 300461, COMISSIONADO), Voo: 3608 - BSB/BELÉM - 08/01/2023; YURI PEREIRA CARNEIRO AGE (Matrícula 300461, COMISSIONADO), Voo: 3609 - BELÉM/BSB - 20/01/2023;'],
      dtype=object)

In [None]:
dados_ceaps['TIPO_DESPESA'].unique()

array(['Aluguel de imóveis para escritório político, compreendendo despesas concernentes a eles.',
       'Divulgação da atividade parlamentar',
       'Locomoção, hospedagem, alimentação, combustíveis e lubrificantes',
       'Aquisição de material de consumo para uso no escritório político, inclusive aquisição ou locação de software, despesas postais, aquisição de publicações, locação de móveis e de equipamentos. ',
       'Contratação de consultorias, assessorias, pesquisas, trabalhos técnicos e outros serviços de apoio ao exercício do mandato parlamentar',
       'Passagens aéreas, aquáticas e terrestres nacionais',
       'Serviços de Segurança Privada'], dtype=object)

In [None]:
dados_copia = dados_ceaps.copy # Cópia dos dados

dados_ceaps = dados_ceaps.drop(columns = ['DOCUMENTO', 'COD_DOCUMENTO']) # removendo DOCUMENTO E COD_DOCUMENTO

dados_ceaps.loc[dados_ceaps['DETALHAMENTO'].isnull(), 'DETALHAMENTO'] = dados_ceaps[dados_ceaps['DETALHAMENTO'].isnull()]['TIPO_DESPESA'] # preenchendo dados ausentes

In [None]:
dados_ceaps.isnull().sum()

ANO                  0
MES                  0
SENADOR              0
TIPO_DESPESA         0
CNPJ_CPF             0
FORNECEDOR           0
DATA                 0
DETALHAMENTO         0
VALOR_REEMBOLSADO    0
dtype: int64

In [None]:
dados_ceaps.dtypes

ANO                   int64
MES                   int64
SENADOR              object
TIPO_DESPESA         object
CNPJ_CPF             object
FORNECEDOR           object
DATA                 object
DETALHAMENTO         object
VALOR_REEMBOLSADO    object
dtype: object

In [None]:
fix_data = pd.to_datetime(dados_ceaps['DATA'], dayfirst=True, errors='coerce')
fix_data[fix_data.isna()]

135720   NaT
137188   NaT
137541   NaT
143923   NaT
143927   NaT
148328   NaT
153609   NaT
163856   NaT
165036   NaT
165151   NaT
169396   NaT
184799   NaT
193933   NaT
194164   NaT
196713   NaT
204631   NaT
219150   NaT
221768   NaT
240687   NaT
261697   NaT
267573   NaT
Name: DATA, dtype: datetime64[ns]

In [None]:
dados_ceaps['DATA'] = dados_ceaps.apply(lambda x: '010'+str(x['MES'])+str(x['ANO']) if x['MES'] < 10 else '01'+str(x['MES'])+str(x['ANO']), axis=1)
dados_ceaps['DATA'] = pd.to_datetime(dados_ceaps['DATA'], format='%d%m%Y').dt.normalize()

In [None]:
dados_ceaps = dados_ceaps.drop(columns = ['ANO', 'MES'])
dados_ceaps.sort_values(by='DATA')

Unnamed: 0,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DATA,DETALHAMENTO,VALOR_REEMBOLSADO
0,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA,2010-01-01,"Aluguel de imóveis para escritório político, c...",5908
12971,MOZARILDO CAVALCANTI,Aquisição de material de consumo para uso no e...,07.575.651/0001-59,VRG Linhas Aéreas S/A.,2010-01-01,Aquisição de material de consumo para uso no e...,16
12970,MOZARILDO CAVALCANTI,Aquisição de material de consumo para uso no e...,07.575.651/0001-59,VRG Linhas Aéreas S/A.,2010-01-01,Aquisição de material de consumo para uso no e...,378
12969,MOZARILDO CAVALCANTI,Aquisição de material de consumo para uso no e...,07.575.651/0001-59,VRG Linhas Aéreas S/A.,2010-01-01,Aquisição de material de consumo para uso no e...,368
12968,MOZARILDO CAVALCANTI,Aquisição de material de consumo para uso no e...,07.575.651/0001-59,VRG Linhas Aéreas S/A.,2010-01-01,Aquisição de material de consumo para uso no e...,378
...,...,...,...,...,...,...,...
285908,ELMANO FÉRRER,"Locomoção, hospedagem, alimentação, combustíve...",23.523.384/0006-37,SANTOS IND E COM LTDA,2022-12-01,REFERENTE À DESPESA COM COMBUSTÍVEL.,38808
285909,ELMANO FÉRRER,"Passagens aéreas, aquáticas e terrestres nacio...",02.012.862/0001-60,TAM LINHAS AÉREAS S.A.,2022-12-01,"Companhia Aérea: TAM, Localizador: LWKQRB. Pas...",304364
285910,ELMANO FÉRRER,"Passagens aéreas, aquáticas e terrestres nacio...",02.012.862/0001-60,TAM LINHAS AÉREAS S.A.,2022-12-01,"Companhia Aérea: TAM, Localizador: YEJEXA. Pas...",322146
285912,ELMANO FÉRRER,Serviços de Segurança Privada,03.582.594/0001-84,SECOPI - SERVIÇOS COMERCIAIS DO PIAUÍ LTDA.,2022-12-01,REFERENTE À DESPESA COM SERVIÇO DE SEGURANÇA E...,55198


In [None]:
dados_ceaps['CORREÇÃO_VALORES'] = dados_ceaps['VALOR_REEMBOLSADO'].str.replace(',', '.')

In [None]:
dados_ceaps.head(10)

Unnamed: 0,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DATA,DETALHAMENTO,VALOR_REEMBOLSADO,CORREÇÃO_VALORES
0,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA,2010-01-01,"Aluguel de imóveis para escritório político, c...",5908,59.08
1,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDônia,2010-01-01,"Aluguel de imóveis para escritório político, c...",4047,40.47
2,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",004.948.028-63,GILBERTO PISELO DO NASCIMENTO,2010-01-01,"Aluguel de imóveis para escritório político, c...",5000,5000.0
3,ACIR GURGACZ,Divulgação da atividade parlamentar,09.040.457/0001-02,CENTRAL RONDÔNIA.COM,2010-01-01,Divulgação da atividade parlamentar,1500,1500.0
4,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",15.896.509/0001-31,POSTO FORTALEZA,2010-01-01,"Locomoção, hospedagem, alimentação, combustíve...",30,30.0
5,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",15.896.509/0001-31,POSTO FORTALEZA,2010-01-01,"Locomoção, hospedagem, alimentação, combustíve...",111,111.0
6,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",63.755.391/0001-74,VICENTE & TESTONI LTDA,2010-01-01,"Locomoção, hospedagem, alimentação, combustíve...",100,100.0
7,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",63.755.391/0001-74,vicente & testoni ltda,2010-01-01,"Locomoção, hospedagem, alimentação, combustíve...",50,50.0
8,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA - CERON,2010-02-01,"Aluguel de imóveis para escritório político, c...",4027,40.27
9,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA - CERON,2010-02-01,"Aluguel de imóveis para escritório político, c...",6927,69.27


In [None]:
dados_ceaps['CORREÇÃO_VALORES'] = dados_ceaps['CORREÇÃO_VALORES'].str.replace('1\r\n675.55', '1675.55')
dados_ceaps.head()

  dados_ceaps['CORREÇÃO_VALORES'] = dados_ceaps['CORREÇÃO_VALORES'].str.replace('1\r\n675.55', '1675.55')


Unnamed: 0,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DATA,DETALHAMENTO,VALOR_REEMBOLSADO,CORREÇÃO_VALORES
0,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA,2010-01-01,"Aluguel de imóveis para escritório político, c...",5908,59.08
1,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDônia,2010-01-01,"Aluguel de imóveis para escritório político, c...",4047,40.47
2,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",004.948.028-63,GILBERTO PISELO DO NASCIMENTO,2010-01-01,"Aluguel de imóveis para escritório político, c...",5000,5000.0
3,ACIR GURGACZ,Divulgação da atividade parlamentar,09.040.457/0001-02,CENTRAL RONDÔNIA.COM,2010-01-01,Divulgação da atividade parlamentar,1500,1500.0
4,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",15.896.509/0001-31,POSTO FORTALEZA,2010-01-01,"Locomoção, hospedagem, alimentação, combustíve...",30,30.0


In [None]:
dados_ceaps['CORREÇÃO_VALORES'] = dados_ceaps['CORREÇÃO_VALORES'].astype(float)
dados_ceaps.head()

Unnamed: 0,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DATA,DETALHAMENTO,VALOR_REEMBOLSADO,CORREÇÃO_VALORES
0,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA,2010-01-01,"Aluguel de imóveis para escritório político, c...",5908,59.08
1,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDônia,2010-01-01,"Aluguel de imóveis para escritório político, c...",4047,40.47
2,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",004.948.028-63,GILBERTO PISELO DO NASCIMENTO,2010-01-01,"Aluguel de imóveis para escritório político, c...",5000,5000.0
3,ACIR GURGACZ,Divulgação da atividade parlamentar,09.040.457/0001-02,CENTRAL RONDÔNIA.COM,2010-01-01,Divulgação da atividade parlamentar,1500,1500.0
4,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",15.896.509/0001-31,POSTO FORTALEZA,2010-01-01,"Locomoção, hospedagem, alimentação, combustíve...",30,30.0


In [None]:
dados_ceaps['VALOR_REEMBOLSADO'] = dados_ceaps['CORREÇÃO_VALORES']
dados_ceaps.head()

Unnamed: 0,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DATA,DETALHAMENTO,VALOR_REEMBOLSADO,CORREÇÃO_VALORES
0,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA,2010-01-01,"Aluguel de imóveis para escritório político, c...",59.08,59.08
1,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDônia,2010-01-01,"Aluguel de imóveis para escritório político, c...",40.47,40.47
2,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",004.948.028-63,GILBERTO PISELO DO NASCIMENTO,2010-01-01,"Aluguel de imóveis para escritório político, c...",5000.0,5000.0
3,ACIR GURGACZ,Divulgação da atividade parlamentar,09.040.457/0001-02,CENTRAL RONDÔNIA.COM,2010-01-01,Divulgação da atividade parlamentar,1500.0,1500.0
4,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",15.896.509/0001-31,POSTO FORTALEZA,2010-01-01,"Locomoção, hospedagem, alimentação, combustíve...",30.0,30.0


In [None]:
dados_ceaps = dados_ceaps.drop(columns = ['CORREÇÃO_VALORES'])
dados_ceaps.head()

Unnamed: 0,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DATA,DETALHAMENTO,VALOR_REEMBOLSADO
0,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDÔNIA,2010-01-01,"Aluguel de imóveis para escritório político, c...",59.08
1,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",05.914.650/0001-66,CENTRAIS ELÉTRICAS DE RONDônia,2010-01-01,"Aluguel de imóveis para escritório político, c...",40.47
2,ACIR GURGACZ,"Aluguel de imóveis para escritório político, c...",004.948.028-63,GILBERTO PISELO DO NASCIMENTO,2010-01-01,"Aluguel de imóveis para escritório político, c...",5000.0
3,ACIR GURGACZ,Divulgação da atividade parlamentar,09.040.457/0001-02,CENTRAL RONDÔNIA.COM,2010-01-01,Divulgação da atividade parlamentar,1500.0
4,ACIR GURGACZ,"Locomoção, hospedagem, alimentação, combustíve...",15.896.509/0001-31,POSTO FORTALEZA,2010-01-01,"Locomoção, hospedagem, alimentação, combustíve...",30.0


In [None]:
dados_ceaps.dtypes

SENADOR                      object
TIPO_DESPESA                 object
CNPJ_CPF                     object
FORNECEDOR                   object
DATA                 datetime64[ns]
DETALHAMENTO                 object
VALOR_REEMBOLSADO           float64
dtype: object

In [None]:
dados_ceaps.describe()

Unnamed: 0,VALOR_REEMBOLSADO
count,298960.0
mean,1005.557058
std,2578.904111
min,-1500.0
25%,100.02
50%,296.53
75%,1000.0
max,270000.0


In [None]:
dados_ceaps.query('VALOR_REEMBOLSADO <-1')

Unnamed: 0,SENADOR,TIPO_DESPESA,CNPJ_CPF,FORNECEDOR,DATA,DETALHAMENTO,VALOR_REEMBOLSADO
133386,GLADSON CAMELI,"Aluguel de imóveis para escritório político, c...",63.600.449/0001-00,Arras Adm. de Bens Imóveis Limpeza e Conservaç...,2015-02-01,Contrato de locação de Imóvel comercial do esc...,-1500.0
144296,RANDOLFE RODRIGUES,"Passagens aéreas, aquáticas e terrestres nacio...",02.012.862/0001-60,Tam Linhas Aereas S/A,2015-01-01,"9572100929351 - R$ 1.298,93 (1º bilhete emitid...",-9.0
182570,DÁRIO BERGER,"Contratação de consultorias, assessorias, pesq...",73.228.876/0001-63,TV CLIPAGEM LTDA. EPP.,2017-05-01,Despesa com Monitoramento de Informação Jornal...,-243.4


In [None]:
dados_ceaps.loc[133386	, 'VALOR_REEMBOLSADO'] = dados_ceaps.loc[133386	, 'VALOR_REEMBOLSADO']* -1
dados_ceaps.loc[133386	, 'VALOR_REEMBOLSADO']

1500.0

In [None]:
dados_ceaps.loc[144296, 'DETALHAMENTO']

'9572100929351 - R$ 1.298,93 (1º bilhete emitido) 9572102224403 - R$ 1.418,93 (1ª remarcação) 9572104023443 - R$ 1.498,93 (2ª remarcação) 9572104373256 - R$ 2.412,03 (3ª remarcação - bilhete utilizado)'

In [None]:
dados_ceaps.loc[144296, 'VALOR_REEMBOLSADO'] = 2412.03
dados_ceaps.loc[144296, 'VALOR_REEMBOLSADO']

2412.03

In [None]:
dados_ceaps.loc[182570, 'DETALHAMENTO']

'Despesa com Monitoramento de Informação Jornalística em Mídia Eletrônica e Imprensa'

In [None]:
dados_ceaps.loc[182570, 'VALOR_REEMBOLSADO'] = 243.40
dados_ceaps.loc[182570, 'VALOR_REEMBOLSADO']

243.4

In [None]:
dados_ceaps.to_csv('dados_2010_2022.csv', sep=';', index = False)