Objetivo:
- Explorar os dados disponíveis
- Ter uma ideia das possibilidades para o Dashboard interativo
- Análise gráfica

# Importando Bibliotecas

In [1]:
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import plotly.express as px
import seaborn as sns
import nbformat

In [2]:
pd.set_option('display.max_columns', None)

# Lendo Base

In [3]:
df = pd.read_csv('../data/df_deputados.csv')
df.drop(columns=['Unnamed: 0'], inplace=True)

In [4]:
df.head()

Unnamed: 0,id,nome,siglaPartido,siglaUf,idLegislatura,urlFoto,email,nomeCivil,cpf,sexo,dataNascimento,ufNascimento,municipioNascimento,escolaridade,ano,mes,tipoDespesa,codDocumento,tipoDocumento,codTipoDocumento,dataDocumento,numDocumento,valorDocumento,urlDocumento,nomeFornecedor,cnpjCpfFornecedor,valorLiquido,valorGlosa,numRessarcimento,codLote,parcela
0,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,11.0,MANUTENÇÃO DE ESCRITÓRIO DE APOIO À ATIVIDADE ...,7837655.0,Nota Fiscal,0.0,2024-11-06T00:00:00,1735,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2092841.0,0.0
1,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,12.0,MANUTENÇÃO DE ESCRITÓRIO DE APOIO À ATIVIDADE ...,7838902.0,Nota Fiscal,0.0,2024-12-03T00:00:00,1806,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2093592.0,0.0
2,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,11.0,COMBUSTÍVEIS E LUBRIFICANTES.,7833232.0,Nota Fiscal Eletrônica,4.0,2024-11-12T14:48:43,432734,333.12,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,333.12,0.0,,2090590.0,0.0
3,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,11.0,COMBUSTÍVEIS E LUBRIFICANTES.,7833238.0,Nota Fiscal Eletrônica,4.0,2024-11-14T17:52:07,433490,300.0,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,300.0,0.0,,2090590.0,0.0
4,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,11.0,COMBUSTÍVEIS E LUBRIFICANTES.,7833235.0,Nota Fiscal Eletrônica,4.0,2024-11-19T19:56:23,434554,330.3,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,330.3,0.0,,2090590.0,0.0


In [5]:
df.columns

Index(['id', 'nome', 'siglaPartido', 'siglaUf', 'idLegislatura', 'urlFoto',
       'email', 'nomeCivil', 'cpf', 'sexo', 'dataNascimento', 'ufNascimento',
       'municipioNascimento', 'escolaridade', 'ano', 'mes', 'tipoDespesa',
       'codDocumento', 'tipoDocumento', 'codTipoDocumento', 'dataDocumento',
       'numDocumento', 'valorDocumento', 'urlDocumento', 'nomeFornecedor',
       'cnpjCpfFornecedor', 'valorLiquido', 'valorGlosa', 'numRessarcimento',
       'codLote', 'parcela'],
      dtype='object')

# Avaliando Partidos Políticos

In [6]:
df_unique_id = df.sort_values(['id']).drop_duplicates('id', keep='first')

## Número de candidatos por Partido

In [7]:
candidatos_por_partido = df_unique_id['siglaPartido'].value_counts()
candidatos_por_partido = pd.DataFrame(candidatos_por_partido).reset_index()
candidatos_por_partido

Unnamed: 0,siglaPartido,count
0,PL,89
1,PT,67
2,UNIÃO,58
3,PP,49
4,REPUBLICANOS,45
5,PSD,44
6,MDB,44
7,PDT,17
8,PODE,15
9,PSB,15


In [8]:
fig = px.bar(candidatos_por_partido, y='count', x='siglaPartido',  text_auto='.2s', title='Candidatos por Partido')
fig.show()

## Classificando partidos

Classificando partidos no espectro ideológico a partir da atuação parlamentar

A seguinte classificação foi feita com base no seguinte artigo - https://pt.wikipedia.org/wiki/Posicionamentos_dos_partidos_brasileiros

Caso tenha alguma observação que possa contribuir, sinta-se a vontade para dizer :)


In [9]:
# novas colunas serão criadas usando _ para a separação - assim saberemos quais foram criadas e quais vieram diretamente da API
# Dicionário com o espectro político de cada partido
espectro_politico = {
    'PL': 'Centro-direita',
    'PT': 'Esquerda',
    'UNIÃO': 'Centro-direita',
    'PP': 'Centro-direita',
    'REPUBLICANOS': 'Direita',
    'PSD': 'Centro',
    'MDB': 'Centro',
    'PDT': 'Centro-esquerda',
    'PODE': 'Centro-direita',
    'PSB': 'Centro-esquerda',
    'PSOL': 'Esquerda',
    'PSDB': 'Centro',
    'PCdoB': 'Esquerda',
    'AVANTE': 'Centro',
    'PV': 'Centro-esquerda',
    'NOVO': 'Direita',
    'PRD': 'Direita',
    'CIDADANIA': 'Centro-esquerda',
    'SOLIDARIEDADE': 'Centro-esquerda',
    'REDE': 'Centro-esquerda'
}

# Adicionando a nova coluna com base no espectro político
df['espectro_politico'] = df['siglaPartido'].map(espectro_politico)

In [10]:
df.head()

Unnamed: 0,id,nome,siglaPartido,siglaUf,idLegislatura,urlFoto,email,nomeCivil,cpf,sexo,dataNascimento,ufNascimento,municipioNascimento,escolaridade,ano,mes,tipoDespesa,codDocumento,tipoDocumento,codTipoDocumento,dataDocumento,numDocumento,valorDocumento,urlDocumento,nomeFornecedor,cnpjCpfFornecedor,valorLiquido,valorGlosa,numRessarcimento,codLote,parcela,espectro_politico
0,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,11.0,MANUTENÇÃO DE ESCRITÓRIO DE APOIO À ATIVIDADE ...,7837655.0,Nota Fiscal,0.0,2024-11-06T00:00:00,1735,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2092841.0,0.0,Centro
1,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,12.0,MANUTENÇÃO DE ESCRITÓRIO DE APOIO À ATIVIDADE ...,7838902.0,Nota Fiscal,0.0,2024-12-03T00:00:00,1806,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2093592.0,0.0,Centro
2,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,11.0,COMBUSTÍVEIS E LUBRIFICANTES.,7833232.0,Nota Fiscal Eletrônica,4.0,2024-11-12T14:48:43,432734,333.12,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,333.12,0.0,,2090590.0,0.0,Centro
3,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,11.0,COMBUSTÍVEIS E LUBRIFICANTES.,7833238.0,Nota Fiscal Eletrônica,4.0,2024-11-14T17:52:07,433490,300.0,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,300.0,0.0,,2090590.0,0.0,Centro
4,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,1983-09-28,AP,Macapá,Superior,2024.0,11.0,COMBUSTÍVEIS E LUBRIFICANTES.,7833235.0,Nota Fiscal Eletrônica,4.0,2024-11-19T19:56:23,434554,330.3,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,330.3,0.0,,2090590.0,0.0,Centro


In [11]:
df.groupby(['espectro_politico'])['valorLiquido'].sum().sort_values(ascending=False)

espectro_politico
Centro-direita     6786709.35
Centro             3710641.56
Esquerda           2429761.54
Direita            1940812.11
Centro-esquerda    1158041.40
Name: valorLiquido, dtype: float64

In [12]:
df.groupby(['nomeCivil'])['valorLiquido'].sum().sort_values(ascending=False)

nomeCivil
MARCO ANTÔNIO FELICIANO                282208.37
ALCIDES RIBEIRO FILHO                  273304.67
GLAUSKSTON BATISTA RIOS                260066.80
GABRIEL MOTA E SILVA                   232991.56
LUIZ AUGUSTO CARVALHO RIBEIRO FILHO    229433.34
                                         ...    
ERIKA SANTOS SILVA                       2428.87
DANIEL BARBOSA DE ALMEIDA SILVA          2124.10
MARCOS ROBERIO RIBEIRO MONTEIRO          1883.00
GILVAN AGUIAR COSTA                      1803.77
JOSÉ OLIMPIO SILVEIRA MORAES             1206.11
Name: valorLiquido, Length: 509, dtype: float64

In [13]:
df_unique_id['espectro_politico'] = df_unique_id['siglaPartido'].map(espectro_politico)

In [14]:
espectro_politico = df_unique_id['espectro_politico'].value_counts()
espectro_politico = pd.DataFrame(espectro_politico).reset_index()
espectro_politico

Unnamed: 0,espectro_politico,count
0,Centro-direita,211
1,Centro,109
2,Esquerda,88
3,Direita,55
4,Centro-esquerda,46


In [15]:
fig = px.bar(espectro_politico, y='count', x='espectro_politico',  text_auto='.2s', title='Espectro político')
fig.show()

# Avaliando Gastos

In [16]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7597 entries, 0 to 7596
Data columns (total 32 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   id                   7597 non-null   int64  
 1   nome                 7597 non-null   object 
 2   siglaPartido         7597 non-null   object 
 3   siglaUf              7597 non-null   object 
 4   idLegislatura        7597 non-null   int64  
 5   urlFoto              7597 non-null   object 
 6   email                7597 non-null   object 
 7   nomeCivil            7597 non-null   object 
 8   cpf                  7597 non-null   int64  
 9   sexo                 7597 non-null   object 
 10  dataNascimento       7597 non-null   object 
 11  ufNascimento         7597 non-null   object 
 12  municipioNascimento  7597 non-null   object 
 13  escolaridade         7452 non-null   object 
 14  ano                  7597 non-null   float64
 15  mes                  7597 non-null   f

In [17]:
gastos = df.groupby('tipoDespesa')['valorLiquido'].sum().sort_values(ascending=False)
gastos = pd.DataFrame(gastos).reset_index()
gastos['numero_despesas'] = gastos['tipoDespesa'].map(df['tipoDespesa'].value_counts())
gastos

Unnamed: 0,tipoDespesa,valorLiquido,numero_despesas
0,DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR.,7300411.3,588
1,MANUTENÇÃO DE ESCRITÓRIO DE APOIO À ATIVIDADE ...,5818586.74,3214
2,COMBUSTÍVEIS E LUBRIFICANTES.,1522687.16,3322
3,LOCAÇÃO OU FRETAMENTO DE VEÍCULOS AUTOMOTORES,725317.86,96
4,PASSAGEM AÉREA - SIGEPA,262376.42,232
5,LOCAÇÃO OU FRETAMENTO DE AERONAVES,216182.71,9
6,SERVIÇO DE SEGURANÇA PRESTADO POR EMPRESA ESPE...,64694.48,10
7,LOCAÇÃO OU FRETAMENTO DE EMBARCAÇÕES,37800.0,7
8,"HOSPEDAGEM ,EXCETO DO PARLAMENTAR NO DISTRITO ...",23551.23,18
9,PASSAGEM AÉREA - REEMBOLSO,20921.54,7


In [18]:
df_atividade_parlamentar = df[df['tipoDespesa'] == 'DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR.']
gastos_divulgacao = df_atividade_parlamentar.groupby('nomeFornecedor')['valorLiquido'].sum().sort_values(ascending=False)
gastos_divulgacao = pd.DataFrame(gastos_divulgacao).reset_index()
gastos_divulgacao['numero_despesas'] = gastos_divulgacao['nomeFornecedor'].map(df_atividade_parlamentar['nomeFornecedor'].value_counts())
# Adicionando uma nova coluna com o nome do deputado responsável pela despesa
gastos_divulgacao = gastos_divulgacao.merge(
    df_atividade_parlamentar[['nomeFornecedor', 'nomeCivil']],
    on='nomeFornecedor',
    how='left'
)

gastos_divulgacao

Unnamed: 0,nomeFornecedor,valorLiquido,numero_despesas,nomeCivil
0,STUDIO AB - CRIATIVIDADE VISUAL EIRELI - EPP,234870.0,3,MARCO ANTÔNIO FELICIANO
1,STUDIO AB - CRIATIVIDADE VISUAL EIRELI - EPP,234870.0,3,MARCO ANTÔNIO FELICIANO
2,STUDIO AB - CRIATIVIDADE VISUAL EIRELI - EPP,234870.0,3,MARCO ANTÔNIO FELICIANO
3,FLEX PRINT GRAFICA EIRELI,197854.0,6,GLAUSKSTON BATISTA RIOS
4,FLEX PRINT GRAFICA EIRELI,197854.0,6,GLAUSKSTON BATISTA RIOS
...,...,...,...,...
583,Elison da Conceicao Antunes Menezes 0011274514...,300.0,1,LUCIENE CAVALCANTE DA SILVA
584,AVA COMUNICACAO,240.0,2,DAGOBERTO NOGUEIRA FILHO
585,AVA COMUNICACAO,240.0,2,DAGOBERTO NOGUEIRA FILHO
586,Bureau de Tecnologia LTDA,130.0,2,LUIZ PHILIPPE DE ORLEANS BRAGANÇA


In [19]:
filtro = df_atividade_parlamentar[df_atividade_parlamentar['nomeFornecedor'] == 'STUDIO AB - CRIATIVIDADE VISUAL EIRELI - EPP']
filtro

Unnamed: 0,id,nome,siglaPartido,siglaUf,idLegislatura,urlFoto,email,nomeCivil,cpf,sexo,dataNascimento,ufNascimento,municipioNascimento,escolaridade,ano,mes,tipoDespesa,codDocumento,tipoDocumento,codTipoDocumento,dataDocumento,numDocumento,valorDocumento,urlDocumento,nomeFornecedor,cnpjCpfFornecedor,valorLiquido,valorGlosa,numRessarcimento,codLote,parcela,espectro_politico
6160,160601,Pr. Marco Feliciano,PL,SP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.pr.marcofeliciano@camara.leg.br,MARCO ANTÔNIO FELICIANO,13117532811,M,1972-10-12,SP,Orlândia,Superior,2024.0,11.0,DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR.,7835839.0,Nota Fiscal,0.0,2024-11-26T00:00:00,1771,65000.0,https://www.camara.leg.br/cota-parlamentar/doc...,STUDIO AB - CRIATIVIDADE VISUAL EIRELI - EPP,35029940000000.0,65000.0,0.0,,2091912.0,0.0,Centro-direita
6161,160601,Pr. Marco Feliciano,PL,SP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.pr.marcofeliciano@camara.leg.br,MARCO ANTÔNIO FELICIANO,13117532811,M,1972-10-12,SP,Orlândia,Superior,2024.0,10.0,DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR.,7835829.0,Nota Fiscal,0.0,2024-11-26T00:00:00,1770,70000.0,https://www.camara.leg.br/cota-parlamentar/doc...,STUDIO AB - CRIATIVIDADE VISUAL EIRELI - EPP,35029940000000.0,70000.0,0.0,,2091910.0,0.0,Centro-direita
6162,160601,Pr. Marco Feliciano,PL,SP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.pr.marcofeliciano@camara.leg.br,MARCO ANTÔNIO FELICIANO,13117532811,M,1972-10-12,SP,Orlândia,Superior,2024.0,12.0,DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR.,7850688.0,Nota Fiscal,0.0,2024-12-20T00:00:00,1778,99870.0,https://www.camara.leg.br/cota-parlamentar/doc...,STUDIO AB - CRIATIVIDADE VISUAL EIRELI - EPP,35029940000000.0,99870.0,0.0,,2099989.0,0.0,Centro-direita
