Objetivo:
- Explorar os dados disponíveis
- Ter uma ideia das possibilidades para o Dashboard interativo
- Análise gráfica

# Importando Bibliotecas

In [2]:
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import plotly.express as px
import seaborn as sns

# Lendo Base

In [3]:
df = pd.read_csv('../data/df_deputados.csv')
df.drop(columns=['Unnamed: 0'], inplace=True)

In [4]:
df.head()

Unnamed: 0,id,nome,siglaPartido,siglaUf,idLegislatura,urlFoto,email,nomeCivil,cpf,sexo,...,numDocumento,valorDocumento,urlDocumento,nomeFornecedor,cnpjCpfFornecedor,valorLiquido,valorGlosa,numRessarcimento,codLote,parcela
0,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,1735,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2092841.0,0.0
1,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,1806,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2093592.0,0.0
2,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,432734,333.12,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,333.12,0.0,,2090590.0,0.0
3,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,433490,300.0,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,300.0,0.0,,2090590.0,0.0
4,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,434554,330.3,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,330.3,0.0,,2090590.0,0.0


In [5]:
df.columns

Index(['id', 'nome', 'siglaPartido', 'siglaUf', 'idLegislatura', 'urlFoto',
       'email', 'nomeCivil', 'cpf', 'sexo', 'dataNascimento', 'ufNascimento',
       'municipioNascimento', 'escolaridade', 'ano', 'mes', 'tipoDespesa',
       'codDocumento', 'tipoDocumento', 'codTipoDocumento', 'dataDocumento',
       'numDocumento', 'valorDocumento', 'urlDocumento', 'nomeFornecedor',
       'cnpjCpfFornecedor', 'valorLiquido', 'valorGlosa', 'numRessarcimento',
       'codLote', 'parcela'],
      dtype='object')

In [6]:
df_unique_id = df.sort_values(['id']).drop_duplicates('id', keep='first')

In [7]:
df_unique_id['siglaPartido'].value_counts()

siglaPartido
PL               89
PT               67
UNIÃO            58
PP               49
REPUBLICANOS     45
PSD              44
MDB              44
PDT              17
PODE             15
PSB              15
PSOL             13
PSDB             13
PCdoB             8
AVANTE            8
PV                5
NOVO              5
PRD               5
CIDADANIA         4
SOLIDARIEDADE     4
REDE              1
Name: count, dtype: int64

Classificando partidos no espectro ideológico a partir da atuação parlamentar

A seguinte classificação foi feita com base no seguinte artigo - https://pt.wikipedia.org/wiki/Posicionamentos_dos_partidos_brasileiros

Caso tenha alguma observação que possa contribuir, sinta-se a vontade para dizer :)


In [None]:
# novas colunas serão criadas usando _ para a separação - assim saberemos quais foram criadas e quais vieram diretamente da API
# Dicionário com o espectro político de cada partido
espectro_politico = {
    'PL': 'Centro-direita',
    'PT': 'Esquerda',
    'UNIÃO': 'Centro-direita',
    'PP': 'Centro-direita',
    'REPUBLICANOS': 'Direita',
    'PSD': 'Centro',
    'MDB': 'Centro',
    'PDT': 'Centro-esquerda',
    'PODE': 'Centro-direita',
    'PSB': 'Centro-esquerda',
    'PSOL': 'Esquerda',
    'PSDB': 'Centro',
    'PCdoB': 'Esquerda',
    'AVANTE': 'Centro',
    'PV': 'Centro-esquerda',
    'NOVO': 'Direita',
    'PRD': 'Direita',
    'CIDADANIA': 'Centro-esquerda',
    'SOLIDARIEDADE': 'Centro-esquerda',
    'REDE': 'Centro-esquerda'
}

# Adicionando a nova coluna com base no espectro político
df['espectro_politico'] = df['siglaPartido'].map(espectro_politico)

In [9]:
df.head()

Unnamed: 0,id,nome,siglaPartido,siglaUf,idLegislatura,urlFoto,email,nomeCivil,cpf,sexo,...,valorDocumento,urlDocumento,nomeFornecedor,cnpjCpfFornecedor,valorLiquido,valorGlosa,numRessarcimento,codLote,parcela,espectro_politico
0,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2092841.0,0.0,Centro
1,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2093592.0,0.0,Centro
2,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,333.12,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,333.12,0.0,,2090590.0,0.0,Centro
3,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,300.0,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,300.0,0.0,,2090590.0,0.0,Centro
4,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,330.3,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,330.3,0.0,,2090590.0,0.0,Centro


In [11]:
df.groupby(['espectro_politico'])['valorLiquido'].sum()

espectro_politico
Centro             3710641.56
Centro-direita     6786709.35
Centro-esquerda    1158041.40
Direita            1940812.11
Esquerda           2429761.54
Name: valorLiquido, dtype: float64