Objetivo:
- Explorar os dados disponíveis
- Ter uma ideia das possibilidades para o Dashboard interativo
- Análise gráfica

# Importando Bibliotecas

In [1]:
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import plotly.express as px
import seaborn as sns
import nbformat

# Lendo Base

In [2]:
df = pd.read_csv('../data/df_deputados.csv')
df.drop(columns=['Unnamed: 0'], inplace=True)

In [3]:
df.head()

Unnamed: 0,id,nome,siglaPartido,siglaUf,idLegislatura,urlFoto,email,nomeCivil,cpf,sexo,...,numDocumento,valorDocumento,urlDocumento,nomeFornecedor,cnpjCpfFornecedor,valorLiquido,valorGlosa,numRessarcimento,codLote,parcela
0,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,1735,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2092841.0,0.0
1,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,1806,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2093592.0,0.0
2,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,432734,333.12,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,333.12,0.0,,2090590.0,0.0
3,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,433490,300.0,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,300.0,0.0,,2090590.0,0.0
4,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,434554,330.3,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,330.3,0.0,,2090590.0,0.0


In [4]:
df.columns

Index(['id', 'nome', 'siglaPartido', 'siglaUf', 'idLegislatura', 'urlFoto',
       'email', 'nomeCivil', 'cpf', 'sexo', 'dataNascimento', 'ufNascimento',
       'municipioNascimento', 'escolaridade', 'ano', 'mes', 'tipoDespesa',
       'codDocumento', 'tipoDocumento', 'codTipoDocumento', 'dataDocumento',
       'numDocumento', 'valorDocumento', 'urlDocumento', 'nomeFornecedor',
       'cnpjCpfFornecedor', 'valorLiquido', 'valorGlosa', 'numRessarcimento',
       'codLote', 'parcela'],
      dtype='object')

# Avaliando Partidos Políticos

In [5]:
df_unique_id = df.sort_values(['id']).drop_duplicates('id', keep='first')

## Número de candidatos por Partido

In [6]:
candidatos_por_partido = df_unique_id['siglaPartido'].value_counts()
candidatos_por_partido = pd.DataFrame(candidatos_por_partido).reset_index()
candidatos_por_partido

Unnamed: 0,siglaPartido,count
0,PL,89
1,PT,67
2,UNIÃO,58
3,PP,49
4,REPUBLICANOS,45
5,PSD,44
6,MDB,44
7,PDT,17
8,PODE,15
9,PSB,15


In [20]:
fig = px.bar(candidatos_por_partido, y='count', x='siglaPartido',  text_auto='.2s', title='Candidatos por Partido')
fig.show()

## Classificando partidos

Classificando partidos no espectro ideológico a partir da atuação parlamentar

A seguinte classificação foi feita com base no seguinte artigo - https://pt.wikipedia.org/wiki/Posicionamentos_dos_partidos_brasileiros

Caso tenha alguma observação que possa contribuir, sinta-se a vontade para dizer :)


In [8]:
# novas colunas serão criadas usando _ para a separação - assim saberemos quais foram criadas e quais vieram diretamente da API
# Dicionário com o espectro político de cada partido
espectro_politico = {
    'PL': 'Centro-direita',
    'PT': 'Esquerda',
    'UNIÃO': 'Centro-direita',
    'PP': 'Centro-direita',
    'REPUBLICANOS': 'Direita',
    'PSD': 'Centro',
    'MDB': 'Centro',
    'PDT': 'Centro-esquerda',
    'PODE': 'Centro-direita',
    'PSB': 'Centro-esquerda',
    'PSOL': 'Esquerda',
    'PSDB': 'Centro',
    'PCdoB': 'Esquerda',
    'AVANTE': 'Centro',
    'PV': 'Centro-esquerda',
    'NOVO': 'Direita',
    'PRD': 'Direita',
    'CIDADANIA': 'Centro-esquerda',
    'SOLIDARIEDADE': 'Centro-esquerda',
    'REDE': 'Centro-esquerda'
}

# Adicionando a nova coluna com base no espectro político
df['espectro_politico'] = df['siglaPartido'].map(espectro_politico)

In [9]:
df.head()

Unnamed: 0,id,nome,siglaPartido,siglaUf,idLegislatura,urlFoto,email,nomeCivil,cpf,sexo,...,valorDocumento,urlDocumento,nomeFornecedor,cnpjCpfFornecedor,valorLiquido,valorGlosa,numRessarcimento,codLote,parcela,espectro_politico
0,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2092841.0,0.0,Centro
1,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,750.0,https://www.camara.leg.br/cota-parlamentar/doc...,AMORETTO CAFES EXPRESSO LTDA,8532429000000.0,750.0,0.0,,2093592.0,0.0,Centro
2,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,333.12,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,333.12,0.0,,2090590.0,0.0,Centro
3,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,300.0,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,300.0,0.0,,2090590.0,0.0,Centro
4,204379,Acácio Favacho,MDB,AP,57,https://www.camara.leg.br/internet/deputado/ba...,dep.acaciofavacho@camara.leg.br,ACÁCIO DA SILVA FAVACHO NETO,74287028287,M,...,330.3,http://www.camara.leg.br/cota-parlamentar/nota...,031 - 302 NORTE - CASCOL COMBUSTIVEIS PARA VEI...,306597000000.0,330.3,0.0,,2090590.0,0.0,Centro


In [10]:
df.groupby(['espectro_politico'])['valorLiquido'].sum().sort_values(ascending=False)

espectro_politico
Centro-direita     6786709.35
Centro             3710641.56
Esquerda           2429761.54
Direita            1940812.11
Centro-esquerda    1158041.40
Name: valorLiquido, dtype: float64

In [11]:
df.groupby(['nomeCivil'])['valorLiquido'].sum().sort_values(ascending=False)

nomeCivil
MARCO ANTÔNIO FELICIANO                282208.37
ALCIDES RIBEIRO FILHO                  273304.67
GLAUSKSTON BATISTA RIOS                260066.80
GABRIEL MOTA E SILVA                   232991.56
LUIZ AUGUSTO CARVALHO RIBEIRO FILHO    229433.34
                                         ...    
ERIKA SANTOS SILVA                       2428.87
DANIEL BARBOSA DE ALMEIDA SILVA          2124.10
MARCOS ROBERIO RIBEIRO MONTEIRO          1883.00
GILVAN AGUIAR COSTA                      1803.77
JOSÉ OLIMPIO SILVEIRA MORAES             1206.11
Name: valorLiquido, Length: 509, dtype: float64

In [13]:
df_unique_id['espectro_politico'] = df_unique_id['siglaPartido'].map(espectro_politico)

In [21]:
espectro_politico = df_unique_id['espectro_politico'].value_counts()
espectro_politico = pd.DataFrame(espectro_politico).reset_index()
espectro_politico

Unnamed: 0,espectro_politico,count
0,Centro-direita,211
1,Centro,109
2,Esquerda,88
3,Direita,55
4,Centro-esquerda,46


In [23]:
fig = px.bar(espectro_politico, y='count', x='espectro_politico',  text_auto='.2s', title='Espectro político')
fig.show()