In [1]:
import pandas as pd
import matplotlib.pyplot as plt

---
## Leitura dos Dados

In [None]:
# Leitura do dataset (limpo) de bens dos candidatos
df_bens = pd.read_csv('data/cleaned/bens_candidatos_brasil.csv', sep=';', encoding='latin-1')
df_bens.head()

In [None]:
# Leitura do dataset (limpo) de despesas dos candidatos
df_despesas = pd.read_csv('data/cleaned/despesas_candidatos_brasil.csv', sep=';', encoding='latin-1')
df_despesas.head()

In [None]:
# Leitura do dataset (limpo) de receitas dos candidatos
df_votacao = pd.read_csv('data/cleaned/votacao_nominal_brasil.csv', sep=';', encoding='latin-1')
df_votacao.head()

---
## Tipos dos Dados

In [None]:
# Verificação dos tipos das colunas (atributos) do dataset de bens dos candidatos
df_bens.dtypes

In [6]:
# Transformações necessárias para os tipos de dados
df_bens['VR_BEM_CANDIDATO'] = df_bens['VR_BEM_CANDIDATO'].str.replace(',', '.').astype(float)

In [None]:
# Verificação dos tipos das colunas (atributos) do dataset de despesas dos candidatos
df_despesas.dtypes

In [8]:
# Transformações necessárias para os tipos de dados
df_despesas['VR_DESPESA_CONTRATADA'] = df_despesas['VR_DESPESA_CONTRATADA'].str.replace(',', '.').astype(float)

In [None]:
# Verificação dos tipos das colunas (atributos) do dataset de votação nominal
df_votacao.dtypes

---
## Estatísticas Básicas - Bens dos Candidatos

In [None]:
# Calculando as médias de bens declarados
mean_asset_value  = df_bens['VR_BEM_CANDIDATO'].mean()
mean_by_state     = df_bens.groupby('NM_UE')['VR_BEM_CANDIDATO'].mean()
mean_by_candidate = df_bens.groupby('SQ_CANDIDATO')['VR_BEM_CANDIDATO'].mean()

# Calculando a mediana de bens declarados
median_asset_value = df_bens['VR_BEM_CANDIDATO'].median()

print(f"Média de bens declarados: R$ {mean_asset_value:.2f}")
print(f"Mediana de bens declarados: R$ {median_asset_value:.2f}")

In [None]:
# Plotando a média de bens declarados por estado
plt.figure(figsize=(14, 8))
mean_by_state.plot(kind='bar', color='steelblue', edgecolor='black')
plt.title('Média de Bens Declarados por Estado', fontsize=16)
plt.xlabel('Estado', fontsize=12)
plt.ylabel('Média de Bens Declarados (R$)', fontsize=12)
plt.xticks(rotation=90)
plt.grid(axis='y', linestyle='--', alpha=0.7)

plt.gca().get_yaxis().set_major_formatter(plt.matplotlib.ticker.FuncFormatter(lambda x, _: f'R$ {x:,.0f}'))

plt.tight_layout()
plt.show()

In [None]:
# Calculando total de instâncias, total de bens declarados e total de candidatos
sum_asset_value     = df_bens['VR_BEM_CANDIDATO'].sum()
count_assets        = df_bens['VR_BEM_CANDIDATO'].count()
total_candidates    = df_bens['SQ_CANDIDATO'].nunique()
candidates_by_state = df_bens.groupby('SG_UF')['SQ_CANDIDATO'].nunique()

print(f"\nTotal de bens declarados: R$ {sum_asset_value:.2f}")
print(f"Quantidade de bens declarados: {count_assets}")
print(f"Quantidade de candidatos: {total_candidates}")

In [None]:
# Plotando a quantidade de candidatos por estado
plt.figure(figsize=(10, 6))
candidates_by_state.plot(kind='bar', color='coral')
plt.title('Quantidade de Candidatos por Estado')
plt.xlabel('Estado')
plt.ylabel('Quantidade de Candidatos')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

In [None]:
# Calculando as variações de bens declarados
std_asset_value  = df_bens['VR_BEM_CANDIDATO'].std()
std_by_state     = df_bens.groupby('NM_UE')['VR_BEM_CANDIDATO'].std()
std_by_candidate = df_bens.groupby('SQ_CANDIDATO')['VR_BEM_CANDIDATO'].std()

print(f"Variação de bens declarados: R$ {std_asset_value:.2f}")

print("\nVariação de bens declarados por estado:")
for position, value in mean_by_state.items():
    print(f"{position}: R$ {value:.2f}")

print("\nVarição de bens declarados por candidato:")
for candidate, value in mean_by_candidate.items():
    print(f"Candidato {candidate}: R$ {value:.2f}")

In [None]:
# Calculando a moda e a ocorrência dos tipos de bens declarados


---
## Estatísticas Básicas - Despesas dos Candidatos

---
## Estatísticas Básicas - Votação Nominal

---
## Normalização

---
## Correlações