# Notebook 02 – Análise Exploratória

Este notebook realiza análises sobre `base_vila_velha.csv`.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os

df = pd.read_csv('dados/base_vila_velha.csv')
os.makedirs('docs', exist_ok=True)

## Distribuição por Faixa Etária

In [None]:
plt.figure(figsize=(10,5))
sns.histplot(df['faixa_etaria'], bins=20)
plt.title('Distribuição por Faixa Etária')
plt.savefig('docs/faixa_etaria.png')
plt.show()

## Distribuição por Sexo

In [None]:
df['sexo'].value_counts().plot(kind='bar')
plt.title('Distribuição por Sexo')
plt.savefig('docs/sexo.png')
plt.show()

## Distribuição por Grau de Instrução

In [None]:
df['grau_instrucao'].value_counts().plot(kind='bar', figsize=(10,5))
plt.title('Grau de Instrução')
plt.savefig('docs/grau_instrucao.png')
plt.show()

## Eleitores por Bairro

In [None]:
df.groupby('bairro')['qtd_eleitores'].sum().sort_values(ascending=False).head(20).plot(kind='bar', figsize=(12,5))
plt.title('Top 20 Bairros por Número de Eleitores')
plt.savefig('docs/bairros_top20.png')
plt.show()

## Eleitores por Região

In [None]:
df.groupby('regiao')['qtd_eleitores'].sum().plot(kind='bar')
plt.title('Eleitores por Região')
plt.savefig('docs/regioes.png')
plt.show()

## Eleitores por Zona Eleitoral

In [None]:
df.groupby('zona')['qtd_eleitores'].sum().plot(kind='bar')
plt.title('Eleitores por Zona Eleitoral')
plt.savefig('docs/zonas.png')
plt.show()

## Tabelas de Insights

In [None]:
pd.DataFrame({
    'Total Eleitores':[df['qtd_eleitores'].sum()],
    'Bairros':[df['bairro'].nunique()],
    'Regiões':[df['regiao'].nunique()],
    'Zonas':[df['zona'].nunique()]
})