<a href="https://colab.research.google.com/github/JohnDiognes/analise-perfil-eleitor-vila-velha/blob/main/notebooks/03_analise_geografica_completa.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üìç Notebook 03 ‚Äî An√°lise Geogr√°fica do Eleitorado de Vila Velha

Este notebook realiza a an√°lise geogr√°fica utilizando:
- Base tratada `base_vila_velha.csv`
- Shapefile dos bairros (`/dados/geodata/bairros_vila_velha.*`)
- Biblioteca `geopandas` para manipula√ß√£o espacial
- Mapas tem√°ticos sobre sexo, idade, escolaridade e participa√ß√£o por bairro


## üîß 1. Importa√ß√£o de bibliotecas

In [3]:
import pandas as pd
import geopandas as gpd
import matplotlib.pyplot as plt
import seaborn as sns
!pip install contextily
import contextily as ctx
import numpy as np

plt.style.use('seaborn-v0_8-whitegrid')

Collecting contextily
  Downloading contextily-1.7.0-py3-none-any.whl.metadata (3.1 kB)
Collecting mercantile (from contextily)
  Downloading mercantile-1.2.1-py3-none-any.whl.metadata (4.8 kB)
Downloading contextily-1.7.0-py3-none-any.whl (16 kB)
Downloading mercantile-1.2.1-py3-none-any.whl (14 kB)
Installing collected packages: mercantile, contextily
Successfully installed contextily-1.7.0 mercantile-1.2.1


## üìÅ 2. Caminhos dos arquivos

In [4]:
repo = 'analise-perfil-eleitor-vila-velha'

base_path = f"{repo}/dados/base_vila_velha.csv"
shape_path = f"{repo}/dados/geodata/bairros_vila_velha.shp"

## üì• 3. Carregamento da base de eleitores

In [5]:
df = pd.read_csv(base_path, delimiter=',', encoding='latin1')
print(df.shape)
df.head()

FileNotFoundError: [Errno 2] No such file or directory: 'analise-perfil-eleitor-vila-velha/dados/base_vila_velha.csv'

## üó∫Ô∏è 4. Carregamento do shapefile dos bairros

In [None]:
gdf_bairros = gpd.read_file(shape_path, encoding='latin1')
gdf_bairros = gdf_bairros.to_crs(epsg=3857)
gdf_bairros.head()

## üîÑ 5. Agrega√ß√£o de dados por bairro
Agrupamos a base para obter indicadores por bairro.

In [None]:
# Corre√ß√£o do nome do bairro
df['bairro'] = df['bairro'].str.upper().str.strip()
gdf_bairros['bairro'] = gdf_bairros['BAIRRO'].str.upper().str.strip()

# Agrega√ß√£o
agg = df.groupby('bairro').agg(
    total_eleitores=('quant_eleitores', 'sum'),
    perc_mulheres=('genero', lambda x: (x=='FEMININO').mean()*100),
    perc_homens=('genero', lambda x: (x=='MASCULINO').mean()*100),
    media_idade=('idade_numerica', 'mean')
).reset_index()

agg.head()

## üîÑ 5.1. Pr√©-processamento da Faixa Et√°ria
Para calcular a idade m√©dia, convertemos a coluna `faixa_etaria` em um valor num√©rico.

In [None]:
def faixa_etaria_to_numeric(faixa):
    if pd.isna(faixa):
        return np.nan
    faixa = str(faixa).replace(' anos', '').replace(' ou mais', '')
    if '-' in faixa:
        low, high = map(int, faixa.split('-'))
        return (low + high) / 2
    elif '80' in faixa: # Handle '80 ou mais'
        return 85 # A reasonable estimate for '80 or more'
    else:
        try:
            return int(faixa)
        except ValueError:
            return np.nan

df['idade_numerica'] = df['faixa_etaria'].apply(faixa_etaria_to_numeric)
df.head()

## üîó 6. Uni√£o espacial entre base e shapefile

In [None]:
geo = gdf_bairros.merge(agg, left_on='bairro', right_on='bairro', how='left')
geo.head()

# üó∫Ô∏è 7. Mapas Tem√°ticos

## üó∫Ô∏è 7.1 Mapa de Total de Eleitores por Bairro

In [None]:
fig, ax = plt.subplots(figsize=(12, 10))
geo.plot(column='total_eleitores', cmap='Blues', legend=True, ax=ax)
ctx.add_basemap(ax, source=ctx.providers.CartoDB.Positron)
ax.set_title('Total de Eleitores por Bairro ‚Äì Vila Velha', fontsize=16)
ax.axis('off')
plt.show()

## üó∫Ô∏è 7.2 Percentual de Mulheres por Bairro

In [None]:
fig, ax = plt.subplots(figsize=(12, 10))
geo.plot(column='perc_mulheres', cmap='Purples', legend=True, ax=ax)
ctx.add_basemap(ax, source=ctx.providers.CartoDB.Positron)
ax.set_title('% de Mulheres por Bairro ‚Äì Vila Velha', fontsize=16)
ax.axis('off')
plt.show()

## üó∫Ô∏è 7.3 Idade M√©dia do Eleitor por Bairro

In [None]:
fig, ax = plt.subplots(figsize=(12, 10))
geo.plot(column='media_idade', cmap='OrRd', legend=True, ax=ax)
ctx.add_basemap(ax, source=ctx.providers.CartoDB.Voyager)
ax.set_title('Idade M√©dia do Eleitor por Bairro ‚Äì Vila Velha', fontsize=16)
ax.axis('off')
plt.show()

# üìå 8. Destaques e Insights Autom√°ticos

In [None]:
print('Top 5 bairros com mais eleitores:')
display(agg.nlargest(5, 'total_eleitores')[['bairro','total_eleitores']])

print('\nBairros com maior % de mulheres:')
display(agg.nlargest(5, 'perc_mulheres')[['bairro','perc_mulheres']])

print('\nBairros com maior idade m√©dia:')
display(agg.nlargest(5, 'media_idade')[['bairro','media_idade']])


Criar dataframe agregado por regi√£o

In [None]:
# Agregar total de eleitores por regi√£o
regiao = df.groupby("num_regiao").size().reset_index(name="total_eleitores")
regiao
