<a href="https://colab.research.google.com/github/JohnDiognes/analise-perfil-eleitor-vila-velha/blob/main/notebooks/02_analise_exploratoria.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üìò Notebook 02 ‚Äî An√°lise Explorat√≥ria do Perfil do Eleitor de Vila Velha

## 1. Carregamento da Base de Dados

In [None]:
# ===============================================================
# 01 ‚Äî CONFIGURA√á√ÉO INICIAL DO PROJONAOT
# ===============================================================

# Clonar reposit√≥rio (executar apenas 1 vez por sess√£o)
!rm -rf analise-perfil-eleitor-vila-velha
!git clone https://github.com/JohnDiognes/analise-perfil-eleitor-vila-velha.git

# Caminho da base
caminho_base = "analise-perfil-eleitor-vila-velha/dados/base_vila_velha.csv"

# Importar bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os

# Configura√ß√£o de estilo
sns.set(style="whitegrid")
plt.rcParams["figure.figsize"] = (12, 6)

# Carregar a base
df_vv = pd.read_csv(caminho_base, encoding='latin1')

df_vv.head()


## 2. Informa√ß√µes Gerais da Base

In [None]:
df_vv.info()

In [None]:
df_vv.describe(include='all')

## Criar pasta docs para salvar os gr√°ficos

In [None]:
os.makedirs('docs', exist_ok=True)

## 3. Distribui√ß√£o por Faixa Et√°ria

In [None]:

plt.figure()
# Agrupar por faixa_etaria e somar quant_eleitores
ax = df_vv.groupby('faixa_etaria')['quant_eleitores'].sum().sort_index().plot(kind='bar')
plt.title("Distribui√ß√£o por Faixa Et√°ria")
plt.xticks(rotation=45)
plt.tight_layout()

# Adicionar os valores exatos em cada barra, centralizados
for p in ax.patches:
    ax.annotate(str(int(p.get_height())), (p.get_x() + p.get_width() / 2, p.get_height() * 1.005), ha='center')

total_eleitores = df_vv['quant_eleitores'].sum()
ax.text(0.95, 0.95, f'Total de Eleitores: {total_eleitores}', transform=ax.transAxes, ha='right', va='top', bbox=dict(facecolor='white', alpha=0.8))

plt.savefig("docs/faixa_etaria.png")
plt.show()


## 4. Distribui√ß√£o por Sexo

In [None]:

plt.figure()

# Agrupar por genero e somar quant_eleitores
distribuicao_genero = df_vv.groupby('genero')['quant_eleitores'].sum().sort_values(ascending=False)
ax = distribuicao_genero.plot(kind='bar')

plt.title("Distribui√ß√£o por Sexo")

# Adicionar os valores exatos em cada barra, centralizados
for p in ax.patches:
    ax.annotate(str(int(p.get_height())), (p.get_x() + p.get_width() / 2, p.get_height() * 1.005), ha='center')

total_eleitores = df_vv['quant_eleitores'].sum()
ax.text(0.95, 0.95, f'Total de Eleitores: {total_eleitores}', transform=ax.transAxes, ha='right', va='top', bbox=dict(facecolor='white', alpha=0.8))

plt.tight_layout()
plt.savefig("docs/sexo.png")
plt.show()


## 5. Distribui√ß√£o por Grau de Escolaridade

In [None]:

plt.figure()
# Agrupar por escolaridade e somar quant_eleitores
ax = df_vv.groupby('escolaridade')['quant_eleitores'].sum().plot(kind='bar')
plt.title("Distribui√ß√£o por Escolaridade")
plt.xticks(rotation=45)
plt.tight_layout()

# Adicionar os valores exatos em cada barra, centralizados
for p in ax.patches:
    ax.annotate(str(int(p.get_height())), (p.get_x() + p.get_width() / 2, p.get_height() * 1.005), ha='center')

plt.savefig("docs/escolaridade.png")
plt.show()


## 6. Top 20 Bairros com Mais Eleitores

In [None]:

plt.figure()
# Agrupar por bairro e somar quant_eleitores, e pegar os 20 maiores
ax = df_vv.groupby('bairro')['quant_eleitores'].sum().nlargest(20).plot(kind='bar')
plt.title("Top 20 Bairros com Mais Eleitores")
plt.xticks(rotation=75)
plt.tight_layout()

# Adicionar os valores exatos em cada barra, centralizados
for p in ax.patches:
    ax.annotate(str(int(p.get_height())), (p.get_x() + p.get_width() / 2, p.get_height() * 1.005), ha='center')

plt.savefig("docs/top_bairros.png")
plt.show()


## 7. Distribui√ß√£o por Zona Eleitoral

In [None]:

plt.figure()
# Agrupar por zona e somar quant_eleitores
ax = df_vv.groupby('zona')['quant_eleitores'].sum().sort_index().plot(kind='bar')
plt.title("Distribui√ß√£o por Zona Eleitoral")

# Adicionar os valores exatos em cada barra, centralizados
for p in ax.patches:
    ax.annotate(str(int(p.get_height())), (p.get_x() + p.get_width() / 2, p.get_height() * 1.005), ha='center')

plt.tight_layout()
plt.savefig("docs/zonas.png")
plt.show()


## 8. Distribui√ß√£o por Regi√£o

In [None]:

plt.figure()
# Agrupar por regiao e somar quant_eleitores
ax = df_vv.groupby('regiao')['quant_eleitores'].sum().sort_index().plot(kind='bar')
plt.title("Distribui√ß√£o por Regi√£o")

# Adicionar os valores exatos em cada barra, centralizados
for p in ax.patches:
    ax.annotate(str(int(p.get_height())), (p.get_x() + p.get_width() / 2, p.get_height() * 1.005), ha='center')

plt.tight_layout()
plt.savefig("docs/regioes.png")
plt.show()


### Total de Eleitores

In [None]:
total_eleitores = df_vv['quant_eleitores'].sum()
print(f"O total de eleitores √©: {total_eleitores}")

## 9. Tabela de Insights

In [None]:

insights = pd.DataFrame({
    'Faixa et√°ria mais comum': [df_vv['faixa_etaria'].mode()[0]],
    'Sexo predominante': [df_vv['genero'].mode()[0]],
    'Escolaridade mais frequente': [df_vv['escolaridade'].mode()[0]],
    'Bairro com mais eleitores': [df_vv['bairro'].value_counts().idxmax()],
    'Regi√£o mais populosa': [df_vv['regiao'].value_counts().idxmax()]
})
insights


### 10. Distribui√ß√£o por Bairro

In [None]:

plt.figure(figsize=(15, 7))
# Agrupar por bairro e somar quant_eleitores
ax = df_vv.groupby('bairro')['quant_eleitores'].sum().plot(kind='bar')
plt.title("Distribui√ß√£o por Bairro")
plt.xlabel("Bairro")
plt.ylabel("N√∫mero de Eleitores")
plt.xticks(rotation=90)

# Adicionar os valores exatos em cada barra, centralizados
for p in ax.patches:
    ax.annotate(str(int(p.get_height())), (p.get_x() + p.get_width() / 2, p.get_height() * 1.005), ha='center')

plt.tight_layout()
plt.savefig("docs/distribuicao_bairro.png")
plt.show()


### 11. Distribui√ß√£o por Bairro (Visual Alternativo - Gr√°fico de Barras Horizontais)

In [None]:

plt.figure(figsize=(15, 10))
# Agrupar por bairro e somar quant_eleitores, e ordenar para melhor visualiza√ß√£o
distribuicao_bairro_horizontal = df_vv.groupby('bairro')['quant_eleitores'].sum().sort_values(ascending=True)
ax = distribuicao_bairro_horizontal.plot(kind='barh')

plt.title("Distribui√ß√£o por Bairro (Gr√°fico Horizontal)")
plt.xlabel("N√∫mero de Eleitores")
plt.ylabel("Bairro")
plt.tight_layout()

# Adicionar os valores exatos em cada barra
for p in ax.patches:
    width = p.get_width()
    plt.text(width + ax.get_xlim()[1] * 0.01, p.get_y() + p.get_height() / 2, f'{int(width)}', va='center')

total_eleitores = df_vv['quant_eleitores'].sum()
ax.text(0.95, 0.98, f'Total de Eleitores: {total_eleitores}', transform=ax.transAxes, ha='right', va='top', bbox=dict(facecolor='white', alpha=0.8))

plt.savefig("docs/distribuicao_bairro_horizontal.png")
plt.show()


### 12. Enviar a pasta `docs` para o GitHub

A pasta `docs` foi criada na raiz do seu ambiente Colab (`/content/`). Para envi√°-la para o seu reposit√≥rio GitHub, ela precisa estar dentro da pasta do reposit√≥rio (`analise-perfil-eleitor-vila-velha/`).

In [None]:
# Mover a pasta docs para dentro do reposit√≥rio clonado
!mv docs analise-perfil-eleitor-vila-velha/

# Verificar se a pasta docs est√° agora dentro do reposit√≥rio
!ls analise-perfil-eleitor-vila-velha/

Agora que a pasta `docs` est√° dentro do reposit√≥rio, podemos usar os comandos Git para adicionar, commitar e enviar as altera√ß√µes. Voc√™ precisar√° se autenticar com o GitHub quando o comando `git push` for executado.

In [None]:
# Entrar no diret√≥rio do reposit√≥rio
%cd analise-perfil-eleitor-vila-velha

# Configurar a identidade do autor (substitua com suas informa√ß√µes)
!git config --global user.email "diognes_santos@hotmail.com"
!git config --global user.name "JohnDiognes"

# Adicionar a pasta docs e seus conte√∫dos ao stage do Git
!git add docs

# Commitar as altera√ß√µes
!git commit -m "Adiciona gr√°ficos gerados na pasta docs"

# Importar userdata para acessar os segredos do Colab
from google.colab import userdata

# Recuperar o PAT do Colab Secrets
# O nome correto do segredo √© 'GITHUB_TOKEN'
github_token = userdata.get('GITHUB_TOKEN')

# Definir o nome de usu√°rio do GitHub (baseado em informa√ß√£o pr√©via)
github_username = "JohnDiognes"

# Enviar as altera√ß√µes para o GitHub usando o PAT do Colab Secrets na URL
!git push https://{github_username}:{github_token}@github.com/JohnDiognes/analise-perfil-eleitor-vila-velha.git main

Ap√≥s executar o √∫ltimo comando, siga as instru√ß√µes para autentica√ß√£o. Se voc√™ usa autentica√ß√£o de dois fatores, precisar√° de um Personal Access Token (PAT) em vez da sua senha. Voc√™ pode gerar um PAT nas configura√ß√µes do seu perfil no GitHub.

### 13. Fazer Download dos Gr√°ficos

In [None]:
# Navegar para o diret√≥rio raiz do reposit√≥rio se ainda n√£o estiver l√°
%cd /content/analise-perfil-eleitor-vila-velha

# Compactar a pasta docs
!zip -r /content/docs.zip docs

# Fornecer um link para download do arquivo zip
from google.colab import files
files.download('/content/docs.zip')