> Esta análise continua na [Parte 2](https://colab.research.google.com/drive/1jA4uyIC-_BgfbyuE00gRFBSpm31f-e1e?usp=sharing)

# Análise do eleitorado da cidade de Campina Grande

Com essa análise buscamos responder uma questão interessante: existe uma associação entre os votos, os perfis dos eleitores e os indicadores socioeconômicos das regiões da cidade de Campina Grande?

Para isso, utilizaremos os dados dos boletins de urna, referentes às eleições federais e estaduais de 2022, obtidos a partir dos [Dados Abertos do TSE](https://dadosabertos.tse.jus.br/). Para conversar com as conclusões obtidas da análise desses dados, iremos consultar a [ANÁLISE RETROSPECTIVA E SITUAÇÃO ATUAL](https://campinagrande.pb.gov.br/wp-content/uploads/2020/07/1-An-lise-Retrospectiva-e-Situa%E2%80%A1%C3%86o-Atual.pdf) da Cidade de Campina Grande, com base nos dados do Censo Brasileiro do IBGE de 2010.

Por conta da extensão das análises e para paralelização do trabalho, dividimos a análise em dois notebooks.

1. [Análise de votos para presidente 1º e 2º turno das eleições de 2022](https://colab.research.google.com/drive/1mjPfIF7ds511-9AZH-kyEYTxa7WiboqL?usp=sharing)
2. [Análise dos perfis do eleitorado apto para cada local de votação](https://colab.research.google.com/drive/1jA4uyIC-_BgfbyuE00gRFBSpm31f-e1e?usp=sharing)

> Os dados tratados e brutos, além de notebooks complementares, podem ser consultados também [neste link](https://drive.google.com/drive/folders/1U8qnMP6NdJKEVTkdBJzGPQ8_NK7H_6EO?usp=drive_link).

# Parte 1 - Análise dos votos para presidente no 1º e 2º turno

In [None]:
!pip install gdown
!gdown https://drive.google.com/uc?id=1Eq4AMr9VKFt1H8p4qfYkTMagBecDoBX0
!gdown https://drive.google.com/uc?id=17B7Zy7yPLRJqThgK5OY9Z_ztMNKnzSmx

Downloading...
From: https://drive.google.com/uc?id=1Eq4AMr9VKFt1H8p4qfYkTMagBecDoBX0
To: /content/PRIMEIRO_TURNO_CG_dados_tratados.csv
100% 24.3M/24.3M [00:00<00:00, 230MB/s]
Downloading...
From: https://drive.google.com/uc?id=17B7Zy7yPLRJqThgK5OY9Z_ztMNKnzSmx
To: /content/SEGUNDO_TURNO_CG_dados_tratados.csv
100% 1.26M/1.26M [00:00<00:00, 150MB/s]


In [None]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

In [None]:
df_1turno = pd.read_csv("PRIMEIRO_TURNO_CG_dados_tratados.csv")
df_2turno = pd.read_csv("SEGUNDO_TURNO_CG_dados_tratados.csv")

In [None]:
df_1turno.columns

Index(['Unnamed: 0', 'NM_MUNICIPIO', 'NR_ZONA', 'NR_SECAO', 'NR_TURNO',
       'NR_LOCAL_VOTACAO', 'NR_PARTIDO', 'SG_PARTIDO', 'DS_CARGO_PERGUNTA',
       'DS_TIPO_VOTAVEL', 'NM_VOTAVEL', 'QT_VOTOS', 'NR_URNA_EFETIVADA',
       'NR_ZONA.1', 'NR_SECAO.1', 'NR_LATITUDE', 'NR_LONGITUDE', 'NM_BAIRRO',
       'NM_LOCAL_VOTACAO'],
      dtype='object')

# Candidatos mais votados por local de votação

## 1º turno

In [None]:
contagem_por_local1 = df_1turno.query("DS_CARGO_PERGUNTA=='Presidente' and DS_TIPO_VOTAVEL in ['Legenda', 'Nominal']").groupby(["NM_VOTAVEL", "NR_LATITUDE", "NR_LONGITUDE", "NM_BAIRRO"]).sum(numeric_only=True).reset_index()[["NM_VOTAVEL", "NR_LATITUDE", "NR_LONGITUDE", "QT_VOTOS", "NM_BAIRRO"]]
contagem_por_local1

Unnamed: 0,NM_VOTAVEL,NR_LATITUDE,NR_LONGITUDE,QT_VOTOS,NM_BAIRRO
0,CIRO GOMES,-7.343545,-36.087300,9.0,DISTRITO DE CATOLÉ
1,CIRO GOMES,-7.311400,-35.813941,11.0,GALANTE
2,CIRO GOMES,-7.306570,-35.782958,20.0,GALANTE
3,CIRO GOMES,-7.306251,-35.774198,62.0,GALANTE
4,CIRO GOMES,-7.305965,-35.782734,35.0,GALANTE
...,...,...,...,...,...
970,VERA,-7.216825,-35.909764,1.0,BODOCONGO
971,VERA,-7.210342,-35.895815,1.0,PALMEIRA
972,VERA,-7.208575,-35.946885,1.0,MUTIRAO DO SERROTAO
973,VERA,-7.205562,-35.901209,1.0,JEREMIAS


In [None]:
candidatos_mais_votados_1t = contagem_por_local1.groupby(['NR_LATITUDE', 'NR_LONGITUDE', "NM_BAIRRO"], as_index=False).apply(lambda group: group.nlargest(1, 'QT_VOTOS'))
candidatos_mais_votados_1t

Unnamed: 0,Unnamed: 1,NM_VOTAVEL,NR_LATITUDE,NR_LONGITUDE,QT_VOTOS,NM_BAIRRO
0,388,LULA,-7.343545,-36.087300,288.0,DISTRITO DE CATOLÉ
1,389,LULA,-7.311400,-35.813941,206.0,GALANTE
2,390,LULA,-7.306570,-35.782958,632.0,GALANTE
3,391,LULA,-7.306251,-35.774198,1402.0,GALANTE
4,392,LULA,-7.305965,-35.782734,892.0,GALANTE
...,...,...,...,...,...,...
119,507,LULA,-7.185304,-35.905208,743.0,CUITES
120,508,LULA,-7.185081,-35.985678,2178.0,DISTRITO DE SAO JOSE DA MATA
121,509,LULA,-7.185017,-35.984861,1572.0,DISTRITO DE SAO JOSE DA MATA
122,510,LULA,-1.000000,-1.000000,345.0,CENTRO


In [None]:
fig1 = px.scatter_mapbox(candidatos_mais_votados_1t, lat='NR_LATITUDE', lon='NR_LONGITUDE', color='NM_VOTAVEL', size='QT_VOTOS',
                        center=dict(lat=-7.2307, lon=-35.8811), zoom=12,
                        hover_name='NM_VOTAVEL', hover_data=['QT_VOTOS'],
                        title='Candidatos à presidência da república mais votados por local de votação em Campina Grande - 1º Turno',
                        mapbox_style='open-street-map',
                        color_discrete_sequence=["red", "blue"],
                        size_max=30)

fig1.update_layout(
    legend=dict(
        title='Candidatos',
        orientation='h',
        itemsizing='constant'
    )
)

Da visualização acima gerada podemos perceber alguns pontos interessantes. Primeiramente, para todos os locais de votação apenas dois candidatos se sobressaíram como os mais votados: **LULA** e **JAIR BOLSONARO**.

Espacialmente observando, o candidato **LULA** foi o mais votado em todos os locais de votação das regiões distritais da cidade de Campina Grande, como Galante, São José da Mata e Catolé. A distribuição dos votos para as urnas ganhas do candidato **JAIR BOLSONARO** é visualmente mais localizada, tendo uma faixa de abrangência que vai do sul da Zona Norte da cidade, passando pela Zona Leste e com maior concentração na Zona Sul. Já o candidato **LULA**, apresenta uma distribuição de urnas ganhas levemente menos concentrada, mas muito presente em regiões não centrais da cidade, tendo a maior concentração de urnas vencidas na Zona Oeste da cidade.

![](https://upload.wikimedia.org/wikipedia/commons/thumb/2/2e/Bairros_de_Campina_Grande.svg/800px-Bairros_de_Campina_Grande.svg.png)

 1. Podemos observar que, em relação aos votos para o candidato JAIR BOLSONARO, a concentração de votos na Zona Norte, mais ao sul da região, foi maior nos bairros do Alto Branco, Conceição, Lauritzen, Centro e Jardim Tavares. De acordo com a Análise Retrospectiva do ano de 2016, com base no senso do IBGE de 2010, fornecida pela Prefeitura Municipal de Campina Grande, essa região coincide com as áreas de maiores indicadores de Melhor Desempenho, como maiores índices de escolaridade entre os jovens de 18 a 24 anos, em que 43.6% deles estavam no ensino superior, maior remuneração média do trabalho com cerca de R$2.018,00, considerando as condições econômicas do ano de 2010. Em relação a faixa de pobreza e pobreza extrema, apenas 25.1% da população da região se encontravam nessas condições.

 2. Considerando os bairros do Velame e Distrito Industrial, que são bairros que estão na Zona Sul e tiveram a maior incidência de votos para o condidato JAIR BOLSONARO, de acordo com a Análise Retrospectiva citada anteriormente, esses dois bairros estão entre as áreas que apresentaram Pior Desempenho, como baixos índices de escolaridade para jovens entre 18 e 24 anos, em que apenas 4.5% estavam cursando o ensino superior, maior remuneração média do trabalho com apenas R$432,00, considerando as condições econômicas do ano de 2010. Em relação a faixa de pobreza e pobreza extrema, 91.7% da população da região se encontravam nessas condições.

 3. Os valores das estatísticas de Pior Desempenho são as mesmas para análise de votos do candidato LULA. Apesar de serem mais distribuídos entre as regiões, na Zona Oeste observa-se a **maior incidência** dos votos, especialmente nos bairros Bela Vista, Centenário, Pedregal e Bodocongó. De acordo com a Análise Retrospectiva, essa região coincide com as áreas de maiores indicadores de Pior Desempenho, exceto Bela Vista que não entrou no extremo das classificações.

 4. Outra concentração de votos que se destacou para o candidato LULA foi nos bairros Castelo Branco, Monte Castelo e Nova Brasília. Essa região do Monte Castelo e Nova Brasília não entrou na classificação de Pior e Melhor Desempenho. Não foram disponibilizadas informações socioeconômicas sobre elas. Já a região que inclui o Castelo Branco foi classificada com Melhor Desempenho, estando entre os melhores indicadores socioeconômicos, descrito no ponto 1 desta análise.

 Para mais informações sobre a Análise Restrospectiva fornecida pela Prefeitura Municipal de Campina Grande, consultar as páginas 20 e 21:
 [Análise Retrospectiva e Situação Atual: março/2016](https://drive.google.com/drive/folders/1U8qnMP6NdJKEVTkdBJzGPQ8_NK7H_6EO)


## 2º turno


In [None]:
contagem_por_local2 = df_2turno.query("DS_CARGO_PERGUNTA=='Presidente' and DS_TIPO_VOTAVEL in ['Legenda', 'Nominal']").groupby(["NM_VOTAVEL", "NR_LATITUDE", "NR_LONGITUDE", "NM_BAIRRO"]).sum(numeric_only=True).reset_index()[["NM_VOTAVEL", "NR_LATITUDE", "NR_LONGITUDE", "QT_VOTOS", "NM_BAIRRO"]]
contagem_por_local2

Unnamed: 0,NM_VOTAVEL,NR_LATITUDE,NR_LONGITUDE,QT_VOTOS,NM_BAIRRO
0,JAIR BOLSONARO,-7.343545,-36.087300,102.0,DISTRITO DE CATOLÉ
1,JAIR BOLSONARO,-7.311400,-35.813941,121.0,GALANTE
2,JAIR BOLSONARO,-7.306570,-35.782958,356.0,GALANTE
3,JAIR BOLSONARO,-7.306251,-35.774198,837.0,GALANTE
4,JAIR BOLSONARO,-7.305965,-35.782734,562.0,GALANTE
...,...,...,...,...,...
243,LULA,-7.185304,-35.905208,750.0,CUITES
244,LULA,-7.185081,-35.985678,2286.0,DISTRITO DE SAO JOSE DA MATA
245,LULA,-7.185017,-35.984861,1644.0,DISTRITO DE SAO JOSE DA MATA
246,LULA,-1.000000,-1.000000,367.0,CENTRO


In [None]:
candidatos_mais_votados_2t = contagem_por_local2.groupby(['NR_LATITUDE', 'NR_LONGITUDE', "NM_BAIRRO"], as_index=False).apply(lambda group: group.nlargest(1, 'QT_VOTOS'))
candidatos_mais_votados_2t

Unnamed: 0,Unnamed: 1,NM_VOTAVEL,NR_LATITUDE,NR_LONGITUDE,QT_VOTOS,NM_BAIRRO
0,124,LULA,-7.343545,-36.087300,323.0,DISTRITO DE CATOLÉ
1,125,LULA,-7.311400,-35.813941,234.0,GALANTE
2,126,LULA,-7.306570,-35.782958,644.0,GALANTE
3,127,LULA,-7.306251,-35.774198,1432.0,GALANTE
4,128,LULA,-7.305965,-35.782734,923.0,GALANTE
...,...,...,...,...,...,...
119,243,LULA,-7.185304,-35.905208,750.0,CUITES
120,244,LULA,-7.185081,-35.985678,2286.0,DISTRITO DE SAO JOSE DA MATA
121,245,LULA,-7.185017,-35.984861,1644.0,DISTRITO DE SAO JOSE DA MATA
122,246,LULA,-1.000000,-1.000000,367.0,CENTRO


In [None]:
fig2 = px.scatter_mapbox(candidatos_mais_votados_2t, lat='NR_LATITUDE', lon='NR_LONGITUDE', color='NM_VOTAVEL', size='QT_VOTOS',
                        center=dict(lat=-7.2307, lon=-35.8811), zoom=12,
                        hover_name='NM_VOTAVEL', hover_data=['QT_VOTOS'],
                        title='Candidatos à presidência da república mais votados por local de votação em Campina Grande - 2º Turno',
                        mapbox_style='open-street-map',
                        color_discrete_sequence=["red", "blue"],
                        size_max=30)

fig2.update_layout(
    legend=dict(
        title='Candidatos',
        orientation='h',
        itemsizing='constant'
    )
)

Os candidatos evidenciados na análise anterior foram os mesmos presentes no segundo turno na eleição. Reproduzindo a mesma análise para o segundo dataset, observamos que a faixa de distribuição de urnas vencidas para ambos os candidatos permaneceu semelhante a do primeiro turno, porém com quantidade mais massiva de votos para o candidato **JAIR BOLSONARO**, bem observado no mapa pelo aumento do tamanho das bolhas, que representa a quantidade de votos daquele local de votação, enquanto a quantidade de votos para o candidato **LULA** aparenta, visualmente, ter continuado na mesma faixa.

# Candidatos menos votados por local de votação

## 1º turno

In [None]:
contagem_por_local1 = df_1turno.query("DS_CARGO_PERGUNTA=='Presidente' and DS_TIPO_VOTAVEL in ['Legenda', 'Nominal']").groupby(["NM_VOTAVEL", "NR_LATITUDE", "NR_LONGITUDE", "NM_BAIRRO"]).sum(numeric_only=True).reset_index()[["NM_VOTAVEL", "NR_LATITUDE", "NR_LONGITUDE", "QT_VOTOS", "NM_BAIRRO"]]
contagem_por_local1

Unnamed: 0,NM_VOTAVEL,NR_LATITUDE,NR_LONGITUDE,QT_VOTOS,NM_BAIRRO
0,CIRO GOMES,-7.343545,-36.087300,9.0,DISTRITO DE CATOLÉ
1,CIRO GOMES,-7.311400,-35.813941,11.0,GALANTE
2,CIRO GOMES,-7.306570,-35.782958,20.0,GALANTE
3,CIRO GOMES,-7.306251,-35.774198,62.0,GALANTE
4,CIRO GOMES,-7.305965,-35.782734,35.0,GALANTE
...,...,...,...,...,...
970,VERA,-7.216825,-35.909764,1.0,BODOCONGO
971,VERA,-7.210342,-35.895815,1.0,PALMEIRA
972,VERA,-7.208575,-35.946885,1.0,MUTIRAO DO SERROTAO
973,VERA,-7.205562,-35.901209,1.0,JEREMIAS


In [None]:
candidatos_menos_votados_1t = contagem_por_local1.groupby(['NR_LATITUDE', 'NR_LONGITUDE', "NM_BAIRRO"], as_index=False).apply(lambda group: group.nsmallest(1, 'QT_VOTOS'))
candidatos_menos_votados_1t

Unnamed: 0,Unnamed: 1,NM_VOTAVEL,NR_LATITUDE,NR_LONGITUDE,QT_VOTOS,NM_BAIRRO
0,571,PADRE KELMON,-7.343545,-36.087300,1.0,DISTRITO DE CATOLÉ
1,572,PADRE KELMON,-7.311400,-35.813941,2.0,GALANTE
2,124,CONSTITUINTE EYMAEL,-7.306570,-35.782958,1.0,GALANTE
3,512,LÉO PÉRICLES,-7.306251,-35.774198,1.0,GALANTE
4,160,FELIPE D'AVILA,-7.305965,-35.782734,1.0,GALANTE
...,...,...,...,...,...,...
119,570,LÉO PÉRICLES,-7.185304,-35.905208,1.0,CUITES
120,157,CONSTITUINTE EYMAEL,-7.185081,-35.985678,1.0,DISTRITO DE SAO JOSE DA MATA
121,651,PADRE KELMON,-7.185017,-35.984861,2.0,DISTRITO DE SAO JOSE DA MATA
122,949,SORAYA THRONICKE,-1.000000,-1.000000,1.0,CENTRO


In [None]:
fig1 = px.scatter_mapbox(candidatos_menos_votados_1t, lat='NR_LATITUDE', lon='NR_LONGITUDE', color='NM_VOTAVEL', size='QT_VOTOS',
                        center=dict(lat=-7.2307, lon=-35.8811), zoom=12,
                        hover_name='NM_VOTAVEL', hover_data=['QT_VOTOS'],
                        title='Candidatos à presidência da república menos votados por local de votação em Campina Grande - 1º Turno',
                        mapbox_style='open-street-map',
                        size_max=50)

fig1.update_layout(
    legend=dict(
        title='Candidatos',
        orientation='v',
        itemsizing='constant'
    )
)

Observando agora os recortes dos candidatos menos votados por local e votação, como esperado, a variedade se deu bem maior. A visualização não exprime nenhuma lógica ou assimilação desses candidatos em relação às localidades em que foram os menos votados.

# Exportando os .csv

In [None]:
candidatos_mais_votados_1t.to_csv("CANDIDATOS_MAIS_VOTADOS_1T.csv")
candidatos_mais_votados_2t.to_csv("CANDIDATOS_MAIS_VOTADOS_2T.csv")

Como próximo passo, iremos analisar os aspectos de perfis dos eleitores aptos nessas mesmas regiões da cidade.

> Esta análise continua na [Parte 2](https://colab.research.google.com/drive/1jA4uyIC-_BgfbyuE00gRFBSpm31f-e1e?usp=sharing)