# "Eleições RJ: Votação por Bairros"
> "dados do TSE"

- toc: true
- branch: master
- badges: true
- comments: false
- numbersections: true
- categories: [eleições, RJ, bairros]
- image: images/some_folder/your_image.png
- hide: false
- search_exclude: true

In [1]:
#hide

import os
from IPython.core.display import display, HTML
from IPython.display import IFrame
# import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import json
from unidecode import unidecode


from ElectionsDB import ElectionsDB

self = ElectionsDB()

def show_folium(m):
    data = m.get_root().render()
    data_fixed_height = data.replace('width: 100%;height: 100%', 'width: 100%').replace('height: 100.0%;', 'height: 609px;', 1)
    # display(HTML(data_fixed_height))
    return data_fixed_height

def get_elected_candidates_dict(uf,partidos,cargos,anos,only_elected=True,verbose=False):
    if only_elected:
        folder_path = 'results/eleitos'
    else:
        folder_path = 'results/candidatos'
    os.makedirs(folder_path,exist_ok=True)
    elected = {}
    for cargo in cargos:
        cargo_api = ' '.join([x.capitalize() for x in cargo.split()])
        elected[cargo] = {}
        for ano in anos:
            fname = f'{ano}_{uf}_{cargo}_{"_".join(partidos)}.csv'.replace(' ','_')
            file_path = f'{folder_path}/{fname}'
            if verbose:
                print(file_path)
            if not os.path.exists(file_path):
                if only_elected:
                    cand = el.get_candidates(year=ano, position=cargo_api,only_elected=only_elected,
                        columns=["NUMERO_CANDIDATO", "NOME_CANDIDATO", "SIGLA_UF", "NUM_TURNO", "SIGLA_PARTIDO", "COMPOSICAO_LEGENDA"])
                else:
                    cand = el.get_candidates(year=ano, position=cargo_api,
                        columns=["NUMERO_CANDIDATO", "NOME_CANDIDATO", "SIGLA_UF", "NUM_TURNO", "SIGLA_PARTIDO", "COMPOSICAO_LEGENDA"])

                cand = cand.query(f"SIGLA_UF == '{uf}' ").query(f"SIGLA_PARTIDO in {partidos}")
                cand.to_csv(file_path,index=False)
            else:
                cand = pd.read_csv(file_path)
                cand['NUMERO_CANDIDATO'] = cand['NUMERO_CANDIDATO'].astype(str)
            
            elected[cargo][ano] = cand
            
    return elected

def shrink_html(fname,base_path):
    # geo_json_file='../assets/html/maps/geo_json_coords.txt'
    with open(fname,'r') as f:
        lines = f.readlines()

    out_str = ''
    script_file = fname.replace('.html','.js')
    script_scr = script_file.replace('../',base_path)
    for i,line in enumerate(lines):
        if '</body>' in line:
            out_str += line + f'<script src="{script_scr}"></script>\n'
            script_index = i + 2
            break
        else:
            # print(line)
            out_str += line

    with open(fname,'w') as f:
        f.write(out_str)

    # print(len(out_str),out_str)

    script_str = ''
    for line in lines[script_index:]:
        if '</script>' in line:
            break
        script_str+= line

    geo_json_file='../assets/html/geo_json_coords.json'

    
    lines = script_str.split('\n')

    out_str = ''
    for i,line in enumerate(lines):
        if '_add' in line:
            if len(line) > 1000:
                index = line.index('{"crs"')
                # print('len(line):',len(line))
                if not os.path.exists(geo_json_file):
                    geo_json_coords = line[index:].strip().rstrip(');')
                    with open(geo_json_file,'w') as f:
                        f.write(geo_json_coords)
                # line = line[:index] + ');'
                line = f"""
        function load_geo_json(file_path) {{
            fetch(file_path)
            .then(response => response.text())
            .then(data => {{
              const obj = JSON.parse(data);
              {line[:index].strip()}obj);
            }})
          }}
            const file_path ='{geo_json_file.replace('../',base_path)}';
            load_geo_json(file_path);
            """
        out_str += line + '\n'

    fname = fname.replace('.html','.js')
    with open(fname,'w') as f:
        f.write(out_str)

# definições gerais fixas

base_path = '/epp/'
abs_folder = f'{base_path}assets/html/'
relative_folder = '../assets/html'

tables_folder = f'{relative_folder}/tables'
os.makedirs(tables_folder,exist_ok=True)
bairros_geo = 'geojson/limites_bairros_RJ_edit.geojson'

maps_folder = f'{relative_folder}/maps'
os.makedirs(maps_folder,exist_ok=True)

# update_maps=True


  from IPython.core.display import display, HTML


In [2]:
#hide
 
uf = 'RJ'
# uf = 'AC'
anos = [2014,2016,2018,2020]

cargos= ["DEPUTADO ESTADUAL","DEPUTADO FEDERAL","GOVERNADOR","VEREADOR","PREFEITO"]
partidos_esquerda = [13,40,50,65]
partidos_direita = [15,17,25,45]
nulo = [96,95]
n_cands = 40


nr_partidos=partidos_esquerda
nr_partidos_str = [str(x) for x in nr_partidos]

##########################################################################3

html_dict = {}

df_bairros = self.get_election_result(uf,ano=0,agg='bairro')
selection_queries = [f"NR_TURNO == 1"]
selection_queries += [f"ANO_ELEICAO == {anos}"]
df_bairros = self.get_selected_df(df_bairros,selection_queries)
df_bairros['DS_CARGO'].unique().tolist(), df_bairros['ANO_ELEICAO'].unique().tolist()

Lendo dados da tabela rj_votacao_bairro.
Obtendo dados salvos de todos os anos.
Anos disponíveis: [2018 2014 2020 2016]


(['DEPUTADO ESTADUAL',
  'DEPUTADO FEDERAL',
  'GOVERNADOR',
  'SENADOR',
  'PREFEITO',
  'VEREADOR'],
 [2018, 2014, 2020, 2016])

In [3]:
#hide
# cargos= ["GOVERNADOR","PREFEITO"]

for cargo in cargos:
    print(cargo)
    html_dict[cargo] = {}

    selection_queries = [f"DS_CARGO == '{cargo}'"]

    df_sel = df_bairros.copy()
    if cargo in ['VEREADOR','PREFEITO']:
        ano_ref = 2020
    else:
        ano_ref = 2018

    self.add_number_name(df_sel,uf,ano=ano_ref) #add coluna NR_NM_VOTAVEL
    df_sel = self.get_selected_df(df_bairros,selection_queries)

    nr_name_dict = self.get_nr_name_dict(uf,cargo,ano_ref)

    selection_queries_dict = [f"ANO_ELEICAO == {ano_ref}"]
    selection_queries_dict += [f"DS_CARGO == '{cargo}'"]
    selection_queries_dict += [f"NR_PARTIDO == {nr_partidos}"]
    selected_cand = self.get_selected_cand(uf,selection_queries_dict,n_cands)
    if True:
        html_dict[cargo]={}
        for relative in [False,True]:
            rel_sufix = 'relativa' if relative else 'absoluta'
            print(f'cargo: {cargo} - ano_ref: {ano_ref} - {rel_sufix}')
            html_dict[cargo][rel_sufix] = {}
            
            index_cols = ['ANO_ELEICAO','NM_MUNICIPIO', 'NM_BAIRRO']
            df = pd.pivot_table(df_sel, values='QT_VOTOS', index=index_cols,columns=['NM_VOTAVEL'],aggfunc=np.sum).fillna(0)
            if relative:
                df = df.div(df.sum(axis=1),axis=0)
        
            df = df.rename(columns=nr_name_dict)
            selected_cols = [x for x in df.columns if x[:2] in nr_partidos_str]            
            df = df[selected_cols]
            df['SOMA'] = df.sum(axis=1)
            df = df.sort_values('SOMA',ascending=False).reset_index(drop=False)
            df.index += 1
            df_all = df.reset_index()
            
            for i,cand in enumerate(selected_cand):
                # print(cand)
                ordem_cand = f'{i+1:02d}_{cand}'
                html_dict[cargo][rel_sufix][ordem_cand] = {}
                table_name = f'{uf}_{cargo}_{i:02d}_{rel_sufix}_{cand}'.replace(' ','_').upper()
                table_path = f'{tables_folder}/{table_name}.html'
                html_dict[cargo][rel_sufix][ordem_cand]['tabela'] = f'{abs_folder}/tables/{table_name}.html'

                df = df_all[index_cols + [cand]].reset_index()
                df = pd.pivot_table(df, values=cand, index=['NM_MUNICIPIO', 'NM_BAIRRO'],columns=['ANO_ELEICAO'],aggfunc=np.sum).fillna(0)
                df = df.sort_values(df.columns[-1],ascending=False)
                mask = df.sum(axis=1)>0
                df = df[mask]
                df_style = self.get_df_style(df,relative)
                df_style.to_html(table_path)
        
with open(f'{relative_folder}/html_dict.json', 'w') as fp:
    json.dump(html_dict, fp,sort_keys=True, indent=4)

DEPUTADO ESTADUAL
Lendo dados da tabela rj_votacao_municipio.
Os dados estão no banco, não serão atualizados.
Lendo dados da tabela rj_votacao_municipio.
Os dados estão no banco, não serão atualizados.
Lendo dados da tabela rj_votacao_municipio.
Obtendo dados salvos de todos os anos.
Anos disponíveis: [2014 2018 2016 2020 2010]
cargo: DEPUTADO ESTADUAL - ano_ref: 2018 - absoluta
cargo: DEPUTADO ESTADUAL - ano_ref: 2018 - relativa
DEPUTADO FEDERAL
Lendo dados da tabela rj_votacao_municipio.
Os dados estão no banco, não serão atualizados.
Lendo dados da tabela rj_votacao_municipio.
Os dados estão no banco, não serão atualizados.
cargo: DEPUTADO FEDERAL - ano_ref: 2018 - absoluta
cargo: DEPUTADO FEDERAL - ano_ref: 2018 - relativa
GOVERNADOR
Lendo dados da tabela rj_votacao_municipio.
Os dados estão no banco, não serão atualizados.
Lendo dados da tabela rj_votacao_municipio.
Os dados estão no banco, não serão atualizados.
cargo: GOVERNADOR - ano_ref: 2018 - absoluta
cargo: GOVERNADOR - ano

In [4]:
df_all
cand
selection_queries_dict
# selection_queries_dict = [f"ANO_ELEICAO == {ano_ref}"]
# selection_queries_dict += [f"DS_CARGO == '{cargo}'"]
# selection_queries_dict += [f"NR_PARTIDO == {nr_partidos}"]
# selected_cand = self.get_selected_cand(uf,selection_queries_dict,n_cands)
selected_cand

['13_BENEDITA SOUZA DA SILVA',
 '13_DIMAS DE PAIVA GADELHA JUNIOR',
 '50_RENATA DA SILVA SOUZA',
 '13_FABIANO TAQUES HORTA',
 '40_RUBENS JOSE FRANCA BOMTEMPO',
 '50_FLAVIO ALVES SERAFINI',
 '50_IVANETE CONCEICAO DA SILVA',
 '50_NATALIA SOARES RIBEIRO',
 '13_ALUIZIO FIRMIANO DA SILVA JUNIOR',
 '65_ISAAC SOUZA DA SILVA',
 '40_JOSE ZUMBA CLEMENTE DA SILVA',
 '13_IGOR PAES NUNES SARDINHA',
 '50_VINICIUS BAIAO VIEIRA',
 '40_ALZEMIRO DOS SANTOS DIAS',
 '13_CLARICE DE FREITAS SILVA AVILA',
 '13_PAULO SERGIO HENRIQUES AGUIAR',
 '50_CLAUDIO DAMIAO SANTOS PEREIRA',
 '65_LIVIA DE LIMA MIRANDA',
 '13_SEBASTIAO WAGNER BERRIEL',
 '13_ODISSEIA PINTO DE CARVALHO',
 '50_LECI CARVALHO E SILVA',
 '40_LUIZ CARLOS DA ROCHA NOVAES',
 '50_JOSE LUIZ DE SOUZA LIMA',
 '40_RODRIGO PIRACIABA COSTA',
 '50_NEUZA DA SILVA BOUMGRATZ',
 '50_JULIANA PEREIRA DE CARVALHO',
 '40_ALEX MARTINS RODRIGUES',
 '13_MARIA APARECIDA DIOGO BRAGA',
 '50_WENDERSON DIAS RIBEIRO',
 '13_ERIVELTON DIAS COSTA',
 '50_ANA PAULA LOPES SIQUEI

In [5]:
df = self.get_most_voted(uf,selection_queries_dict,n_cands)
df

Unnamed: 0,ANO_ELEICAO,DS_CARGO,NR_PARTIDO,NR_VOTAVEL,NM_VOTAVEL,QT_VOTOS,GRUPO,GRUPAO
1,2020,PREFEITO,13,13,BENEDITA SOUZA DA SILVA,296847,2_esquerda_ref,1_esquerda
2,2020,PREFEITO,13,13,DIMAS DE PAIVA GADELHA JUNIOR,117346,2_esquerda_ref,1_esquerda
3,2020,PREFEITO,50,50,RENATA DA SILVA SOUZA,85272,2_esquerda_ref,1_esquerda
4,2020,PREFEITO,13,13,FABIANO TAQUES HORTA,76285,2_esquerda_ref,1_esquerda
5,2020,PREFEITO,40,40,RUBENS JOSE FRANCA BOMTEMPO,39093,2_esquerda_ref,1_esquerda
6,2020,PREFEITO,50,50,FLAVIO ALVES SERAFINI,23846,2_esquerda_ref,1_esquerda
7,2020,PREFEITO,50,50,IVANETE CONCEICAO DA SILVA,17251,2_esquerda_ref,1_esquerda
8,2020,PREFEITO,50,50,NATALIA SOARES RIBEIRO,11622,2_esquerda_ref,1_esquerda
9,2020,PREFEITO,13,13,ALUIZIO FIRMIANO DA SILVA JUNIOR,10854,2_esquerda_ref,1_esquerda
10,2020,PREFEITO,65,65,ISAAC SOUZA DA SILVA,8775,2_esquerda_ref,1_esquerda


In [6]:
#hide

## opção de adicionar os valores absolutos e relativos na mesma tabela.


# for cargo in cargos:
#     print(cargo)
#     html_dict[cargo] = {}

#     selection_queries = [f"DS_CARGO == '{cargo}'"]

#     df_sel = df_bairros.copy()
#     if cargo == 'VEREADOR':
#         ano_ref = 2020
#     else:
#         ano_ref = 2018

#     self.add_number_name(df_sel,uf,ano=ano_ref) #add coluna NR_NM_VOTAVEL
#     df_sel = self.get_selected_df(df_bairros,selection_queries)

#     nr_name_dict = self.get_nr_name_dict(uf,cargo,ano_ref)

#     selection_queries_dict = [f"ANO_ELEICAO == {ano_ref}"]
#     selection_queries_dict += [f"DS_CARGO == '{cargo}'"]
#     selection_queries_dict += [f"NR_PARTIDO == {nr_partidos}"]
#     selected_cand = self.get_selected_cand(uf,selection_queries_dict,n_cands)
#     if True:
#         html_dict[cargo]={}
#         # for relative in [False,True]:
#         if True:
#             relative=False
#             # rel_sufix = 'relativa' if relative else 'absoluta'
#             # print(f'cargo: {cargo} - ano_ref: {ano_ref} - {rel_sufix}')
#             print(f'cargo: {cargo} - ano_ref: {ano_ref}')
#             # html_dict[cargo][rel_sufix] = {}
            
#             index_cols = ['ANO_ELEICAO','NM_MUNICIPIO', 'NM_BAIRRO']
#             df = pd.pivot_table(df_sel, values='QT_VOTOS', index=index_cols,columns=['NM_VOTAVEL'],aggfunc=np.sum).fillna(0)
            
#             df_rel = df.div(df.sum(axis=1),axis=0)
#             df_rel = df_rel.reset_index()
#             df_rel['ANO_ELEICAO'] = df_rel['ANO_ELEICAO'].apply(lambda x: f'perc_{x}')
            
#             df = df.reset_index()

#             df = pd.concat([df, df_rel]).set_index(index_cols)


#             # if relative:
#             #     df = df.div(df.sum(axis=1),axis=0)
        
#             df = df.rename(columns=nr_name_dict)
#             selected_cols = [x for x in df.columns if x[:2] in nr_partidos_str]            
#             df = df[selected_cols]
#             df['SOMA'] = df.sum(axis=1)
#             df = df.sort_values('SOMA',ascending=False).reset_index(drop=False)
#             df.index += 1
#             df_all = df.reset_index()
            
#             for cand in selected_cand:
#                 # print(cand)
#                 html_dict[cargo][cand] = {}
#                 table_name = f'{uf}_{cargo}_{cand}'.replace(' ','_').upper()
#                 table_path = f'{tables_folder}/{table_name}.html'
#                 html_dict[cargo][cand]['tabela'] = f'{abs_folder}/tables/{table_name}.html'

#                 df = df_all[index_cols + [cand]].reset_index()
#                 df = pd.pivot_table(df, values=cand, index=['NM_MUNICIPIO', 'NM_BAIRRO'],columns=['ANO_ELEICAO'],aggfunc=np.sum).fillna(0)
#                 df = df.sort_values(df.columns[-1],ascending=False)
#                 mask = df.sum(axis=1)>0
#                 df = df[mask]
#                 df_style = self.get_df_style(df,relative)
#                 df_style.to_html(table_path)

# with open(f'{relative_folder}/html_dict.json', 'w') as fp:
#     json.dump(html_dict, fp,sort_keys=True, indent=4)

# Votação por Bairro - Rio de Janeiro (Capital)
## Tabelas
## Mapas