In [1]:
# -*- coding: utf-8
# Transparency International - Brazil (https://transparenciainternacional.org.br)
# Reinaldo Chaves (@paidatocandeira)
# Carrega os bens dos candidatos das Eleições 2018
#

In [None]:
import pandas as pd
import unidecode
from pathlib import Path
import math

In [2]:
# Função para retirar acentuação
def f(str):
    return (unidecode.unidecode(str))

In [3]:
# Funcao para ler arquivos em diretorio - bens 2014
def _reader_b_2018(fname):
    return pd.read_csv(fname, sep=';', encoding='latin_1', converters={'SQ_CANDIDATO': lambda x: str(x)}, decimal = ',')

In [4]:
# Cria arquivo único
folder = Path("bens/bens_2018")
bens_2018 = pd.concat([
    _reader_b_2018(txt)
    for txt in folder.glob("*.csv")
])

In [5]:
bens_2018.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 93200 entries, 0 to 2589
Data columns (total 19 columns):
DT_GERACAO               93200 non-null object
HH_GERACAO               93200 non-null object
ANO_ELEICAO              93200 non-null int64
CD_TIPO_ELEICAO          93200 non-null int64
NM_TIPO_ELEICAO          93200 non-null object
CD_ELEICAO               93200 non-null int64
DS_ELEICAO               93200 non-null object
DT_ELEICAO               93200 non-null object
SG_UF                    93200 non-null object
SG_UE                    93200 non-null object
NM_UE                    93200 non-null object
SQ_CANDIDATO             93200 non-null object
NR_ORDEM_CANDIDATO       93200 non-null int64
CD_TIPO_BEM_CANDIDATO    93200 non-null int64
DS_TIPO_BEM_CANDIDATO    93200 non-null object
DS_BEM_CANDIDATO         93200 non-null object
VR_BEM_CANDIDATO         93200 non-null float64
DT_ULTIMA_ATUALIZACAO    93200 non-null object
HH_ULTIMA_ATUALIZACAO    93200 non-null object
dty

In [6]:
# Apaga colunas inúteis
del bens_2018['DT_GERACAO']
del bens_2018['HH_GERACAO']
del bens_2018['ANO_ELEICAO']
del bens_2018['CD_TIPO_ELEICAO']
del bens_2018['NM_TIPO_ELEICAO']
del bens_2018['CD_ELEICAO']
del bens_2018['DS_ELEICAO']
del bens_2018['DT_ELEICAO']
del bens_2018['SG_UE']
del bens_2018['NM_UE']
del bens_2018['DS_BEM_CANDIDATO']
del bens_2018['NR_ORDEM_CANDIDATO']
del bens_2018['CD_TIPO_BEM_CANDIDATO']
del bens_2018['DT_ULTIMA_ATUALIZACAO']
del bens_2018['HH_ULTIMA_ATUALIZACAO']

bens_2018.columns  = ['uf', 'sequencial', 'descricao', 'valor']
bens_2018.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 93200 entries, 0 to 2589
Data columns (total 4 columns):
uf            93200 non-null object
sequencial    93200 non-null object
descricao     93200 non-null object
valor         93200 non-null float64
dtypes: float64(1), object(3)
memory usage: 3.6+ MB


In [7]:
total1 = bens_2018[(bens_2018['sequencial'] == '80000620180')]
total1

Unnamed: 0,uf,sequencial,descricao,valor
15,ES,80000620180,"Veículo automotor terrestre: caminhão, automóv...",110000.0
326,ES,80000620180,Outros bens imóveis,32000.0
778,ES,80000620180,"Veículo automotor terrestre: caminhão, automóv...",4000.0
980,ES,80000620180,Apartamento,354000.0
1761,ES,80000620180,Construção,24970.54
1765,ES,80000620180,Construção,103418.77


Carrega os candidatos para deputados federais e senador

In [8]:
candidatos_2018 = pd.read_excel('resultados/candidatos_2018_atual_atual.xlsx',sheet_name='Sheet1', converters={'sequencial': lambda x: str(x), 
                                                                                              'cpf': lambda x: str(x),  
                                                                                              'numero_urna': lambda x: str(x),
                                                                                              'titulo_eleitor': lambda x: str(x),     
                                                                                                  })

In [9]:
candidatos_2018.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 8263 entries, 21 to 458
Data columns (total 16 columns):
uf                      8263 non-null object
cargo                   8263 non-null object
sequencial              8263 non-null object
numero_urna             8263 non-null object
nome_completo           8263 non-null object
nome_urna               8263 non-null object
cpf                     8263 non-null object
e_mail                  8263 non-null object
situacao_candidatura    8263 non-null object
partido_eleicao         8263 non-null object
uf_nascimento           8263 non-null object
municipio_nascimento    8263 non-null object
data_nascimento         8263 non-null object
titulo_eleitor          8263 non-null object
ocupacao                8263 non-null object
reeleicao               8263 non-null object
dtypes: object(16)
memory usage: 1.1+ MB


Une bens e candidados pelo código sequencial

In [10]:
bens_gerais_candidatos_2018 =  pd.merge(candidatos_2018, bens_2018, left_on='sequencial', right_on='sequencial')

In [11]:
bens_gerais_candidatos_2018.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 32618 entries, 0 to 32617
Data columns (total 19 columns):
uf_x                    32618 non-null object
cargo                   32618 non-null object
sequencial              32618 non-null object
numero_urna             32618 non-null object
nome_completo           32618 non-null object
nome_urna               32618 non-null object
cpf                     32618 non-null object
e_mail                  32618 non-null object
situacao_candidatura    32618 non-null object
partido_eleicao         32618 non-null object
uf_nascimento           32618 non-null object
municipio_nascimento    32618 non-null object
data_nascimento         32618 non-null object
titulo_eleitor          32618 non-null object
ocupacao                32618 non-null object
reeleicao               32618 non-null object
uf_y                    32618 non-null object
descricao               32618 non-null object
valor                   32618 non-null float64
dtypes: float64(

In [12]:
total1 = bens_gerais_candidatos_2018[(bens_gerais_candidatos_2018['sequencial'] == '80000620180')]
total1

Unnamed: 0,uf_x,cargo,sequencial,numero_urna,nome_completo,nome_urna,cpf,e_mail,situacao_candidatura,partido_eleicao,uf_nascimento,municipio_nascimento,data_nascimento,titulo_eleitor,ocupacao,reeleicao,uf_y,descricao,valor
26735,ES,DEPUTADO FEDERAL,80000620180,7007,ALEXANDRE MAGNO COLA,ALEXANDRE COLA,87669528753,ALEXANDRECOLA@GMAIL.COM,DEFERIDO,AVANTE,ES,CACHOEIRO DE ITAPEMIRIM,01/02/1966,1484171465,TABELIÃO,N,ES,"Veículo automotor terrestre: caminhão, automóv...",110000.0
26736,ES,DEPUTADO FEDERAL,80000620180,7007,ALEXANDRE MAGNO COLA,ALEXANDRE COLA,87669528753,ALEXANDRECOLA@GMAIL.COM,DEFERIDO,AVANTE,ES,CACHOEIRO DE ITAPEMIRIM,01/02/1966,1484171465,TABELIÃO,N,ES,Outros bens imóveis,32000.0
26737,ES,DEPUTADO FEDERAL,80000620180,7007,ALEXANDRE MAGNO COLA,ALEXANDRE COLA,87669528753,ALEXANDRECOLA@GMAIL.COM,DEFERIDO,AVANTE,ES,CACHOEIRO DE ITAPEMIRIM,01/02/1966,1484171465,TABELIÃO,N,ES,"Veículo automotor terrestre: caminhão, automóv...",4000.0
26738,ES,DEPUTADO FEDERAL,80000620180,7007,ALEXANDRE MAGNO COLA,ALEXANDRE COLA,87669528753,ALEXANDRECOLA@GMAIL.COM,DEFERIDO,AVANTE,ES,CACHOEIRO DE ITAPEMIRIM,01/02/1966,1484171465,TABELIÃO,N,ES,Apartamento,354000.0
26739,ES,DEPUTADO FEDERAL,80000620180,7007,ALEXANDRE MAGNO COLA,ALEXANDRE COLA,87669528753,ALEXANDRECOLA@GMAIL.COM,DEFERIDO,AVANTE,ES,CACHOEIRO DE ITAPEMIRIM,01/02/1966,1484171465,TABELIÃO,N,ES,Construção,24970.54
26740,ES,DEPUTADO FEDERAL,80000620180,7007,ALEXANDRE MAGNO COLA,ALEXANDRE COLA,87669528753,ALEXANDRECOLA@GMAIL.COM,DEFERIDO,AVANTE,ES,CACHOEIRO DE ITAPEMIRIM,01/02/1966,1484171465,TABELIÃO,N,ES,Construção,103418.77


In [13]:
bens_gerais_candidatos_2018.to_excel('resultados/bens_candidatos_2018_1out.xlsx',sheet_name='Sheet1')

Calcula o total por candidato

In [14]:
total = bens_gerais_candidatos_2018.groupby("sequencial").valor.sum().reset_index().sort_values("valor", ascending=False)

In [15]:
total.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 5379 entries, 3203 to 4973
Data columns (total 2 columns):
sequencial    5379 non-null object
valor         5379 non-null float64
dtypes: float64(1), object(1)
memory usage: 126.1+ KB


In [16]:
total.rename(columns={"valor": "total_bens"}, inplace=True)
total.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 5379 entries, 3203 to 4973
Data columns (total 2 columns):
sequencial    5379 non-null object
total_bens    5379 non-null float64
dtypes: float64(1), object(1)
memory usage: 126.1+ KB


In [17]:
total1 = total[(total['sequencial'] == '80000620180')]
total1

Unnamed: 0,sequencial,total_bens
5168,80000620180,628389.31


In [18]:
candidatos_bens =  pd.merge(candidatos_2018, total, how='left', left_on='sequencial', right_on='sequencial')

In [19]:
candidatos_bens.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 8263 entries, 0 to 8262
Data columns (total 17 columns):
uf                      8263 non-null object
cargo                   8263 non-null object
sequencial              8263 non-null object
numero_urna             8263 non-null object
nome_completo           8263 non-null object
nome_urna               8263 non-null object
cpf                     8263 non-null object
e_mail                  8263 non-null object
situacao_candidatura    8263 non-null object
partido_eleicao         8263 non-null object
uf_nascimento           8263 non-null object
municipio_nascimento    8263 non-null object
data_nascimento         8263 non-null object
titulo_eleitor          8263 non-null object
ocupacao                8263 non-null object
reeleicao               8263 non-null object
total_bens              5379 non-null float64
dtypes: float64(1), object(16)
memory usage: 1.1+ MB


In [20]:
candidatos_bens.reset_index().head()

Unnamed: 0,index,uf,cargo,sequencial,numero_urna,nome_completo,nome_urna,cpf,e_mail,situacao_candidatura,partido_eleicao,uf_nascimento,municipio_nascimento,data_nascimento,titulo_eleitor,ocupacao,reeleicao,total_bens
0,0,AC,DEPUTADO FEDERAL,10000601383,4466,GILMAR FONTES,GILMAR FONTES,41924398249,JK.AC@HOTMAIL.COM,DEFERIDO,PRP,PR,MARECHAL CANDIDO RONDOM,04/11/1972,10779642372,OUTROS,N,
1,1,AC,DEPUTADO FEDERAL,10000602521,2323,ROSANA SOUSA DO NASCIMENTO,ROSANA NASCIMENTO,30796644268,POYONAWA@HOTMAIL.COM,DEFERIDO,PPS,AC,RIO BRANCO,24/04/1969,1883482488,PROFESSOR DE ENSINO SUPERIOR,N,
2,2,AC,DEPUTADO FEDERAL,10000602509,2525,ALAN RICK MIRANDA,ALAN RICK,44726570234,ALANRICKMIRANDA@UOL.COM.BR,DEFERIDO,DEM,AC,RIO BRANCO,23/10/1976,3240992410,DEPUTADO,S,727390.11
3,3,AC,SENADOR,10000600003,181,MINORU MARTINS KINPARA,MINORU KINPARA,21722099291,DEGMARAF@GMAIL.COM,DEFERIDO,REDE,GO,ITAPACI,02/12/1968,1448152437,SERVIDOR PÚBLICO FEDERAL,N,850000.0
4,4,AC,DEPUTADO FEDERAL,10000608401,1377,RAQUEL GLEYCIANE SANTOS DE SOUZA,RAQUEL SOUZA,68261039234,RAQUELCIANE@GMAIL.COM,DEFERIDO,PT,AC,RIO BRANCO,11/10/1980,4129812445,AGENTE DE SAÚDE E SANITARISTA,N,


Cria o link direto para acessar a lista de bens

In [21]:
def limpeza1(linha):
    uf = str(linha["uf"])
    sequencial = str(linha["sequencial"])
    valor = linha["total_bens"]
        
    if math.isnan(valor):
        link = "Não declarou bens até o momento"
    else:
        link = url_chave +  uf + '/' + sequencial + '/bens'
    return link

In [22]:
url_chave = 'http://divulgacandcontas.tse.jus.br/divulga/#/candidato/2018/2022802018/'
candidatos_bens["detalhes_bens"] = candidatos_bens.apply(limpeza1, axis=1)

In [23]:
candidatos_bens.detalhes_bens.head()

0                      Não declarou bens até o momento
1                      Não declarou bens até o momento
2    http://divulgacandcontas.tse.jus.br/divulga/#/...
3    http://divulgacandcontas.tse.jus.br/divulga/#/...
4                      Não declarou bens até o momento
Name: detalhes_bens, dtype: object

In [24]:
candidatos_bens.to_excel('resultados/bens_candidatos_2018_atual.xlsx',sheet_name='Sheet1')

In [25]:
candidatos_bens.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 8263 entries, 0 to 8262
Data columns (total 18 columns):
uf                      8263 non-null object
cargo                   8263 non-null object
sequencial              8263 non-null object
numero_urna             8263 non-null object
nome_completo           8263 non-null object
nome_urna               8263 non-null object
cpf                     8263 non-null object
e_mail                  8263 non-null object
situacao_candidatura    8263 non-null object
partido_eleicao         8263 non-null object
uf_nascimento           8263 non-null object
municipio_nascimento    8263 non-null object
data_nascimento         8263 non-null object
titulo_eleitor          8263 non-null object
ocupacao                8263 non-null object
reeleicao               8263 non-null object
total_bens              5379 non-null float64
detalhes_bens           8263 non-null object
dtypes: float64(1), object(17)
memory usage: 1.2+ MB
