# Dicionario dos dados da tabela 

| **Nome**                     | **Tipo No BigQuery** | **Descrição**                                                                         | **Cobertura Temporal** | **Coberta Por Um Dicionário** | **Coluna Correspondente Nos Diretórios** | **Unidade De Medida** | **Contém Dados Sensíveis (LGPD)** | **Observações** |
|:--------|:----------------------|:------------|:------------------------|:-------------------------------|:--------------------------------|:--------------------------|:-----------------------------------|:-----------------|
| ano                          | INT64                | Ano                                                                                   | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| tipo_eleicao                 | STRING               | Tipo da eleição                                                                       | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| sigla_uf                     | STRING               | Sigla da unidade da federação                                                         | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| sequencial_candidato         | STRING               | Sequencial do candidato                                                               | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| numero_candidato             | STRING               | Número do candidato                                                                   | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| id_candidato_bd              | STRING               | ID Candidato - Base dos Dados                                                         | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| nome_candidato               | STRING               | Nome do candidato                                                                     | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| sigla_partido                | STRING               | Sigla do partido                                                                      | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| cargo                        | STRING               | Cargo                                                                                 | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| data_receita                 | DATE                 | Data da receita                                                                       | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| especie_receita              | STRING               | Espécie da receita                                                                    | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| valor_receita                | FLOAT64              | Valor da receita                                                                      | 2002     | Não                           | Não listado                              | BRL (R$)              | Não                               | Não listado     |
| sigla_uf_doador              | STRING               | Sigla da unidade da federação do doador                                               | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| nome_doador                  | STRING               | Nome do doador                                                                        | 2002     | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |


# Configurando o Ambiente

In [1]:
import pandas as pd
import basedosdados as bd

### Recebendo os dados da fonte "Base dos Dados"

* Os dados utilizados se referem a dados de financiamento de campanha e receita dos candidatos
* Devido a limitação da extração dos dados só temos registros do ano de 2002

In [2]:
# Recebendo a tabela com as informações dos bens de cada candidato (limitado a 5 mil linhas)
receitas_candidatos = bd.read_table(dataset_id='br_tse_eleicoes',
                   table_id='receitas_candidato',
                   billing_project_id='eleicoes-380622',
                   limit=10000)

Downloading: 100%|█████████████████████████████████| 10000/10000 [00:05<00:00, 1846.25rows/s]


# Tratando a Tabela

In [3]:
# Visualizando os dados
receitas_candidatos.head()

Unnamed: 0,ano,turno,tipo_eleicao,sigla_uf,id_municipio,id_municipio_tse,sequencial_candidato,numero_candidato,cpf_candidato,cnpj_candidato,...,cpf_administrador,numero_recibo_eleitoral,numero_documento,numero_recibo_doacao,numero_documento_doacao,tipo_prestacao_contas,data_prestacao_contas,sequencial_prestador_contas,cnpj_prestador_contas,entrega_conjunto
0,2002,,eleicao ordinaria,AC,,,302,11106,,,...,,,,,,,NaT,,,
1,2002,,eleicao ordinaria,AC,,,302,11106,,,...,,,,,,,NaT,,,
2,2002,,eleicao ordinaria,AC,,,302,11106,,,...,,,,,,,NaT,,,
3,2002,,eleicao ordinaria,AC,,,302,11106,,,...,,,,,,,NaT,,,
4,2002,,eleicao ordinaria,AC,,,302,11106,,,...,,,,,,,NaT,,,


In [4]:
# Verificandos os dados ausentes
receitas_candidatos.isnull().sum()

ano                                 0
turno                           10000
tipo_eleicao                        0
sigla_uf                            0
id_municipio                    10000
id_municipio_tse                10000
sequencial_candidato                0
numero_candidato                    0
cpf_candidato                   10000
cnpj_candidato                  10000
titulo_eleitor_candidato        10000
id_candidato_bd                    50
nome_candidato                      0
cpf_vice_suplente               10000
numero_partido                  10000
nome_partido                    10000
sigla_partido                       0
cargo                               0
sequencial_receita              10000
data_receita                        3
fonte_receita                   10000
origem_receita                  10000
natureza_receita                10000
especie_receita                     0
situacao_receita                10000
descricao_receita               10000
valor_receit

In [5]:
# Criando um dicionario com o nome da coluna e a quantidade de valores vazios ela possui
indice_lista = list(receitas_candidatos[receitas_candidatos.notnull()])
valor_lista = list(receitas_candidatos.isnull().sum())

dict_vazio = dict(zip(indice_lista, valor_lista))

In [6]:
# Criando uma lista com o nome das colunas que estão vazias
vazio = []

for n, v in dict_vazio.items():
    if v > 50:
        vazio.append(n)
        
    # dict_vazio
    
len(vazio)

43

In [8]:
# Excluindo as informações não relevantes, sensiveis ou vazias da tabela
for n in vazio:
    receitas_candidatos.drop(columns=n, axis=1, inplace=True)
print("Colunas Removidas")

Colunas Removidas


In [13]:
receitas_candidatos.head()

Unnamed: 0,ano,tipo_eleicao,sigla_uf,sequencial_candidato,numero_candidato,id_candidato_bd,nome_candidato,sigla_partido,cargo,data_receita,especie_receita,valor_receita,sigla_uf_doador,nome_doador
0,2002,eleicao ordinaria,AC,302,11106,1667299,JOSÉ RAIMUNDO BARROZO BESTENE,PPB,deputado estadual,2002-09-17,em especie,7000.0,AC,JOSE RAIMUNDO BARROSO BESTENE
1,2002,eleicao ordinaria,AC,302,11106,1667299,JOSÉ RAIMUNDO BARROZO BESTENE,PPB,deputado estadual,2002-08-14,em especie,1000.0,AC,JOSE RAIMUNDO BARROSO BESTENE
2,2002,eleicao ordinaria,AC,302,11106,1667299,JOSÉ RAIMUNDO BARROZO BESTENE,PPB,deputado estadual,2002-07-31,em especie,1000.0,AC,DENTAL BELIA LTDA
3,2002,eleicao ordinaria,AC,302,11106,1667299,JOSÉ RAIMUNDO BARROZO BESTENE,PPB,deputado estadual,2002-08-22,em especie,2000.0,AC,JOSE RAIMUNDO BARROSO BESTENE
4,2002,eleicao ordinaria,AC,302,11106,1667299,JOSÉ RAIMUNDO BARROZO BESTENE,PPB,deputado estadual,2002-07-31,em especie,1000.0,AC,DENTAL BELIA TDA


# Criando a função de busca na tabela

In [15]:
# Função de busca pelo condidato e
def busca_candidato(nome: str, inicio: int=2002, fim: int=2022, baixar=2):
    """
    Busca pelo nome do candidato entre o intervalo informado,
    e retorna um novo DataFrame contendo 
    
    -----------
    Parametros:
    nome: string;
    inicio: int, padrão '2000';
    fim: int, padrão '2022';
    baixar: bool, padrão False;
    
    -----------
    Retorna:
    A função retorna um DataFrame com as informações 
    filtradas conforme os parametros passados para a variavel, 
    e caso o usuário tenha solicitado a função faz o dowload da tabela
    em um arquivo do tipo excel na pasta dentro do diretório.
    
    -----------
    """
    
    # Criando um DataFrame filtrando o nome pesquisado
    df_busca_nome = receitas_candidatos[receitas_candidatos['nome_candidato'].str.contains(nome, case=False, regex=False) ]
    
    # Criando um DataFrame filtrando o intervalo dos anos pesquisados
    df_busca = df_busca_nome[df_busca_nome['ano'].between(inicio, fim, inclusive='both')]
    
    # Verificando o tamanha da tabela
    if len(df_busca) < 0 or None:
        print("Nome não encontrado")
        
    else:
        if baixar == '1' or baixar  == 1:
            df_busca.to_excel(f'pesquisas/pesquisa_cadidato_{nome}.xlsx')
            print("Aquivo foi salvo na pasta 'pesquisas'")
        if baixar == '2' or baixar == 2:
            return df_busca
        else:
            print("Tente novamente, informando um numero que seja 1 ou 2") 
    

# Pegando as informações com o usuário

In [16]:
# Recebendo do usuairo as informações para a busca do candidato na base de dados
# E tratando os possiveis erros com o preenchimento das variaveis

try:
    nome_candidato = str(input("Qual o nome do candidato?: "))
    inicio_data = int(input("Qual o primeiro ano do intervalo da busca?: "))
    fim_data = int(input("Qual o último ano do intervalo da busca?: "))
    baixar_busca = input("Deseja baixar a tabela com o resultado da busca? (1 para baixar e 2 para não baixar): ")

except (ValueError, TypeError) as error:
    print(f'Algo deu errado: {error}')


Qual o nome do candidato?: Augusto
Qual o primeiro ano do intervalo da busca?: 2002
Qual o último ano do intervalo da busca?: 2002
Deseja baixar a tabela com o resultado da busca? (1 para baixar e 2 para não baixar): 2


In [17]:
# Tratando os possiveis erros da função
busca_candidato(nome=nome_candidato,inicio=inicio_data, fim=fim_data, baixar=baixar_busca)

Unnamed: 0,ano,tipo_eleicao,sigla_uf,sequencial_candidato,numero_candidato,id_candidato_bd,nome_candidato,sigla_partido,cargo,data_receita,especie_receita,valor_receita,sigla_uf_doador,nome_doador
685,2002,eleicao ordinaria,AC,298,25666,1388843,JOSÉ AUGUSTO FERREIRA PINHEIRO,PFL,deputado estadual,2002-09-17,estimado,700.0,AC,JOÃO PEDRO DE OLIVEIRA
686,2002,eleicao ordinaria,AC,298,25666,1388843,JOSÉ AUGUSTO FERREIRA PINHEIRO,PFL,deputado estadual,2002-07-31,estimado,520.0,AC,RITA FEITOSA PINHEIRO
687,2002,eleicao ordinaria,AC,298,25666,1388843,JOSÉ AUGUSTO FERREIRA PINHEIRO,PFL,deputado estadual,2002-09-18,estimado,1000.0,AC,RITA FEITOSA PINHEIRO
688,2002,eleicao ordinaria,AC,298,25666,1388843,JOSÉ AUGUSTO FERREIRA PINHEIRO,PFL,deputado estadual,2002-10-09,estimado,780.0,AC,MARIA DE FATIMA PINHEIRO DE OLIVEIRA
689,2002,eleicao ordinaria,AC,298,25666,1388843,JOSÉ AUGUSTO FERREIRA PINHEIRO,PFL,deputado estadual,2002-08-05,estimado,750.0,AC,RITA FEITOSA PINHEIRO
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
8331,2002,eleicao ordinaria,BA,1296,45456,1702086,LUIZ AUGUSTO GORDIANO DE MORAES,PSDB,deputado estadual,2002-10-29,cheque,20000.0,BA,LUIZ AUGUSTO GORDIANO DE MORAES
8332,2002,eleicao ordinaria,BA,1296,45456,1702086,LUIZ AUGUSTO GORDIANO DE MORAES,PSDB,deputado estadual,2002-10-04,em especie,1430.0,BA,LUIZ AUGUSTO GORDIANO DE MORAES
8333,2002,eleicao ordinaria,BA,1296,45456,1702086,LUIZ AUGUSTO GORDIANO DE MORAES,PSDB,deputado estadual,2002-11-01,cheque,110.0,BA,LUIZ AUGUSTO GORDIANO DE MORAES
8334,2002,eleicao ordinaria,BA,1296,45456,1702086,LUIZ AUGUSTO GORDIANO DE MORAES,PSDB,deputado estadual,2002-10-04,cheque,5000.0,BA,LUIZ AUGUSTO GORDIANO DE MORAES
