# Receita Declarada dos Candidatos
A pesquisa considera os cargos de:
- Presidente da Republica;
- Governadores;
- Senadores;
- Deputados Federais;
- Deputados Estaduais.

### A base de dados em questão, foi escolhida para entender como estava distribuida a concentração de receita dos cadidatos por estado.

* Os dados utilizados se referem a dados de financiamento de campanha e receita dos candidatos;
* Devido a limitação da extração dos dados só temos registros dos anos de **2010 e 2022** .

O foco da pesquisa é ter a informação de como está dividida a concentração de receita entre os estados do país e entre os partidos de cada estado

# Dicionario dos dados da tabela 

| **Nome**                     | **Tipo No BigQuery** | **Descrição**                                                                         | **Cobertura Temporal** | **Coberta Por Um Dicionário** | **Coluna Correspondente Nos Diretórios** | **Unidade De Medida** | **Contém Dados Sensíveis (LGPD)** | **Observações** |
|:--------|:----------------------|:------------|:------------------------|:-------------------------------|:--------------------------------|:--------------------------|:-----------------------------------|:-----------------|
| ano                          | INT64                | Ano                                                                                   | 2010 - 2022 | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| tipo_eleicao                 | STRING               | Tipo da eleição                                                                       |2010 - 2022 | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| sigla_uf                     | STRING               | Sigla da unidade da federação                                                         | 2010 - 2022  | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| sequencial_candidato         | STRING               | Sequencial do candidato                                                               | 2010 - 2022  | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| numero_candidato             | STRING               | Número do candidato                                                                   |2010 - 2022 | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| id_candidato_bd              | STRING               | ID Candidato - Base dos Dados                                                         | 2010 - 2022  | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| nome_candidato               | STRING               | Nome do candidato                                                                     | 2010 - 2022      | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| sigla_partido                | STRING               | Sigla do partido                                                                      | 2010 - 2022      | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| cargo                        | STRING               | Cargo                                                                                 | 2010 - 2022      | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| data_receita                 | DATE                 | Data da receita                                                                       | 2010 - 2022      | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| especie_receita              | STRING               | Espécie da receita                                                                    | 2010 - 2022      | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| valor_receita                | FLOAT64              | Valor da receita                                                                      | 2010 - 2022      | Não                           | Não listado                              | BRL (R$)              | Não                               | Não listado     |
| sigla_uf_doador              | STRING               | Sigla da unidade da federação do doador                                               | 2010 - 2022      | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |
| nome_doador                  | STRING               | Nome do doador                                                                        | 2010 - 2022      | Não                           | Não listado                              | Não listado           | Não                               | Não listado     |


# Configurando o Ambiente

In [1]:
# Importando as bibliotecas necessárias do projeto
import numpy as np
import pandas as pd
import basedosdados as bd
import matplotlib.pyplot as plt

### Salvando a amostra de dados nos arquivos do projeto

In [2]:
# Recebendo a tabela com as informações dos bens de cada candidato (limitado a 5 mil linhas)
# df = bd.read_table(dataset_id='br_tse_eleicoes',
#                  table_id='receitas_candidato',
#                  billing_project_id='eleicoes-380622',
#                  limit=100000,
#                  reauth=True)


# Salvando a tabela carregada do 'Base dos dados', nos arquivo do projeto
# df.to_csv('./amostra/dados_receita_candidatos.csv')

# Tratando a Tabela

In [3]:
receitas_candidatos = pd.read_csv('./amostra/dados_receita_candidatos.csv', index_col=0)

receitas_candidatos.head()

Unnamed: 0,ano,turno,tipo_eleicao,sigla_uf,id_municipio,id_municipio_tse,sequencial_candidato,numero_candidato,cpf_candidato,cnpj_candidato,...,cpf_administrador,numero_recibo_eleitoral,numero_documento,numero_recibo_doacao,numero_documento_doacao,tipo_prestacao_contas,data_prestacao_contas,sequencial_prestador_contas,cnpj_prestador_contas,entrega_conjunto
0,2010,,eleicao ordinaria,,,,280000000002,43,38359910863,,...,,43001310000.0,,,,,,,,nao
1,2010,,eleicao ordinaria,,,,280000000002,43,38359910863,,...,,43001310000.0,,,,,,,,nao
2,2010,,eleicao ordinaria,,,,280000000002,43,38359910863,,...,,43001310000.0,,,,,,,,nao
3,2010,,eleicao ordinaria,,,,280000000002,43,38359910863,,...,,43001310000.0,,,,,,,,nao
4,2010,,eleicao ordinaria,,,,280000000002,43,38359910863,,...,,43001310000.0,,,,,,,,nao


In [4]:
# Verificandos os dados ausentes
receitas_candidatos.isnull().sum()

ano                                  0
turno                            87799
tipo_eleicao                         0
sigla_uf                            72
id_municipio                    100000
id_municipio_tse                100000
sequencial_candidato                 0
numero_candidato                     0
cpf_candidato                        0
cnpj_candidato                  100000
titulo_eleitor_candidato        100000
id_candidato_bd                    414
nome_candidato                       0
cpf_vice_suplente                99489
numero_partido                   87799
nome_partido                     87799
sigla_partido                        0
cargo                                0
sequencial_receita               87799
data_receita                         0
fonte_receita                        0
origem_receita                       0
natureza_receita                     0
especie_receita                  87799
situacao_receita                100000
descricao_receita        

In [5]:
# Criando um dicionario com o nome da coluna e a quantidade de valores vazios ela possui
indice_lista = list(receitas_candidatos[receitas_candidatos.notnull()])
valor_lista = list(receitas_candidatos.isnull().sum())
dict_vazio = dict(zip(indice_lista, valor_lista))


# Criando uma lista com o nome das colunas que estão vazias
vazio = []

for n, v in dict_vazio.items():
    if v > 10000:                # Será excluida a coluna que possui mais de 10% de dados ausentes
        vazio.append(n)


# Excluindo as conlunas vazias da tabela
for n in vazio:
    receitas_candidatos.drop(columns=n, axis=1, inplace=True)
    
print("Colunas Removidas")

Colunas Removidas


 - De 53 colunas para 17, após a exclusão das colunas vazias

In [6]:
receitas_candidatos

Unnamed: 0,ano,tipo_eleicao,sigla_uf,sequencial_candidato,numero_candidato,cpf_candidato,id_candidato_bd,nome_candidato,sigla_partido,cargo,data_receita,fonte_receita,origem_receita,natureza_receita,valor_receita,cpf_cnpj_doador,nome_doador
0,2010,eleicao ordinaria,,280000000002,43,38359910863,114169.0,GUILHERME PEIRÃO LEAL,PV,vice-presidente,2010-07-16,outros recursos nao descritos,recursos de outros candidatos/comites,estimado,29550.0,12154858000190.0,Comitê Financeiro Nacional para Presidente da ...
1,2010,eleicao ordinaria,,280000000002,43,38359910863,114169.0,GUILHERME PEIRÃO LEAL,PV,vice-presidente,2010-09-30,nao especificado,recursos de pessoas fisicas,estimado,3000.0,59494131134.0,LEANDRO MACHADO DA ROSA
2,2010,eleicao ordinaria,,280000000002,43,38359910863,114169.0,GUILHERME PEIRÃO LEAL,PV,vice-presidente,2010-07-15,outros recursos nao descritos,recursos de outros candidatos/comites,estimado,3050.0,12154858000190.0,Comitê Financeiro Nacional para Presidente da ...
3,2010,eleicao ordinaria,,280000000002,43,38359910863,114169.0,GUILHERME PEIRÃO LEAL,PV,vice-presidente,2010-09-30,nao especificado,recursos de pessoas fisicas,estimado,3000.0,4360087772.0,PEDRO LEITAO FILHO
4,2010,eleicao ordinaria,,280000000002,43,38359910863,114169.0,GUILHERME PEIRÃO LEAL,PV,vice-presidente,2010-07-23,outros recursos nao descritos,recursos de outros candidatos/comites,estimado,14000.0,12154858000190.0,Comitê Financeiro Nacional para Presidente da ...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
99995,2022,eleicao ordinaria,AM,40001600311,35888,56917236772,383850.0,DAGMO VARELA DA CUNHA,PMB,deputado estadual,2022-08-16,outros recursos,recursos de pessoas fisicas,estimavel,1363.5,456490221.0,LÍRIA CRISTINA PESSOA SOUZA
99996,2022,eleicao ordinaria,AM,40001600311,35888,56917236772,383850.0,DAGMO VARELA DA CUNHA,PMB,deputado estadual,2022-09-01,outros recursos,recursos de pessoas fisicas,estimavel,606.0,94792615291.0,CARLOS HENRIQUE LIMA DE SOUZA
99997,2022,eleicao ordinaria,AM,40001600311,35888,56917236772,383850.0,DAGMO VARELA DA CUNHA,PMB,deputado estadual,2022-09-01,outros recursos,recursos de pessoas fisicas,estimavel,606.0,93602499200.0,IVALDO MIGUEL SANTANA DE SOUZA
99998,2022,eleicao ordinaria,AM,40001600311,35888,56917236772,383850.0,DAGMO VARELA DA CUNHA,PMB,deputado estadual,2022-09-01,outros recursos,recursos de pessoas fisicas,estimavel,606.0,1624934285.0,ADRIELE CARVALHO RODRIGUES


## Explorando os Dados

- Nome dos candidatos que não temos informação de UF devido inconsistencia da tabela original

In [7]:
uf_vazia = receitas_candidatos[receitas_candidatos['sigla_uf'].isnull()]
uf_vazia['nome_candidato'].unique()

array(['GUILHERME PEIRÃO LEAL',
       'ANTÔNIO PEDRO DE SIQUEIRA INDIO DA COSTA',
       'HAMILTON MOREIRA DE ASSIS'], dtype=object)

- Cargos considerados na amostra de dados

In [8]:
nomes = list(receitas_candidatos['cargo'].unique())

nomes.sort()

for nome in nomes:
    print(nome)

1º suplente senador
2º suplente senador
deputado distrital
deputado estadual
deputado federal
governador
senador
vice-governador
vice-presidente


In [9]:
receitas_candidatos.dtypes

ano                       int64
tipo_eleicao             object
sigla_uf                 object
sequencial_candidato      int64
numero_candidato          int64
cpf_candidato             int64
id_candidato_bd         float64
nome_candidato           object
sigla_partido            object
cargo                    object
data_receita             object
fonte_receita            object
origem_receita           object
natureza_receita         object
valor_receita           float64
cpf_cnpj_doador          object
nome_doador              object
dtype: object

- Visualizando alguns dados sobre as informações de receita

In [10]:
# Guardando em uma lista os valores de receita
valor_receita = list(receitas_candidatos['valor_receita'])
valor_receita.sort()    # Ordenando a lista para facilitar a localizacao dos valores centrais

valor_min = min(valor_receita)                                # Acessando o menor valor da lista
valor_medio = sum(valor_receita) / len(valor_receita)         # Acessando o valor medio da lista
valor_max = max(valor_receita)                                # Acessando o maior valor da lista

print("""
Estatisticas da tabela:

Menor valor de receita: R$ {};
Valor médio de receita: R$ {:.2f};
Maior valore de receita: R$ {};
""".format(valor_min, valor_medio, valor_max))


Estatisticas da tabela:

Menor valor de receita: R$ 0.01;
Valor médio de receita: R$ 10996.91;
Maior valore de receita: R$ 9481198.17;



- Agrupando a tabela apenas com as colunas necessárias para o projeto

In [11]:
receitas_agrupada = receitas_candidatos.groupby(['ano', 'sigla_uf', 'sigla_partido'])['valor_receita'] \
    .sum().reset_index()

receitas_agrupada

Unnamed: 0,ano,sigla_uf,sigla_partido,valor_receita
0,2010,AC,DEM,163632.87
1,2010,AC,PC do B,1149032.85
2,2010,AC,PDT,333614.19
3,2010,AC,PHS,9085.80
4,2010,AC,PMDB,787973.50
...,...,...,...,...
311,2022,AM,PSC,3062486.75
312,2022,AM,PT,1566126.98
313,2022,AM,PTB,536260.00
314,2022,AM,REDE,103480.00


# Criando a Busca na Tabela

In [12]:
# Criando a solicitação de pesquisa
def entradaDados():
    """
    Funcao vai receber a informacao de qual estado o usuario deseja pesquisar
    """
    continuar = True
    while continuar == True:
        # Solicitando o ano que o usuario deseja pesquisar
        try:
            ano = int(input("Digite abaixo qual o ano que deseja pesquisar (2010 ou 2022):\n"))
        except (TypeError, AttributeError, ValueError) as error:
            print("Ocorreu tente novamente:")
        else:
            continuar = False
    
            # Retornando a tabela contendo apenas o ano informado pelo usuario
            tabela_pesquisa = receitas_agrupada[receitas_agrupada['ano'] == ano]
            
            return tabela_pesquisa

In [13]:
# Criando a função que gera a visualização dos dados
def visualizacao():
    tabela = entradaDados()
    
    # Criando o gráfico da doação do portido por estado
    # Gerando os dados do gráfico
    estado = tabela['sigla_uf']                       # label de X
    partido = tabela['sigla_partido']                 # o ax.bar de cada label de X
    receita = tabela['valor_receita']                 # O valor de cada ax.bar
    unico = len(tabela['sigla_partido'].unique())     # Quantidade de barras que serao geradas
    largura = 0.25                                    # largura do ax.bar
    multiplicador = 0
    x = len(estado)    # Localização da legenda X 
    
    # Subplotage
    fig, ax = plt.subplots(layout='constrained')
    
    for i in partido:
        desvio = largura * multiplicador
        ajuste = ax.bar(x + desvio, receita, largura, label=partido)
        ax.bar_label(ajuste, padding=unico)
        multiplicador += 1
       
    # Passando os textos dos titulos e das legendas
    ax.set_ylabel('Receita em R$)')
    ax.set_title('Receita de Partidos por Estado')
    ax.set_xticks(x + largura, estado)
    ax.legend(loc='upper left', ncols=unico)
    ax.set_ylim(0, 250)

    plt.show()

# TESTES

In [None]:
tabela = entradaDados()

estado = tabela['sigla_uf']                       # label de X
partido = tabela['sigla_partido']                 # o ax.bar de cada label de X
receita = tabela['valor_receita']                 # O valor de cada ax.bar
unico = len(tabela['sigla_partido'].unique())     # Quantidade de barras que serao geradas
largura = 0.25                                    # largura do ax.bar
multiplicador = 0
x = np.arange(len(estado))    # Localização da legenda X 

# Subplotage
fig, ax = plt.subplots(layout='constrained')

for i in partido:
    desvio = largura * multiplicador
    ajuste = ax.bar(x + desvio, receita, largura, label=partido)
    ax.bar_label(ajuste, padding=unico)
    multiplicador += 1

# Passando os textos dos titulos e das legendas
ax.set_ylabel('Receita em R$)')
ax.set_title('Receita de Partidos por Estado')
ax.set_xticks(x + largura, estado)
ax.legend(loc='upper left', ncols=unico)
ax.set_ylim(0, 250)

plt.show()

Digite abaixo qual o ano que deseja pesquisar (2010 ou 2022):
2010
