# Robô de download de dados

TODO:

    -[X] REPLICAR O PROCEDIMENTO ABAIXO PARA OS OUTROS REPOS (candidatos, prest_contas, resultados);
    -[X] Estruturar os diretórios de saída dos arquivos
    -[ ] Paralelizar?

In [1]:
import os
import time
import requests
from tqdm import tqdm

In [2]:
bases_tse = [
    ('resultados_anos', 'http://agencia.tse.jus.br/estatistica/sead/odsele/votacao_partido_munzona/votacao_partido_munzona_{}.zip'),
    ('candidatos_anos', 'http://agencia.tse.jus.br/estatistica/sead/odsele/consulta_cand/consulta_cand_{}.zip'),
    ('cand_legendas_anos', 'http://agencia.tse.jus.br/estatistica/sead/odsele/consulta_legendas/consulta_legendas_{}.zip'),
    ('cand_vagas', 'http://agencia.tse.jus.br/estatistica/sead/odsele/consulta_vagas/consulta_vagas_{}.zip'),
    ('perfil_eleitorado', 'http://agencia.tse.jus.br/estatistica/sead/odsele/perfil_eleitorado/perfil_eleitorado_{}.zip'),
    ('prest_contas_polit', 'http://agencia.tse.jus.br/estatistica/sead/odsele/prestacao_contas_anual_partidaria/prestacao_contas_anual_partidaria_{}.zip')
]

Testando download da base de dados de perfil do eleitorado do TSE

In [10]:
def baixar_dados(db_link: tuple, lista_anos=list(range(1994,2020,2))):
    """
    Método para recuperar dados do TSE baseado num link do repositório eleitoral
    
    Ele verifica se existem os referidos dados nos diretórios do projeto,
    configurado pela variável OUTPATH. Caso existam, não a fazer, caso contrário,
    baixa o arquivo em OUTPATH/<schema>, onde o schema é obtido na tupla em db_link.
    
    dblink: list<tuples> 
    lista_anos: list lista de anos para serem buscados nos diretórios do TSE.
    
    return bool True caso todo o fluxo tenha ocorrido, False, caso haja exceção não tratada.
    """
    assert isinstance(lista_anos,list), 'Tipo inválido'
    assert isinstance(db_link, tuple), 'Tipo inválido'
    OUTPATH = os.path.join(os.getcwd(),'bases/')
    
    for ano in lista_anos:
        print(f"Buscando dados de {ano}")
        try:
            perfil_eleitorado = db_link[1].format(ano)
            resposta = requests.get(url=perfil_eleitorado, stream=True)
            resposta.raise_for_status()
        except requests.HTTPError as http_err:
            print(f'HTTP error occurred: {http_err}')
        except:
            print(f'Other error occurred: {os.sys.exc_info()[0]}')
        else:
            print('Página Encontrada')
            if resposta.headers['Content-Type'] == 'application/zip':
                try:
                    if not os.path.exists(os.path.join(OUTPATH,f'{db_link[0]}')):
                        os.mkdir(os.path.join(OUTPATH, f'{db_link[0]}'))
                except IOError as e1:
                    print('ERRO de acesso: {e1.errno} , {e1.strerror}')
                    return False
                curpath = os.path.join(OUTPATH, f'{db_link[0]}')
                
                if not os.path.exists(os.path.join(curpath, f'{ano}.zip')):
                    print(f"Salvando Arquivo '{ano}.zip'")
                    total_size = int(resposta.headers.get('content-length', 0))
                    block_size = 1024 #1 Kilobyte
                    t=tqdm(total=total_size, unit='iB', unit_scale=True, )
                    with open(os.path.join(curpath,f'{ano}.zip'),'wb') as file:
                        for data in resposta.iter_content(block_size):
                            t.update(len(data))
                            file.write(data)
                    t.close()
                    if total_size != 0 and t.n != total_size:
                        print(f"ERRO, algo errado no download. Confira o arquivo {ano}.zip!")
                    else:
                        print(f"Pronto!")
                else:
                    print('Arquivo já baixado!')
        time.sleep(3.)
    return True

Base de Resultados

In [5]:
baixar_dados(bases_tse[0])

Buscando dados de 1994
Página Encontrada
Arquivo já baixado!
Buscando dados de 1996
Página Encontrada
Arquivo já baixado!
Buscando dados de 1998
Página Encontrada
Arquivo já baixado!
Buscando dados de 2000
Página Encontrada
Arquivo já baixado!
Buscando dados de 2002
Página Encontrada
Arquivo já baixado!
Buscando dados de 2004
Página Encontrada
Arquivo já baixado!
Buscando dados de 2006
Página Encontrada
Arquivo já baixado!
Buscando dados de 2008
Página Encontrada
Arquivo já baixado!
Buscando dados de 2010
Página Encontrada
Arquivo já baixado!
Buscando dados de 2012
Página Encontrada
Arquivo já baixado!
Buscando dados de 2014
Página Encontrada
Arquivo já baixado!
Buscando dados de 2016
Página Encontrada
Arquivo já baixado!
Buscando dados de 2018
Página Encontrada
Arquivo já baixado!


True

Base de candidatos

In [29]:
baixar_dados(bases_tse[1])

Buscando dados de 1994


 11%|█▏        | 92.2k/813k [00:00<00:01, 695kiB/s]

Página Encontrada
Salvando Arquivo '1994.zip'


100%|██████████| 813k/813k [00:01<00:00, 712kiB/s] 


Pronto!
Buscando dados de 1996


 10%|▉         | 92.2k/940k [00:00<00:01, 763kiB/s]

Página Encontrada
Salvando Arquivo '1996.zip'


100%|██████████| 940k/940k [00:01<00:00, 787kiB/s] 


Pronto!


  0%|          | 0.00/1.59M [00:00<?, ?iB/s]

Buscando dados de 1998
Página Encontrada
Salvando Arquivo '1998.zip'


100%|██████████| 1.59M/1.59M [00:02<00:00, 777kiB/s]


Pronto!
Buscando dados de 2000


  0%|          | 92.2k/23.3M [00:00<00:28, 812kiB/s]

Página Encontrada
Salvando Arquivo '2000.zip'


100%|██████████| 23.3M/23.3M [00:29<00:00, 795kiB/s]


Pronto!


  0%|          | 0.00/1.96M [00:00<?, ?iB/s]

Buscando dados de 2002
Página Encontrada
Salvando Arquivo '2002.zip'


100%|██████████| 1.96M/1.96M [00:04<00:00, 482kiB/s]


Pronto!
Buscando dados de 2004


  0%|          | 59.4k/25.5M [00:00<00:46, 549kiB/s]

Página Encontrada
Salvando Arquivo '2004.zip'


100%|██████████| 25.5M/25.5M [00:33<00:00, 771kiB/s]


Pronto!
Buscando dados de 2006


  4%|▍         | 90.1k/2.05M [00:00<00:02, 770kiB/s]

Página Encontrada
Salvando Arquivo '2006.zip'


100%|██████████| 2.05M/2.05M [00:02<00:00, 789kiB/s]


Pronto!


  0%|          | 0.00/24.8M [00:00<?, ?iB/s]

Buscando dados de 2008
Página Encontrada
Salvando Arquivo '2008.zip'


100%|██████████| 24.8M/24.8M [00:35<00:00, 696kiB/s]


Pronto!
Buscando dados de 2010


  3%|▎         | 59.4k/2.22M [00:00<00:06, 346kiB/s]

Página Encontrada
Salvando Arquivo '2010.zip'


100%|██████████| 2.22M/2.22M [00:04<00:00, 457kiB/s]


Pronto!
Buscando dados de 2012


  0%|          | 60.4k/34.5M [00:00<01:28, 388kiB/s]

Página Encontrada
Salvando Arquivo '2012.zip'


100%|██████████| 34.5M/34.5M [00:46<00:00, 744kiB/s]


Pronto!
Buscando dados de 2014


  1%|          | 59.4k/5.58M [00:00<00:09, 590kiB/s]

Página Encontrada
Salvando Arquivo '2014.zip'


100%|██████████| 5.58M/5.58M [00:09<00:00, 589kiB/s]


Pronto!


  0%|          | 0.00/130M [00:00<?, ?iB/s]

Buscando dados de 2016
Página Encontrada
Salvando Arquivo '2016.zip'


100%|██████████| 130M/130M [03:30<00:00, 619kiB/s] 


Pronto!
Buscando dados de 2018


  1%|▏         | 81.9k/6.10M [00:00<00:07, 812kiB/s]

Página Encontrada
Salvando Arquivo '2018.zip'


100%|██████████| 6.10M/6.10M [00:11<00:00, 516kiB/s]


Pronto!


True

In [9]:
baixar_dados(bases_tse[3])

Buscando dados de 1994


  5%|▌         | 24.6k/470k [00:00<00:02, 216kiB/s]

Página Encontrada
Salvando Arquivo '1994.zip'


100%|██████████| 470k/470k [00:00<00:00, 687kiB/s] 


Pronto!


  0%|          | 0.00/474k [00:00<?, ?iB/s]

Buscando dados de 1996
Página Encontrada
Salvando Arquivo '1996.zip'


100%|██████████| 474k/474k [00:00<00:00, 818kiB/s] 


Pronto!


  0%|          | 0.00/473k [00:00<?, ?iB/s]

Buscando dados de 1998
Página Encontrada
Salvando Arquivo '1998.zip'


100%|██████████| 473k/473k [00:00<00:00, 867kiB/s] 


Pronto!


  0%|          | 0.00/554k [00:00<?, ?iB/s]

Buscando dados de 2000
Página Encontrada
Salvando Arquivo '2000.zip'


100%|██████████| 554k/554k [00:00<00:00, 880kiB/s] 


Pronto!


  0%|          | 0.00/474k [00:00<?, ?iB/s]

Buscando dados de 2002
Página Encontrada
Salvando Arquivo '2002.zip'


100%|██████████| 474k/474k [00:00<00:00, 869kiB/s] 


Pronto!


  0%|          | 0.00/553k [00:00<?, ?iB/s]

Buscando dados de 2004
Página Encontrada
Salvando Arquivo '2004.zip'


100%|██████████| 553k/553k [00:00<00:00, 773kiB/s] 


Pronto!


  0%|          | 0.00/474k [00:00<?, ?iB/s]

Buscando dados de 2006
Página Encontrada
Salvando Arquivo '2006.zip'


100%|██████████| 474k/474k [00:00<00:00, 795kiB/s] 


Pronto!


  0%|          | 0.00/556k [00:00<?, ?iB/s]

Buscando dados de 2008
Página Encontrada
Salvando Arquivo '2008.zip'


100%|██████████| 556k/556k [00:00<00:00, 822kiB/s] 


Pronto!


  0%|          | 0.00/474k [00:00<?, ?iB/s]

Buscando dados de 2010
Página Encontrada
Salvando Arquivo '2010.zip'


100%|██████████| 474k/474k [00:00<00:00, 753kiB/s] 


Pronto!


  0%|          | 0.00/799k [00:00<?, ?iB/s]

Buscando dados de 2012
Página Encontrada
Salvando Arquivo '2012.zip'


100%|██████████| 799k/799k [00:01<00:00, 792kiB/s] 


Pronto!


  0%|          | 0.00/66.1k [00:00<?, ?iB/s]

Buscando dados de 2014
Página Encontrada
Salvando Arquivo '2014.zip'


100%|██████████| 66.1k/66.1k [00:00<00:00, 777kiB/s]


Pronto!


  0%|          | 0.00/350k [00:00<?, ?iB/s]

Buscando dados de 2016
Página Encontrada
Salvando Arquivo '2016.zip'


100%|██████████| 350k/350k [00:00<00:00, 892kiB/s] 


Pronto!


  0%|          | 0.00/65.0k [00:00<?, ?iB/s]

Buscando dados de 2018
Página Encontrada
Salvando Arquivo '2018.zip'


100%|██████████| 65.0k/65.0k [00:00<00:00, 745kiB/s]


Pronto!


True

In [11]:
baixar_dados(bases_tse[2])

Buscando dados de 1994


 19%|█▉        | 96.3k/502k [00:00<00:00, 875kiB/s]

Página Encontrada
Salvando Arquivo '1994.zip'


100%|██████████| 502k/502k [00:00<00:00, 867kiB/s] 


Pronto!


  0%|          | 0.00/494k [00:00<?, ?iB/s]

Buscando dados de 1996
Página Encontrada
Salvando Arquivo '1996.zip'


100%|██████████| 494k/494k [00:00<00:00, 862kiB/s] 


Pronto!


  0%|          | 0.00/500k [00:00<?, ?iB/s]

Buscando dados de 1998
Página Encontrada
Salvando Arquivo '1998.zip'


100%|██████████| 500k/500k [00:00<00:00, 826kiB/s] 


Pronto!


  0%|          | 0.00/618k [00:00<?, ?iB/s]

Buscando dados de 2000
Página Encontrada
Salvando Arquivo '2000.zip'


100%|██████████| 618k/618k [00:00<00:00, 816kiB/s] 


Pronto!


  0%|          | 0.00/515k [00:00<?, ?iB/s]

Buscando dados de 2002
Página Encontrada
Salvando Arquivo '2002.zip'


100%|██████████| 515k/515k [00:00<00:00, 737kiB/s] 


Pronto!


  0%|          | 0.00/1.89M [00:00<?, ?iB/s]

Buscando dados de 2004
Página Encontrada
Salvando Arquivo '2004.zip'


100%|██████████| 1.89M/1.89M [00:02<00:00, 762kiB/s]


Pronto!


  0%|          | 0.00/513k [00:00<?, ?iB/s]

Buscando dados de 2006
Página Encontrada
Salvando Arquivo '2006.zip'


100%|██████████| 513k/513k [00:00<00:00, 880kiB/s] 


Pronto!


  0%|          | 0.00/2.31M [00:00<?, ?iB/s]

Buscando dados de 2008
Página Encontrada
Salvando Arquivo '2008.zip'


100%|██████████| 2.31M/2.31M [00:02<00:00, 791kiB/s]


Pronto!


  0%|          | 0.00/518k [00:00<?, ?iB/s]

Buscando dados de 2010
Página Encontrada
Salvando Arquivo '2010.zip'


100%|██████████| 518k/518k [00:00<00:00, 786kiB/s] 


Pronto!


  0%|          | 0.00/3.97M [00:00<?, ?iB/s]

Buscando dados de 2012
Página Encontrada
Salvando Arquivo '2012.zip'


100%|██████████| 3.97M/3.97M [00:05<00:00, 752kiB/s]


Pronto!
Buscando dados de 2014


 10%|█         | 64.5k/624k [00:00<00:01, 408kiB/s]

Página Encontrada
Salvando Arquivo '2014.zip'


100%|██████████| 624k/624k [00:01<00:00, 562kiB/s] 


Pronto!


  0%|          | 0.00/5.77M [00:00<?, ?iB/s]

Buscando dados de 2016
Página Encontrada
Salvando Arquivo '2016.zip'


100%|██████████| 5.77M/5.77M [00:07<00:00, 800kiB/s]


Pronto!
Buscando dados de 2018
HTTP error occurred: 404 Client Error: Not Found for url: http://agencia.tse.jus.br/estatistica/sead/odsele/consulta_legendas/consulta_legendas_2018.zip


True

In [12]:
baixar_dados(bases_tse[5])

Buscando dados de 1994
HTTP error occurred: 404 Client Error: Not Found for url: http://agencia.tse.jus.br/estatistica/sead/odsele/prestacao_contas_anual_partidaria/prestacao_contas_anual_partidaria_1994.zip
Buscando dados de 1996
HTTP error occurred: 404 Client Error: Not Found for url: http://agencia.tse.jus.br/estatistica/sead/odsele/prestacao_contas_anual_partidaria/prestacao_contas_anual_partidaria_1996.zip
Buscando dados de 1998
HTTP error occurred: 404 Client Error: Not Found for url: http://agencia.tse.jus.br/estatistica/sead/odsele/prestacao_contas_anual_partidaria/prestacao_contas_anual_partidaria_1998.zip
Buscando dados de 2000
HTTP error occurred: 404 Client Error: Not Found for url: http://agencia.tse.jus.br/estatistica/sead/odsele/prestacao_contas_anual_partidaria/prestacao_contas_anual_partidaria_2000.zip
Buscando dados de 2002
HTTP error occurred: 404 Client Error: Not Found for url: http://agencia.tse.jus.br/estatistica/sead/odsele/prestacao_contas_anual_partidaria/pre

  0%|          | 0.00/41.8M [00:00<?, ?iB/s]

Buscando dados de 2018
Página Encontrada
Salvando Arquivo '2018.zip'


100%|██████████| 41.8M/41.8M [00:55<00:00, 754kiB/s]


Pronto!


True