# Notebook em Python para baixar filiados a partidos

Estes códigos foram elaborados no curso Dados 360 para fins didáticos, visando dar uma introdução à lógica por trás da programação. Não necessariamente as funções utilizadas aqui são as mais rápidas ou mais eficientes para lidar com os dados em escala.

Confira a página com a lista dos arquivos ZIP, no site do TSE: [https://www.tse.jus.br/hotsites/pesquisas-eleitorais/filiacao_partidaria.htm](https://www.tse.jus.br/hotsites/pesquisas-eleitorais/filiacao_partidaria.htm)

## Para começo de conversa...
Carregamos os pacotes desejados e definimos variáveis importantes

In [None]:
import urllib.request as get
import pandas as pd
import zipfile
import glob

In [None]:
partidos = ['pstu','pco','phs']
url_base = "http://cdn.tse.jus.br/estatistica/sead/odsele/filiacao_partidaria/filiados_{partido}.zip"

## Loop para baixar os arquivos

In [None]:
# Loop para baixar os arquivos

for partido in partidos:
  url = url_base.replace('{partido}', partido)
  print(url)
  get.urlretrieve(url, partido+".zip")

http://cdn.tse.jus.br/estatistica/sead/odsele/filiacao_partidaria/filiados_pstu.zip
http://cdn.tse.jus.br/estatistica/sead/odsele/filiacao_partidaria/filiados_pco.zip
http://cdn.tse.jus.br/estatistica/sead/odsele/filiacao_partidaria/filiados_phs.zip


## Loop para extrair/ler os arquivos


In [None]:
# Aqui vamos extrair a lista dos arquivos
arquivos_zip = glob.glob("*.zip")

for arquivo in arquivos_zip:
    with zipfile.ZipFile(arquivo,"r") as zip_ref:
      zip_ref.extractall()

In [None]:
# Agora vamos ler os arquivos CSV

arquivos_csv = glob.glob("*.csv")

filiados = pd.concat([pd.read_csv(arquivo, sep = ';', encoding='ISO-8859-1') for arquivo in arquivos_csv ])


## Enfim, os dados

In [None]:
filiados

Unnamed: 0,DATA DA EXTRACAO,HORA DA EXTRACAO,NUMERO DA INSCRICAO,NOME DO FILIADO,SIGLA DO PARTIDO,NOME DO PARTIDO,UF,CODIGO DO MUNICIPIO,NOME DO MUNICIPIO,ZONA ELEITORAL,SECAO ELEITORAL,DATA DA FILIACAO,SITUACAO DO REGISTRO,TIPO DO REGISTRO,DATA DO PROCESSAMENTO,DATA DA DESFILIACAO,DATA DO CANCELAMENTO,DATA DA REGULARIZACAO,MOTIVO DO CANCELAMENTO
0,30/04/2021,03:54:43,3824542038,VERALUCIA ALVES DE OLIVEIRA,PSTU,PARTIDO SOCIALISTA DOS TRABALHADORES UNIFICADO,MA,7170,ARAIOSES,12,65.0,09/10/2005,CANCELADO,OFICIAL,,,,,
1,30/04/2021,03:54:43,25982490744,LUCIANO MOTA DA SILVA,PSTU,PARTIDO SOCIALISTA DOS TRABALHADORES UNIFICADO,CE,13277,ARATUBA,105,65.0,27/03/1995,REGULAR,OFICIAL,,,,,
2,30/04/2021,03:54:43,9338231635,FRANCISCA BORGES,PSTU,PARTIDO SOCIALISTA DOS TRABALHADORES UNIFICADO,RN,18759,TAIPU,46,15.0,20/02/1995,REGULAR,OFICIAL,,,,,
3,30/04/2021,03:54:43,20951261040,SERGIO JORGE DE PINA,PSTU,PARTIDO SOCIALISTA DOS TRABALHADORES UNIFICADO,GO,92215,ANÁPOLIS,3,628.0,16/09/2005,CANCELADO,OFICIAL,,10/04/2006,10/04/2006,,JUDICIAL
4,30/04/2021,03:54:43,9773922046,JOVENTINA LIBORIO ALMEIDA,PSTU,PARTIDO SOCIALISTA DOS TRABALHADORES UNIFICADO,DF,97012,BRASÍLIA,5,34.0,14/01/1995,REGULAR,OFICIAL,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
6504,30/04/2021,03:51:24,135246960124,JOSE CELSO DE LIMA,PCO,PARTIDO DA CAUSA OPERÁRIA,SP,63134,CARAPICUÍBA,388,,24/09/2003,CANCELADO,OFICIAL,,09/02/2004,15/10/2019,,
6505,30/04/2021,03:51:24,323352178,JOSEFA MARIA DA CONCEICAO,PCO,PARTIDO DA CAUSA OPERÁRIA,SE,32476,TOBIAS BARRETO,23,,22/11/1996,CANCELADO,OFICIAL,,14/06/2013,15/10/2019,,
6506,30/04/2021,03:51:24,89206850310,ROGERIO ROCHA DA SILVA,PCO,PARTIDO DA CAUSA OPERÁRIA,RJ,58556,MENDES,56,,31/10/1996,CANCELADO,OFICIAL,,,15/10/2019,,
6507,30/04/2021,03:51:24,14052762283,MINEIA SANTANA FREITAS,PCO,PARTIDO DA CAUSA OPERÁRIA,AM,98418,PRESIDENTE FIGUEIREDO,51,,25/08/2003,CANCELADO,OFICIAL,,,15/10/2019,,


In [None]:
filiados.describe(include= 'all')

Unnamed: 0,DATA DA EXTRACAO,HORA DA EXTRACAO,NUMERO DA INSCRICAO,NOME DO FILIADO,SIGLA DO PARTIDO,NOME DO PARTIDO,UF,CODIGO DO MUNICIPIO,NOME DO MUNICIPIO,ZONA ELEITORAL,SECAO ELEITORAL,DATA DA FILIACAO,SITUACAO DO REGISTRO,TIPO DO REGISTRO,DATA DO PROCESSAMENTO,DATA DA DESFILIACAO,DATA DO CANCELAMENTO,DATA DA REGULARIZACAO,MOTIVO DO CANCELAMENTO
count,29153,29153,29153.0,29153,29153,29153,29153,29153.0,29153,29153.0,28098.0,29153,29153,29153,2111,4326,7370,7,5833
unique,1,3,,27991,3,3,28,,1577,,,3177,3,1,11,1112,1212,7,4
top,30/04/2021,03:54:43,,MARIA APARECIDA DA SILVA,PSTU,PARTIDO SOCIALISTA DOS TRABALHADORES UNIFICADO,SP,,SÃO PAULO,,,27/03/1995,REGULAR,OFICIAL,16/04/2020,15/04/2013,15/10/2019,23/05/2013,CANCELAMENTO AUTOMÁTICO
freq,29153,22390,,14,22390,22390,6776,,1673,,,968,19987,29153,1569,270,2586,1,2832
mean,,,77398680000.0,,,,,47520.758858,,111.782321,192.445049,,,,,,,,
std,,,92553560000.0,,,,,28221.633965,,121.858903,178.971759,,,,,,,,
min,,,1252623.0,,,,,35.0,,1.0,1.0,,,,,,,,
25%,,,13447820000.0,,,,,17752.0,,18.0,57.0,,,,,,,,
50%,,,39725980000.0,,,,,56049.0,,60.0,138.0,,,,,,,,
75%,,,104680800000.0,,,,,70998.0,,163.0,280.0,,,,,,,,


In [None]:
# Conta o total por partidos
filiados.groupby('UF')['SIGLA DO PARTIDO'].value_counts()

UF  SIGLA DO PARTIDO
AC  PSTU                119
    PCO                  57
AL  PSTU                317
    PCO                  91
AM  PCO                 306
                       ... 
SP  PHS                  44
TO  PSTU                 17
    PCO                   4
ZZ  PSTU                 26
    PCO                   9
Name: SIGLA DO PARTIDO, Length: 66, dtype: int64