# Consulta de Casas de Candomblé e Umbanda do Estado de São Paulo

In [1]:
import pandas as pd
import numpy as np
import xlsxwriter as xl
import requests

In [2]:
print('pandas', pd.__version__)
print('numpy', np.__version__)

pandas 1.2.1
numpy 1.20.0


## Leitura da base da dados e ajustes iniciais

In [3]:
iles = pd.read_csv('data/base_iles_formatada.txt',
                   header=None,
                   sep='|',
                   error_bad_lines=False)
iles.columns = ['dirigente_original', 'casa_original', 'endereco_original']
iles

Unnamed: 0,dirigente_original,casa_original,endereco_original
0,"Ada de Omulu, Ialorixá (Adamaris Sá Oliveira)",Abaçá Oluayê Omode Okunrin Efan - candomblé q...,"Rua João Perestrello, 29 - Vila Mazzei - CEP..."
1,"Adão Conceição da Silva, Babalorixá",Ilê Axé Oxum Iyá Ayê - candomblé queto,"Rua Adolfo Lopes Rodrigues, 295 - Jardim Aloh..."
2,"Adejimi Aderotimi, Babalaô",Ilê Axé Olodumare - candomblé tradição,"Rua Dr. Jaci Barbosa, 375 - Vila Carrão - CEP..."
3,"Ademir Pereira Cunha, Pai",Tenda de Umbamba Mestre Junqueira e Maria do ...,"Rua dos Apiáres, 172-A - fundos - Jd. Santa T..."
4,"Adriano Luiz de Ogum, Pai",Templo de Umbanda Ogum Rompe Mato - umbanda,"Rua Alberto Andaló, 124 A - Freguesia do Ó - ..."
...,...,...,...
739,"Zezinho de Logum Edé, Babalorixá",Ebé Omó Logunbiyí - candomblé queto,"Rua João de Barro, 9 - Estância Montreal - Li..."
740,"Zilda de Vasconcelos Santos, Mãe",Tenda de Umbanda Cruzada Ogum e Mãe Maria do ...,"Rua André Mussoline, 44 - Jardim Eldorado - C..."
741,"Zilda Geraldo Pontes do Nascimento, Mãe",Abassá de Oxum e Ogum,"Rua Dr. Francisco José Longo, 299 - Saúde - C..."
742,"Zizi de Logum Edé, Babalorixá (Edson Alves da ...",Ilê Axé Araketu Awón Olodé - candomblé queto,"Rua Almada, 85 - Jardim Santo Alberto - CEP 0..."


Remoção limitação de exibição do conteúdo das células e aumento das linhas para 20 registros

In [4]:
pd.set_option('display.max_rows', None)
pd.set_option('display.max_colwidth', None)

Remoção dos espaços em branco das colunas de texto

In [5]:
for column in iles.columns:
    if isinstance(iles[column].dtype, object):
        iles[column] = iles[column].str.strip()

Extração do CEP do endereço e remoção de caracteres inválidos do CEP

In [6]:
import string

iles['cep'] = iles['endereco_original'].str.extract(r'(\d{2}\.?\d{3}-? ?\d?\d?\d?)')
trans_table = ''.maketrans({key: '' for key in string.punctuation + string.whitespace})
iles['cep'] = iles['cep'].str.translate(trans_table)

Abertura do arquivo de CEPs previamente criado para o projeto,

**Se o arquivo não existir**, será criada uma lista única de CEPS e cada CEP será consultado no ViaCep para obtenção dos dados, em seguida o arquivo será salvo e também será disponibilizado no dataframe `ceps`

In [7]:
try:
    ceps = pd.read_parquet('data/ceps.parquet')
except:
    ceps_list = set(map(str, iles.cep.to_list()))
    
    enderecos_dict = {}

    for cep in ceps_list:
        url = f'https://viacep.com.br/ws/{cep}/json/'
        response = requests.get(f'{url}')
        enderecos_dict[cep] = response.json()
        
    pd.to_parquet('data/ceps.parquet')
    ceps = pd.DataFrame.from_dict(enderecos_dict, orient='index')

Alteração do campo `cep` para o index do dataframe para fazer o merge dos CEPs com o dataframe principal

In [8]:
ceps['cep'] = ceps.index
iles = iles.merge(ceps, how='left', on='cep')

Extração de email, ddd, telefone e url do campo de endereço

In [9]:
iles['email'] = iles['endereco_original'].str.extract(r"([a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)")
iles['url'] = iles['endereco_original'].str.extract(r"(http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+)")
iles['ddd_telefone1'] = iles['endereco_original'].str.extract(r"(\([1-9]{2}\))")
iles['ddd_telefone1'] = iles['ddd_telefone1'].str.translate(trans_table)
iles['telefone1'] = iles['endereco_original'].str.extract(r"((?:[2-8]|9[1-9])[0-9]{3}\-[0-9]{4})")
iles['telefone1'] = iles['telefone1'].str.translate(trans_table)

Separação do campo de endereço para extração do número de localização do logradouro

In [10]:
iles['log_num'] = iles['endereco_original'].str.split(" - ", expand=True)[0]
iles['numero_complemento'] = iles['log_num'].str.split(",").str[1].str.strip()

Separação do campo de casa para extração do nome do terreiro e da religião (na granularidade de especialização)

In [11]:
iles['terreiro'] = iles['casa_original'].str.split("- ", expand=True)[0].str.strip()
iles['especializacao'] = iles['casa_original'].str.split("- ", expand=True)[1].str.lower().str.strip()

In [12]:
iles['titulo_original'] = iles['dirigente_original'].str.split(",", expand=True)[1].str.strip()
iles['dirigente_nome_santo'] = iles['dirigente_original'].str.split(",", expand=True)[0].str.strip()
iles['titulo'] = iles['titulo_original'].str.split("(", expand=True)[0].str.strip().str.translate(trans_table)
iles['dirigente_nome_civil'] = iles['titulo_original'].str.extract(r"(\(.*\))")
iles['dirigente_nome_civil'] = iles['dirigente_nome_civil'].str.strip().str.translate(''.maketrans({key: '' for key in string.punctuation}))

Classificação das religiões em
 - candomblé
 - umbanda
 - tambor-de-mina
 - outras
 - não-declarada

In [13]:
def tipo_religiao(row):
    religioes = {'candomblé' : 'candomblé',
                 'umbanda': 'umbanda',
                 'tambor': 'tambor de mina'
                }

    if row['especializacao'] == "" or row['especializacao'] == None:
        return 'não-declarada'
    
    religiao_lista = []
    
    for key, value in religioes.items():
        if key in row['especializacao']:
            religiao_lista.append(value)
    
    if religiao_lista == []:
        religiao_lista.append('outras')
        
    return ', '.join(religiao_lista)


iles['religiao'] = iles.apply(tipo_religiao, axis=1)

In [14]:
iles.fillna("", inplace=True)

In [15]:
iles.rename(columns={'erro' : 'erro_cep'}, inplace=True)
iles = iles[['titulo',
             'dirigente_nome_santo',
             'dirigente_nome_civil',
             'terreiro',
             'religiao',
             'especializacao',
             'logradouro',
             'numero_complemento',
             'bairro',
             'localidade',
             'uf',
             'cep',
             'erro_cep',
             'ddd_telefone1',
             'telefone1',
             'email',
             'url',
             'casa_original',
             'endereco_original'
            ]]
iles

Unnamed: 0,titulo,dirigente_nome_santo,dirigente_nome_civil,terreiro,religiao,especializacao,logradouro,numero_complemento,bairro,localidade,uf,cep,erro_cep,ddd_telefone1,telefone1,email,url,casa_original,endereco_original
0,Ialorixá,Ada de Omulu,Adamaris Sá Oliveira,Abaçá Oluayê Omode Okunrin Efan,candomblé,candomblé queto-efã,Rua João Perestrello,29,Vila Nova Mazzei,São Paulo,SP,2314040.0,,11.0,62039930.0,,,Abaçá Oluayê Omode Okunrin Efan - candomblé queto-efã,"Rua João Perestrello, 29 - Vila Mazzei - CEP 02314-040 - São Paulo - SP telefone: (11) 6203-9930"
1,Babalorixá,Adão Conceição da Silva,,Ilê Axé Oxum Iyá Ayê,candomblé,candomblé queto,Rua Leopoldo Augusto Miguez,295,Melvi,Praia Grande,SP,11712170.0,,13.0,35944520.0,fenorixa@uol.com.br,,Ilê Axé Oxum Iyá Ayê - candomblé queto,"Rua Adolfo Lopes Rodrigues, 295 - Jardim Alohá - CEP 11712-170 - Praia Grande - SP telefone: (13) 3594-4520 / 9112-4300, e-mail: fenorixa@uol.com.br"
2,Babalaô,Adejimi Aderotimi,,Ilê Axé Olodumare,candomblé,candomblé tradição,Rua Doutor Jaci Barbosa,375,Vila Carrão,São Paulo,SP,3447000.0,,11.0,67812628.0,rotimi@terra.com.br,,Ilê Axé Olodumare - candomblé tradição,"Rua Dr. Jaci Barbosa, 375 - Vila Carrão - CEP 03447-000 - São Paulo - SP telefone: (11) 6781-2628, e-mail: rotimi@terra.com.br"
3,Pai,Ademir Pereira Cunha,,Tenda de Umbamba Mestre Junqueira e Maria do Coquinho,umbanda,umbanda,Rua dos Apiaris,172-A,Jardim Santa Terezinha (Pedreira),São Paulo,SP,4474140.0,,,,,,Tenda de Umbamba Mestre Junqueira e Maria do Coquinho - umbanda,"Rua dos Apiáres, 172-A - fundos - Jd. Santa Terezinha - CEP 04474-140 - São Paulo - SP"
4,Pai,Adriano Luiz de Ogum,,Templo de Umbanda Ogum Rompe Mato,umbanda,umbanda,Rua Alberto Andaló,124 A,Parque São Luís,São Paulo,SP,2840080.0,,11.0,39242371.0,,http://ogum.rompe.mato.sites.uol.com.br/index.html,Templo de Umbanda Ogum Rompe Mato - umbanda,"Rua Alberto Andaló, 124 A - Freguesia do Ó - CEP 02840-080 - São Paulo - SP telefone: (11) 3924-2371, e-mail: http://ogum.rompe.mato.sites.uol.com.br/index.html"
5,Babalorixá,Aganjusurema e Iyá Omi Layó,Eliezer Correia e Meire R B Correia,Ilê Eya Omi Axé Opô Ekueran,candomblé,candomblé queto,Rua Cassiano Ricardo,6373,Esmeralda,Praia Grande,SP,11713540.0,,13.0,34773345.0,aganjusurema@gmail.com,,Ilê Eya Omi Axé Opô Ekueran - candomblé queto,"Rua Cassiano Ricardo, 6373 - Balneário Sônia Regina - CEP 11713-540 - Praia Grande - SP telefone: (13) 3477-3345, e-mail: aganjusurema@gmail.com/ ileiyaomiaseopoekueran@gmail.com"
6,Balorixá,Aguinaldo da Conceição,,Terreiro dos Orixás,candomblé,candomblé queto,Avenida Francisco Delfino dos Santos,901,Jardim Paulistano,Franca,SP,14402412.0,,,,,,Terreiro dos Orixás - candomblé queto,"Av. Francisco Delfino dos Santos, 901 - Jardim Paulistano - CEP 14402-412 - Franca - SP"
7,Babalorixá,Ailton d’Ogum,,Ilê Axé Alaketu Ogunjá,candomblé,candomblé queto,Rua Blumenau,246,Catiapoa,São Vicente,SP,11370290.0,,13.0,30220349.0,danleke@terra.com.br,,Ilê Axé Alaketu Ogunjá - candomblé queto,"Rua Blumenau, 246 - Catiapõa - CEP 11370-290 - São Vicente - SP telefone: (13) 3022-0349, e-mail: danleke@terra.com.br"
8,Babalorixá,Ajaoci de Nanã,Joselito de Souza Costa,Casa do Boiadeiro Rei da Hungria,candomblé,candomblé queto e angola,Avenida Duquesa de Goiás,194,Real Parque,São Paulo,SP,5686000.0,,,,,,Casa do Boiadeiro Rei da Hungria - candomblé queto e angola,"Rua Emílio Cavalieri, 194 - Jd. Adalgisa - CEP 05686-000 - São Paulo - SP"
9,Babalorixá,Akinlogungana - Babá Alexandre,Alexandre Correia dos Santos,Templo Taquiri de Ogum,umbanda,umbanda guaraciana,Rua Águas da Prata,396 A,Rochdale,Osasco,SP,6223200.0,,11.0,966225696.0,templotaquirideogum@gmail.com,http://www.facebook.com/templotaquirideogum,Templo Taquiri de Ogum - umbanda guaraciana,"Rua Águas da Prata, 396 A - bairro: Rochdalle - CEP: 06223-200 - Osasco - SP. T telefone: (11) 96622-5696 ou (11) 99337-6336; email: templotaquirideogum@gmail.com; http://www.facebook.com/templotaquirideogum"


In [16]:
def salvar_excel(dataframe, filename, sheetname='Planilha1', tablename='Tabela1'):
    """salvar_excel: salva o dataframe em uma tabela dentro de uma planilha no formato .xlsx"""
    
    rows, cols = dataframe.shape
    data = dataframe.to_dict('split')['data']
    headers = []
    
    try:
        for col in dataframe.columns:
            headers.append({'header' : col})

        wb = xl.Workbook(filename, {'nan_inf_to_errors': True})
        ws = wb.add_worksheet(sheetname)

        ws.add_table(0, 0, rows, cols - 1, {'name': tablename,
                                            'data': data,
                                            'columns': headers
        })
        print(f"Escrevendo arquivo:{filename}")
        wb.close()
        
        return True
    except:
        return False

    
print(salvar_excel.__doc__)

salvar_excel: salva o dataframe em uma tabela dentro de uma planilha no formato .xlsx


In [17]:
salvar_excel(iles, 'excel/iles.xlsx', 'Terreiros', 'Terreiros')

Escrevendo arquivo:excel/iles.xlsx


True

In [18]:
iles.groupby(['localidade'])[['dirigente_nome_santo']].count().sort_values('dirigente_nome_santo', ascending=False).head(15)

Unnamed: 0_level_0,dirigente_nome_santo
localidade,Unnamed: 1_level_1
São Paulo,340
Diadema,105
,98
São Bernardo do Campo,28
Guarulhos,15
Santo André,14
Osasco,12
Franca,9
Praia Grande,9
Campinas,8


In [19]:
iles.groupby(['religiao'])[['dirigente_nome_santo']].count().sort_values('dirigente_nome_santo', ascending=False).head(15)

Unnamed: 0_level_0,dirigente_nome_santo
religiao,Unnamed: 1_level_1
candomblé,284
não-declarada,283
umbanda,150
"candomblé, umbanda",10
outras,9
tambor de mina,7
"candomblé, tambor de mina",1
