# Geolocation Datasets

This dataset has information Brazilian zip codes and its lat/lng coordinates. Use it to plot maps and find distances between sellers and customers.

## Initial Column Description


|**Column Title**|**geolocation_zip_code_prefix-> int** |**geolocation_lat -> float** |**geolocation_lng-> float** |**geolocation_city -> str**|**geolocation_state-> int**|
|--|--|--|--|--|--|
|Description |Primary key - first 5 digits of zip code|latitude |longitude |city name |state |
|Example |01037 |-23.54562128115268 |-46.63929204800168 |sao paulo |SP |

### Errors found
+ For this table the raw data didn't contain null or empties values.
+   contains geolocation_city variations and special characters like: â, ç, ã, etc.
+ Diferent names for the same city.

## Required Libraries

In [1]:
#Tool that allows us to import, better manage the data set.
import pandas as pd
#Tool that helps us in the mathematical management of data. 
import numpy as np

## Data Preprocessing

 + First the definition and substitution of the special characters of the city_state dataset is done.
 + Definition and substituting formats other than geolocation_df ['geolocation_city']. 

It is necessary to merge the information in this datasets to create a unique output for geolocation:

1. Merge between `city_dataset`.csv and `geolocation_df`. To replace the geolocation city name for the number of the state id, the outcome:

|**Column Title**|**geolocation_lat** |**geolocation_lng** |**city_state_id** |**geolocation_state**|**code_zip_prefix**|
|--|--|--|--|--|--|
|Example |-25.571748 |-49.334374 |1273 |PR |81470 |

2. Merge between the datasets `state_dataset.csv` and `geolocations_database`. To replace the state abbreviation for the state id number, the outcome:

|**Column Title**|**geolocation_lat** |**geolocation_lng** |**city_state_id** |**state_id**|**code_zip_prefix**|
|--|--|--|--|--|--|
|Example |-25.571748 |-49.334374 |1273 |26 |81470 |

3. Merge between the datasets `code_zip_prefix_dataset.csv` and `geolocations_database`. the outcome:

|**Column Title**|**geolocation_code_zip_prefix_id** |**geolocation_lat** |**geolocation_lng** |**geolocation_city_state_id**|**geolocation_state_id**|
|--|--|--|--|--|--|
|Example |16295	 |-25.571748 |-49.334374 |1273 |26 |

Finally, the Geolocation id column is generated. the outcome:

|**Column Title**|**geolocation_id** |**geolocation_code_zip_prefix_id** |**geolocation_lat** |**geolocation_lng** |**geolocation_city_state_id**|**geolocation_state_id**|
|--|--|--|--|--|--|--|
|Example |1 |16295	 |-25.571748 |-49.334374 |1273 |26 |

csvs import (main and auxiliary)

In [2]:
geolocation_csv = '../../data/raw/olist_geolocation_dataset.csv'
geolocation_df = pd.read_csv(geolocation_csv)

In [3]:
city_state_csv = '../../data/interim/city_state_dataset.csv'
city_state_dataset = pd.read_csv(city_state_csv)

In [4]:
code_zip_prefix_csv = '../../data/interim/code_zip_prefix_dataset.csv'
code_zip_prefix_dataset = pd.read_csv(code_zip_prefix_csv)

In [5]:
state_csv = '../../data/interim/state_dataset.csv'
state_dataset = pd.read_csv(state_csv)

Viewing entries for each of the dataframes

In [6]:
geolocation_df

Unnamed: 0,geolocation_zip_code_prefix,geolocation_lat,geolocation_lng,geolocation_city,geolocation_state
0,1037,-23.545621,-46.639292,sao paulo,SP
1,1046,-23.546081,-46.644820,sao paulo,SP
2,1046,-23.546129,-46.642951,sao paulo,SP
3,1041,-23.544392,-46.639499,sao paulo,SP
4,1035,-23.541578,-46.641607,sao paulo,SP
...,...,...,...,...,...
1000158,99950,-28.068639,-52.010705,tapejara,RS
1000159,99900,-27.877125,-52.224882,getulio vargas,RS
1000160,99950,-28.071855,-52.014716,tapejara,RS
1000161,99980,-28.388932,-51.846871,david canabarro,RS


In [7]:
city_state_dataset

Unnamed: 0,city_state_id,city_state,state_id
0,1,abadia de goias/GO,20
1,2,abadia dos dourados/MG,6
2,3,abadiania/GO,20
3,4,abaete/MG,6
4,5,abaetetuba/PA,15
...,...,...,...
5565,5566,xique xique/BA,7
5566,5567,zabele/PB,11
5567,5568,zacarias/SP,1
5568,5569,ze doca/MA,14


In [8]:
code_zip_prefix_dataset

Unnamed: 0,code_zip_prefix_id,code_zip_prefix
0,1,1037
1,2,1046
2,3,1041
3,4,1035
4,5,1012
...,...,...
19291,19292,72338
19292,19293,68629
19293,19294,28530
19294,19295,55863


In [9]:
state_dataset

Unnamed: 0,state_id,state
0,1,SP
1,2,RN
2,3,AC
3,4,RJ
4,5,ES
5,6,MG
6,7,BA
7,8,SE
8,9,PE
9,10,AL


#### Defining and substituting special characters from the dataset city_state

In [10]:
city_modify = []
for i in geolocation_df.geolocation_city.to_list():
    aux = ""
    for j in i:
        if j == 'ã':
            aux = aux+'a'
        elif j == 'â':
            aux = aux+'a'
        elif j == 'á':
            aux = aux+'a'
        elif j == 'á':
            aux = aux+'a'
        elif j == 'à':
            aux = aux+'a'
        elif j == 'ã':
            aux = aux+'a'
        elif j == 'é':
            aux = aux+'e'
        elif j == 'ê':
            aux = aux+'e'
        elif j == 'í':
            aux = aux+'i'
        elif j == 'î':
            aux = aux+'i'
        elif j == 'ó':
            aux = aux+'o'
        elif j == 'ô':
            aux = aux+'o'
        elif j == 'õ':
            aux = aux+'o'
        elif j == 'ú':
            aux = aux+'u'
        elif j == 'û':
            aux = aux+'u'
        elif j == 'ü':
            aux = aux+'u'
        elif j == 'ç':
            aux = aux+'c'
        elif j == '-':
            aux = aux+' '
        elif j == "'":
            aux = aux+' '
        elif j == '£':
            pass
        elif j == '.':
            pass
        elif j == "(":
            pass
        elif j == ")":
            pass
        else:
            aux = aux+j
    aux=aux.lower()
    city_modify.append(aux)

Finally, we replace the `geolocation_city` column with the `city_modify` list.

In [11]:
geolocation_df['geolocation_city'] = city_modify
geolocation_df

Unnamed: 0,geolocation_zip_code_prefix,geolocation_lat,geolocation_lng,geolocation_city,geolocation_state
0,1037,-23.545621,-46.639292,sao paulo,SP
1,1046,-23.546081,-46.644820,sao paulo,SP
2,1046,-23.546129,-46.642951,sao paulo,SP
3,1041,-23.544392,-46.639499,sao paulo,SP
4,1035,-23.541578,-46.641607,sao paulo,SP
...,...,...,...,...,...
1000158,99950,-28.068639,-52.010705,tapejara,RS
1000159,99900,-27.877125,-52.224882,getulio vargas,RS
1000160,99950,-28.071855,-52.014716,tapejara,RS
1000161,99980,-28.388932,-51.846871,david canabarro,RS


#### Concatenate geolocation_city with geolocation_state

In [12]:
geolocation_df['geolocation_city_state'] = [geolocation_df.geolocation_city[i] + '/'+ geolocation_df.geolocation_state[i] for i in range(len(geolocation_df.geolocation_state))]

In [13]:
geolocation_df.sort_values(by='geolocation_city_state',inplace=True)
geolocation_df.drop(columns=['geolocation_city'],inplace=True)
geolocation_df

Unnamed: 0,geolocation_zip_code_prefix,geolocation_lat,geolocation_lng,geolocation_state,geolocation_city_state
851430,81470,-25.571748,-49.334374,PR,* cidade/PR
896733,87365,-24.271860,-53.069433,PR,4o centenario/PR
896977,87365,-24.281905,-53.074516,PR,4º centenario/PR
897217,87365,-24.277697,-53.074930,PR,4º centenario/PR
804534,75345,-16.756821,-49.435020,GO,abadia de goias/GO
...,...,...,...,...,...
933159,89633,-27.458106,-51.553812,SC,zortea/SC
932946,89633,-27.454065,-51.554470,SC,zortea/SC
933539,89633,-27.454790,-51.550597,SC,zortea/SC
932551,89633,-27.456633,-51.547892,SC,zortea/SC


#### Defining and substituting formats other than geolocation_df ['geolocation_city'].

In [14]:
cidade = [['cidade gaucha/PR'],[r'* cidade/PR']]
centenario = [['quarto centenario/PR'],['4o centenario/PR','4º centenario/PR','4º centenario/PR']]
abrantes = [['lauro de freitas/BA'],['abrantes/BA','catu de abrantes/BA','catucaba/SP']]
abreus = [['alto rio doce/MG'],['abreus/MG','vitorinos   alto rio doce/MG','vitorinos/MG']]
acioli = [['joao neiva/ES'],['acioli/ES']]
acu_da_torre = [['mata de sao joao/BA'],['acu da torre/BA']]
acupe = [['santo amaro/BA'],['acupe/BA']]
adao_colares = [['botumirim/MG'],['adao colares/MG']]
adhemar_de_barros = [['terra rica/PR'],['adhemar de barros/PR']]
afonso_arinos = [['comendador levy gasparian/RJ'],['afonso arinos/RJ']]
agisse = [['rancharia/SP'],['agisse/SP']]
agua_boa = [['paicandu/PR'],['agua boa/PR']]
agua_branca_de_minas = [['comercinho/MG'],['agua branca de minas/MG']]
agua_fria = [['recife/PE'],['agua fria/PE']]
agua_vermelha = [['sao carlos/SP'],['agua vermelha/SP']]
aguas_claras = [['viamao/RS'],['aguas claras/RS']]
aguas_ferreas = [['sao pedro dos ferros/MG'],['aguas ferreas/MG']]
agulha = [['fernando prestes/SP'],['agulha/SP']]
alberto_isaacson = [['martinho campos/MG'],['alberto isaacson/MG']]
aldeia = [['cuparaque/MG'],['aldeia/MG']]
alegria = [['simonesia/MG'],['alegria/MG']]
alexandra = [['paranagua/PR'],['alexandra/PR']]
alexandrita = [['iturama/MG'],['alexandrita/MG']]
alfredo_guedes = [['lencois paulista/SP'],['alfredo guedes/SP']]
algodoes = [['quijingue/BA'],['algodoes/BA']]
alta_alegre_dos_parecis = [['alto alegre dos parecis/RO'],['alta alegre dos parecis/RO']]
alta_floresta_do_oeste = [['alta floresta d oeste/RO'],['alta floresta do oeste/RO','alta floresta doeste/RO']]
alto_alegre_do_iguacu = [['capitao leonidas marques/PR'],['alto alegre do iguacu/PR']]
alto_alegre = [['colorado/PR'],['alto alegre/PR']]
alto_calcado = [['sao jose do calcado/ES'],['alto calcado/ES']]
alto_maranhao = [['congonhas/MG'],['alto maranhao/MG']]
alto_mutum_preto = [['baixo guandu/ES'],['alto mutum preto/ES']]
alvacao = [['coracao de jesus/MG'],['alvacao/MG']]
alvorada_do_oeste = [['alvorada d oeste/RO'],['alvorada do oeste/RO']]
alvorada = [['alvorada de minas/MG'],['alvorada/MG']]
amanari = [['maranguape/CE'],['amanari/CE']]
amandina = [['ivinhema/MS'],['amandina/MS']]
amanhece = [['araguari/MG'],['amanhece/MG']]
amapari = [['pedra branca do amapari/AP'],['amapari/AP']]
amarantina = [['ouro preto/MG'],['amarantina/MG']]
americano = [['americana/SP'],['americano/PA']]
amparo_da_serra = [['amparo do serra/MG'],['amparo da serra/MG']]
amparo_de_sao_francisco = [['amparo do sao francisco/SE'],['amparo de sao francisco/SE']]
ana_dias = [['itariri/SP'],['ana dias/SP']]
andrade_pinto = [['vassouras/RJ'],['andrade pinto/RJ']]
andrequice = [['tres marias/MG'],['andrequice/MG']]
anguereta = [['curvelo/MG'],['anguereta/MG']]
angustura = [['alem paraiba/MG'],['angustura/MG']]
anhandui = [['campo grande/MS'],['anhandui/MS']]
anta = [['sapucaia/RJ'],['anta/RJ']]
antonio_pereira = [['ouro preto/MG'],['antonio pereira/MG']]
antunes_igaratinga = [['igaratinga/MG'],['antunes igaratinga/MG','antunes/MG']]
aparecida_de_monte_alto = [['monte alto/SP'],['aparecida de monte alto/SP']]
aparecida_de_sao_manuel = [['sao manuel/SP'],['aparecida de sao manuel/SP']]
aparecida_doeste = [['aparecida d oeste/SP'],['aparecida doeste/SP']]
apeu = [['castanhal/PA'],['apeu/PA']]
aquidaban = [['marialva/PR'],['aquidaban/PR']]
arace = [['domingos martins/ES'],['arace/ES']]
araguaia = [['marechal floriano/ES'],['araguaia/ES']]
arapua = [['tres lagoas/MS'],['arapua/MS']]
arco_verde = [['carlos barbosa/RS'],['arco verde/RS']]
areia_branca_dos_assis = [['mandirituba/PR'],['areia branca dos assis/PR']]
arembepe = [['camacari/BA'],['arembepe/BA']]
arez = [['ares/RN'],['arez/RN']]
armacao_de_buzios = [['armacao dos buzios/RJ'],['armacao de buzios/RJ']]
arrozal = [['pirai/RJ'],['arrozal/RJ']]
aurora_do_iguacu = [['sao miguel do iguacu/PR'],['aurora do iguacu/PR']]
avai_do_jacinto = [['jacinto/MG'],['avai do jacinto/MG']]
avelar = [['paty do alferes/RJ'],['avelar/RJ']]
azambuja = [['brusque/SC'],['azambuja/SC']]
azurita = [['mateus leme/MG'],['azurita/MG']]
bacaxa = [['saquarema/RJ'],['bacaxa saquarema   distrito/RJ','bacaxa/RJ']]
baguacu = [['olimpia/SP'],['baguacu/SP']]
baguari = [['governador valadares/MG'],['baguari/MG']]
balneario_de_picarras = [['balneario picarras/SC'],['balneario de picarras/SC']]
bandeirantes_d_oeste = [['sud mennucci/SP'],['bandeirantes d oeste/SP']]
bandeirantes = [['bandeira/MG'],['bandeirantes/MG']]
banquete = [['rio de janeiro/RJ'],['banquete/RJ']]
barao_ataliba_nogueira = [['itapura/SP'],['barao ataliba nogueira/SP']]
barao_de_juparana = [['valenca/RJ'],['barao de juparana/RJ']]
barcelos = [['sao joao da barra/RJ'],['barcelos/RJ']]
barra_de_santo_antonio = [['barra de santo antonio/AL'],['barra de  santo antonio/AL']]
barra_de_sao_joao = [['casimiro de abreu/RJ'],['barra de sao joao/RJ']]
barra_do_ariranha = [['mantena/MG'],['barra do ariranha/MG']]
barra_do_cuiete = [['conselheiro pena/MG'],['barra do cuiete/MG']]
barra_do_jacuipe = [['camacari/BA'],['barra do jacuipe/BA']]
barra_do_tarrachil = [['chorrocho/BA'],['barra do tarrachil/BA']]
barra_feliz = [['santa barbara/MG'],['barra feliz/MG']]
barrado_quarai = [['barra do quarai/RS'],['barrado quarai/RS']]
barreiro_branco = [['catuti/MG'],['barreiro branco/MG']]
barro_duro = [['tutoia/MA'],['barro duro/MA']]
bataipora = [['bataypora/MS'],['bataipora/MS']]
batateira = [['belem de maria/PE'],['batateira/PE']]
batinga = [['itanhem/BA'],['batinga/BA']]
belem_de_sao_francisco = [['belem do sao francisco/PE'],['belem de sao francisco/PE']]
belo_horizonta = [['belo horizonte/MG'],['belo horizonta/MG']]
benfica = [['benevides/PA'],['benfica/PA']]
bentopolis_de_minas = [['ubai/MG'],['bentopolis de minas/MG']]
bentopolis = [['nossa senhora das gracas/PR'],['bentopolis/PR']]
bh = [['belo horizonte/MG'],['bh/MG']]
bitupita = [['barroquinha/CE'],['bitupita/CE']]
bizarra = [['limoeiro/PE'],['bizarra/PE']]
boa_esperanca = [['sorriso/MT'],['boa esperanca/MT']]
boa_esperanca_2 = [['rio bonito/RJ'],['boa esperanca/RJ']]
boa_saude = [['januario cicco/RN'],['boa saude/RN']]
boa_sorte = [['cantagalo/RJ'],['boa sorte/RJ']]
boa_uniao_de_itabirinha = [['itabirinha/MG'],['boa uniao de itabirinha/MG']]
boa_uniao = [['alagoinhas/BA'],['boa uniao/BA']]
boa_ventura = [['itaperuna/RJ'],['boa ventura/RJ']]
boa_vista_de_minas = [['bela vista de minas/MG'],['boa vista de minas/MG']]
boa_vista_dos_andradas = [['alvares florence/SP'],['boa vista dos andradas/SP']]
boa_vista = [['alto boa vista/MT'],['boa vista/MT']]
bom_fim_do_bom_jesus = [['cabreuva/SP'],['bom fim do bom jesus/SP']]
bom_jardim_do_sul = [['ivai/PR'],['bom jardim do sul/PR']]
bom_jesus = [['bom jesus de goias/GO'],['bom jesus/GO']]
bom_retiro_da_esperanca = [['angatuba/SP'],['bom retiro da esperanca/SP']]
bonfim_paulista = [['ribeirao preto/SP'],['bonfim paulista/SP']]
borda_do_campo = [['sao jose dos pinhais/PR'],['borda do campo/PR']]
botelho = [['santa adelia/SP'],['botelho/SP']]
braco_do_rio = [['conceicao da barra/ES'],['braco do rio/ES']]
bragantina = [['assis chateaubriand/PR'],['bragantina/PR']]
brasitania = [['fernandopolis/SP'],['brasitania/SP']]
brasopolis = [['brazopolis/MG'],['brasopolis/MG']]
brejo_bonito = [['cruzeiro da fortaleza/MG'],['brejo bonito/MG']]
bugre = [['balsa nova/PR'],['bugre/PR']]
buriti = [['santo angelo/RS'],['buriti/RS']]
buritirama = [['buritirana/MA'],['buritirama/MA']]
buzios = [['armacao dos buzios/RJ'],['buzios/RJ']]
cacaratiba = [['turmalina/MG'],['cacaratiba/MG']]
cacarema = [['capitao eneas/MG'],['cacarema/MG']]
cachoeira_de_piria = [['cachoeira do piria/PA'],['cachoeira de piria/PA']]
cachoeira_de_santa_cruz = [['vicosa/MG'],['cachoeira de santa cruz/MG']]
cachoeira_do_brumado = [['mariana/MG'],['cachoeira do brumado/MG']]
cachoeira_do_campo = [['ouro preto/MG'],['cachoeira do campo/MG']]
caetano_mendes = [['tibagi/PR'],['caetano mendes/PR']]
caicara = [['cruz/CE'],['caicara/CE']]
calheiros = [['bom jesus do itabapoana/RJ'],['calheiros/RJ']]
calixto = [['resplendor/MG'],['calixto/MG']]
cambiasca = [['sao fidelis/RJ'],['cambiasca/RJ']]
camela = [['ipojuca/PE'],['camela/PE']]
campinal = [['presidente epitacio/SP'],['campinal/SP']]
campinas = [['placido de castro/AC'],['campinas/AC']]
campo_alegre_de_lourdes = [['campo alegre de lourdes/BA'],[r"campo alegre de lourdes, bahia, brasil/BA"]]
campo_alegre_de_minas = [['resplendor/MG'],['campo alegre de minas/MG']]
campo_grande = [['rio de janeiro/RJ'],['campo grande/RJ']]
campos_de_cunha = [['cunha/SP'],['campos de cunha/SP']]
canabrava = [['joao pinheiro/MG'],['canabrava/MG']]
candia = [['pontal/SP'],['candia/SP']]
cangas = [['pocone/MT'],['cangas/MT']]
capao_da_porteira = [['viamao/RS'],['capao da porteira/RS']]
capao_novo = [['capao da canoa/RS'],['capao novo/RS']]
caponga = [['cascavel/CE'],['caponga/CE']]
carabucu = [['bom jesus do itabapoana/RJ'],['carabucu/RJ']]
caraiba = [['carnaiba/PE'],['caraiba/PE']]
carajas = [['parauapebas/PA'],['carajas/PA']]
cardeal = [['elias fausto/SP'],['cardeal/SP']]
carnaiba_do_sertao = [['juazeiro/BA'],['carnaiba do sertao/BA']]
caruara = [['santos/SP'],['caruara/SP']]
castelo_dos_sonhos = [['altamira/PA'],['castelo dos sonhos/PA']]
catingal = [['manoel vitorino/BA'],['catingal/BA']]
catune = [['tombos/MG'],['catune/MG']]
catuni = [['francisco sa/MG'],['catuni/MG']]
celina = [['alegre/ES'],['celina/ES']]
central_de_santa_helena = [['divino das laranjeiras/MG'],['central de santa helena/MG']]
chaveslandia = [['santa vitoria/MG'],['chaveslandia/MG']]
chonim = [['governador valadares/MG'],['chonim/MG']]
cipolandia = [['aquidauana/MS'],['cipolandia/MS']]
cisneiros = [['palma/MG'],['cisneiros/MG']]
claudio_manuel = [['mariana/MG'],['claudio manuel/MG']]
clevelandia_do_norte = [['oiapoque/AP'],['clevelandia do norte/AP']]
cocais = [['barao de cocais/MG'],['cocais/MG']]
colonia_nova = [['acegua/RS'],['colonia nova/RS']]
colonia_vitoria = [['guarapuava/PR'],['colonia vitoria/PR']]
guaranta = [['guaranta/SP'],['colonia z 3/RS']]
central_de_santa_helena = [['divino das laranjeiras/MG'],['central de santa helena/MG']]
chaveslandia = [['santa vitoria/MG'],['chaveslandia/MG']]
chonim = [['governador valadares/MG'],['chonim/MG']]
cipolandia = [['aquidauana/MS'],['cipolandia/MS']]
cisneiros = [['aquidauana/MS'],['cisneiros/MG']]
claudio_manuel = [['mariana/MG'],['claudio manuel/MG']]
clevelandia_do_norte = [['oiapoque/AP'],['clevelandia do norte/AP']]
colonia_nova = [['acegua/RS'],['colonia nova/RS']]
colonia_vitoria = [['ortigueira/PR'],['colonia vitoria/PR']]
colonia_z_3 = [['pelotas/RS'],['colonia z 3/RS']]
colorado_do_norte = [['nova canaa do norte/MT'],['colorado do norte/MT']]
comendador_venancio = [['itaperuna/RJ'],['comendador venancio/RJ']]
conceicao_da_ibitipoca = [['lima duarte/MG'],['conceicao da ibitipoca/MG']]
conceicao_de_jacarei = [['lima duarte/MG'],['conceicao de jacarei/RJ']]
conceicao_de_tronqueiras = [['coroaci/MG'],['conceicao de tronqueiras/MG']]
conceicao_do_capim = [['aimores/MG'],['conceicao do capim/MG']]
conceicao = [['osasco/SP'],['conceicao/SP']]
concordia_de_mucuri = [['ladainha/MG'],['concordia de mucuri/MG']]
congonhas = [['alto parana/PR'],['congonhas/PR']]
conrado = [['rio de janeiro/RJ'],['conrado/RJ']]
conservatoria = [['valenca/RJ'],['conservatoria/RJ']]
coqueiral = [['aracruz/ES'],['coqueiral/ES']]
corrego_do_ouro = [['campos gerais/MG'],['corrego do ouro/MG']]
correntinho = [['guanhaes/MG'],['correntinho/MG']]
costa_machado = [['mirante do paranapanema/SP'],['costa machado/SP']]
couto_de_magalhaes = [['couto magalhaes/TO'],['couto de magalhaes/TO']]
crisolia = [['ouro fino/MG'],['crisolia/MG']]
cristal_do_norte = [['pedro canario/ES'],['cristal do norte/ES']]
cristalina = [['caarapo/MS'],['cristalina/MS']]
cruzeiro_do_norte = [['urai/PR'],['cruzeiro do norte/PR']]
cruzes = [['panelas/PE'],['cruzes/PE']]
cuiaba_paulista = [['mirante do paranapanema/SP'],['cuiaba paulista/SP']]
cumuruxatiba = [['prado/BA'],['cumuruxatiba/BA']]
curumim = [['capao da canoa/RS'],['curumim/RS']]
curupa = [['tabatinga/SP'],['curupa/SP']]
dalbergia = [['ibirama/SC'],['dalbergia/SC']]
deserto = [['itapipoca/CE'],['deserto/CE']]
dez_de_maio = [['toledo/MG'],['dez de maio/PR']]
diamante_d_oeste = [['diamante d oeste/PR'],['diamante d  oeste/PR']]
dias_davila = [['dias d avila/BA'],['dias davila/BA']]
divino_espirito_santo = [['alterosa/MG'],['divino espirito santo/MG']]
dois_de_abril = [['palmopolis/MG'],['dois de abril/MG']]
domelia = [['agudos/SP'],['domelia/SP']]
dorandia = [['barra do pirai/RJ'],['dorandia/RJ']]
dores_do_paraibuna = [['santos dumont/MG'],['dores do paraibuna/MG']]
eldorado_dos_carajas = [['eldorado do carajas/PA'],['eldorado dos carajas/PA']]
eleuterio = [['itapira/SP'],['eleuterio/SP']]
embu = [['embu das artes/SP'],['embu/SP']]
embuguacu = [['embu guacu/SP'],['embuguacu/SP']]
encantado_d_oeste = [['assis chateaubriand/PR'],['encantado d oeste/PR']]
eneida = [['presidente prudente/SP'],['eneida/SP']]
engenheiro_balduino = [['monte aprazivel/SP'],['engenheiro balduino/SP']]
engenheiro_franca = [['ubaira/BA'],['engenheiro franca/BA']]
engenheiro_passos = [['resende/RJ'],['engenheiro passos/RJ']]
engenheiro_schnoor = [['aracuai/MG'],['engenheiro schnoor/MG']]
engenho_do_ribeiro = [['bom despacho/MG'],['engenho do ribeiro/MG']]
epaminondas_otoni = [['carlos chagas/MG'],['epaminondas otoni/MG']]
esmeraldas_de_ferros = [['ferros/MG'],['esmeraldas de ferros/MG']]
espigao_do_oeste = [['espigao d oeste/RO'],['espigao do oeste/RO']]
espigao = [['regente feijo/SP'],['espigao/SP']]
estacao_cocal = [['cocal do sul/SC'],['estacao cocal/SC']]
esteios = [['luz/MG'],['esteios/MG']]
estrela_de_jordania = [['jordania/MG'],['estrela de jordania/MG']]
estrela_doeste = [['estrela d oeste/SP'],['estrela doeste/SP']]
fatimarmnte_dutra = [['presidente dutra/MA'],['fatimarmnte dutra/MA']]
fazenda_nova = [['brejo da madre de deus/PE'],['fazenda nova/PE']]
fazenda_souza = [['caxias do sul/RS'],['fazenda souza/RS']]
feiticeiro = [['jaguaribe/CE'],['feiticeiro/CE']]
ferruginha = [['conselheiro pena/MG'],['ferruginha/MG']]
figueiropolis_doeste = [['figueiropolis d oeste/MT'],['figueiropolis doeste/MT']]
flores = [['russas/CE'],['flores/CE']]
floresta_do_sul = [['presidente prudente/SP'],['floresta do sul/SP']]
floresta = [['florestal/MG'],['floresta/MG']]
florinia = [['florinea/SP'],['florinia/SP']]
florineo = [['florianopolis/SC'],[r'florian&oacute;polis/SC','floripa/SC']]
fonseca = [['alvinopolis/MG'],['fonseca/MG']]
fortaleza_do_tabocao = [['tabocao/TO'],['fortaleza do tabocao/TO']]
frade = [['angra dos reis/RJ'],['frade/RJ']]
fragosos = [['campo alegre/SC'],['fragosos/SC']]
franca_sp = [['franca/SP'],['franca sp/SP']]
freguesia_do_andira = [['barreirinha/AM'],['freguesia do andira/AM']]
frutal_do_campo = [['candido mota/SP'],['frutal do campo/SP']]
furquim = [['mariana/MG'],['furquim/MG']]
gardenia = [['rancharia/SP'],['gardenia/SP']]
getulandia = [['rio claro/RJ'],['getulandia/RJ']]
glicerio = [['macae/RJ'],['glicerio/RJ']]
goiabal = [['sao jose do goiabal/MG'],['goiabal/MG']]
gororos = [['dom joaquim/MG'],['gororos/MG']]
gouvea = [['gouveia/MG'],['gouvea/MG']]
governador_lomanto_junior = [['barro preto/BA'],['governador lomanto junior/BA']]
governador_portela = [['miguel pereira/RJ'],['governador portela/RJ']]
graccho_cardoso = [['gracho cardoso/SE'],['graccho cardoso/SE']]
graciosa = [['alto parana/PR'],['graciosa/PR']]
gramadinho = [['itapetininga/SP'],['gramadinho/SP']]
granada = [['abre campo/MG'],['granada/MG']]
guaianas = [['pederneiras/SP'],['guaianas/SP']]
guaicui = [['varzea da palma/MG'],['guaicui/MG']]
guaipora = [['cafezal do sul/PR'],['guaipora/PR']]
guaporanga = [['biguacu/SC'],['guaporanga/SC']]
guarapua = [['dois corregos/SP'],['guarapua/SP']]
guarda_dos_ferreiros = [['rio paranaiba/MG'],['guarda dos ferreiros/MG']]
guardinha = [['sao sebastiao do paraiso/MG'],['guardinha/MG']]
guarizinho = [['itapeva/SP'],['guarizinho/SP']]
guarulhos_sp = [['guarulhos/SP'],['guarulhos sp/SP']]
guassusse = [['oros/CE'],['guassusse/CE']]
guaxima = [['conquista/MG'],['guaxima/MG']]
guia_de_pacobaiba = [['mage/RJ'],['guia de pacobaiba/RJ']]
harmonia = [['telemaco borba/PR'],['harmonia/PR']]
herval_d_oeste = [['herval d oeste/SC'],['herval d  oeste/SC','herval doeste/SC']]
hidreletrica_tucurui = [['tucurui/PA'],['hidreletrica tucurui/PA']]
holambra_ii = [['holambra/SP'],['holambra ii/SP']]
honoropolis = [['campina verde/MG'],['honoropolis/MG']]
iauarete = [['sao gabriel da cachoeira/AM'],['iauarete/AM']]
ibiajara = [['rio do pires/BA'],['ibiajara/BA']]
ibicua = [['piquet carneiro/CE'],['ibicua/CE']]
ibiraja = [['itanhem/BA'],['ibiraja/BA']]
ibitira = [['rio do antonio/BA'],['ibitira/BA']]
ibitira_MG = [['martinho campos/MG'],['ibitira/MG']]
ibitiranga =[['carnaiba/PE'],['ibitiranga/PE']]
ibitiuva = [['pitangueiras/SP'],['ibitiuva/SP']]
ibo = [['abare/BA'],['ibo/BA']]
icara = [['astorga/PR'],['icara/PR']]
igarai = [['mococa/SP'],['igarai/SP']]
iguaibi = [['iguai/BA'],['iguaibi/BA']]
iguaraci = [['iguaracy/PE'],['iguaraci/PE']]
ilha_dos_valadares = [['paranagua/PR'],['ilha dos valadares/PR']]
ilha_grande = [['angra dos reis/RJ'],['ilha grande/RJ']]
independencia = [['belo horizonte/MG'],['independencia/MG']]
inhomirim = [['mage/RJ'],['inhomirim/RJ']]
inoa = [['marica/RJ'],['inoa/RJ']]
inubia = [['piata/BA'],['inubia/BA']]
ipuca = [['sao fidelis/RJ'],['ipuca/RJ']]
irape = [['chavantes/SP'],['irape/SP']]
iraporanga = [['iraquara/BA'],['iraporanga/BA']]
irundiara = [['jacaraci/BA'],['irundiara/BA']]
isabel = [['domingos martins/ES'],['isabel/ES']]
itabaiana = [['mucurici/ES'],['itabaiana/ES']]
itabata = [['mucuri/BA'],['itabata/BA','itabatan mucuri/BA','itabatan/BA']]
itabirinha_de_mantena = [['itabirinha/MG'],['itabirinha de mantena/MG']]
itaguacu = [['sao simao/GO'],['itaguacu/GO']]
itaim = [['cachoeira de minas/MG'],['itaim/MG']]
itaimbe = [['itaguacu/ES'],['itaimbe/ES']]
itaipava = [['petropolis/RJ'],['itaipava/ES']]
itamaraca = [['ilha de itamaraca/PE'],['itamaraca/PE']]
itamarati_norte = [['tangara da serra/MT'],['itamarati norte/MT']]
itamira = [['apora/BA'],['itamira/BA']]
itaoca = [['itapemirim/ES'],['itaoca/ES']]
itapage = [['itapaje/CE'],['itapage/CE']]
itapejara_d_oeste = [['itapejara d oeste/PR'],['itapejara d  oeste/PR']]
itapiru = [['rubim/MG'],['itapiru/MG']]
itapirucu = [['palma/MG'],['itapirucu/MG']]
itapocu = [['araquari/SC'],['itapocu/SC']]
itaquarai = [['brumado/BA'],['itaquarai/BA']]
itaunas = [['conceicao da barra/ES'],['itaunas/ES']]
itupeva = [['medeiros neto/BA'],['itupeva/BA']]
iubatinga = [['caiabu/SP'],['iubatinga/SP']]
ivailandia = [['engenheiro beltrao/PR'],['ivailandia/PR']]
jabitaca = [['iguaracy/PE'],['jabitaca/PE']]
jaboatao_dos_gurarapes = [['jaboatao dos guararapes/PE'],['jaboatao dos gurarapes/PE']]
jacare_cabreuva = [['cabreuva/SP'],['jacare cabreuva/SP','jacare/SP']]
jacigua = [['vargem alta/ES'],['jacigua/ES']]
jacilandia = [['itapirapua/GO'],['jacilandia/GO']]
jacuba = [['arealva/SP'],['jacuba/SP']]
jafa = [['garca/SP'],['jafa/SP']]
jamapara = [['sapucaia/RJ'],['jamapara/RJ']]
jangada = [['cafezal do sul/PR'],['jangada/PR']]
jansen = [['farroupilha/RS'],['jansen/RS']]
japuiba = [['cachoeiras de macacu/RJ'],['japuiba/RJ']]
jardim_abc_de_goias = [['cidade ocidental/GO'],['jardim abc de goias/GO']]
jequirica = [['jiquirica/BA'],['jequirica/BA']]
joao_amaro = [['iacu/BA'],['joao amaro/BA']]
jordanesia = [['cajamar/SP'],['jordanesia/SP']]
juatama = [['quixada/CE'],['juatama/CE']]
juritis = [['glicerio/SP'],['juritis/SP']]
juruce = [['jardinopolis/SP'],['juruce/SP']]
jurupema = [['taquaritinga/SP'],['jurupema/SP']]
lages = [['maranguape/CE'],['lages/CE']]
lagoa_bonita = [['deodapolis/MS'],['lagoa bonita/MS']]
lagoa_do_itaenga = [['lagoa de itaenga/PE'],['lagoa do itaenga/PE']]
lagoa_do_mato = [['aracati/CE'],['lagoa do mato/CE']]
lagoinha = [['fortaleza/CE'],['lagoinha/CE']]
laje_grande = [['catende/PE'],['laje grande/PE']]
lambari = [['lambari d oeste/MT'],[r'lambari d%26apos%3boeste/MT','lambari doeste/MT']]
lamounier = [['itapecerica/MG'],['lamounier/MG']]
laranjais = [['itaocara/RJ'],['laranjais/RJ']]
lavras = [['lavras/MG'],['lavras mg/MG']]
lavras_novas = [['ouro preto/MG'],['lavras novas/MG']]
lidice = [['rio claro/RJ'],['lidice/RJ']]
limeira_d_oeste = [['limeira do oeste/MG'],['limeira d oeste/MG','limeira do oeste mg/MG']]
limeira_de_mantena = [['mantena/MG'],['limeira de mantena/MG']]
linharesl = [['linhares/ES'],['linharesl/ES']]
lucaia = [['planalto/BA'],['lucaia/BA']]
luiz_pires_de_minas = [['coracao de jesus/MG'],['luiz pires de minas/MG']]
luizlandia_do_oeste = [['sao goncalo do abaete/MG'],['luizlandia do oeste/MG']]
luminosa = [['brazopolis/MG'],['luminosa/MG']]
luziapolis = [['campo alegre/AL'],['luziapolis/AL']]
maceiA = [['maceio/AL'],['maceia³/AL']]
machadinho_doeste = [['machadinho d oeste/RO'],['machadinho doeste/RO']]
macuco_de_minas = [['itumirim/MG'],['macuco de minas/MG','macuco/MG']]
maiauata = [['igarape miri/PA'],['maiauata/PA']]
mangabeira = [['lavras da mangabeira/CE'],['mangabeira/CE']]
maniacu = [['caetite/BA'],['maniacu/BA']]
maracana = [['curitibanos/SC'],['maracana/SC']]
marambainha = [['carai/MG'],['marambainha/MG']]
maresias = [['sao sebastiao/SP'],['maresias/SP']]
mariental = [['lapa/PR'],['mariental/PR']]
maristela = [['laranjal paulista/SP'],['maristela/SP']]
martinho_prado_junior = [['mogi guacu/SP'],['martinho prado junior/SP']]
martins_guimaraes = [['lagoa da prata/MG'],['martins guimaraes/MG']]
melo_viana = [['coronel fabriciano/MG'],['melo viana/MG']]
mendonca = [['veredinha/MG'],['mendonca/MG']]
menino_jesus = [['candeias/BA'],['menino jesus/BA']]
merces_de_agua_limpa = [['sao tiago/MG'],['merces de agua limpa/MG']]
milho_verde = [['serro/MG'],['milho verde/MG']]
mineirolandia = [['pedra branca/CE'],['mineirolandia/CE']]
mocambeiro = [['matozinhos/MG'],['mocambeiro/MG']]
mogidascruzes = [['mogi das cruzes/SP'],['mogidascruzes/SP']]
monsenhor_horta = [['mariana/MG'],['monsenhor horta/MG']]
monsenhor_joao_alexandre = [['claudio/MG'],['monsenhor joao alexandre/MG']]
monte_alegre = [['santo antonio de padua/RJ'],['monte alegre/RJ']]
monte_alverne = [['santa cruz do sul/RS'],['monte alverne/RS']]
monte_bonito = [['pelotas/RS'],['monte bonito/RS']]
monte_gordo = [['camacari/BA'],['monte gordo camacari   distrito/BA','monte gordo/BA']]
monte_sinai = [['barra de sao francisco/ES'],['monte sinai/ES']]
monte_verde_paulista = [['cajobi/SP'],['monte verde paulista/SP']]
monte_verde = [['camanducaia/MG'],['monte verde/MG']]
montese = [['itapora/MS'],['montese/MS']]
morro_chato = [['morro grande/SC'],['morro chato/SC']]
morro_de_sao_paulo = [['cairu/BA'],['morro de sao paulo/BA']]
morro_do_ferro = [['oliveira/MG'],['morro do ferro/MG']]
morro_vermelho = [['caete/MG'],['morro vermelho/MG']]
mujui_dos_campos = [['mojui dos campos/PA'],['mujui dos campos/PA']]
muquem_de_sao_francisco = [['muquem do sao francisco/BA'],['muquem de sao francisco/BA']]
nelson_de_sena = [['sao joao evangelista/MG'],['nelson de sena/MG']]
neolandia = [['itapecerica/MG'],['neolandia/MG']]
nossa_senhora_da_aparecida = [['sapucaia/RJ'],['nossa senhora da aparecida/RJ']]
nossa_senhora_da_guia = [['varzea grande/MT'],['nossa senhora da guia/MT']]
nossa_senhora_da_luz = [['sao lourenco da mata/PE'],['nossa senhora da luz/PE']]
nossa_senhora_de_caravaggio = [['nova veneza/SC'],['nossa senhora de caravaggio/SC']]
nossa_senhora_do_o = [['ipojuca/PE'],['nossa senhora do o/PE']]
nova_alexandria = [['candido mota/SP'],['nova alexandria/SP']]
nova_andradina = [['nova andradina/MS'],['nova andradina/RS']]
nova_brasilandia_doeste = [['nova brasilandia d oeste/RO'],['nova brasilandia doeste/RO']]
nova_casa_verde = [['nova andradina/MS'],['nova casa verde/MS']]
nova_floresta = [['jaguaribe/CE'],['nova floresta/CE']]
nova_itapirema = [['nova esperanca/PR'],['nova itapirema/SP']]
nova_milano = [['farroupilha/RS'],['nova milano/RS']]
nova_patria = [['presidente bernardes/SP'],['nova patria/SP']]
nova_redencao = [['nova redencao/BA'],['nova redencao bahia/BA']]
nova_santa_luzia = [['crisolita/MG'],['nova santa luzia/MG']]
nova_sardenha = [['farroupilha/RS'],['nova sardenha/RS']]
novo_brasil = [['governador lindenberg/ES'],['novo brasil/ES']]
novo_diamantino = [['diamantino/MT'],['novo diamantino/MT']]
olho_dagua_das_cunhas = [['olho d agua das cunhas/MA'],['olho dagua das cunhas/MA']]
olho_dagua_grande = [['olho d agua grande/AL'],['olho dagua grande/AL']]
olhos_d_agua_do_oeste = [['joao pinheiro/MG'],['olhos d agua do oeste/MG']]
osvaldo_kroeff = [['cambara do sul/RS'],['osvaldo kroeff/RS']]
otavio_rocha = [['flores da cunha/RS'],['otavio rocha/RS']]
ouro_verde_do_piquiri = [['corbelia/PR'],['ouro verde do piquiri/PR']]
ouroana = [['rio verde/GO'],['ouroana/GO']]
padre_fialho = [['matipo/MG'],['padre fialho/MG']]
padre_gonzales = [['tres passos/RS'],['padre gonzales/RS']]
paiquere = [['londrina/PR'],['paiquere/PR']]
palmeira_doeste = [['palmeira d oeste/SP'],['palmeira doeste/SP']]
palmeiral = [['botelhos/MG'],['palmeiral/MG']]
panema = [['santa mariana/PR'],['panema/PR']]
papucaia = [['cachoeiras de macacu/RJ'],['papucaia/RJ']]
paraiso_do_tobias = [['miracema/RJ'],['paraiso do tobias/RJ']]
paraju = [['domingos martins/ES'],['paraju/ES']]
parana_d_oeste = [['moreira sales/PR'],['parana d oeste/PR']]
parapeuna = [['valenca/RJ'],['parapeuna/RJ']]
parati_mirim = [['paraty/RJ'],['parati mirim/RJ','parati/RJ']]
paruru = [['ibiuna/SP'],['paruru/SP']]
passa_tres = [['rio claro/RJ'],['passa tres/RJ']]
passagem_de_mariana = [['mariana/MG'],['passagem de mariana/MG']]
passagem_dos_teixeiras = [['candeias/BA'],['passagem dos teixeiras/BA']]
passe = [['sao sebastiao do passe/BA'],['passe/BA']]
pau_d_arco = [['pau d arco/PA'],['pau d  arco/PA','pau d arco/AL']]
paulista = [['barra de sao francisco/ES'],['paulista/ES']]
pecem = [['sao goncalo do amarante/CE'],['pecem/CE']]
pedra_menina = [['espera feliz/MG'],['pedra menina/MG']]
penedo_itatiaia = [['itatiaia/RJ'],['penedo itatiaia/RJ','penedo/RJ']]
penha_do_capim = [['aimores/MG'],['penha do capim/MG']]
perola_doeste = [['perola d oeste/PR'],['perola doeste/PR']]
perpetuo_socorro = [['alagoinha/PE'],['perpetuo socorro/PE']]
piabeta = [['mage/RJ'],['piabeta/RJ']]
piao = [['sao jose do vale do rio preto/RJ'],['piao/RJ']]
picarras = [['balneario picarras/SC'],['picarras/SC']]
piedade_do_paraopeba = [['brumadinho/MG'],['piedade do paraopeba/MG']]
pilar = [['belo horizonte/MG'],['pilar/MG']]
pindurao = [['camalau/PB'],['pindurao/PB']]
pinhal_alto = [['pinhal/RS'],['pinhal alto/RS']]
pinheiros_altos = [['piranga/MG'],['pinheiros altos/MG']]
pioneiros = [['guara/SP'],['pioneiros/SP']]
pipa = [['tibau do sul/RN'],['pipa/RN']]
piramboia = [['anhembi/SP'],['piramboia/SP']]
pirapo = [['arapongas/PR'],['pirapo/PR']]
pirapora = [['itapora/MS'],['pirapora/MS']]
pirituba = [['vitoria de santo antao/PE'],['pirituba/PE']]
piumhii = [['piumhi/MG'],['piumhii/MG']]
planaltina_de_goias = [['planaltina/GO'],['planaltina de goias/GO']]
pocoes_de_paineiras = [['paineiras/MG'],['pocoes de paineiras/MG']]
polvilho = [['cajamar/SP'],['polvilho/SP']]
ponte_alta_de_minas = [['carangola/MG'],['ponte alta de minas/MG']]
ponte_alta = [['uberaba/MG'],['ponte alta/MG']]
pontinha_do_cocho = [['camapua/MS'],['pontinha do cocho/MS']]
ponto_do_marambaia = [['carai/MG'],['ponto do marambaia/MG']]
portela = [['itaocara/RJ'],['portela/RJ']]
porto_aelgre = [['porto alegre/RS'],['porto aelgre/RS']]
porto_de_cima = [['morretes/PR'],['porto de cima/PR']]
porto_mendes = [['marechal candido rondon/PR'],['porto mendes/PR']]
porto_sao_jose = [['sao pedro do parana/PR'],['porto sao jose/PR']]
porto_trombetas = [['oriximina/PA'],['porto trombetas/PA']]
porto_velho_do_cunha = [['carmo/RJ'],['porto velho do cunha/RJ']]
posto_da_mata = [['nova vicosa/BA'],['posto da mata/BA']]
potunduva = [['jau/SP'],['potunduva/SP']]
poxim = [['coruripe/AL'],['poxim/AL']]
praia_grande = [['fundao/ES'],['praia grande fundao   distrito/ES','praia grande/ES']]
presidente_pena = [['carlos chagas/MG'],['presidente pena/MG']]
primavera = [['rosana/SP'],['primavera/SP']]
prudencio_thomaz = [['rio brilhante/MS'],['prudencio thomaz/MS']]
pulinopolis = [['mandaguacu/PR'],['pulinopolis/PR']]
pureza = [['sao fidelis/RJ'],['pureza/RJ']]
purilandia = [['porciuncula/RJ'],['purilandia/RJ']]
quatituba = [['itueta/MG'],['quatituba/MG']]
quatro_bocas = [['nova timboteua/PA'],['quatro bocas/PA']]
queimados = [['horizonte/CE'],['queimados/CE']]
queixada = [['novo cruzeiro/MG'],['queixada/MG']]
quilombo = [['pelotas/RS'],['quilombo/RS']]
quilometro_14_do_mutum = [['baixo guandu/ES'],['quilometro 14 do mutum/ES']]
quinta = [['rio grande/RS'],['quinta/RS']]
quintao = [['rio grande/RS'],['quintao/RS']]
quintinos = [['carmo do paranaiba/MG'],['quintinos/MG']]
quixada = [['quixada/CE'],['quixada/PE']]
rainha_isabel = [['bom conselho/PE'],['rainha isabel/PE']]
rajada = [['petrolina/PE'],['rajada/PE']]
rancho_alegre_d_oeste = [['rancho alegre d oeste/PR'],['rancho alegre d  oeste/PR']]
raposo = [['itaperuna/RJ'],['raposo/RJ']]
ravena = [['sabara/MG'],['ravena/MG']]
rechan = [['itapetininga/SP'],['rechan/SP']]
residencia_fuck = [['monte castelo/SC'],['residencia fuck/SC']]
retiro_do_muriae = [['itaperuna/RJ'],['retiro do muriae/RJ']]
ribeirao_de_sao_domingos = [['santa margarida/MG'],['ribeirao de sao domingos/MG']]
rio_bonito = [['ariranha do ivai/PR'],['rio bonito/PR']]
rio_bonito_2 = [['ituporanga/SC'],['rio bonito/SC']]
rio_bracnco = [['rio branco/AC'],['rio bracnco/AC']]
rio_de_janeiro = [['rio de janeiro/RJ'],[r"rio de janeiro, rio de janeiro, brasil/RJ",'rio de janeiro/AC','rio janeiro/RJ','rj/RJ']]
rio_do_meio = [['itororo/BA'],['rio do meio/BA']]
rio_melo = [['rio espera/MG'],['rio melo/MG']]
rio_verde = [['colombo/PR'],['rio verde/PR']]
rive = [['alegre/ES'],['rive/ES']]
riverlandia = [['rio verde/GO'],['riverlandia/GO']]
roberto = [['pindorama/SP'],['roberto/SP']]
rocas_novas = [['caete/MG'],['rocas novas/MG']]
rodrigo_silva = [['ouro preto/MG'],['rodrigo silva/MG']]
roseiral = [['mutum/MG'],['roseiral/MG']]
rubiao_junior = [['botucatu/SP'],['rubiao junior/SP']]
sacra_familia_do_tingua = [['engenheiro paulo de frontin/RJ'],['sacra familia do tingua/RJ']]
salgadalia = [['conceicao do coite/BA'],['salgadalia/BA']]
salobro = [['canarana/BA'],['salobro/BA']]
salvador = [['salvador/BA'],['salvador /BA']]
sampaio_correia = [['saquarema/RJ'],['sampaio correia/RJ']]
sana = [['macae/RJ'],['sana/RJ']]
sanga_puita = [['ponta pora/MS'],['sanga puita/MS']]
santa_barbara = [['santa barbara d oeste/SP'],[r'santa barbara d`oeste/SP','santa barbara doeste/SP']]
santa_cecilia_de_umbuzeiro = [['santa cecilia/PB'],['santa cecilia de umbuzeiro/PB']]
santa_clara = [['sao francisco de itabapoana/RJ'],['santa clara/RJ']]
santa_cruz_do_prata = [['guaranesia/MG'],['santa cruz do prata/MG']]
santa_cruz_do_timbo = [['porto uniao/SC'],['santa cruz do timbo/SC']]
santa_efigenia = [['belo horizonte/MG'],['santa efigenia/MG']]
santa_elvira = [['juscimeira/MT'],['santa elvira/MT']]
santa_eudoxia = [['sao carlos/SP'],['santa eudoxia/SP']]
santa_isabel_do_para = [['santa izabel do para/PA'],['santa isabel do para/PA']]
santa_isabel_do_rio_preto = [['valenca/RJ'],['santa isabel do rio preto/RJ']]
santa_lucia_do_piai = [['caxias do sul/RS'],['santa lucia do piai/RS']]
santa_luzia_de_caratinga = [['caratinga/MG'],['santa luzia de caratinga/MG']]
santa_luzia_de_mantenopolis = [['mantenopolis/ES'],['santa luzia de mantenopolis/ES']]
santa_luzia_do_cariri = [['serra branca/PB'],['santa luzia do cariri/PB']]
santa_luzia_doeste = [['santa luzia d oeste/RO'],['santa luzia doeste/RO']]
santa_luzia = [['osorio/RS'],['santa luzia/RS']]
santa_maria = [['santa maria madalena/RJ'],['santa maria/RJ']]
santa_rita_da_floresta = [['cantagalo/RJ'],['santa rita da floresta/RJ']]
santa_rita_de_ouro_preto = [['ouro preto/MG'],['santa rita de ouro preto/MG']]
santa_rita_do_cedro = [['curvelo/MG'],['santa rita do cedro/MG']]
santa_rita_do_ibitipoca = [['santa rita de ibitipoca/MG'],['santa rita do ibitipoca/MG']]
santa_rita_do_oeste = [['terra roxa/PR'],['santa rita do oeste/PR','santa rita doeste/SP']]
santa_rita_durao = [['mariana/MG'],['santa rita durao/MG']]
santa_teresinha = [['santa terezinha/BA'],['santa teresinha/BA']]
santa_terezinha_de_minas = [['itatiaiucu/MG'],['santa terezinha de minas/MG']]
santa_zelia = [['astorga/PR'],['santa zelia/PR']]
santana_de_caldas = [['caldas/MG'],['santana de caldas/MG']]
santana_de_patos = [['patos de minas/MG'],['santana de patos/MG']]
santana_do_capivari = [['pouso alto/MG'],['santana do capivari/MG']]
santana_do_livramento = [['sant ana do livramento/RS'],['santana do livramento/RS']]
santana_do_paraopeba = [['belo vale/MG'],['santana do paraopeba/MG']]
santana_do_sobrado = [['casa nova/BA'],['santana do sobrado/BA']]
santanesia = [['pirai/RJ'],['santanesia/RJ']]
santelmo = [['pederneiras/SP'],['santelmo/SP']]
santo_agostinho_2 = [['cabo de santo agostinho/PE'],['santo agostinho/PE']]
santo_aleixo = [['mage/RJ'],['santo aleixo/RJ']]
santo_amaro = [['santo amaro do maranhao/MA'],['santo amaro/MA']]
santo_antonio_das_queimadas = [['jurema/PE'],['santo antonio das queimadas/PE']]
santo_antonio_do_canaa = [['santa teresa/ES'],['santo antonio do canaa/ES']]
santo_antonio_do_leite = [['ouro preto/MG'],['santo antonio do leite/MG']]
santo_antonio_do_manhuacu = [['caratinga/MG'],['santo antonio do manhuacu/MG']]
santo_antonio_do_norte = [['conceicao do mato dentro/MG'],['santo antonio do norte/MG']]
santo_antonio_do_pirapetinga = [['piranga/MG'],['santo antonio do pirapetinga/MG']]
santo_antonio_do_rio_verde = [['catalao/GO'],['santo antonio do rio verde/GO']]
santo_antonio_dos_campos = [['divinopolis/MG'],['santo antonio dos campos/MG']]
sao_bartolomeu = [['ouro preto/MG'],['sao bartolomeu/MG']]
sao_benedito_da_cachoeirinha = [['ituverava/SP'],['sao benedito da cachoeirinha/SP']]
sao_benedito_das_areias = [['mococa/SP'],['sao benedito das areias/SP']]
sao_camilo = [['palotina/PR'],['sao camilo/PR']]
sao_francisco_da_praia = [['sao sebastiao/SP'],['sao francisco da praia/SP']]
sao_francisco_xavier = [['sao jose dos campos/SP'],['sao francisco xavier/SP']]
sao_geraldo_do_baguari = [['sao joao evangelista/MG'],['sao geraldo do baguari/MG']]
sao_goncalo_de_botelhos = [['botelhos/MG'],['sao goncalo de botelhos/MG']]
sao_goncalo_do_rio_das_pedras = [['serro/MG'],['sao goncalo do rio das pedras/MG']]
sao_joao_da_fortaleza = [['cicero dantas/BA'],['sao joao da fortaleza/BA']]
sao_joao_da_serra = [['santos dumont/MG'],['sao joao da serra/MG']]
sao_joao_dalianca = [['sao joao d alianca/GO'],['sao joao dalianca/GO']]
sao_joao_de_deus = [['russas/CE'],['sao joao de deus/CE']]
sao_joao_de_itaguacu = [['urupes/SP'],['sao joao de itaguacu/SP']]
sao_joao_de_petropolis = [['santa teresa/ES'],['sao joao de petropolis/ES']]
sao_joao_do_jacutinga = [['caratinga/MG'],['sao joao do jacutinga/MG']]
sao_joao_do_pau_dalho = [['sao joao do pau d alho/SP'],['sao joao do pau dalho/SP',r'sao joao do pau d%26apos%3balho/SP']]
sao_joao_do_sobrado = [['pinheiros/ES'],['sao joao do sobrado/ES']]
sao_jorge_do_oeste = [['sao jorge d oeste/PR'],['sao jorge do oeste/PR','sao jorge doeste/PR']]
sao_jorge_do_tiradentes = [['rio bananal/ES'],['sao jorge do tiradentes/ES']]
sao_jose_da_mata = [['campina grande/PB'],['sao jose da mata/PB']]
sao_jose_das_laranjeiras = [['maracai/SP'],['sao jose das laranjeiras/SP']]
sao_jose_das_torres = [['mimoso do sul/ES'],['sao jose das torres/ES']]
sao_jose_do_acacio = [['fernandes tourinho/MG'],['sao jose do acacio/MG']]
sao_jose_do_barreiro = [['sao roque de minas/MG'],['sao jose do barreiro/MG']]
sao_jose_do_itavo = [['itaipulandia/PR'],['sao jose do itavo/PR']]
sao_jose_do_itueto = [['santa rita do itueto/MG'],['sao jose do itueto/MG']]
sao_jose_do_ivai = [['santa isabel do ivai/PR'],['sao jose do ivai/PR']]
sao_jose_do_ribeirao = [['bom jardim/RJ'],['sao jose do ribeirao/RJ']]
sao_jose_dos_salgados = [['carmo do cajuru/MG'],['sao jose dos salgados/MG']]
sao_jose = [['vicentina/MS'],['sao jose/MS']]
sao_luis_do_paraitinga = [['sao luiz do paraitinga/SP'],['sao luis do paraitinga/SP']]
sao_manoel_do_guaiacu = [['dona euzebia/MG'],['sao manoel do guaiacu/MG']]
sao_martinho = [['rolandia/PR'],['sao martinho/PR']]
sao_mateus_de_minas = [['camanducaia/MG'],['sao mateus de minas/MG']]
sao_miguel_de_touros = [['sao miguel do gostoso/RN'],['sao miguel de touros/RN']]
sao_miguel = [['caucaia/CE'],['sao miguel/CE']]
sao_paulo_RN = [['sao paulo do potengi/RN'],['sao paulo/RN']]
sao_pedro_de_rates = [['guacui/ES'],['sao pedro de rates/ES']]
sao_pedro_CE = [['russas/CE'],['sao pedro/CE']]
sao_pedro_MS = [['inocencia/MS'],['sao pedro/MS']]
sao_pedro_PE = [['sao joao/PE'],['sao pedro/PE']]
sao_roque_da_fartura = [['aguas da prata/SP'],['sao roque da fartura/SP']]
sao_roque_do_cannaa = [['sao roque do canaa/ES'],['sao roque do cannaa/ES']]
sao_roque_do_chopim = [['pato branco/PR'],['sao roque do chopim/PR']]
sao_roque_do_paraguacu = [['maragogipe/BA'],['sao roque do paraguacu/BA']]
sao_sebastiao_da_barra = [['iapu/MG'],['sao sebastiao da barra/MG']]
sao_sebastiao_da_vala = [['aimores/MG'],['sao sebastiao da vala/MG']]
sao_sebastiao_da_vitoria = [['sao joao del rei/MG'],['rio das mortes/MG','sao sebastiao da vitoria/MG']]
sao_sebastiao_de_braunas = [['belo oriente/MG'],['perpetuo socorro/MG','sao sebastiao de braunas/MG']]
sao_sebastiao_do_pontal = [['carneirinho/MG'],['estrela da barra/MG','sao sebastiao do pontal/MG']]
sao_sebastiao_do_sacramento = [['manhuacu/MG'],['realeza manhuacu/MG','sao pedro do avai/MG','sao sebastiao do sacramento/MG']]
sao_sebastiao_dos_pocoes = [['montalvania/MG'],['sao sebastiao dos pocoes/MG']]
sao_sebastiao_dos_torres = [['barbacena/MG'],['correia de almeida/MG','costas da mantiqueira/MG','mantiqueira do palmital/MG','pinheiro grosso/MG','sao sebastiao dos torres/MG']]
sao_silvestre = [['campo largo/PR'],['sao silvestre/PR']]
sao_thome_das_letras = [['sao tome das letras/MG'],['sao thome das letras/MG']]
sao_valerio_da_natividade = [['sao valerio/TO'],['sao valerio da natividade/TO']]
sao_vicente_de_paula = [['araruama/RJ'],['sao vicente de paula/RJ']]
sao_vicente_do_grama = [['jequeri/MG'],['grota/MG','sao vicente do grama/MG']]
sao_vicente_do_rio_doce = [['tarumirim/MG'],['sao vicente do rio doce/MG']]
sapiranga = [['meleiro/SC'],['sapiranga/SC']]
sapucaia_de_guanhaes = [['virginopolis/MG'],['sapucaia de guanhaes/MG']]
sapucaia_do_norte = [['galileia/MG'],['sapucaia do norte/MG','sapucaia/MG']]
sarandira = [['juiz de fora/MG'],['rosario de minas/MG','sarandira/MG']]
sbcampo = [['sao bernardo do campo/SP'],['sbcampo/SP']]
sebastiao_de_abreu = [['apuiares/CE'],['sebastiao de abreu/CE']]
sede_alvorada = [['cascavel/PR'],['rio do salto/PR','sede alvorada/PR']]
senador_la_roque = [['senador la rocque/MA'],['senador la roque/MA']]
senador_mourao = [['diamantina/MG'],['desembargador otoni/MG','sao joao da chapada/MG','senador mourao/MG']]
senhora_das_dores = [['barbacena/MG'],['senhora das dores/MG']]
senhora_do_carmo = [['itabira/MG'],['ipoema/MG','senhora do carmo/MG']]
sereno = [['cataguases/MG'],['cataguarino/MG','sereno/MG']]
serra_azul = [['serra azul de minas/MG'],['serra azul/MG']]
serra_bonita = [['buritis/MG'],['serra bonita/MG']]
serra_da_tapuia = [['sitio novo/RN'],['serra da tapuia/RN']]
serra_do_vento = [['belo jardim/PE'],['serra do vento/PE']]
serra_dos_dourados = [['umuarama/PR'],['santa eliza/PR','serra dos dourados/PR']]
silvano = [['patrocinio/MG'],['sao joao da serra negra/MG','silvano/MG']]
silveira_carvalho = [['barao de monte alto/MG'],['cachoeira alegre/MG','silveira carvalho/MG']]
simoes = [['cafelandia/SP'],['simoes/SP']]
sitio_grande = [['sao desiderio/BA'],['roda velha/BA','sitio grande/BA']]
sobradinho = [['brasilia/DF'],['brazlandia/DF','candangolandia/DF','ceilandia norte/DF','ceilandia/DF','cruzeiro/DF','gama/DF','guara/DF','lago norte/DF','lago sul/DF','nucleo bandeirante/DF','paranoa/DF','planaltina/DF','recanto das emas/DF','riacho fundo 2/DF','riacho fundo/DF','samambaia/DF','santa maria/DF','sao sebastiao/DF','sobradinho/DF','taguatinga/DF']]
socavao = [['castro/PR'],['colonia castrolanda/PR','colonia castrolanda/PR','doutor oliveira castro/PR','socavao/PR']]
sodrelia = [['santa cruz do rio pardo/SP'],['caporanga/SP','sodrelia/SP']]
sonho_azul = [['mirassol d oeste/MT'],['mirassol doeste/MT','sonho azul/MT']]
sousania = [['anapolis/GO'],['sousania/GO']]
sucatinga = [['beberibe/CE'],['sucatinga/CE']]
sucesso = [['tamboril/CE'],['sucesso/CE']]
taboas = [['rio das flores/RJ'],['manuel duarte/RJ','taboas/RJ']]
tabuao_MG = [['bom jardim de minas/MG'],['tabuao/MG']]
taliandia = [['tailandia/PA'],['taliandia/PA']]
tamoios_cabo_frio = [['cabo frio/RJ'],['tamoios cabo frio/RJ']]
taperuaba = [['sobral/CE'],['jordao/CE','rafael arruda/CE','sao jose do torto/CE','jaibaras/CE','taperuaba/CE']]
tapinas = [['itapolis/SP'],['nova america/SP','tapinas/SP']]
tapuirama = [['uberlandia/MG'],['martinesia/MG','tapuirama/MG']]
tauape = [['licinio de almeida/BA'],['tauape/BA']]
tecainda = [['martinopolis/SP'],['tecainda/SP']]
termas_de_ibira = [['ibira/SP'],['termas de ibira/SP']]
tocandira = [['porteirinha/MG'],['tocandira/MG']]
topazio = [['teofilo otoni/MG'],['mucuri/MG','pedro versiani/MG','topazio/MG']]
torneiros = [['para de minas/MG'],['torneiros/MG']]
trancoso = [['porto seguro/BA'],['arraial d ajuda/BA','trancoso/BA']]
tres_aliancas = [['mirandopolis/SP'],['tres aliancas/SP']]
tres_irmaos = [['cambuci/RJ'],['sao joao do paraiso/RJ','tres irmaos/RJ']]
tuparece = [['medina/MG'],['tuparece/MG']]
ubauna = [['sao joao do ivai/PR'],['luar/PR','ubauna/PR']]
ubiraita = [['andarai/BA'],['ubiraita/BA']]
valao_do_barro = [['sao sebastiao do alto/RJ'],['ipituna/RJ','valao do barro/RJ']]
vale_dos_vinhedos = [['bento goncalves/RS'],['tuiuti/RS','vale dos vinhedos/RS']]
vargem_alegre = [['barra do pirai/RJ'],['ipiabas/RJ','sao jose do turvo/RJ','california da barra barra do pirai/RJ','california da barra/RJ','vargem alegre/RJ']]
vargem_grande_do_soturno = [['cachoeiro de itapemirim/ES'],['conduru/ES','corrego dos monos/ES','pacotuba/ES','burarama/ES','vargem grande do soturno/ES']]
varzea_nova = [['santa rita/PB'],['varzea nova/PB']]
vau_acu = [['ponte nova/MG'],['rosario do pontal/MG','vau acu/MG']]
venda_branca = [['casa branca/SP'],['lagoa branca/SP','venda branca/SP']]
venda_nova = [['venda nova do imigrante/ES'],['sao joao de vicosa/ES','venda nova do imigrante es/ES']]
vera_cruz_de_minas = [['pedro leopoldo/MG'],['vera cruz de minas/MG']]
veredas = [['ribeirao das neves/MG'],['veredas/MG']]
vermelho_velho = [['raul soares/MG'],['santana do tabuleiro/MG','bicuiba/MG','sao vicente da estrela/MG','vermelho velho/MG']]
vermelho = [['muriae/MG'],['vermelho/MG']]
vidigal = [['cianorte/PR'],['vidigal/PR']]
vila_bela_da = [['vila bela da santissima trindade/MT'],['vila bela da santssima trindade/MT']]
vila_dos_cabanos = [['barcarena/PA'],['murucupi/PA','vila dos cabanos/PA']]
vila_marques = [['aral moreira/MS'],['vila marques/MS']]
vila_muriqui = [['mangaratiba/RJ'],['itacurussa/RJ','vila muriqui/RJ']]
vila_nelita = [['agua doce do norte/ES'],['governador lacerda de aguiar/ES','vila nelita/ES','santo agostinho/ES']]
vila_nova_de_campos = [['campos dos goytacazes/RJ'],['santo amaro de campos/RJ','morro do coco/RJ','goitacazes/RJ','sao sebastiao de campos/RJ','vila nova de campos/RJ','campos dos goytacaze/RJ','tocos/RJ','travessao/RJ']]
vila_nova_de_minas = [['montes claros/MG'],['vila nova de minas/MG','nova esperanca/MG']]
vila_nova = [['toledo/PR'],['vila nova/PR','novo sarandi/PR','novo sobradinho/PR','dois irmaos/PR']]
vila_pereira = [['nanuque/MG'],['vila pereira/MG','naque nanuque/MG']]
vila_reis = [['apucarana/PR'],['vila reis/PR']]
vila_sao_francisco = [['sao paulo/SP'],['vila sao francisco/AL','jamaica/SP','sao paulo/AC','saopaulo/SP','sp/SP']]
vila_vargas = [['dourados/MS'],['vila vargas/MS','itahum/MS']]
vila_verde = [['pancas/ES'],['vila verde/ES','lajinha/ES']]
vinhatico = [['montanha/ES'],['vinhatico/ES']]
visconde_de_imbe = [['trajano de moraes/RJ'],['visconde de imbe/RJ','trajano de morais/RJ']]
visconde_de_maua = [['nova resende/MG'],['visconde de maua/RJ','petunia/MG']]
vista_alegre_do_abuna = [['porto velho/RO'],['mutum parana/RO','nova california/RO','vista alegre do abuna/RO','extrema/RO','jaci parana/RO']]
vista_alegre = [['leopoldina/MG'],['vista alegre/MG','piacatuba/MG','ribeiro junqueira/MG','tebas/MG']]
vista_alegre_MS = [['maracaju/MS'],['vista alegre/MS']]
vitoria = [['porto vitoria/PR'],['vitoria/PR']]
xangrila = [['xangri la/RS'],['xangrila/RS','rainha do mar/RS']]
werneck = [['paraiba do sul/RJ'],['werneck/RJ']]
teresopolis = [['teresopolis/RJ'],[r"´teresopolis/RJ"]]
aparecida_de_minas = [['frutal/MG'],['aparecida de minas/MG']]
cafe = [['alegre/ES'],['cafe/ES']]
colonia = [['sao fidelis/RJ'],['colonia/RJ']]
cortado = [['novo cabrais/RS'],['cortado/RS']]
perdilandia = [['santa vitoria/MG'],['perdilandia/MG']]
realeza = [['manhuacu/MG'],['realeza/MG']]
saodomingos = [['sao domingos do prata/MG'],['sao domingos/MG']]
sao_domingos_PE = [['brejo da madre de deus/PE'],['sao domingos/PE']]
sao_vicente = [['sao vicente de minas/MG'],['sao vicente/MG']]

In [15]:
words_to_change = [cafe,colonia,cortado,perdilandia,realeza,saodomingos,sao_domingos_PE,sao_vicente,aparecida_de_minas,cidade,centenario,abrantes,abreus,acioli,acu_da_torre,acupe,adao_colares,adhemar_de_barros,afonso_arinos,agisse,agua_boa,agua_branca_de_minas,agua_fria,agua_vermelha,aguas_claras,aguas_ferreas,agulha,alberto_isaacson,aldeia,alegria,alexandra,alexandrita,alfredo_guedes,algodoes,alta_alegre_dos_parecis,alta_floresta_do_oeste,alto_alegre_do_iguacu,alto_alegre,alto_calcado,alto_maranhao,alto_mutum_preto,alvacao,alvorada_do_oeste,alvorada,amanari,amandina,amanhece,amapari,amarantina,americano,amparo_da_serra,amparo_de_sao_francisco,ana_dias,andrade_pinto,andrequice,anguereta,angustura,anhandui,anta,antonio_pereira,antunes_igaratinga,aparecida_de_minas,aparecida_de_monte_alto,aparecida_de_sao_manuel,aparecida_doeste,apeu,aquidaban,arace,araguaia,arapua,arco_verde,areia_branca_dos_assis,arembepe,arez,armacao_de_buzios,arrozal,aurora_do_iguacu,avai_do_jacinto,avelar,azambuja,azurita,bacaxa,baguacu,baguari,balneario_de_picarras,bandeirantes_d_oeste,bandeirantes,banquete,barao_ataliba_nogueira,barao_de_juparana,barcelos,barra_de_santo_antonio,barra_de_sao_joao,barra_do_ariranha,barra_do_cuiete,barra_do_jacuipe,barra_do_tarrachil,barra_feliz,barrado_quarai,barreiro_branco,barro_duro,bataipora,batateira,batinga,belem_de_sao_francisco,belo_horizonta,benfica,bentopolis_de_minas,bentopolis,bh,bitupita,bizarra,boa_esperanca,boa_esperanca_2,boa_saude,boa_sorte,boa_uniao_de_itabirinha,boa_uniao,boa_ventura,boa_vista_de_minas,boa_vista_dos_andradas,boa_vista,bom_fim_do_bom_jesus,bom_jardim_do_sul,bom_jesus,bom_retiro_da_esperanca,bonfim_paulista,borda_do_campo,botelho,braco_do_rio,bragantina,brasitania,brasopolis,brejo_bonito,bugre,buriti,buritirama,buzios,cacaratiba,cacarema,cachoeira_de_piria,cachoeira_de_santa_cruz,cachoeira_do_brumado,cachoeira_do_campo,caetano_mendes,caicara,calheiros,calixto,cambiasca,camela,campinal,campinas,campo_alegre_de_lourdes,campo_alegre_de_minas,campo_grande,campos_de_cunha,canabrava,candia,cangas,capao_da_porteira,capao_novo,caponga,carabucu,caraiba,carajas,cardeal,carnaiba_do_sertao,caruara,castelo_dos_sonhos,catingal,catune,catuni,celina,central_de_santa_helena,chaveslandia,chonim,cipolandia,cisneiros,claudio_manuel,clevelandia_do_norte,cocais,colonia_nova,colonia_vitoria,guaranta,central_de_santa_helena,chaveslandia,chonim,cipolandia,cisneiros,claudio_manuel,clevelandia_do_norte,cocais,colonia_nova,colonia_vitoria,colonia_z_3,colorado_do_norte,comendador_venancio,conceicao_da_ibitipoca,conceicao_de_jacarei,conceicao_de_tronqueiras,conceicao_do_capim,conceicao,concordia_de_mucuri,congonhas,conrado,conservatoria,coqueiral,corrego_do_ouro,correntinho,costa_machado,couto_de_magalhaes,crisolia,cristal_do_norte,cristalina,cruzeiro_do_norte,cruzes,cuiaba_paulista,cumuruxatiba,curumim,curupa,dalbergia,deserto,dez_de_maio,diamante_d_oeste,dias_davila,divino_espirito_santo,dois_de_abril,domelia,dorandia,dores_do_paraibuna,eldorado_dos_carajas,eleuterio,embu,embuguacu,encantado_d_oeste,eneida,engenheiro_balduino,engenheiro_franca,engenheiro_passos,engenheiro_schnoor,engenho_do_ribeiro,epaminondas_otoni,esmeraldas_de_ferros,espigao_do_oeste,espigao,estacao_cocal,esteios,estrela_de_jordania,estrela_doeste,fatimarmnte_dutra,fazenda_nova,fazenda_souza,feiticeiro,ferruginha,figueiropolis_doeste,flores,floresta_do_sul,floresta,florinia,florineo,fonseca,fortaleza_do_tabocao,frade,fragosos,franca_sp,freguesia_do_andira,frutal_do_campo,furquim,gardenia,getulandia,glicerio,goiabal,gororos,gouvea,governador_lomanto_junior,governador_portela,graccho_cardoso,graciosa,gramadinho,granada,guaianas,guaicui,guaipora,guaporanga,guarapua,guarda_dos_ferreiros,guardinha,guarizinho,guarulhos_sp,guassusse,guaxima,guia_de_pacobaiba,harmonia,herval_d_oeste,hidreletrica_tucurui,holambra_ii,honoropolis,iauarete,ibiajara,ibicua,ibiraja,ibitira,ibitira_MG,ibitiranga,ibitiuva,ibo,icara,igarai,iguaibi,iguaraci,ilha_dos_valadares,ilha_grande,independencia,inhomirim,inoa,inubia,ipuca,irape,iraporanga,irundiara,isabel,itabaiana,itabata,itabirinha_de_mantena,itaguacu,itaim,itaimbe,itaipava,itamaraca,itamarati_norte,itamira,itaoca,itapage,itapejara_d_oeste,itapiru,itapirucu,itapocu,itaquarai,itaunas,itupeva,iubatinga,ivailandia,jabitaca,jaboatao_dos_gurarapes,jacare_cabreuva,jacigua,jacilandia,jacuba,jafa,jamapara,jangada,jansen,japuiba,jardim_abc_de_goias,jequirica,joao_amaro,jordanesia,juatama,juritis,juruce,jurupema,lages,lagoa_bonita,lagoa_do_itaenga,lagoa_do_mato,lagoinha,laje_grande,lambari,lamounier,laranjais,lavras,lavras_novas,lidice,limeira_d_oeste,limeira_de_mantena,linharesl,lucaia,luiz_pires_de_minas,luizlandia_do_oeste,luminosa,luziapolis,maceiA,machadinho_doeste,macuco_de_minas,maiauata,mangabeira,maniacu,maracana,marambainha,maresias,mariental,maristela,martinho_prado_junior,martins_guimaraes,melo_viana,mendonca,menino_jesus,merces_de_agua_limpa,milho_verde,mineirolandia,mocambeiro,mogidascruzes,monsenhor_horta,monsenhor_joao_alexandre,monte_alegre,monte_alverne,monte_bonito,monte_gordo,monte_sinai,monte_verde_paulista,monte_verde,montese,morro_chato,morro_de_sao_paulo,morro_do_ferro,morro_vermelho,mujui_dos_campos,muquem_de_sao_francisco,nelson_de_sena,neolandia,nossa_senhora_da_aparecida,nossa_senhora_da_guia,nossa_senhora_da_luz,nossa_senhora_de_caravaggio,nossa_senhora_do_o,nova_alexandria,nova_andradina,nova_brasilandia_doeste,nova_casa_verde,nova_floresta,nova_itapirema,nova_milano,nova_patria,nova_redencao,nova_santa_luzia,nova_sardenha,novo_brasil,novo_diamantino,olho_dagua_das_cunhas,olho_dagua_grande,olhos_d_agua_do_oeste,osvaldo_kroeff,otavio_rocha,ouro_verde_do_piquiri,ouroana,padre_fialho,padre_gonzales,paiquere,palmeira_doeste,palmeiral,panema,papucaia,paraiso_do_tobias,paraju,parana_d_oeste,parapeuna,parati_mirim,paruru,passa_tres,passagem_de_mariana,passagem_dos_teixeiras,passe,pau_d_arco,paulista,pecem,pedra_menina,penedo_itatiaia,penha_do_capim,perola_doeste,perpetuo_socorro,piabeta,piao,picarras,piedade_do_paraopeba,pilar,pindurao,pinhal_alto,pinheiros_altos,pioneiros,pipa,piramboia,pirapo,pirapora,pirituba,piumhii,planaltina_de_goias,pocoes_de_paineiras,polvilho,ponte_alta_de_minas,ponte_alta,pontinha_do_cocho,ponto_do_marambaia,portela,porto_aelgre,porto_de_cima,porto_mendes,porto_sao_jose,porto_trombetas,porto_velho_do_cunha,posto_da_mata,potunduva,poxim,praia_grande,presidente_pena,primavera,prudencio_thomaz,pulinopolis,pureza,purilandia,quatituba,quatro_bocas,queimados,queixada,quilombo,quilometro_14_do_mutum,quinta,quintao,quintinos,quixada,rainha_isabel,rajada,rancho_alegre_d_oeste,raposo,ravena,rechan,residencia_fuck,retiro_do_muriae,ribeirao_de_sao_domingos,rio_bonito,rio_bonito_2,rio_bracnco,rio_de_janeiro,rio_do_meio,rio_melo,rio_verde,rive,riverlandia,roberto,rocas_novas,rodrigo_silva,roseiral,rubiao_junior,sacra_familia_do_tingua,salgadalia,salobro,salvador,sampaio_correia,sana,sanga_puita,santa_barbara,santa_cecilia_de_umbuzeiro,santa_clara,santa_cruz_do_prata,santa_cruz_do_timbo,santa_efigenia,santa_elvira,santa_eudoxia,santa_isabel_do_para,santa_isabel_do_rio_preto,santa_lucia_do_piai,santa_luzia_de_caratinga,santa_luzia_de_mantenopolis,santa_luzia_do_cariri,santa_luzia_doeste,santa_luzia,santa_maria,santa_rita_da_floresta,santa_rita_de_ouro_preto,santa_rita_do_cedro,santa_rita_do_ibitipoca,santa_rita_do_oeste,santa_rita_durao,santa_teresinha,santa_terezinha_de_minas,santa_zelia,santana_de_caldas,santana_de_patos,santana_do_capivari,santana_do_livramento,santana_do_paraopeba,santana_do_sobrado,santanesia,santelmo,santo_agostinho_2,santo_aleixo,santo_amaro,santo_antonio_das_queimadas,santo_antonio_do_canaa,santo_antonio_do_leite,santo_antonio_do_manhuacu,santo_antonio_do_norte,santo_antonio_do_pirapetinga,santo_antonio_do_rio_verde,santo_antonio_dos_campos,sao_bartolomeu,sao_benedito_da_cachoeirinha,sao_benedito_das_areias,sao_camilo,sao_francisco_da_praia,sao_francisco_xavier,sao_geraldo_do_baguari,sao_goncalo_de_botelhos,sao_goncalo_do_rio_das_pedras,sao_joao_da_fortaleza,sao_joao_da_serra,sao_joao_dalianca,sao_joao_de_deus,sao_joao_de_itaguacu,sao_joao_de_petropolis,sao_joao_do_jacutinga,sao_joao_do_pau_dalho,sao_joao_do_sobrado,sao_jorge_do_oeste,sao_jorge_do_tiradentes,sao_jose_da_mata,sao_jose_das_laranjeiras,sao_jose_das_torres,sao_jose_do_acacio,sao_jose_do_barreiro,sao_jose_do_itavo,sao_jose_do_itueto,sao_jose_do_ivai,sao_jose_do_ribeirao,sao_jose_dos_salgados,sao_jose,sao_luis_do_paraitinga,sao_manoel_do_guaiacu,sao_martinho,sao_mateus_de_minas,sao_miguel_de_touros,sao_miguel,sao_paulo_RN,sao_pedro_de_rates,sao_pedro_CE,sao_pedro_MS,sao_pedro_PE,sao_roque_da_fartura,sao_roque_do_cannaa,sao_roque_do_chopim,sao_roque_do_paraguacu,sao_sebastiao_da_barra,sao_sebastiao_da_vala,sao_sebastiao_da_vitoria,sao_sebastiao_de_braunas,sao_sebastiao_do_pontal,sao_sebastiao_do_sacramento,sao_sebastiao_dos_pocoes,sao_sebastiao_dos_torres,sao_silvestre,sao_thome_das_letras,sao_valerio_da_natividade,sao_vicente_de_paula,sao_vicente_do_grama,sao_vicente_do_rio_doce,sapiranga,sapucaia_de_guanhaes,sapucaia_do_norte,sarandira,sbcampo,sebastiao_de_abreu,sede_alvorada,senador_la_roque,senador_mourao,senhora_das_dores,senhora_do_carmo,sereno,serra_azul,serra_bonita,serra_da_tapuia,serra_do_vento,serra_dos_dourados,silvano,silveira_carvalho,simoes,sitio_grande,sobradinho,socavao,sodrelia,sonho_azul,sousania,sucatinga,sucesso,taboas,tabuao_MG,taliandia,tamoios_cabo_frio,taperuaba,tapinas,tapuirama,tauape,tecainda,termas_de_ibira,tocandira,topazio,torneiros,trancoso,tres_aliancas,tres_irmaos,tuparece,ubauna,ubiraita,valao_do_barro,vale_dos_vinhedos,vargem_alegre,vargem_grande_do_soturno,varzea_nova,vau_acu,venda_branca,venda_nova,vera_cruz_de_minas,veredas,vermelho_velho,vermelho,vidigal,vila_bela_da,vila_dos_cabanos,vila_marques,vila_muriqui,vila_nelita,vila_nova_de_campos,vila_nova_de_minas,vila_nova,vila_pereira,vila_reis,vila_sao_francisco,vila_vargas,vila_verde,vinhatico,visconde_de_imbe,visconde_de_maua,vista_alegre_do_abuna,vista_alegre,vista_alegre_MS,vitoria,xangrila,werneck,teresopolis]

In [16]:
for word_to_change in words_to_change:
    geolocation_df['geolocation_city_state'].replace(word_to_change[1],word_to_change[0][0], inplace=True)

#### Making merge between `city_dataset`.csv and `geolocation_df`.

In [17]:
city_state_dataset = city_state_dataset.reindex(columns=['city_state','state_id','city_state_id'])
city_state_dataset.rename(columns={'city_state':'geolocation_city_state'}, inplace=True)

In [18]:
geolocations_database = pd.merge(geolocation_df,city_state_dataset, on='geolocation_city_state', how='left')
geolocations_database.drop(columns=['geolocation_city_state','state_id'], inplace=True)
geolocations_database = geolocations_database.reindex(columns=['geolocation_lat','geolocation_lng','city_state_id','geolocation_state','geolocation_zip_code_prefix'])
geolocations_database.rename(columns={'geolocation_zip_code_prefix':'code_zip_prefix'}, inplace=True)
geolocations_database

Unnamed: 0,geolocation_lat,geolocation_lng,city_state_id,geolocation_state,code_zip_prefix
0,-25.571748,-49.334374,1273,PR,81470
1,-24.271860,-53.069433,4059,PR,87365
2,-24.281905,-53.074516,4059,PR,87365
3,-24.277697,-53.074930,4059,PR,87365
4,-16.756821,-49.435020,1,GO,75345
...,...,...,...,...,...
1000158,-27.458106,-51.553812,5570,SC,89633
1000159,-27.454065,-51.554470,5570,SC,89633
1000160,-27.454790,-51.550597,5570,SC,89633
1000161,-27.456633,-51.547892,5570,SC,89633


#### Making merge between the datasets `state_dataset.csv` and `geolocations_database`.

In [19]:
state_dataset = state_dataset.reindex(columns=['state','state_id'])
state_dataset.rename(columns={'state':'geolocation_state'}, inplace=True)

In [20]:
geolocations_database_state = pd.merge(geolocations_database,state_dataset, on='geolocation_state', how='left')
geolocations_database_state.drop(columns=['geolocation_state'], inplace=True)
geolocations_database_state = geolocations_database_state.reindex(columns=['geolocation_lat','geolocation_lng','city_state_id','state_id','code_zip_prefix'])
geolocations_database_state

Unnamed: 0,geolocation_lat,geolocation_lng,city_state_id,state_id,code_zip_prefix
0,-25.571748,-49.334374,1273,26,81470
1,-24.271860,-53.069433,4059,26,87365
2,-24.281905,-53.074516,4059,26,87365
3,-24.277697,-53.074930,4059,26,87365
4,-16.756821,-49.435020,1,20,75345
...,...,...,...,...,...
1000158,-27.458106,-51.553812,5570,27,89633
1000159,-27.454065,-51.554470,5570,27,89633
1000160,-27.454790,-51.550597,5570,27,89633
1000161,-27.456633,-51.547892,5570,27,89633


#### Making merge between the datasets `code_zip_prefix_dataset.csv` and `geolocations_database`.

In [21]:
code_zip_prefix_dataset = code_zip_prefix_dataset.reindex(columns=['code_zip_prefix','code_zip_prefix_id'])

In [22]:
geolocations_db = pd.merge(geolocations_database_state,code_zip_prefix_dataset, on='code_zip_prefix', how='left')
geolocations_db.drop(columns=['code_zip_prefix'], inplace=True)
geolocations_db = geolocations_db.reindex(columns=['code_zip_prefix_id','geolocation_lat','geolocation_lng','city_state_id', 'state_id'])
geolocations_db.rename(columns={'code_zip_prefix_id':'geolocation_code_zip_prefix_id','city_state_id':'geolocation_city_state_id','state_id':'geolocation_state_id'}, inplace=True)
geolocations_db


Unnamed: 0,geolocation_code_zip_prefix_id,geolocation_lat,geolocation_lng,geolocation_city_state_id,geolocation_state_id
0,16295,-25.571748,-49.334374,1273,26
1,17169,-24.271860,-53.069433,4059,26
2,17169,-24.281905,-53.074516,4059,26
3,17169,-24.277697,-53.074930,4059,26
4,15177,-16.756821,-49.435020,1,20
...,...,...,...,...,...
1000158,17777,-27.458106,-51.553812,5570,27
1000159,17777,-27.454065,-51.554470,5570,27
1000160,17777,-27.454790,-51.550597,5570,27
1000161,17777,-27.456633,-51.547892,5570,27


#### Generating the column geolocation_id

In [23]:
geolocation_items = len(geolocations_db)
geolocation_id = range(1,geolocation_items+1)
geolocations_db.insert(0,'geolocation_id',geolocation_id) 
geolocations_db 

Unnamed: 0,geolocation_id,geolocation_code_zip_prefix_id,geolocation_lat,geolocation_lng,geolocation_city_state_id,geolocation_state_id
0,1,16295,-25.571748,-49.334374,1273,26
1,2,17169,-24.271860,-53.069433,4059,26
2,3,17169,-24.281905,-53.074516,4059,26
3,4,17169,-24.277697,-53.074930,4059,26
4,5,15177,-16.756821,-49.435020,1,20
...,...,...,...,...,...,...
1000158,1000159,17777,-27.458106,-51.553812,5570,27
1000159,1000160,17777,-27.454065,-51.554470,5570,27
1000160,1000161,17777,-27.454790,-51.550597,5570,27
1000161,1000162,17777,-27.456633,-51.547892,5570,27


#### Create the dataset `geolocation_dataset.csv`

When you saved the dataset always mark **"index = False"**. Or pandas will add a new column with a consequtive number. This small script is to remove this useless column.

In [24]:
geolocations_db.to_csv('../../data/interim/geolocation_dataset.csv', index=False)

## Final Column Description

|**Column Title**|**geolocation_id -> int** |**geolocation_code_zip_prefix_id -> int** |**geolocation_lat-> flota** |**geolocation_lng -> float**| **geolocation_city_state_id -> int** |**geolocation_state_id -> int** |
|--|--|--|--|--|--|--|
|Description |Geolocation ID |Primary key - first 5 digits of zip code |Latitude | Longitude |city state id |State id|
|After Preprocessing |1 |16295 |-25.571748 |-49.334374 |1273 |26 |1 |