# Pré-processamento dos códigos das Cidades

## Importações

Para este arquivo é necessário apenas a importação do pandas e então carregar a base de dados do Instituto Brasileiro de Geografia e Estatística(IBGE) que é disponibilizada para download no [site do instituto](https://www.ibge.gov.br/explica/codigos-dos-municipios.php) em formato .xls.

In [2]:
import pandas as pd

In [4]:
ibge_code_cities = pd.read_excel("../datasets/municipios.xls")
ibge_code_cities.head(10)

Unnamed: 0,TÍTULO : BET - BANCO DE ESTRUTURAS TERRITORIAIS,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8
0,RELATÓRIO DE DIVISÃO TERRITORIAL BRASILEIRA,,,,,,,,
1,UF: 99 - BRASIL,,,,,,,,
2,DATA BASE: 22/11/2024,,,,,,,,
3,,,,,,,,,
4,,,,,,,,,
5,UF,Nome_UF,Região Geográfica Intermediária,Nome Região Geográfica Intermediária,Região Geográfica Imediata,Nome Região Geográfica Imediata,Município,Código Município Completo,Nome_Município
6,11,Rondônia,1102,Ji-Paraná,110005,Cacoal,00015,1100015,Alta Floresta D'Oeste
7,11,Rondônia,1102,Ji-Paraná,110005,Cacoal,00379,1100379,Alto Alegre dos Parecis
8,11,Rondônia,1101,Porto Velho,110002,Ariquemes,00403,1100403,Alto Paraíso
9,11,Rondônia,1102,Ji-Paraná,110004,Ji-Paraná,00346,1100346,Alvorada D'Oeste


## Tratamento dos Dados

Primeiramente será feita a retirada das primeiras linhas, inclusive a linha que nomeia as colunas, porque elas não contém informações relevantes.

In [5]:
ibge_code_cities.dropna(inplace=True)
ibge_code_cities.head(10)

Unnamed: 0,TÍTULO : BET - BANCO DE ESTRUTURAS TERRITORIAIS,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8
5,UF,Nome_UF,Região Geográfica Intermediária,Nome Região Geográfica Intermediária,Região Geográfica Imediata,Nome Região Geográfica Imediata,Município,Código Município Completo,Nome_Município
6,11,Rondônia,1102,Ji-Paraná,110005,Cacoal,00015,1100015,Alta Floresta D'Oeste
7,11,Rondônia,1102,Ji-Paraná,110005,Cacoal,00379,1100379,Alto Alegre dos Parecis
8,11,Rondônia,1101,Porto Velho,110002,Ariquemes,00403,1100403,Alto Paraíso
9,11,Rondônia,1102,Ji-Paraná,110004,Ji-Paraná,00346,1100346,Alvorada D'Oeste
10,11,Rondônia,1101,Porto Velho,110002,Ariquemes,00023,1100023,Ariquemes
11,11,Rondônia,1101,Porto Velho,110002,Ariquemes,00452,1100452,Buritis
12,11,Rondônia,1102,Ji-Paraná,110006,Vilhena,00031,1100031,Cabixi
13,11,Rondônia,1101,Porto Velho,110002,Ariquemes,00601,1100601,Cacaulândia
14,11,Rondônia,1102,Ji-Paraná,110005,Cacoal,00049,1100049,Cacoal


In [6]:
ibge_code_cities.drop(5, inplace=True)
ibge_code_cities.head(10)

Unnamed: 0,TÍTULO : BET - BANCO DE ESTRUTURAS TERRITORIAIS,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8
6,11,Rondônia,1102,Ji-Paraná,110005,Cacoal,15,1100015,Alta Floresta D'Oeste
7,11,Rondônia,1102,Ji-Paraná,110005,Cacoal,379,1100379,Alto Alegre dos Parecis
8,11,Rondônia,1101,Porto Velho,110002,Ariquemes,403,1100403,Alto Paraíso
9,11,Rondônia,1102,Ji-Paraná,110004,Ji-Paraná,346,1100346,Alvorada D'Oeste
10,11,Rondônia,1101,Porto Velho,110002,Ariquemes,23,1100023,Ariquemes
11,11,Rondônia,1101,Porto Velho,110002,Ariquemes,452,1100452,Buritis
12,11,Rondônia,1102,Ji-Paraná,110006,Vilhena,31,1100031,Cabixi
13,11,Rondônia,1101,Porto Velho,110002,Ariquemes,601,1100601,Cacaulândia
14,11,Rondônia,1102,Ji-Paraná,110005,Cacoal,49,1100049,Cacoal
15,11,Rondônia,1101,Porto Velho,110002,Ariquemes,700,1100700,Campo Novo de Rondônia


## Base de Dados final

Recorte das colunas que interessam para o projeto, renomeação destas e, ao final, salvar o dataframe resultante no diretório "datasets", o mesmo diretório do dataset original.

In [7]:
code_cities = ibge_code_cities[["Unnamed: 1", "Unnamed: 7", "Unnamed: 8"]]
code_cities.head(10)

Unnamed: 0,Unnamed: 1,Unnamed: 7,Unnamed: 8
6,Rondônia,1100015,Alta Floresta D'Oeste
7,Rondônia,1100379,Alto Alegre dos Parecis
8,Rondônia,1100403,Alto Paraíso
9,Rondônia,1100346,Alvorada D'Oeste
10,Rondônia,1100023,Ariquemes
11,Rondônia,1100452,Buritis
12,Rondônia,1100031,Cabixi
13,Rondônia,1100601,Cacaulândia
14,Rondônia,1100049,Cacoal
15,Rondônia,1100700,Campo Novo de Rondônia


In [8]:
code_cities.reset_index(drop=True, inplace=True)
code_cities.head(5)

Unnamed: 0,Unnamed: 1,Unnamed: 7,Unnamed: 8
0,Rondônia,1100015,Alta Floresta D'Oeste
1,Rondônia,1100379,Alto Alegre dos Parecis
2,Rondônia,1100403,Alto Paraíso
3,Rondônia,1100346,Alvorada D'Oeste
4,Rondônia,1100023,Ariquemes


In [9]:
code_cities.rename(columns={"Unnamed: 1":"UF",	"Unnamed: 7":"code",	"Unnamed: 8":"name"}, inplace=True)
code_cities.head(10)

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  code_cities.rename(columns={"Unnamed: 1":"UF",	"Unnamed: 7":"code",	"Unnamed: 8":"name"}, inplace=True)


Unnamed: 0,UF,code,name
0,Rondônia,1100015,Alta Floresta D'Oeste
1,Rondônia,1100379,Alto Alegre dos Parecis
2,Rondônia,1100403,Alto Paraíso
3,Rondônia,1100346,Alvorada D'Oeste
4,Rondônia,1100023,Ariquemes
5,Rondônia,1100452,Buritis
6,Rondônia,1100031,Cabixi
7,Rondônia,1100601,Cacaulândia
8,Rondônia,1100049,Cacoal
9,Rondônia,1100700,Campo Novo de Rondônia


In [None]:
code_cities.to_csv("../datasets/code_cities.csv", index=False)

# Criações das funções para os módulos

In [10]:
code_cities = pd.read_csv("../datasets/code_cities.csv")
code_cities.head(5)

Unnamed: 0,UF,code,name
0,Rondônia,1100015,Alta Floresta D'Oeste
1,Rondônia,1100379,Alto Alegre dos Parecis
2,Rondônia,1100403,Alto Paraíso
3,Rondônia,1100346,Alvorada D'Oeste
4,Rondônia,1100023,Ariquemes


In [11]:
uniques = code_cities['UF'].unique()
uniques

array(['Rondônia', 'Acre', 'Amazonas', 'Roraima', 'Pará', 'Amapá',
       'Tocantins', 'Maranhão', 'Piauí', 'Ceará', 'Rio Grande do Norte',
       'Paraíba', 'Pernambuco', 'Alagoas', 'Sergipe', 'Bahia',
       'Minas Gerais', 'Espírito Santo', 'Rio de Janeiro', 'São Paulo',
       'Paraná', 'Santa Catarina', 'Rio Grande do Sul',
       'Mato Grosso do Sul', 'Mato Grosso', 'Goiás', 'Distrito Federal'],
      dtype=object)

In [12]:
uniques[9]

'Ceará'

In [13]:
ceara = code_cities[code_cities['UF'] == uniques[9]]
ceara

Unnamed: 0,UF,code,name
891,Ceará,2300101,Abaiara
892,Ceará,2300150,Acarape
893,Ceará,2300200,Acaraú
894,Ceará,2300309,Acopiara
895,Ceará,2300408,Aiuaba
...,...,...,...
1070,Ceará,2313807,Uruburetama
1071,Ceará,2313906,Uruoca
1072,Ceará,2313955,Varjota
1073,Ceará,2314003,Várzea Alegre


In [18]:
str(code_cities[code_cities['name'] == 'Acarape']['code'].values[0])

'2300150'