# Tratamento de Dados (Indicadores Municipais do ES)

Dados obitidos através da API do IBGE, pelo link: https://servicodados.ibge.gov.br/

In [1]:
!pip install unidecode



In [2]:
from requests import get
import pandas as pd
from unidecode import unidecode

## Carrega Dados 

### Nomes e Códigos de Municípios

In [3]:
# URL para buscar nomes e dados de municípios do Espírito Santo
url_municipios = 'https://servicodados.ibge.gov.br/api/v1/localidades/estados/ES/municipios'

# Recebe como parâmetro um dicionário e o retorna em outro formato
def parse_municipio(m):
    return {
        'codarea': str(m['id']),
        'Municipio': m['nome'],
        'codarea_join': str(m['id'])[:-1],
        'Microrregiao_id': m['microrregiao']['id'],
        'Microrregiao': m['microrregiao']['nome'],
        'Mesorregiao_id': m['microrregiao']['mesorregiao']['id'],
        'Mesorregiao': m['microrregiao']['mesorregiao']['nome'],
    }

# Obtém o nome e o código de cada município
municipios = list(map(parse_municipio, get(url_municipios).json()))

# Gera um DataFrame dos nomes dos municípios e define o código como o índice
df_municipios = pd.DataFrame(municipios)
df_municipios.set_index('codarea_join', inplace=True)
df_municipios

Unnamed: 0_level_0,codarea,Municipio,Microrregiao_id,Microrregiao,Mesorregiao_id,Mesorregiao
codarea_join,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
320010,3200102,Afonso Cláudio,32007,Afonso Cláudio,3203,Central Espírito-santense
320013,3200136,Águia Branca,32002,Nova Venécia,3201,Noroeste Espírito-santense
320016,3200169,Água Doce do Norte,32001,Barra de São Francisco,3201,Noroeste Espírito-santense
320020,3200201,Alegre,32011,Alegre,3204,Sul Espírito-santense
320030,3200300,Alfredo Chaves,32010,Guarapari,3203,Central Espírito-santense
...,...,...,...,...,...,...
320510,3205101,Viana,32009,Vitória,3203,Central Espírito-santense
320515,3205150,Vila Pavão,32002,Nova Venécia,3201,Noroeste Espírito-santense
320517,3205176,Vila Valério,32002,Nova Venécia,3201,Noroeste Espírito-santense
320520,3205200,Vila Velha,32009,Vitória,3203,Central Espírito-santense


### Indicadores de Municípios

In [4]:
# O dicionário abaixo realiza uma associação entre o id e o nome do indicador
indicador_label = {
    '29167': 'Area', # Área Territorial - km²
    '29168': 'DensidadeDemografica', # Densidade Demográfica
    '29171': 'PopulacaoEstimada', # População Estimada
    '47001': 'PIBPerCapita', # PIB per Capita
    '28141': 'Receitas', # Total de Receitas Realizadas
    '29749': 'Despesas', # Total de Despesas Empenhadas
    '30255': 'IndiceDesenvolvimentoHumano', # IDHM
    '30279': 'MortalidadeInfantil', # Mortalidade Infantil
    '60045': 'Escolarizacao' # Taxa de escolarização de 6 a 14 anos
}

# Realiza uma junção dos ids dos indicadores separando por pipe
indicadores = '|'.join(indicador_label.keys())

# URL para obter os indicadores dos municípios
url = f'https://servicodados.ibge.gov.br/api/v1/pesquisas/indicadores/{indicadores}/resultados/32xxxxx'

# Obtem os dados dos indicadores a partir da URL
indicadores_results = get(url).json()

# Recebe como parâmetro o id do indicador e os valores para diversos anos
# Retorna um dicionário contendo o código do município e o valor do indicador para o ano mais recente
def parse_result(indicador_id, l_res):
    codarea = l_res['localidade'] # id do município
    last_year = max(l_res['res'].keys()) # ano da última pesquisa realizada
    last_result = l_res['res'][last_year] # resultado da última pesquisa realizada
    label = indicador_label[indicador_id] # Label do indicador a partir do id
    
    return {
        'codarea_join': codarea,
        label: 0.0 if last_result == '-' else float(last_result)
    }

# Gera uma série para cada indicador e concatena ao DataFrame de municípios
for indicador_result in indicadores_results:
    indicador_id = str(indicador_result['id'])
    results = indicador_result['res']
    
    df_indicador_result = pd.DataFrame(map(lambda l_res: parse_result(indicador_id, l_res), results))
    df_indicador_result.set_index('codarea_join', inplace=True)
    
    df_municipios = pd.concat([df_municipios, df_indicador_result], axis=1)

df_municipios.reset_index(inplace=True)
df_municipios.drop(columns='codarea_join', inplace=True)
df_municipios.head(5)

Unnamed: 0,codarea,Municipio,Microrregiao_id,Microrregiao,Mesorregiao_id,Mesorregiao,Receitas,Area,DensidadeDemografica,PopulacaoEstimada,Despesas,IndiceDesenvolvimentoHumano,MortalidadeInfantil,PIBPerCapita,Escolarizacao
0,3200102,Afonso Cláudio,32007,Afonso Cláudio,3203,Central Espírito-santense,96941.22275,941.188,32.68,30326.0,83418.9248,0.667,5.29,14487.2,94.0
1,3200136,Águia Branca,32002,Nova Venécia,3201,Noroeste Espírito-santense,51711.69069,454.448,20.95,9621.0,40803.11094,0.678,0.0,17162.69,97.8
2,3200169,Água Doce do Norte,32001,Barra de São Francisco,3201,Noroeste Espírito-santense,41712.41705,473.729,24.85,10801.0,37980.88326,0.652,5.26,12553.23,98.7
3,3200201,Alegre,32011,Alegre,3204,Sul Espírito-santense,91301.44131,756.86,39.85,29869.0,83131.56111,0.721,12.95,15854.35,97.6
4,3200300,Alfredo Chaves,32010,Guarapari,3203,Central Espírito-santense,66597.4239,615.677,22.66,14670.0,57849.10038,0.71,25.81,24625.87,98.6


## Padroniza e Converte os Dados

In [5]:
padroniza_nome = lambda regiao: df_municipios[regiao].apply(lambda n: unidecode(n).upper())

df_municipios['Municipio'] = padroniza_nome('Municipio')
df_municipios['Microrregiao'] = padroniza_nome('Microrregiao')
df_municipios['Mesorregiao'] = padroniza_nome('Mesorregiao')
df_municipios.head(5)

Unnamed: 0,codarea,Municipio,Microrregiao_id,Microrregiao,Mesorregiao_id,Mesorregiao,Receitas,Area,DensidadeDemografica,PopulacaoEstimada,Despesas,IndiceDesenvolvimentoHumano,MortalidadeInfantil,PIBPerCapita,Escolarizacao
0,3200102,AFONSO CLAUDIO,32007,AFONSO CLAUDIO,3203,CENTRAL ESPIRITO-SANTENSE,96941.22275,941.188,32.68,30326.0,83418.9248,0.667,5.29,14487.2,94.0
1,3200136,AGUIA BRANCA,32002,NOVA VENECIA,3201,NOROESTE ESPIRITO-SANTENSE,51711.69069,454.448,20.95,9621.0,40803.11094,0.678,0.0,17162.69,97.8
2,3200169,AGUA DOCE DO NORTE,32001,BARRA DE SAO FRANCISCO,3201,NOROESTE ESPIRITO-SANTENSE,41712.41705,473.729,24.85,10801.0,37980.88326,0.652,5.26,12553.23,98.7
3,3200201,ALEGRE,32011,ALEGRE,3204,SUL ESPIRITO-SANTENSE,91301.44131,756.86,39.85,29869.0,83131.56111,0.721,12.95,15854.35,97.6
4,3200300,ALFREDO CHAVES,32010,GUARAPARI,3203,CENTRAL ESPIRITO-SANTENSE,66597.4239,615.677,22.66,14670.0,57849.10038,0.71,25.81,24625.87,98.6


## Salva os Dados no Banco de Dados

In [6]:
from pymongo import MongoClient, ReplaceOne

print('Preparando para salvar o DataFrame resultante...')
# Persiste o DataFrame
str_conn = 'mongodb://localhost'

production = False

if production:
    usr = argv[1]
    pwd = argv[2]
    str_conn = f'mongodb+srv://{usr}:{pwd}@es-covid-19.nuzlk.mongodb.net/myFirstDatabase?retryWrites=true&w=majority'

client = MongoClient(str_conn)

dados_dict = df_municipios.to_dict(orient='records')

print('Deletando banco de dados existente...')
client.drop_database('db_municipios')

print('Inserindo novos dados...')
if len(dados_dict) > 0:
    client.db_municipios.dados.insert_many(dados_dict)

print('~~ Fim ~~')

Preparando para salvar o DataFrame resultante...
Deletando banco de dados existente...
Inserindo novos dados...
~~ Fim ~~
