# Tratamento de Dados (Indicadores Municipais do ES)

Dados obitidos através do IBGE Cidades, pelo link: https://cidades.ibge.gov.br/brasil/es/panorama

In [None]:
!pip install unidecode



In [None]:
import pandas as pd
from unidecode import unidecode

## Carrega Dados

In [None]:
dados = pd.read_csv('ES_INDICADORES_MUNICIPAIS.csv', sep=',', encoding='UTF-8')
dados.drop('Gentílico', axis=1, inplace=True)
dados.drop(dados.shape[0] - 1, inplace=True)

## Renomeia Colunas

In [None]:
columns_names_map = {
    'Municípios': 'Nome',
    'Densidade demográfica': 'DensidadeDemografica',
    'População estimada': 'PopulacaoEstimada',
    'Salário médio mensal dos trabalhadores formais': 'SalarioMedio',
    'Índice de Desenvolvimento Humano Municipal (IDHM)': 'IndiceDesenvolvimentoHumano',
    'Mortalidade Infantil': 'MortalidadeInfantil',
    'PIB per capita': 'PIBPerCapita'
}

dados.rename(columns_names_map, axis=1, inplace=True)

## Padroniza e Converte os Dados

In [None]:
dados['Nome'] = dados['Nome'].apply(lambda n: unidecode(n).upper())
dados['DensidadeDemografica'] = dados['DensidadeDemografica'].apply(lambda d: float(d.replace(' hab/km²', '').replace(',', '.')))
dados['PopulacaoEstimada'] = dados['PopulacaoEstimada'].apply(lambda p: int(p.replace(' pessoas', '')))
dados['SalarioMedio'] = dados['SalarioMedio'].apply(lambda s: float(s.replace(' salários mínimos', '').replace(',', '.')))
dados['IndiceDesenvolvimentoHumano'] = dados['IndiceDesenvolvimentoHumano'].apply(lambda i: float(i.replace(',', '.')))
dados['MortalidadeInfantil'] = dados['MortalidadeInfantil'].apply(lambda m: float(m.replace(' óbitos por mil nascidos vivos', '').replace(',', '.')))
dados['PIBPerCapita'] = dados['PIBPerCapita'].apply(lambda p: float(p.replace(' R$', '').replace(',', '.')))

## Salva os Dados em Formato CSV

In [None]:
dados.to_csv('ES_INDICADORES_MUNICIPAIS_CLEAN.csv', sep=',', encoding='UTF-8', index=False)