# Ajuste de quantidades e conversão de siglas

Apesar de os dados do GT Educação terem sido tratados nos notebooks anteriores, é necessário realizar algumas transformações adicionais para facilitar a visualização dos dados no Qlik Sense. Vamos ajustar os dados realizando algumas transformações e filtros adicionais.

In [None]:
import pandas as pd
import os

# Carregando os dados

In [None]:
base_path = os.path.join('data_output', 'educacao')

In [None]:
alunos_24 = pd.read_csv(os.path.join(base_path, 'perfil-dos-educandos.csv'),
                        sep=';',
                        decimal=',',
                        encoding='utf-8')

In [None]:
escolas_24 = pd.read_csv(os.path.join(base_path, 'escolas-municipais.csv'),
                        sep=';',
                        decimal=',',
                        encoding='utf-8')

# Transformando os dados

## Filtrando os dados de escolas

In [None]:
tipoesc_validos = [
    'CCI/CIPS',
    'CECI',
    'CEI DIRET',
    'CEI INDIR',
    'CEMEI',
    'CEU CEI',
    'CEU CEMEI',
    'CEU EMEF',
    'CEU EMEI',
    'CIEJA',
    'CMCT',
    'CR.P.CONV',
    'EMEBS',
    'EMEF',
    'EMEF P FOM',
    'EMEFM',
    'EMEI',
    'EMEI P FOM',
    'MOVA'
]

O filtro acima remove os registros de escola que não compoem a rede municipal. Porém, ele também acaba excluindo uma escola municipal, por isso adicionaremos uma condição para manter essa escola específica.

In [None]:
escolas_24.head()

In [None]:
escolas_24[escolas_24['NOMES'].str.contains('MAKIGUTI')]

In [None]:
cd_makiguti = escolas_24[escolas_24['NOMES'].str.contains('MAKIGUTI')].loc[:, 'CODESC'].values[0]
cd_makiguti

In [None]:
filtro_escolas = (
    (escolas_24['TIPOESC'].isin(tipoesc_validos))
    |
    (escolas_24['CODESC'] == cd_makiguti)
)

In [None]:
escolas_24_filtrado = escolas_24[filtro_escolas].copy()
escolas_24_filtrado

## Ajustando as etapas e níveis de ensino de alunos

In [None]:
alunos_est_2024_desc_modal = {
    'CRECHE': 'Creches',
    'PRE': 'Pré-Escola',
    'FUND': 'Ensino Fundamental',
    'EJA': 'EJA/CIEJA',
    'MOVA': 'MOVA (Parceira)',
    'MEDIO': 'Ensino Médio',
    'EDPROF': 'Educação Profissional',
    'ESPEC': 'EMEBS',
    'CONVEE': 'Educação Especial (Parceira)'
}

alunos_24['DESC_MODAL'] = alunos_24['MODAL'].map(alunos_est_2024_desc_modal)
alunos_24

Vamos conferir se o map foi aplicado corretamente checando a contagem dos valores únicos nas combindações das colunas `MODAL` e `DESC_MODAL`.

In [None]:
alunos_24.groupby(['MODAL', 'DESC_MODAL']).agg({'Qtde': 'sum'}).reset_index()

Como temos apenas modalidades com as descrições pretendidas, podemos concluir que o mapeamento foi aplicado corretamente.