In [61]:
import json
from datetime import datetime
import pandas as pd
from google.cloud import storage

In [62]:
BUCKET = "rjr-portal-da-transparencia"
client = storage.Client()
bucket = client.get_bucket(BUCKET)

In [1]:
def save_maps(maps):
    with open(f'maps.json', 'w', encoding='utf-8') as file:
        json.dump(maps, file, ensure_ascii=False)

    blob = bucket.blob(f"aux/maps.json")
    blob = blob.upload_from_filename(f'maps.json')
    
def parse_csv(table, bucket, dtype=None):
    return dict(pd.read_csv(f"gs://{BUCKET}/aux/tables/{table}.csv").dropna().values.tolist())

# Escolas

In [64]:
maps["TP_SITUACAO_FUNCIONAMENTO"] = {
    1: "Em Atividade",
    2: "Paralisada",
    3: "Extinta (ano do censo)",
    4: "Extinta em anos anteriores"
}

maps["TP_DEPENDENCIA"] = {
    1: "Federal",
    2: "Estadual",
    3: "Municipal",
    4: "Privada"
}


maps["TP_LOCALIZACAO"] = {
    1: "Urbana",
    2: "Rural"
}

maps["TP_LOCALIZACAO_DIFERENCIADA"] = {
    0: "A escola não está em área de localização diferenciada",
    1: "Área de assentamento",
    2: "Terra indígena",
    3: "Área onde se localiza comunidade remanescente de quilombos"
}

maps["TP_CATEGORIA_ESCOLA_PRIVADA"] = {
    1: "Particular",
    2: "Comunitária",
    3: "Confessional",
    4: "Filantrópica"
}

maps["TP_CONVENIO_PODER_PUBLICO"] = {
    1: "Municipal",
    2: "Estadual",
    3: "Estadual e Municipal",
}

maps["TP_REGULAMENTACAO"] = {
    0: "Não",
    1: "Sim", 
    2: "Em tramitação"
}


maps["TP_RESPONSAVEL_REGULAMENTACAO"] = {
    1: "Federal",
    2: "Estadual",
    3: "Municipal",
    4: "Estadual e Municipal",
    5: "Federal e Estadual",
    6: "Federal, Estadual e Municipal"
}

maps["TP_OCUPACAO_PREDIO_ESCOLAR"] = {
    1: "Próprio",
    2: "Alugado",
    3: "Cedido"
}

maps["TP_REDE_LOCAL"] = {
    0: "Não há rede local interligando computadores",
    1: "A cabo",
    2: "Wireless",
    3: "A cabo e Wireless"
}


maps["TP_INDIGENA_LINGUA"] = {
    1: "Somente em Língua Indígena",
    2: "Somente em Língua Portuguesa",
    3: "Em Língua Indígena e em Língua Portuguesa"
}

maps["TP_PROPOSTA_PEDAGOGICA"] = {
    0: "Não",
    1: "Sim",
    2: "A escola não possui projeto político pedagógico/proposta pedagógica"
}

maps["TP_AEE"] = {
    0: "Não oferece",
    1: "Não exclusivamente",
    2: "Exclusivamente"
}

maps["TP_ATIVIDADE_COMPLEMENTAR"] = {
    0: "Não oferece",
    1: "Não exclusivamente",
    2: "Exclusivamente"
}

maps["TP_OCUPACAO_GALPAO"] = {
    1: "Próprio",
    2: "Alugado",
    3: "Cedido"
}

maps["CO_LINGUA_INDIGENA_1"] = parse_csv("CO_LINGUA_INDIGENA", bucket,
                                               dtype={"Cód. Atual": str, "Língua de identificação": str})
maps["CO_LINGUA_INDIGENA_2"] = maps["CO_LINGUA_INDIGENA_3"] = maps["CO_LINGUA_INDIGENA_1"]

# Turmas

In [65]:
maps["TP_MEDIACAO_DIDATICO_PEDAGO"] = {
    1: "Presencial",
    2: "Semipresencial",
    3: "Educação a Distância - EAD"
}

maps["TP_TIPO_ATENDIMENTO_TURMA"] = {
    1: "Exclusivo Escolarização", 
    2: "Escolarização e Atividade complementar",
    3: "Atividade complementar",
    4: "Atendimento Educacional Especializado (AEE)"
}

maps["TP_TIPO_LOCAL_TURMA"] = {
    0: "A turma não está em local de funcionamento diferenciado",
    1: "Sala anexa",
    2: "Unidade de atendimento socioeducativo",
    3: "Unidade prisional"
}

maps["TP_UNIFICADA"] = {
    0: "Não",
    1: "Unificada",
    2: "Multietapa",
    3: "Multi",
    4: "Correção de fluxo",
    5: "Mista (Concomitante e Subsequente)"
}

maps["TP_ETAPA_ENSINO"] = {
    1: "Educação Infantil - Creche",
    2: "Educação Infantil - Pré-escola",
    3: "Educação Infantil - Unificada",
    56: "Educação Infantil e Ensino Fundamental (9 anos) Multietapa",
    4: "Ensino Fundamental de 8 anos - 1ª Série",
    5: "Ensino Fundamental de 8 anos - 2ª Série",
    6: "Ensino Fundamental de 8 anos - 3ª Série",
    7: "Ensino Fundamental de 8 anos - 4ª Série",
    8: "Ensino Fundamental de 8 anos - 5ª Série",
    9: "Ensino Fundamental de 8 anos - 6ª Série",
    10: "Ensino Fundamental de 8 anos - 7ª Série",
    11: "Ensino Fundamental de 8 anos - 8ª Série",
    12: "Ensino Fundamental de 8 anos - Multi",
    13: "Ensino Fundamental de 8 anos - Correção de Fluxo",
    14: "Ensino Fundamental de 9 anos - 1º Ano",
    15: "Ensino Fundamental de 9 anos - 2º Ano",
    16: "Ensino Fundamental de 9 anos - 3º Ano",
    17: "Ensino Fundamental de 9 anos - 4º Ano",
    18: "Ensino Fundamental de 9 anos - 5º Ano",
    19: "Ensino Fundamental de 9 anos - 6º Ano",
    20: "Ensino Fundamental de 9 anos - 7º Ano",
    21: "Ensino Fundamental de 9 anos - 8º Ano",
    41: "Ensino Fundamental de 9 anos - 9º Ano",
    22: "Ensino Fundamental de 9 anos - Multi",
    23: "Ensino Fundamental de 9 anos - Correção de Fluxo",
    24: "Ensino Fundamental de 8 e 9 anos - Multi 8 e 9 anos",
    25: "Ensino Médio - 1º ano/1ª Série",
    26: "Ensino Médio - 2º ano/2ª Série",
    27: "Ensino Médio - 3ºano/3ª Série",
    28: "Ensino Médio - 4º ano/4ª Série",
    29: "Ensino Médio - Não Seriada",
    30: "Curso Técnico Integrado (Ensino Médio Integrado) 1ª Série",
    31: "Curso Técnico Integrado (Ensino Médio Integrado) 2ª Série",
    32: "Curso Técnico Integrado (Ensino Médio Integrado) 3ª Série",
    33: "Curso Técnico Integrado (Ensino Médio Integrado) 4ª Série",
    34: "Curso Técnico Integrado (Ensino Médio Integrado) Não Seriada",
    35: "Ensino Médio - Modalidade Normal/Magistério 1ª Série",
    36: "Ensino Médio - Modalidade Normal/Magistério 2ª Série",
    37: "Ensino Médio - Modalidade Normal/Magistério 3ª Série",
    38: "Ensino Médio - Modalidade Normal/Magistério 4ª Série",
    39: "Curso Técnico - Concomitante",
    40: "Curso Técnico - Subsequente",
    64: "Curso Técnico Misto (Concomitante e Subsequente)",
    65: "EJA - Ensino Fundamental - Projovem Urbano",
    67: "Curso FIC integrado na modalidade EJA  - Nível Médio",
    68: "Curso FIC Concomitante",
    69: "EJA - Ensino Fundamental - Anos Iniciais",
    70: "EJA - Ensino Fundamental - Anos Finais",
    71: "EJA - Ensino Médio",
    72: "EJA - Ensino Fundamental - Anos Iniciais e Anos Finais",
    73: "Curso FIC integrado na modalidade EJA - Nível Fundamental (EJA integrada à Educação Profissional de Nível Fundamental)",
    74: "Curso Técnico Integrado na Modalidade EJA (EJA integrada à Educação Profissional de Nível Médio)"
}



# Matriculas

In [66]:
maps["TP_SEXO"] = {
    1: "Masculino",
    2: "Feminino"
}

maps["TP_COR_RACA"] = {
    0: "Não declarada",
    1: "Branca",
    2: "Preta",
    3: "Parda",
    4: "Amarela",
    5: "Indígena"
}

maps["TP_NACIONALIDADE"] = {
    1: "Brasileira",
    2: "Brasileira - nascido no exterior ou naturalizado",
    3: "Estrangeira"
}

maps["TP_ZONA_RESIDENCIAL"] = {
    1: "Urbana",
    2: "Rural"
}

maps["TP_LOCALIZACAO"] = maps["TP_ZONA_RESIDENCIAL"]

maps["TP_LOCALIZACAO_DIFERENCIADA"] = {
    0: "A escola não está em área de localização diferenciada",
    1: "Área de assentamento",
    2: "Terra indígena",
    3: "Área onde se localiza comunidade remanescente de quilombos"
}

maps["TP_LOCAL_RESID_DIFERENCIADA"] = {
    0: "Não reside em área de localização diferenciada",  
    1: "Área onde se localiza comunidade remanescente de quilombos",
    2: "Terra indígena", 
    3: "Área de assentamento"
}

maps["TP_OUTRO_LOCAL_AULA"] = {
    1: "Em hospital",
    2: "Em domicílio",
    3: "Não recebe escolarização fora da escola"
}

maps["TP_RESPONSAVEL_TRANSPORTE"] = {
    1: "Estadual",
    2: "Municipal"
}

maps["TP_ETAPA_ENSINO"] = {
    1: "Educação Infantil - Creche",
    2: "Educação Infantil - Pré-escola",
    3: "Educação Infantil - Unificada",
    56: "Educação Infantil e Ensino Fundamental (9 anos) Multietapa",
    4: "Ensino Fundamental de 8 anos - 1ª Série",
    5: "Ensino Fundamental de 8 anos - 2ª Série",
    6: "Ensino Fundamental de 8 anos - 3ª Série",
    7: "Ensino Fundamental de 8 anos - 4ª Série",
    8: "Ensino Fundamental de 8 anos - 5ª Série",
    9: "Ensino Fundamental de 8 anos - 6ª Série",
    10: "Ensino Fundamental de 8 anos - 7ª Série",
    11: "Ensino Fundamental de 8 anos - 8ª Série",
    12: "Ensino Fundamental de 8 anos - Multi",
    13: "Ensino Fundamental de 8 anos - Correção de Fluxo",
    14: "Ensino Fundamental de 9 anos - 1º Ano",
    15: "Ensino Fundamental de 9 anos - 2º Ano",
    16: "Ensino Fundamental de 9 anos - 3º Ano",
    17: "Ensino Fundamental de 9 anos - 4º Ano",
    18: "Ensino Fundamental de 9 anos - 5º Ano",
    19: "Ensino Fundamental de 9 anos - 6º Ano",
    20: "Ensino Fundamental de 9 anos - 7º Ano",
    21: "Ensino Fundamental de 9 anos - 8º Ano",
    41: "Ensino Fundamental de 9 anos - 9º Ano",
    22: "Ensino Fundamental de 9 anos - Multi",
    23: "Ensino Fundamental de 9 anos - Correção de Fluxo",
    24: "Ensino Fundamental de 8 e 9 anos - Multi 8 e 9 anos",
    25: "Ensino Médio - 1º ano/1ª Série",
    26: "Ensino Médio - 2º ano/2ª Série",
    27: "Ensino Médio - 3ºano/3ª Série",
    28: "Ensino Médio - 4º ano/4ª Série",
    29: "Ensino Médio - Não Seriada",
    30: "Curso Técnico Integrado (Ensino Médio Integrado) 1ª Série",
    31: "Curso Técnico Integrado (Ensino Médio Integrado) 2ª Série",
    32: "Curso Técnico Integrado (Ensino Médio Integrado) 3ª Série",
    33: "Curso Técnico Integrado (Ensino Médio Integrado) 4ª Série",
    34: "Curso Técnico Integrado (Ensino Médio Integrado) Não Seriada",
    35: "Ensino Médio - Modalidade Normal/Magistério 1ª Série",
    36: "Ensino Médio - Modalidade Normal/Magistério 2ª Série",
    37: "Ensino Médio - Modalidade Normal/Magistério 3ª Série",
    38: "Ensino Médio - Modalidade Normal/Magistério 4ª Série",
    39: "Curso Técnico - Concomitante",
    40: "Curso Técnico - Subsequente",
    64: "Curso Técnico Misto (Concomitante e Subsequente)",
    65: "EJA - Ensino Fundamental - Projovem Urbano",
    67: "Curso FIC integrado na modalidade EJA  - Nível Médio",
    68: "Curso FIC Concomitante",
    69: "EJA - Ensino Fundamental - Anos Iniciais",
    70: "EJA - Ensino Fundamental - Anos Finais",
    71: "EJA - Ensino Médio",
    72: "EJA - Ensino Fundamental - Anos Iniciais e Anos Finais",
    73: "Curso FIC integrado na modalidade EJA - Nível Fundamental (EJA integrada à Educação Profissional de Nível Fundamental)",
    74: "Curso Técnico Integrado na Modalidade EJA (EJA integrada à Educação Profissional de Nível Médio)"
}

# Docente e gestor

In [67]:
maps["TP_SITUACAO_CURSO_1"] = {
    1: "Concluído",
    2: "Em andamento"
}
maps["TP_SITUACAO_CURSO_3"] = maps["TP_SITUACAO_CURSO_2"] = maps["TP_SITUACAO_CURSO_1"]

maps["TP_TIPO_IES_1"] = {
    1: "Pública",
    2: "Privada"
}

maps["TP_ENSINO_MEDIO"] = {
    1: "Formação Geral",
    2: "Modalidade Normal (Magistério)",
    3: "Curso Técnico",
    4: "Magistério Indígena Modalidade Normal",                                          
    9: "Não informado"
}

maps["TP_ESCOLARIDADE"] = {
    1: "Não concluiu o ensino fundamental (fundamental incompleto)",
    2: "Ensino fundamental completo",
    3: "Ensino médio completo",
    4: "Ensino superior completo"
}

maps["TP_CARGO_GESTOR"] = {
    1: "Diretor(a)",
    2: "Outro Cargo"
}

maps["TP_TIPO_ACESSO_CARGO"] = {
    1: "Ser proprietário ou sócio-proprietário da escola (apenas escolas privadas)",
    2: "Exclusivamente por indicação/escolha da gestão (escolas públicas e privadas)",
    3: "Processo seletivo qualificado e escolha/nomeação da gestão (escolas públicas e privadas)",
    4: "Concurso público específico para o cargo de gestor escolar (apenas escolas públicas)",
    5: "Exclusivamente por processo eleitoral com  aparticipação da comunidade escolar (apenas escolas públicas)",
    6: "Processo seletivo qualificado e eleição com participação da comunidade escolar (apenas escola pública)",
    7: "Outro (escolas públicas e privadas)"
}

maps["TP_TIPO_CONTRATACAO"] = {
    1: "Concursado/efetivo/estável",
    2: "Contrato temporário",
    3: "Contrato terceirizado",
    4: "Contrato CLT"
}


# Geral

In [68]:
df = pd.read_csv(f"gs://{BUCKET}/aux/tables/ufs.csv", 
                 engine="python", sep=',', quotechar='"', header=0, encoding="utf8")
names = ["CO_REGIAO", "CO_UF", "CO_MESORREGIAO", 
        "CO_MICRORREGIAO", "CO_MUNICIPIO"]
cols = [[0, 1], [2, 3], [2, 5, 6], [2, 7, 8], [9, 10]]
names_cols = zip(names, cols)
for name, cols_ in names_cols:
    df_ = df.iloc[:, cols_].drop_duplicates()
    if len(cols_) == 2:
        map_ = dict(df_.values.tolist())
    elif name == "CO_MESORREGIAO":
        map_ = {f"{col1}{col2:02}": col3
                       for col1, col2, col3 
                       in df_.values}
    else:
        map_ = {f"{col1}{col2:03}": col3
                       for col1, col2, col3 
                       in df_.values} 
    maps[name] = map_
maps["CO_UF_NASC"] = maps["CO_UF"] 
maps["CO_MUNICIPIO_NASC"] = maps["CO_MUNICIPIO"] 
maps["CO_UF_END"] = maps["CO_UF"] 
maps["CO_MUNICIPIO_END"] = maps["CO_MUNICIPIO"] 

maps[f"CO_LINGUA_INDIGENA_1"] = parse_csv("CO_LINGUA_INDIGENA", bucket,
                                               dtype={"Cód. Atual": str, "Língua de identificação": str})
maps[f"CO_LINGUA_INDIGENA_2"] = maps[f"CO_LINGUA_INDIGENA_3"] = maps[f"CO_LINGUA_INDIGENA_1"]


tables = ["CO_AREA_COMPL_PEDAGOGICA", "CO_AREA_CURSO", "CO_ORGAO_REGIONAL",
            "CO_CURSO", "CO_PAIS_ORIGEM", "CO_CURSO_EDUC_PROFISSIONAL", "CO_TIPO_ATIVIDADE", "CO_IES"]
for table in tables:
    table_ = parse_csv(table, bucket)
    if table == "CO_TIPO_ATIVIDADE":
        for i in range(1, 8):
            maps[f"{table}_{i}"] = table_
            
    elif table in  ["CO_AREA_COMPL_PEDAGOGICA", "CO_AREA_CURSO", "CO_CURSO", "CO_IES"]:
        maps[f"{table}_2"] = maps[f"{table}_3"] = maps[f"{table}_1"] = table_
    else:
        maps[f"{table}"] = table_
        
maps["CO_IES_OFERTANTE"] = maps["CO_IES_1"]

maps["CO_PAIS_RESIDENCIA"] = maps["CO_PAIS_ORIGEM"] 


In [69]:
save_maps(maps)