In [15]:
import os
import pandas as pd

# Set the directory paths
PATH = "/Users/rdahis/Downloads/censo_educacao_superior"

FIRST_YEAR  = 2009
LAST_YEAR   = 2021
SECOND_YEAR = FIRST_YEAR + 1

# Create output directories
os.makedirs(os.path.join(PATH, "output/ies"),   exist_ok=True)
os.makedirs(os.path.join(PATH, "output/curso"), exist_ok=True)

def df_column_switch(df, column1, column2):
    i = list(df.columns)
    a, b = i.index(column1), i.index(column2)
    i[b], i[a] = i[a], i[b]
    df = df[i]
    return df

#------------------------------#
# ies
#------------------------------#

for year in range(FIRST_YEAR, LAST_YEAR + 1):
    file_path = os.path.join(PATH, f"input/microdados_censo_da_educacao_superior_{year}/Microdados do Censo da Educa‡ֶo Superior {year}/dados/MICRODADOS_CADASTRO_IES_{year}.csv")
    ies_data = pd.read_csv(file_path, sep=";", dtype = 'str', encoding="latin-1")

    # Dropping columns
    cols_to_drop = ["NO_REGIAO_IES", "CO_REGIAO_IES", "NO_UF_IES", "CO_UF_IES", "NO_MUNICIPIO_IES", "IN_CAPITAL_IES", "NO_MESORREGIAO_IES", "CO_MESORREGIAO_IES", "NO_MICRORREGIAO_IES", "CO_MICRORREGIAO_IES"]
    if year >= 2021:
        cols_to_drop.extend(["CO_PROJETO", "CO_LOCAL_OFERTA", "NO_LOCAL_OFERTA"])
    ies_data.drop(columns=cols_to_drop, inplace=True)
    
    # Column renaming and dropping
    ies_data.rename(columns={
        "NU_ANO_CENSO":                     "ano",
        "SG_UF_IES":                        "sigla_uf",
        "CO_MUNICIPIO_IES":				    "id_municipio",
        "TP_ORGANIZACAO_ACADEMICA":		    "tipo_organizacao_academica",
        "TP_CATEGORIA_ADMINISTRATIVA":      "tipo_categoria_administrativa",
        "NO_MANTENEDORA":				    "nome_mantenedora",
        "CO_MANTENEDORA":				    "id_mantenedora",
        "CO_IES":							"id_ies",
        "NO_IES":							"nome",
        "SG_IES":							"sigla",
        "DS_ENDERECO_IES":					"endereco",
        "DS_NUMERO_ENDERECO_IES":			"numero",
        "DS_COMPLEMENTO_ENDERECO_IES":		"complemento",
        "NO_BAIRRO_IES":					"bairro",
        "NU_CEP_IES":						"cep",
        "QT_TEC_TOTAL":					    "quantidade_tecnicos",
        "QT_TEC_FUNDAMENTAL_INCOMP_FEM":	"quantidade_tecnicos_ef_incompleto_feminino",
        "QT_TEC_FUNDAMENTAL_INCOMP_MASC":	"quantidade_tecnicos_ef_incompleto_masculino",
        "QT_TEC_FUNDAMENTAL_COMP_FEM":		"quantidade_tecnicos_ef_completo_feminino",
        "QT_TEC_FUNDAMENTAL_COMP_MASC":	    "quantidade_tecnicos_ef_completo_masculino",
        "QT_TEC_MEDIO_FEM":				    "quantidade_tecnicos_em_feminino",
        "QT_TEC_MEDIO_MASC":				"quantidade_tecnicos_em_masculino",
        "QT_TEC_SUPERIOR_FEM":				"quantidade_tecnicos_es_feminino",
        "QT_TEC_SUPERIOR_MASC":			    "quantidade_tecnicos_es_masculino",
        "QT_TEC_ESPECIALIZACAO_FEM":		"quantidade_tecnicos_especializacao_feminino",
        "QT_TEC_ESPECIALIZACAO_MASC":		"quantidade_tecnicos_especializacao_masculino",
        "QT_TEC_MESTRADO_FEM":				"quantidade_tecnicos_mestrado_feminino",
        "QT_TEC_MESTRADO_MASC":			    "quantidade_tecnicos_mestrado_masculino",
        "QT_TEC_DOUTORADO_FEM":			    "quantidade_tecnicos_doutorado_feminino",
        "QT_TEC_DOUTORADO_MASC":			"quantidade_tecnicos_doutorado_masculino",
        "IN_ACESSO_PORTAL_CAPES":			"indicador_biblioteca_acesso_portal_capes",
        "IN_ACESSO_OUTRAS_BASES":			"indicador_biblioteca_acesso_outras_bases",
        "IN_ASSINA_OUTRA_BASE":			    "indicador_biblioteca_assina_outras_bases",
        "IN_REPOSITORIO_INSTITUCIONAL":	    "indicador_biblioteca_repositorio_institucional",
        "IN_BUSCA_INTEGRADA":				"indicador_biblioteca_busca_integrada",
        "IN_SERVICO_INTERNET":				"indicador_biblioteca_internet",
        "IN_PARTICIPA_REDE_SOCIAL":		    "indicador_biblioteca_rede_social",
        "IN_CATALOGO_ONLINE":				"indicador_biblioteca_catalogo_online",
        "QT_PERIODICO_ELETRONICO":			"quantidade_biblioteca_periodicos_eletronicos",
        "QT_LIVRO_ELETRONICO":				"quantidade_biblioteca_livros_eletronicos",
    }, inplace=True)
    
    if year == 2009:
        ies_data.rename(columns={
            "QT_DOCENTE_TOTAL":			"quantidade_docentes",
            "QT_DOCENTE_EXE":			"quantidade_docentes_exercicio",
            "DOC_EX_FEMI":				"quantidade_docentes_exercicio_feminino",
            "DOC_EX_MASC":				"quantidade_docentes_exercicio_masculino",
            "DOC_EX_SEM_GRAD":			"quantidade_docentes_exercicio_sem_graduacao",
            "DOC_EX_GRAD":				"quantidade_docentes_exercicio_graduacao",
            "DOC_EX_ESP":				"quantidade_docentes_exercicio_especializacao",
            "DOC_EX_MEST":				"quantidade_docentes_exercicio_mestrado",
            "DOC_EX_DOUT":				"quantidade_docentes_exercicio_doutorado",
            "DOC_EX_INT":				"quantidade_docentes_exercicio_integral",
            "DOC_EX_INT_DE":			"quantidade_docentes_exercicio_integral_dedicacao_exclusiva",
            "DOC_EX_INT_SEM_DE":		"quantidade_docentes_exercicio_integral_sem_dedicacao_exclusiva",
            "DOC_EX_PARC":				"quantidade_docentes_exercicio_parcial",
            "DOC_EX_HOR":				"quantidade_docentes_exercicio_horista",
            "DOC_EX_0_29":				"quantidade_docentes_exercicio_0_29",
            "DOC_EX_30_34":				"quantidade_docentes_exercicio_30_34",
            "DOC_EX_35_39":				"quantidade_docentes_exercicio_35_39",
            "DOC_EX_40_44":				"quantidade_docentes_exercicio_40_44",
            "DOC_EX_45_49":				"quantidade_docentes_exercicio_45_49",
            "DOC_EX_50_54":				"quantidade_docentes_exercicio_50_54",
            "DOC_EX_55_59":				"quantidade_docentes_exercicio_55_59",
            "DOC_EX_60_MAIS":			"quantidade_docentes_exercicio_60_mais",
            "DOC_EX_BRANCA":			"quantidade_docentes_exercicio_branca",
            "DOC_EX_PRETA":				"quantidade_docentes_exercicio_preta",
            "DOC_EX_PARDA":				"quantidade_docentes_exercicio_parda",
            "DOC_EX_AMARELA":			"quantidade_docentes_exercicio_amarela",
            "DOC_EX_INDIGENA":			"quantidade_docentes_exercicio_indigena",
            "DOC_EX_COR_ND":			"quantidade_docentes_exercicio_cor_nao_declarada",
            "DOC_EX_BRA":				"quantidade_docentes_exercicio_brasileiro",
            "DOC_EX_EST":				"quantidade_docentes_exercicio_estrangeiro",
            "DOC_EX_COM_DEFICIENCIA":	"quantidade_docentes_exercicio_deficiencia",
        }, inplace=True)
    else:
        ies_data.rename(columns={
            "QT_DOC_TOTAL":			        "quantidade_docentes",
            "QT_DOC_EXE":			        "quantidade_docentes_exercicio",
            "QT_DOC_EX_FEMI":				"quantidade_docentes_exercicio_feminino",
            "QT_DOC_EX_MASC":				"quantidade_docentes_exercicio_masculino",
            "QT_DOC_EX_SEM_GRAD":			"quantidade_docentes_exercicio_sem_graduacao",
            "QT_DOC_EX_GRAD":				"quantidade_docentes_exercicio_graduacao",
            "QT_DOC_EX_ESP":				"quantidade_docentes_exercicio_especializacao",
            "QT_DOC_EX_MEST":				"quantidade_docentes_exercicio_mestrado",
            "QT_DOC_EX_DOUT":				"quantidade_docentes_exercicio_doutorado",
            "QT_DOC_EX_INT":				"quantidade_docentes_exercicio_integral",
            "QT_DOC_EX_INT_DE":			    "quantidade_docentes_exercicio_integral_dedicacao_exclusiva",
            "QT_DOC_EX_INT_SEM_DE":		    "quantidade_docentes_exercicio_integral_sem_dedicacao_exclusiva",
            "QT_DOC_EX_PARC":				"quantidade_docentes_exercicio_parcial",
            "QT_DOC_EX_HOR":				"quantidade_docentes_exercicio_horista",
            "QT_DOC_EX_0_29":				"quantidade_docentes_exercicio_0_29",
            "QT_DOC_EX_30_34":				"quantidade_docentes_exercicio_30_34",
            "QT_DOC_EX_35_39":				"quantidade_docentes_exercicio_35_39",
            "QT_DOC_EX_40_44":				"quantidade_docentes_exercicio_40_44",
            "QT_DOC_EX_45_49":				"quantidade_docentes_exercicio_45_49",
            "QT_DOC_EX_50_54":				"quantidade_docentes_exercicio_50_54",
            "QT_DOC_EX_55_59":				"quantidade_docentes_exercicio_55_59",
            "QT_DOC_EX_60_MAIS":			"quantidade_docentes_exercicio_60_mais",
            "QT_DOC_EX_BRANCA":			    "quantidade_docentes_exercicio_branca",
            "QT_DOC_EX_PRETA":				"quantidade_docentes_exercicio_preta",
            "QT_DOC_EX_PARDA":				"quantidade_docentes_exercicio_parda",
            "QT_DOC_EX_AMARELA":			"quantidade_docentes_exercicio_amarela",
            "QT_DOC_EX_INDIGENA":			"quantidade_docentes_exercicio_indigena",
            "QT_DOC_EX_COR_ND":			    "quantidade_docentes_exercicio_cor_nao_declarada",
            "QT_DOC_EX_BRA":				"quantidade_docentes_exercicio_brasileiro",
            "QT_DOC_EX_EST":				"quantidade_docentes_exercicio_estrangeiro",
            "QT_DOC_EX_COM_DEFICIENCIA":    "quantidade_docentes_exercicio_deficiencia",
        }, inplace=True)

    boolean_columns = [
        'indicador_biblioteca_acesso_portal_capes',
        'indicador_biblioteca_acesso_outras_bases',
        'indicador_biblioteca_assina_outras_bases',
        'indicador_biblioteca_repositorio_institucional',
        'indicador_biblioteca_busca_integrada',
        'indicador_biblioteca_internet',
        'indicador_biblioteca_rede_social',
        'indicador_biblioteca_catalogo_online',
    ]
    for c in boolean_columns:
        ies_data[c] = ies_data[c].str.replace('0','FALSE')
        ies_data[c] = ies_data[c].str.replace('1','TRUE')
    
    # Save data to CSV
    ies_output_dir = os.path.join(PATH, f"output/ies/ano={year}")
    os.makedirs(ies_output_dir, exist_ok=True)
    ies_data.drop(columns=["ano"], inplace=True)
    ies_data.to_csv(os.path.join(ies_output_dir, "ies.csv"), index=False)

#------------------------------#
# curso
#------------------------------#

for year in range(FIRST_YEAR, LAST_YEAR + 1):
    file_path = os.path.join(PATH, f"input/microdados_censo_da_educacao_superior_{year}/Microdados do Censo da Educa‡ֶo Superior {year}/dados/MICRODADOS_CADASTRO_CURSOS_{year}.csv")
    curso_data = pd.read_csv(file_path, sep=";", dtype = 'str', encoding="latin-1")

    # Dropping columns
    cols_to_drop = ["NO_REGIAO", "CO_REGIAO", "NO_UF", "CO_UF", "NO_MUNICIPIO", "IN_CAPITAL", "QT_CURSO"]
    if year == 2020:
        curso_data.rename(columns={"CO_CINE_ROTULO2": "CO_CINE_ROTULO"}, inplace=True)
    curso_data.drop(columns=cols_to_drop, inplace=True)
    
    # Column renaming and dropping
    curso_data.rename(columns={
        "NU_ANO_CENSO":                 "ano",
        "SG_UF":                        "sigla_uf",
        "CO_MUNICIPIO":					"id_municipio",
        "TP_DIMENSAO":					"tipo_dimensao",
        "TP_ORGANIZACAO_ACADEMICA":		"tipo_organizacao_academica",
        "TP_CATEGORIA_ADMINISTRATIVA":	"tipo_organizacao_administrativa",
        "TP_REDE":						"rede",
        "CO_IES":						"id_ies",
        "NO_CURSO":						"nome_curso",
        "CO_CURSO":						"id_curso",
        "CO_CINE_ROTULO":				"id_curso_cine",
        "NO_CINE_ROTULO":				"nome_curso_cine",
        "CO_CINE_AREA_GERAL":			"id_area_geral",
        "NO_CINE_AREA_GERAL":			"nome_area_geral",
        "CO_CINE_AREA_ESPECIFICA":		"id_area_especifica",
        "NO_CINE_AREA_ESPECIFICA":		"nome_area_especifica",
        "CO_CINE_AREA_DETALHADA":		"id_area_detalhada",
        "NO_CINE_AREA_DETALHADA":		"nome_area_detalhada",
        "TP_GRAU_ACADEMICO":			"tipo_grau_academico",
        "IN_GRATUITO":					"indicador_gratuito",
        "TP_MODALIDADE_ENSINO":			"tipo_modalidade_ensino",
        "TP_NIVEL_ACADEMICO":			"tipo_nivel_academico",
        "QT_VG_TOTAL":					"quantidade_vagas",
        "QT_VG_TOTAL_DIURNO":			"quantidade_vagas_diurno",
        "QT_VG_TOTAL_NOTURNO":			"quantidade_vagas_noturno",
        "QT_VG_TOTAL_EAD":				"quantidade_vagas_ead",
        "QT_VG_NOVA":					"quantidade_vagas_novas",
        "QT_VG_PROC_SELETIVO":			"quantidade_vagas_processos_seletivos",
        "QT_VG_REMANESC":				"quantidade_vagas_remanescentes",
        "QT_VG_PROG_ESPECIAL":			"quantidade_vagas_programas_especiais",
        "QT_INSCRITO_TOTAL":			"quantidade_inscritos",
        "QT_INSCRITO_TOTAL_DIURNO":		"quantidade_inscritos_diurno",
        "QT_INSCRITO_TOTAL_NOTURNO":	"quantidade_inscritos_noturno",
        "QT_INSCRITO_TOTAL_EAD":		"quantidade_inscritos_ead",
        "QT_INSC_VG_NOVA":				"quantidade_inscritos_vagas_novas",
        "QT_INSC_PROC_SELETIVO":		"quantidade_inscritos_processos_seletivos",
        "QT_INSC_VG_REMANESC":			"quantidade_inscritos_remanescentes",
        "QT_INSC_VG_PROG_ESPECIAL":		"quantidade_inscritos_programas_especiais",
        "QT_ING":						"quantidade_ingressantes",
        "QT_ING_FEM":					"quantidade_ingressantes_feminino",
        "QT_ING_MASC":					"quantidade_ingressantes_masculino",
        "QT_ING_DIURNO":				"quantidade_ingressantes_diurno",
        "QT_ING_NOTURNO":				"quantidade_ingressantes_noturno",
        "QT_ING_VG_NOVA":				"quantidade_ingressantes_vagas_novas",
        "QT_ING_VESTIBULAR":			"quantidade_ingressantes_vestibular",
        "QT_ING_ENEM":					"quantidade_ingressantes_enem",
        "QT_ING_AVALIACAO_SERIADA":		"quantidade_ingressantes_avaliacao_seriada",
        "QT_ING_SELECAO_SIMPLIFICA":	"quantidade_ingressantes_selecao_simplificada",
        "QT_ING_EGR":					"quantidade_ingressantes_egressos",
        "QT_ING_OUTRO_TIPO_SELECAO":	"quantidade_ingressantes_outro_tipo_selecao",
        "QT_ING_PROC_SELETIVO":			"quantidade_ingressantes_processos_seletivos",
        "QT_ING_VG_REMANESC":			"quantidade_ingressantes_remanescentes",
        "QT_ING_VG_PROG_ESPECIAL":		"quantidade_ingressantes_programas_especiais",
        "QT_ING_OUTRA_FORMA":			"quantidade_ingressantes_outras_formas",
        "QT_ING_0_17":					"quantidade_ingressantes_0_17",
        "QT_ING_18_24":					"quantidade_ingressantes_18_24",
        "QT_ING_25_29":					"quantidade_ingressantes_25_29",
        "QT_ING_30_34":					"quantidade_ingressantes_30_34",
        "QT_ING_35_39":					"quantidade_ingressantes_35_39",
        "QT_ING_40_49":					"quantidade_ingressantes_40_49",
        "QT_ING_50_59":					"quantidade_ingressantes_50_59",
        "QT_ING_60_MAIS":				"quantidade_ingressantes_60_mais",
        "QT_ING_BRANCA":				"quantidade_ingressantes_branca",
        "QT_ING_PRETA":					"quantidade_ingressantes_preta",
        "QT_ING_PARDA":					"quantidade_ingressantes_parda",
        "QT_ING_AMARELA":				"quantidade_ingressantes_amarela",
        "QT_ING_INDIGENA":				"quantidade_ingressantes_indigena",
        "QT_ING_CORND":					"quantidade_ingressantes_cor_nao_declarada",
        "QT_MAT":						"quantidade_matriculas",
        "QT_MAT_FEM":					"quantidade_matriculas_feminino",
        "QT_MAT_MASC":					"quantidade_matriculas_masculino",
        "QT_MAT_DIURNO":				"quantidade_matriculas_diurno",
        "QT_MAT_NOTURNO":				"quantidade_matriculas_noturno",
        "QT_MAT_0_17":					"quantidade_matriculas_0_17",
        "QT_MAT_18_24":					"quantidade_matriculas_18_24",
        "QT_MAT_25_29":					"quantidade_matriculas_25_29",
        "QT_MAT_30_34":					"quantidade_matriculas_30_34",
        "QT_MAT_35_39":					"quantidade_matriculas_35_39",
        "QT_MAT_40_49":					"quantidade_matriculas_40_49",
        "QT_MAT_50_59":					"quantidade_matriculas_50_59",
        "QT_MAT_60_MAIS":				"quantidade_matriculas_60_mais",
        "QT_MAT_BRANCA":				"quantidade_matriculas_branca",
        "QT_MAT_PRETA":					"quantidade_matriculas_preta",
        "QT_MAT_PARDA":					"quantidade_matriculas_parda",
        "QT_MAT_AMARELA":				"quantidade_matriculas_amarela",
        "QT_MAT_INDIGENA":				"quantidade_matriculas_indigena",
        "QT_MAT_CORND":					"quantidade_matriculas_cor_nao_declarada",
        "QT_CONC":						"quantidade_concluintes",
        "QT_CONC_FEM":					"quantidade_concluintes_feminino",
        "QT_CONC_MASC":					"quantidade_concluintes_masculino",
        "QT_CONC_DIURNO":				"quantidade_concluintes_diurno",
        "QT_CONC_NOTURNO":				"quantidade_concluintes_noturno",
        "QT_CONC_0_17":					"quantidade_concluintes_0_17",
        "QT_CONC_18_24":				"quantidade_concluintes_18_24",
        "QT_CONC_25_29":				"quantidade_concluintes_25_29",
        "QT_CONC_30_34":				"quantidade_concluintes_30_34",
        "QT_CONC_35_39":				"quantidade_concluintes_35_39",
        "QT_CONC_40_49":				"quantidade_concluintes_40_49",
        "QT_CONC_50_59":				"quantidade_concluintes_50_59",
        "QT_CONC_60_MAIS":				"quantidade_concluintes_60_mais",
        "QT_CONC_BRANCA":				"quantidade_concluintes_branca",
        "QT_CONC_PRETA":				"quantidade_concluintes_preta",
        "QT_CONC_PARDA":				"quantidade_concluintes_parda",
        "QT_CONC_AMARELA":				"quantidade_concluintes_amarela",
        "QT_CONC_INDIGENA":				"quantidade_concluintes_indigena",
        "QT_CONC_CORND":				"quantidade_concluintes_cor_nao_declarada",
        "QT_ING_NACBRAS":				"quantidade_ingressantes_brasileiro",
        "QT_ING_NACESTRANG":			"quantidade_ingressantes_estrangeiro",
        "QT_MAT_NACBRAS":				"quantidade_matriculas_brasileiro",
        "QT_MAT_NACESTRANG":			"quantidade_matriculas_estrangeiro",
        "QT_CONC_NACBRAS":				"quantidade_concluintes_brasileiro",
        "QT_CONC_NACESTRANG":			"quantidade_concluintes_estrangeiro",
        "QT_ALUNO_DEFICIENTE":			"quantidade_alunos_deficiencia",
        "QT_ING_DEFICIENTE":			"quantidade_ingressantes_deficiencia",
        "QT_MAT_DEFICIENTE":			"quantidade_matriculas_deficiencia",
        "QT_CONC_DEFICIENTE":			"quantidade_concluintes_deficiencia",
        "QT_ING_FINANC":				"quantidade_ingressantes_financiamento",
        "QT_ING_FINANC_REEMB":			"quantidade_ingressantes_financiamento_reembolsavel",
        "QT_ING_FIES":					"quantidade_ingressantes_financiamento_reembolsavel_fies",
        "QT_ING_RPFIES":				"quantidade_ingressantes_financiamento_reembolsavel_instituicao",
        "QT_ING_FINANC_REEMB_OUTROS":	"quantidade_ingressantes_financiamento_reembolsavel_outros",
        "QT_ING_FINANC_NREEMB":			"quantidade_ingressantes_financiamento_nao_reembolsavel",
        "QT_ING_PROUNII":				"quantidade_ingressantes_financiamento_nao_reembolsavel_prouni_integral",
        "QT_ING_PROUNIP":				"quantidade_ingressantes_financiamento_nao_reembolsavel_prouni_parcial",
        "QT_ING_NRPFIES":				"quantidade_ingressantes_financiamento_nao_reembolsavel_instituicao",
        "QT_ING_FINANC_NREEMB_OUTROS":	"quantidade_ingressantes_financiamento_nao_reembolsavel_outros",
        "QT_MAT_FINANC":				"quantidade_matriculas_financiamento",
        "QT_MAT_FINANC_REEMB":			"quantidade_matriculas_financiamento_reembolsavel",
        "QT_MAT_FIES":					"quantidade_matriculas_financiamento_reembolsavel_fies",
        "QT_MAT_RPFIES":				"quantidade_matriculas_financiamento_reembolsavel_instituicao",
        "QT_MAT_FINANC_REEMB_OUTROS":	"quantidade_matriculas_financiamento_reembolsavel_outros",
        "QT_MAT_FINANC_NREEMB":			"quantidade_matriculas_financiamento_nao_reembolsavel",
        "QT_MAT_PROUNII":				"quantidade_matriculas_financiamento_nao_reembolsavel_prouni_integral",
        "QT_MAT_PROUNIP":				"quantidade_matriculas_financiamento_nao_reembolsavel_prouni_parcial",
        "QT_MAT_NRPFIES":				"quantidade_matriculas_financiamento_nao_reembolsavel_instituicao",
        "QT_MAT_FINANC_NREEMB_OUTROS":	"quantidade_matriculas_financiamento_nao_reembolsavel_outros",
        "QT_CONC_FINANC":				"quantidade_concluintes_financiamento",
        "QT_CONC_FINANC_REEMB":			"quantidade_concluintes_financiamento_reembolsavel",
        "QT_CONC_FIES":					"quantidade_concluintes_financiamento_reembolsavel_fies",
        "QT_CONC_RPFIES":				"quantidade_concluintes_financiamento_reembolsavel_instituicao",
        "QT_CONC_FINANC_REEMB_OUTROS":	"quantidade_concluintes_financiamento_reembolsavel_outros",
        "QT_CONC_FINANC_NREEMB":		"quantidade_concluintes_financiamento_nao_reembolsavel",
        "QT_CONC_PROUNII":				"quantidade_concluintes_financiamento_nao_reembolsavel_prouni_integral",
        "QT_CONC_PROUNIP":				"quantidade_concluintes_financiamento_nao_reembolsavel_prouni_parcial",
        "QT_CONC_NRPFIES":				"quantidade_concluintes_financiamento_nao_reembolsavel_instituicao",
        "QT_CONC_FINANC_NREEMB_OUTROS":	"quantidade_concluintes_financiamento_nao_reembolsavel_outros",
        "QT_ING_RESERVA_VAGA":			"quantidade_ingressantes_reserva_vaga",
        "QT_ING_RVREDEPUBLICA":			"quantidade_ingressantes_reserva_vaga_rede_publica",
        "QT_ING_RVETNICO":				"quantidade_ingressantes_reserva_vaga_etnico",
        "QT_ING_RVPDEF":				"quantidade_ingressantes_reserva_vaga_deficiencia",
        "QT_ING_RVSOCIAL_RF":			"quantidade_ingressantes_reserva_vaga_social_renda_familiar",
        "QT_ING_RVOUTROS":				"quantidade_ingressantes_reserva_vaga_outros",
        "QT_MAT_RESERVA_VAGA":			"quantidade_matriculas_reserva_vaga",
        "QT_MAT_RVREDEPUBLICA":			"quantidade_matriculas_reserva_vaga_rede_publica",
        "QT_MAT_RVETNICO":				"quantidade_matriculas_reserva_vaga_etnico",
        "QT_MAT_RVPDEF":				"quantidade_matriculas_reserva_vaga_deficiencia",
        "QT_MAT_RVSOCIAL_RF":			"quantidade_matriculas_reserva_vaga_social_renda_familiar",
        "QT_MAT_RVOUTROS":				"quantidade_matriculas_reserva_vaga_outros",
        "QT_CONC_RESERVA_VAGA":			"quantidade_concluintes_reserva_vaga",
        "QT_CONC_RVREDEPUBLICA":		"quantidade_concluintes_reserva_vaga_rede_publica",
        "QT_CONC_RVETNICO":				"quantidade_concluintes_reserva_vaga_etnico",
        "QT_CONC_RVPDEF":				"quantidade_concluintes_reserva_vaga_deficiencia",
        "QT_CONC_RVSOCIAL_RF":			"quantidade_concluintes_reserva_vaga_social_renda_familiar",
        "QT_CONC_RVOUTROS":				"quantidade_concluintes_reserva_vaga_outros",
        "QT_SIT_TRANCADA":				"quantidade_alunos_situacao_trancada",
        "QT_SIT_DESVINCULADO":			"quantidade_alunos_situacao_desvinculada",
        "QT_SIT_TRANSFERIDO":			"quantidade_alunos_situacao_transferida",
        "QT_SIT_FALECIDO":				"quantidade_alunos_situacao_falecidos",
        "QT_ING_PROCESCPUBLICA":		"quantidade_ingressantes_em_rede_publica",
        "QT_ING_PROCESCPRIVADA":		"quantidade_ingressantes_em_rede_privada",
        "QT_ING_PROCNAOINFORMADA":		"quantidade_ingressantes_em_rede_nao_informada",
        "QT_MAT_PROCESCPUBLICA":		"quantidade_matriculas_em_rede_publica",
        "QT_MAT_PROCESCPRIVADA":		"quantidade_matriculas_em_rede_privada",
        "QT_MAT_PROCNAOINFORMADA":		"quantidade_matriculas_em_rede_nao_informada",
        "QT_CONC_PROCESCPUBLICA":		"quantidade_concluintes_em_rede_publica",
        "QT_CONC_PROCESCPRIVADA":		"quantidade_concluintes_em_rede_privada",
        "QT_CONC_PROCNAOINFORMADA":		"quantidade_concluintes_em_rede_nao_informada",
        "QT_PARFOR":					"quantidade_alunos_parfor",
        "QT_ING_PARFOR":				"quantidade_ingressantes_parfor",
        "QT_MAT_PARFOR":				"quantidade_matriculas_parfor",
        "QT_CONC_PARFOR":				"quantidade_concluintes_parfor",
        "QT_APOIO_SOCIAL":				"quantidade_alunos_apoio_social",
        "QT_ING_APOIO_SOCIAL":			"quantidade_ingressantes_apoio_social",
        "QT_MAT_APOIO_SOCIAL":			"quantidade_matriculas_apoio_social",
        "QT_CONC_APOIO_SOCIAL":			"quantidade_concluintes_apoio_social",
        "QT_ATIV_EXTRACURRICULAR":		"quantidade_alunos_atividade_extracurricular",
        "QT_ING_ATIV_EXTRACURRICULAR":	"quantidade_ingressantes_atividade_extracurricular",
        "QT_MAT_ATIV_EXTRACURRICULAR":	"quantidade_matriculas_atividade_extracurricular",
        "QT_CONC_ATIV_EXTRACURRICULAR":	"quantidade_concluintes_atividade_extracurricular",
        "QT_MOB_ACADEMICA":				"quantidade_alunos_mobilidade_academica",
        "QT_ING_MOB_ACADEMICA":			"quantidade_ingressantes_mobilidade_academica",
        "QT_MAT_MOB_ACADEMICA":			"quantidade_matriculas_mobilidade_academica",
        "QT_CONC_MOB_ACADEMICA":		"quantidade_concluintes_mobilidade_academica",
    }, inplace=True)
    
    curso_data = df_column_switch(curso_data, 'id_curso_cine', 'nome_curso_cine')

    curso_data['id_curso_cine'] = curso_data['id_curso_cine'].str.replace('"','')

    boolean_columns = [
        'indicador_gratuito',
    ]
    for c in boolean_columns:
        curso_data[c] = curso_data[c].str.replace('0','FALSE')
        curso_data[c] = curso_data[c].str.replace('1','TRUE')
    
    # Save data to CSV
    curso_output_dir = os.path.join(PATH, f"output/curso/ano={year}")
    os.makedirs(curso_output_dir, exist_ok=True)
    sigla_ufs = ['AC','AL','AP','AM','BA','CE','DF','ES','GO','MA','MS','MT','MG','PA','PB','PR','PE','PI','RJ','RN','RS','RO','RR','SC','SP','SE','TO']
    for uf in sigla_ufs:
        uf_output_dir = os.path.join(curso_output_dir, f"sigla_uf={uf}")
        os.makedirs(uf_output_dir, exist_ok=True)
        uf_data = curso_data[(curso_data["ano"] == str(year)) & (curso_data["sigla_uf"] == uf)]
        uf_data.drop(columns=["ano", "sigla_uf"], inplace=True)
        uf_data.to_csv(os.path.join(uf_output_dir, "curso.csv"), index=False)


A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  uf_data.drop(columns=["ano", "sigla_uf"], inplace=True)
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  uf_data.drop(columns=["ano", "sigla_uf"], inplace=True)
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  uf_data.drop(columns=["ano", "sigla_uf"], inplace=True)
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  