In [None]:
import pandas as pd
import os

pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

# --- 1. CAMINHOS ---

# Caminho de LEITURA (o arquivo que você quer renomear)
path_leitura_ofertas = '../../../planilhas/limpo/modulo_2/ajustar_nan_cine_ofertas/ofertas_agrupado_limpo_CORRIGIDO.csv'

# Caminho de SAÍDA (onde salvar o arquivo com nomes novos)
path_salvar_ofertas = '../../../planilhas/limpo/modulo_3/limpar_e_padronizar_colunas/ofertas_limpo.csv'

mapa_nomes_curto = {
    'ano_ofertas': 'ano',
    'semestre_ofertas': 'semestre',
    'nome_mantenedora_ofertas': 'nome_mantenedora',
    'codigo_e_mec_mantenedora_ofertas': 'codigo_mec_mantenedora',
    'cnpj_mantenedora_ofertas': 'cnpj_mantenedora',
    'nome_ies_ofertas': 'nome_ies',
    'codigo_e_mec_ies_ofertas': 'codigo_mec_ies',
    'organizacao_academica_ies_ofertas': 'organizacao_academica_ies',
    'uf_ies_ofertas': 'uf_ies',
    'municipio_ies_ofertas': 'municipio_ies',
    'nome_local_oferta_ofertas': 'nome_local_oferta',
    'codigo_local_oferta_ofertas': 'codigo_local_oferta',
    'municipio_local_oferta_ofertas': 'municipio_local_oferta',
    'uf_local_oferta_ofertas': 'uf_local_oferta',
    'nome_microrregiao_ofertas': 'nome_microrregiao',
    'codigo_microrregiao_ofertas': 'codigo_microrregiao',
    'codigo_mesorregiao_ofertas': 'codigo_mesorregiao',
    'nome_mesorregiao_ofertas': 'nome_mesorregiao',
    'area_conhecimento_ofertas': 'area_conhecimento',
    'subarea_conhecimento_ofertas': 'subarea_conhecimento',
    'codigo_grupo_preferencia_ofertas': 'codigo_grupo_preferencia',
    'nota_corte_grupo_preferencia_ofertas': 'nota_corte_gp',
    'codigo_curso_ofertas': 'codigo_curso',
    'nome_curso_ofertas': 'nome_curso',
    'turno_ofertas': 'turno',
    'grau_ofertas': 'grau',
    'conceito_ofertas': 'conceito_curso',
    'vagas_autorizadas_e_mec_ofertas': 'vagas_autorizadas_mec',
    'vagas_ofertadas_fies_ofertas': 'vagas_fies',
    'vagas_alem_da_oferta_ofertas': 'vagas_alem_oferta',
    'vagas_ocupadas_ofertas': 'vagas_ocupadas',
    'participa_p_fies_ofertas': 'participa_p_fies',
    'vagas_ofertadas_p_fies_ofertas': 'vagas_p_fies',
    
    # Agentes Financeiros
    'banco_nordeste_brasil_004_ofertas': 'ag_banco_nordeste_004',
    'itau_unibanco_pravaler_341_ofertas': 'ag_itau_pravaler_341',
    'bv_financeira_pravaler_455_ofertas': 'ag_bv_pravaler_455',
    'banco_andbank_pravaler_65_ofertas': 'ag_andbank_pravaler_65',
    'banco_amazonia_sa_003_ofertas': 'ag_banco_amazonia_003',
    
    # Valores Brutos
    'valor_bruto_curso_ofertas': 'valor_bruto_curso',
    'semestre_1_bruto_ofertas': 'sem_1_bruto',
    'semestre_2_bruto_ofertas': 'sem_2_bruto',
    'semestre_3_bruto_ofertas': 'sem_3_bruto',
    'semestre_4_bruto_ofertas': 'sem_4_bruto',
    'semestre_5_bruto_ofertas': 'sem_5_bruto',
    'semestre_6_bruto_ofertas': 'sem_6_bruto',
    'semestre_7_bruto_ofertas': 'sem_7_bruto',
    'semestre_8_bruto_ofertas': 'sem_8_bruto',
    'semestre_9_bruto_ofertas': 'sem_9_bruto',
    'semestre_10_bruto_ofertas': 'sem_10_bruto',
    'semestre_11_bruto_ofertas': 'sem_11_bruto',
    'semestre_12_bruto_ofertas': 'sem_12_bruto',
    
    # Valores FIES
    'valor_curso_fies_ofertas': 'valor_curso_fies',
    'indice_correcao_ipca_ofertas': 'indice_correcao_ipca',
    'semestre_1_fies_ofertas': 'sem_1_fies',
    'semestre_2_fies_ofertas': 'sem_2_fies',
    'semestre_3_fies_ofertas': 'sem_3_fies',
    'semestre_4_fies_ofertas': 'sem_4_fies',
    'semestre_5_fies_ofertas': 'sem_5_fies',
    'semestre_6_fies_ofertas': 'sem_6_fies',
    'semestre_7_fies_ofertas': 'sem_7_fies',
    'semestre_8_fies_ofertas': 'sem_8_fies',
    'semestre_9_fies_ofertas': 'sem_9_fies',
    'semestre_10_fies_ofertas': 'sem_10_fies',
    'semestre_11_fies_ofertas': 'sem_11_fies',
    'semestre_12_fies_ofertas': 'sem_12_fies',
    
    # Colunas CINE
    'NO_CURSO': 'nome_curso_cine',
    'CO_CURSO': 'codigo_curso_cine',
    'CO_CINE_AREA_GERAL': 'codigo_cine_area_geral',
    'NO_CINE_AREA_GERAL': 'nome_cine_area_geral'
}

# --- 3. PROCESSAMENTO ---
print(f"Lendo arquivo de ofertas: {path_leitura_ofertas}")

df_ofertas = pd.read_csv(path_leitura_ofertas, low_memory=False) # Adicionado low_memory=False

print("Renomeando colunas...")
df_ofertas_renomeado = df_ofertas.rename(columns=mapa_nomes_curto)

# Cria o diretório se ele não existir
os.makedirs(os.path.dirname(path_salvar_ofertas), exist_ok=True)



# criacao da coluna de regiao

# Mapeamento UF -> Região
mapa_uf_regiao = {
    'AC': 'Norte', 'AP': 'Norte', 'AM': 'Norte', 'PA': 'Norte', 'RO': 'Norte', 'RR': 'Norte', 'TO': 'Norte',
    'AL': 'Nordeste', 'BA': 'Nordeste', 'CE': 'Nordeste', 'MA': 'Nordeste', 'PB': 'Nordeste', 'PE': 'Nordeste', 'PI': 'Nordeste', 'RN': 'Nordeste', 'SE': 'Nordeste',
    'DF': 'Centro-Oeste', 'GO': 'Centro-Oeste', 'MT': 'Centro-Oeste', 'MS': 'Centro-Oeste',
    'ES': 'Sudeste', 'MG': 'Sudeste', 'RJ': 'Sudeste', 'SP': 'Sudeste',
    'PR': 'Sul', 'RS': 'Sul', 'SC': 'Sul'
}

coluna_uf_ies = 'uf_ies' # Nome da coluna APÓS a renomeação


df_ofertas_renomeado_e_coluna_regiao=df_ofertas_renomeado.copy()


df_ofertas_renomeado_e_coluna_regiao['regiao_ies']=df_ofertas_renomeado_e_coluna_regiao['uf_ies'].map(mapa_uf_regiao)

# 1. Verifica quantos valores ficaram NaN (UFs inválidas)
num_nan = df_ofertas_renomeado_e_coluna_regiao['regiao_ies'].isna().sum()

# 2. Imprime o resultado correto
if num_nan > 0:
    print(f"   -> Aviso: {num_nan} ofertas tinham UF inválida ou faltante, resultando em 'regiao_ies' NaN.")
else:
    print("   -> Coluna 'regiao_ies' adicionada com sucesso e sem valores inválidos.")







print(f"Salvando arquivo renomeado em: {path_salvar_ofertas}")
df_ofertas_renomeado_e_coluna_regiao.to_csv(path_salvar_ofertas, index=False)

print("\n--- Processo Concluído (Ofertas) ---")

print("\nNovos nomes de colunas:")
print(df_ofertas_renomeado_e_coluna_regiao.columns.to_list())

pd.set_option('display.max_rows', None) # Para mostrar todos os nomes
pd.set_option('display.max_columns', None)

display(df_ofertas_renomeado_e_coluna_regiao.head())#type: ignore

Lendo arquivo de ofertas: ../../../planilhas/limpo/modulo_2/ajustar_nan_cine_ofertas/ofertas_agrupado_limpo_CORRIGIDO.csv
Renomeando colunas...
   -> Coluna 'regiao_ies' adicionada com sucesso e sem valores inválidos.
Salvando arquivo renomeado em: ../../../planilhas/limpo/modulo_3/limpar_e_padronizar_colunas/ofertas_limpo.csv

--- Processo Concluído (Ofertas) ---

Novos nomes de colunas:
['ano', 'semestre', 'nome_mantenedora', 'codigo_mec_mantenedora', 'cnpj_mantenedora', 'nome_ies', 'codigo_mec_ies', 'organizacao_academica_ies', 'uf_ies', 'municipio_ies', 'nome_local_oferta', 'codigo_local_oferta', 'municipio_local_oferta', 'uf_local_oferta', 'nome_microrregiao', 'codigo_microrregiao', 'codigo_mesorregiao', 'nome_mesorregiao', 'area_conhecimento', 'subarea_conhecimento', 'codigo_grupo_preferencia', 'nota_corte_gp', 'codigo_curso', 'nome_curso', 'turno', 'grau', 'conceito_curso', 'vagas_autorizadas_mec', 'vagas_fies', 'vagas_alem_oferta', 'vagas_ocupadas', 'participa_p_fies', 'vagas_p

Unnamed: 0,ano,semestre,nome_mantenedora,codigo_mec_mantenedora,cnpj_mantenedora,nome_ies,codigo_mec_ies,organizacao_academica_ies,uf_ies,municipio_ies,nome_local_oferta,codigo_local_oferta,municipio_local_oferta,uf_local_oferta,nome_microrregiao,codigo_microrregiao,codigo_mesorregiao,nome_mesorregiao,area_conhecimento,subarea_conhecimento,codigo_grupo_preferencia,nota_corte_gp,codigo_curso,nome_curso,turno,grau,conceito_curso,vagas_autorizadas_mec,vagas_fies,vagas_alem_oferta,vagas_ocupadas,participa_p_fies,vagas_p_fies,ag_banco_nordeste_004,ag_itau_pravaler_341,ag_bv_pravaler_455,ag_andbank_pravaler_65,ag_banco_amazonia_003,valor_bruto_curso,sem_1_bruto,sem_2_bruto,sem_3_bruto,sem_4_bruto,sem_5_bruto,sem_6_bruto,sem_7_bruto,sem_8_bruto,sem_9_bruto,sem_10_bruto,sem_11_bruto,sem_12_bruto,valor_curso_fies,indice_correcao_ipca,sem_1_fies,sem_2_fies,sem_3_fies,sem_4_fies,sem_5_fies,sem_6_fies,sem_7_fies,sem_8_fies,sem_9_fies,sem_10_fies,sem_11_fies,sem_12_fies,nome_curso_cine,codigo_curso_cine,codigo_cine_area_geral,nome_cine_area_geral,regiao_ies
0,2020.0,1.0,INSTITUTO SANTANENSE DE ENSINO SUPERIOR,316.0,62881100000000.0,CENTRO UNIVERSITÁRIO SANT ANNA,456.0,Centro Universitário,SP,São Paulo,CAMPUS - SÃO PAULO - SANTANA,657908.0,São Paulo,SP,São Paulo,35061.0,3515.0,Metropolitana de São Paulo,CURSOS DA AREA DE SAUDE,"SERVIÇO SOCIAL, FONOAUDIOLOGIA, TERAPIA OCUPAC...",59606.0,45000,106958.0,RADIOLOGIA,NOTURNO,Tecnológico,4,140.0,56.0,0.0,0.0,NAO,0.0,N,N,N,N,N,"31.890,00","5.100,00","5.100,00","5.100,00","5.100,00","5.100,00","6.390,00",-,-,-,-,-,-,"31.890,00",200%,"5.100,00","5.100,00","5.100,00","5.100,00","5.100,00","6.390,00",-,-,-,-,-,-,Radiologia,106958.0,9.0,Saúde e bem-estar,Sudeste
1,2020.0,1.0,SOCIEDADE EDUCACIONAL BRAZ CUBAS LTDA.,365.0,52556410000000.0,CENTRO UNIVERSITÁRIO BRAZ CUBAS,526.0,Centro Universitário,SP,Mogi das Cruzes,Campus I Sede,25802.0,Mogi das Cruzes,SP,Mogi das Cruzes,35062.0,3515.0,Metropolitana de São Paulo,CURSOS DA AREA DE SAUDE,"SERVIÇO SOCIAL, FONOAUDIOLOGIA, TERAPIA OCUPAC...",59606.0,45000,70672.0,ÓPTICA E OPTOMETRIA,NOTURNO,Tecnológico,4,120.0,12.0,0.0,4.0,NAO,0.0,N,N,N,N,N,"42.552,00","5.940,00","6.528,00","6.528,00","6.528,00","6.528,00","5.250,00","5.250,00",-,-,-,-,-,"39.405,60",500%,"4.752,00","4.569,60","6.528,00","6.528,00","6.528,00","5.250,00","5.250,00",-,-,-,-,-,Óptica E Optometria,70672.0,9.0,Saúde e bem-estar,Sudeste
2,2020.0,1.0,ASSUPERO ENSINO SUPERIOR LTDA.,2415.0,6099229000000.0,UNIVERSIDADE PAULISTA,322.0,Universidade,SP,São Paulo,Santos I,370.0,Santos,SP,Santos,35063.0,3515.0,Metropolitana de São Paulo,CURSOS DA AREA DE SAUDE,"SERVIÇO SOCIAL, FONOAUDIOLOGIA, TERAPIA OCUPAC...",59606.0,45000,5000459.0,RADIOLOGIA,NOTURNO,Tecnológico,4,115.0,46.0,23.0,1.0,SIM,46.0,N,S,N,S,N,"27.131,79","4.083,43","3.979,92","4.485,62","4.683,64","4.820,53","5.078,65",-,-,-,-,-,-,"22.236,42",250%,"2.858,40","2.878,68","3.520,88","3.799,37","4.354,38","4.824,71",-,-,-,-,-,-,Radiologia,5000459.0,9.0,Saúde e bem-estar,Sudeste
3,2020.0,1.0,ASSUPERO ENSINO SUPERIOR LTDA.,2415.0,6099229000000.0,UNIVERSIDADE PAULISTA,322.0,Universidade,SP,São Paulo,Campus VII - MARQUÊS,2643.0,São Paulo,SP,São Paulo,35061.0,3515.0,Metropolitana de São Paulo,CURSOS DA AREA DE SAUDE,"SERVIÇO SOCIAL, FONOAUDIOLOGIA, TERAPIA OCUPAC...",59606.0,45000,1180797.0,RADIOLOGIA,MATUTINO,Tecnológico,4,115.0,46.0,23.0,0.0,SIM,46.0,N,S,N,S,N,"22.051,39","2.944,97","2.929,05","3.273,41","3.358,34","3.530,08","6.015,54",-,-,-,-,-,-,"17.502,16",250%,"2.061,48","2.118,58","2.558,74","2.724,29","3.353,57","4.685,50",-,-,-,-,-,-,Radiologia,1180797.0,9.0,Saúde e bem-estar,Sudeste
4,2020.0,1.0,ASSOCIACAO EDUCACIONAL NOVE DE JULHO,222.0,43374770000000.0,UNIVERSIDADE NOVE DE JULHO,316.0,Universidade,SP,São Paulo,MEMORIAL,1801.0,São Paulo,SP,São Paulo,35061.0,3515.0,Metropolitana de São Paulo,CURSOS DA AREA DE SAUDE,"SERVIÇO SOCIAL, FONOAUDIOLOGIA, TERAPIA OCUPAC...",59606.0,45000,116620.0,SERVIÇO SOCIAL,MATUTINO,Bacharelado,4,140.0,56.0,28.0,2.0,SIM,28.0,N,S,N,S,N,"46.368,00","6.624,00","6.624,00","6.624,00","6.624,00","6.624,00","6.624,00","6.624,00",-,-,-,-,-,"25.862,00",120%,"1.910,00","2.310,00","3.054,00","3.288,00","4.764,00","4.764,00","5.772,00",-,-,-,-,-,Serviço Social,116620.0,9.0,Saúde e bem-estar,Sudeste
