<a href="https://colab.research.google.com/github/kdolfo/PythonPandas/blob/main/SM2_terca_feira_Dados_INEP.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
### ✅ Resumo do dia (terça-feira)
#- Explorei o cruzamento entre `SG_UF_IES` e `TP_ORGANIZACAO_ACADEMICA`
#- Gerei gráficos interativos com Plotly
#- Exportei duas tabelas com dados consolidados para uso posterior
#- Consegui visualizar o perfil das instituições por UF e organização

In [None]:
#Configurando o ambiente
import pandas as pd
import plotly.express as px
import matplotlib.pyplot as plt

In [None]:
#Configurando o DF com o arquivo IES
df_ies = pd.read_csv('../content/drive/MyDrive/MachineLearning/censo_ed_sup_2023/MICRODADOS_ED_SUP_IES_2023.CSV', encoding="cp1252", sep=",")
df_ies.columns = df_ies.columns.str.strip()  # remove espaços invisíveis
print(df_ies.columns.tolist())  # veja se SG_UF_IES está direitinho

['NU_ANO_CENSO', 'NO_REGIAO_IES', 'CO_REGIAO_IES', 'NO_UF_IES', 'SG_UF_IES', 'CO_UF_IES', 'NO_MUNICIPIO_IES', 'CO_MUNICIPIO_IES', 'IN_CAPITAL_IES', 'NO_MESORREGIAO_IES', 'CO_MESORREGIAO_IES', 'NO_MICRORREGIAO_IES', 'CO_MICRORREGIAO_IES', 'TP_ORGANIZACAO_ACADEMICA', 'TP_REDE', 'TP_CATEGORIA_ADMINISTRATIVA', 'IN_COMUNITARIA', 'IN_CONFESSIONAL', 'NO_MANTENEDORA', 'CO_MANTENEDORA', 'CO_IES', 'NO_IES', 'SG_IES', 'DS_ENDERECO_IES', 'DS_NUMERO_ENDERECO_IES', 'DS_COMPLEMENTO_ENDERECO_IES', 'NO_BAIRRO_IES', 'NU_CEP_IES', 'QT_TEC_TOTAL', 'QT_TEC_FUNDAMENTAL_INCOMP_FEM', 'QT_TEC_FUNDAMENTAL_INCOMP_MASC', 'QT_TEC_FUNDAMENTAL_COMP_FEM', 'QT_TEC_FUNDAMENTAL_COMP_MASC', 'QT_TEC_MEDIO_FEM', 'QT_TEC_MEDIO_MASC', 'QT_TEC_SUPERIOR_FEM', 'QT_TEC_SUPERIOR_MASC', 'QT_TEC_ESPECIALIZACAO_FEM', 'QT_TEC_ESPECIALIZACAO_MASC', 'QT_TEC_MESTRADO_FEM', 'QT_TEC_MESTRADO_MASC', 'QT_TEC_DOUTORADO_FEM', 'QT_TEC_DOUTORADO_MASC', 'IN_ACESSO_PORTAL_CAPES', 'IN_ACESSO_OUTRAS_BASES', 'IN_ASSINA_OUTRA_BASE', 'IN_REPOSITORIO_I

In [None]:
print('TP_MODALIDADE_ENSINO' in df_ies.columns)

False


In [None]:
#Verifica as IES por UF
ies_por_uf = df_ies['SG_UF_IES'].value_counts().reset_index()
ies_por_uf.columns = ['UF', 'Quantidade']

fig = px.bar(ies_por_uf,
             x='UF',
             y='Quantidade',
             title='Quantidade de IES por UF')
fig.show()

In [None]:
#Separar organização por tipo
#Há um dicionário que terá que ser checado

# Contar por tipo
org_p_tipo = df_ies['TP_CATEGORIA_ADMINISTRATIVA'].value_counts().reset_index()
org_p_tipo.columns = ['Tipo', 'Quantidade']

# Dicionário de categorias do INEP
categorias = {
    1: 'Pública Federal',
    2: 'Pública Estadual',
    3: 'Pública Municipal',
    4: 'Privada com fins lucrativos',
    5: 'Privada sem fins lucrativos',
    6: 'Privada - Especial'
}

# Mapear os nomes legíveis
org_p_tipo['Categoria'] = org_p_tipo['Tipo'].map(categorias)

# Gráfico com nomes no eixo X

fig = px.bar(
    org_p_tipo,
    x='Categoria',
    y='Quantidade',
    title='Organizações por Tipo',
    text='Quantidade'
)
fig.update_traces(textposition='outside')
fig.update_layout(xaxis_tickangle=-45)
fig.show()

In [None]:
#Tipo de OA
TipoOA = df_ies['TP_ORGANIZACAO_ACADEMICA'].value_counts().reset_index()
TipoOA.columns = ['Tipo', 'Quantidade']

# Dicionário de categorias
categorias = {
    1: 'Universidade',
    2: 'Centro Universitário',
    3: 'Faculdade',
    4: 'Instituto Federal de Educação, Ciência e Tecnologia  ',
    5: 'Centro Federal de Educação Tecnológica'
}

#Vincular o tipo à categoria
TipoOA['Categoria'] = TipoOA['Tipo'].map(categorias)

#Gráfico
fig =px.bar(
    TipoOA,
    x='Categoria',
    y='Quantidade',
    title='Organizações Acadêmicas por tipo',
    text='Quantidade'
)
fig.update_traces(textposition='outside')
fig.update_layout(xaxis_tickangle=-45)
fig.show()

In [None]:
fig = px.pie(TipoOA, names='Categoria', values='Quantidade',
             title='Distribuição das IES por Organização Acadêmica')
fig.show()

In [None]:
#Agrupar por UF e Categoria Administrativa
uf_cad = df_ies.groupby(['SG_UF_IES','TP_CATEGORIA_ADMINISTRATIVA']).size().reset_index(name='Quantidade')
uf_cad.columns = ('Sigla_UF', 'Tipo', 'Quantidade')

# Dicionário de categorias do INEP
categorias = {
    1: 'Pública Federal',
    2: 'Pública Estadual',
    3: 'Pública Municipal',
    4: 'Privada com fins lucrativos',
    5: 'Privada sem fins lucrativos',
    6: 'Privada - Especial'
}

uf_cad['Categoria'] = uf_cad['Tipo'].map(categorias)

#Gráfico
fig = px.bar(
    uf_cad,
    x='Sigla_UF',
    y='Quantidade',
    color='Categoria',
    barmode='group',
    title='Quantidade de Organizações por UF e Tipo',
    text='Quantidade'
)
fig.update_traces(textposition='outside')
fig.update_layout(xaxis_tickangle=-45)
fig.show()

In [None]:
#Pegando as quantidades da Sigla_UF SP
uf_sp = uf_cad[uf_cad['Sigla_UF'] == 'SP']
print(uf_sp)

    Sigla_UF  Tipo  Quantidade                    Categoria
105       SP     1           6              Pública Federal
106       SP     2          82             Pública Estadual
107       SP     3          16            Pública Municipal
108       SP     4         257  Privada com fins lucrativos
109       SP     5         218  Privada sem fins lucrativos
110       SP     7           7                          NaN


In [None]:
univ_uf = df_ies[['NO_MANTENEDORA', 'SG_UF_IES']].drop_duplicates()
univ_uf.columns = ('Nome_Universidade', 'Sigla_UF')

univ_sp = univ_uf[univ_uf['Sigla_UF'] == 'SP']
univ_df = univ_uf[univ_uf['Sigla_UF'] == 'DF']
print(univ_df)

                                      Nome_Universidade Sigla_UF
1                     FUNDACAO UNIVERSIDADE DE BRASILIA       DF
174         CENTRO DE ENSINO UNIFICADO DE BRASILIA CEUB       DF
175               UNIAO BRASILEIRA DE EDUCACAO CATOLICA       DF
176                 UNIAO PIONEIRA DE INTEGRACAO SOCIAL       DF
233   CENTRO DE ENSINO UNIFICADO DO DISTRITO FEDERAL...       DF
336                       FUNDACAO BRASILEIRA DE TEATRO       DF
441   CESB - CENTRO DE EDUCACAO SUPERIOR DE BRASILIA...       DF
463                INSTITUTO EURO-AMERICANO DE EDUCACAO       DF
487            ANHANGUERA EDUCACIONAL PARTICIPACOES S/A       DF
616                       ASSOBES ENSINO SUPERIOR LTDA.       DF
629              ERICH FROMM INSTITUTO EDUCACIONAL LTDA       DF
663    BCEC - BRASIL CENTRAL DE EDUCACAO E CULTURA LTDA       DF
731   IESST - INSTITUTO DE ENSINO SUPERIOR SOCIAL E ...       DF
732   GUATAG - SOCIEDADE DE ASSISTENCIA EDUCACIONAL ...       DF
775   CESCO - CENTRO DE E

In [None]:
univ_uf = df_ies[['NO_IES', 'SG_UF_IES']].drop_duplicates()
univ_uf.columns = ('Nome_Universidade', 'Sigla_UF')

univ_sp = univ_uf[univ_uf['Sigla_UF'] == 'SP']
univ_df = univ_uf[univ_uf['Sigla_UF'] == 'DF']
print(univ_df)
#univ_df.to_csv('univ_df.csv', index=False)
#univ_sp.to_csv('univ_sp.csv', index=False)

                             Nome_Universidade Sigla_UF
1                     UNIVERSIDADE DE BRASÍLIA       DF
174           CENTRO UNIVERSITÁRIO DE BRASÍLIA       DF
175          UNIVERSIDADE CATÓLICA DE BRASÍLIA       DF
176              FACULDADES INTEGRADAS DA UPIS       DF
233   CENTRO UNIVERSITÁRIO DO DISTRITO FEDERAL       DF
...                                        ...      ...
2538                          Faculdade Guerra       DF
2563              FACULDADE ANCLIVEPA BRASÍLIA       DF
2566                            Instituto Aria       DF
2568           Faculdade Comunidade das Nações       DF
2572          UNIVERSIDADE DO DISTRITO FEDERAL       DF

[61 rows x 2 columns]
