# 👩‍💻**Análise de dados da planilha do sisu de 2024**
---
### Objetivo:
    Criar uma análise de dados que ajude na escolha de cursos em 2025
    
    1. Analisar as vagas e notas de corte
    2. Calcular porcentagens
    3. Criar gráficos para análise visual
    4. Identificar erros e prever melhorias nos dados das planilhas(Exemplo: O que fazer para melhorar as notas e qual será a nova análise feita) 

In [None]:
#Importanto bibliotecas
import pandas as pd
import plotly.express as px

#Definindo tabela com a planilha
tabela = pd.read_csv("Portal Sisu_Sisu 2024_Inscrições e notas de corte 2(inscricao_2024 (2)).csv", encoding = "cp1252", sep=";")
#Excluindo dados nulos
tabela = tabela.dropna()
#Excluindo colunas desnecessárias
tabela = tabela.drop(columns= ["EDICAO", "CO_IES", "DS_ORGANIZACAO_ACADEMICA", "DS_CATEGORIA_ADM", "NU_PERCENTUAL_BONUS", "CO_IES_CURSO"])
#Visualizando tabela
display(tabela)

Unnamed: 0,NO_IES,SG_IES,NO_CAMPUS,NO_MUNICIPIO_CAMPUS,SG_UF_CAMPUS,DS_REGIAO_CAMPUS,NO_CURSO,DS_GRAU,DS_TURNO,TP_MOD_CONCORRENCIA,TIPO_CONCORRENCIA,DS_MOD_CONCORRENCIA,QT_VAGAS_OFERTADAS,NU_NOTACORTE,QT_INSCRICAO
0,UNIVERSIDADE FEDERAL DO AGRESTE DE PERNAMBUCO,UFAPE,Unidade SEDE,Garanhuns,PE,Nordeste,PEDAGOGIA,Licenciatura,Vespertino,L,LB_PPI,"Candidatos autodeclarados pretos, pardos ou in...",4.0,55644,85.0
1,UNIVERSIDADE FEDERAL DO AGRESTE DE PERNAMBUCO,UFAPE,Unidade SEDE,Garanhuns,PE,Nordeste,PEDAGOGIA,Licenciatura,Vespertino,L,LI_PPI,"Candidatos autodeclarados pretos, pardos ou in...",4.0,58148,23.0
2,UNIVERSIDADE FEDERAL DO AGRESTE DE PERNAMBUCO,UFAPE,Unidade SEDE,Garanhuns,PE,Nordeste,PEDAGOGIA,Licenciatura,Vespertino,L,LB_Q,"Candidatos autodeclarados quilombolas, com ren...",1.0,52629,4.0
5,UNIVERSIDADE FEDERAL DO AGRESTE DE PERNAMBUCO,UFAPE,Unidade SEDE,Garanhuns,PE,Nordeste,PEDAGOGIA,Licenciatura,Vespertino,L,LI_PCD,"Candidatos com deficiência, independentemente ...",1.0,38746,1.0
6,UNIVERSIDADE FEDERAL DO AGRESTE DE PERNAMBUCO,UFAPE,Unidade SEDE,Garanhuns,PE,Nordeste,PEDAGOGIA,Licenciatura,Vespertino,L,LB_EP,Candidatos com renda familiar bruta per capita...,1.0,61694,27.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
57935,UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO,UFES,CAMPUS ALEGRE,Alegre,ES,Sudeste,AGRONOMIA,Bacharelado,Integral,L,LB_PPI,"Candidatos autodeclarados pretos, pardos ou in...",10.0,5287,43.0
57936,UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO,UFES,CAMPUS ALEGRE,Alegre,ES,Sudeste,AGRONOMIA,Bacharelado,Integral,L,LI_PPI,"Candidatos autodeclarados pretos, pardos ou in...",10.0,55562,25.0
57939,UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO,UFES,CAMPUS ALEGRE,Alegre,ES,Sudeste,AGRONOMIA,Bacharelado,Integral,L,LB_PCD,"Candidatos com deficiência, que tenham renda f...",2.0,43004,2.0
57941,UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO,UFES,CAMPUS ALEGRE,Alegre,ES,Sudeste,AGRONOMIA,Bacharelado,Integral,L,LB_EP,Candidatos com renda familiar bruta per capita...,2.0,60386,17.0


In [15]:
# Calculando total de vagas, média de nota de corte por curso e instituição
vaga_nota_analise = tabela.groupby(['NO_IES', 'NO_CURSO'], as_index=False).agg({
    'QT_VAGAS_OFERTADAS': 'sum',
    'NU_NOTACORTE': lambda x: pd.to_numeric(x.str.replace(',', '.'), errors='coerce').mean()  # Convertendo notas para numérico
}).rename(columns={
    'QT_VAGAS_OFERTADAS': 'TOTAL_VAGAS',
    'NU_NOTACORTE': 'MEDIA_NOTA_CORTE'
})

# Calculando total de vagas e média de nota de corte por região
regiao_analise = tabela.groupby(['DS_REGIAO_CAMPUS'], as_index=False).agg({
    'QT_VAGAS_OFERTADAS': 'sum',
    'NU_NOTACORTE': lambda x: pd.to_numeric(x.str.replace(',', '.'), errors='coerce').mean()
}).rename(columns={
    'QT_VAGAS_OFERTADAS': 'TOTAL_VAGAS',
    'NU_NOTACORTE': 'MEDIA_NOTA_CORTE'
})

vaga_nota_analise.head(), regiao_analise.head()

(                                              NO_IES                 NO_CURSO  \
 0  CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO S...            ADMINISTRAÇÃO   
 1  CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO S...    CIÊNCIA DA COMPUTAÇÃO   
 2  CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO S...     ENGENHARIA AMBIENTAL   
 3  CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO S...         ENGENHARIA CIVIL   
 4  CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO S...  ENGENHARIA DE ALIMENTOS   
 
    TOTAL_VAGAS  MEDIA_NOTA_CORTE  
 0        162.0        596.270833  
 1         77.0        694.646667  
 2         75.0        598.960000  
 3         77.0        614.201667  
 4         47.0        514.126667  ,
   DS_REGIAO_CAMPUS  TOTAL_VAGAS  MEDIA_NOTA_CORTE
 0     Centro_Oeste      17654.0        600.022860
 1         Nordeste     108585.0        592.985498
 2            Norte       9357.0        613.350082
 3          Sudeste      75189.0        613.658836
 4              Sul      24287.0  

In [14]:
# 1. Gráfico de barras: Total de vagas por instituição (Top 10)
vaga_por_instituicao = vaga_nota_analise.groupby('NO_IES')['TOTAL_VAGAS'].sum().nlargest(10).reset_index()
fig1 = px.bar(
    vaga_por_instituicao,
    x='NO_IES', 
    y='TOTAL_VAGAS',
    title='Top 10 Instituições com Mais Vagas Ofertadas',
    labels={'NO_IES': 'Instituição', 'TOTAL_VAGAS': 'Total de Vagas'},
    text_auto=True
)
fig1.update_traces(marker_color='skyblue', marker_line_color='black', marker_line_width=1.5)
fig1.update_layout(xaxis_tickangle=45)
fig1.show()

# 2. Gráfico de barras: Média de nota de corte por região
fig2 = px.bar(
    regiao_analise,
    x='DS_REGIAO_CAMPUS',
    y='MEDIA_NOTA_CORTE',
    title='Média de Nota de Corte por Região',
    labels={'DS_REGIAO_CAMPUS': 'Região', 'MEDIA_NOTA_CORTE': 'Média da Nota de Corte'},
    text_auto=True
)
fig2.update_traces(marker_color='lightcoral', marker_line_color='black', marker_line_width=1.5)
fig2.update_layout(xaxis_tickangle=45)
fig2.show()

# 3. Histograma: Distribuição das notas de corte
notas = tabela['NU_NOTACORTE'].str.replace(',', '.').astype(float)
fig3 = px.histogram(
    notas.dropna(),
    nbins=30,
    title='Distribuição das Notas de Corte',
    labels={'value': 'Nota de Corte', 'count': 'Frequência'},
)
fig3.update_traces(marker_color='mediumseagreen', marker_line_color='black', marker_line_width=1.5)
fig3.show()
