# Analise dos resultados do SISU
Vamos analisar aqui as notas dos estudantes selecionados pelo SISU no ano de 2021

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [2]:
df_selecionados = pd.read_csv("Data/alunos_selecionados.csv", sep=';')
df_cursos = pd.read_csv("lista_cursos.csv", sep=';')

In [3]:
df_selecionados.head()

Unnamed: 0,nome,codigo_inscricao_enem,codigo_oferta,bonus,classificacao,nota,codigo_modalidade,modalidade
0,CARLOS AUGUSTO SANTOS FERNANDES,20****4646741,162887,0.0,1,655.17,0,Ampla concorrência
1,DEBORA LOUISE DE SOUZA FELISBERTO,20****4665356,162887,0.0,2,641.81,0,Ampla concorrência
2,MATHEUS CANDIDO DE OLIVEIRA SILVA,20****7040864,162887,0.0,3,639.64,0,Ampla concorrência
3,LUIS ANTONIO CORSO DA COSTA,20****1199474,162887,0.0,4,639.41,0,Ampla concorrência
4,BRENDA DANTAS DA COSTA,20****2513744,162887,0.0,5,636.21,0,Ampla concorrência


In [4]:
df_cursos.head()

Unnamed: 0,codigo_oferta,codigo_curso,nome_curso,grau_curso,turno_curso,numero_vagas,nome_campus,cidade_campus,uf_campus,nome_ies,...,peso_ciencias_natureza,min_ciencias_humanas,peso_ciencias_humanas,min_linguagens,peso_linguagens,min_matematica,peso_matematica,min_redacao,peso_redacao,media_minima
0,162887,1513995,CIÊNCIAS SOCIAIS,Licenciatura,Noturno,40,CAMPUS REALENGO II,Rio de Janeiro,RJ,COLÉGIO PEDRO II,...,1.0,0.01,3.0,0.01,2.0,0.01,1.0,0.01,2.0,0.01
1,162886,1513993,FILOSOFIA,Licenciatura,Noturno,40,CAMPUS REALENGO II,Rio de Janeiro,RJ,COLÉGIO PEDRO II,...,1.0,0.01,3.0,0.01,2.0,0.01,1.0,0.01,2.0,0.01
2,162889,1513994,GEOGRAFIA,Licenciatura,Noturno,40,CAMPUS REALENGO II,Rio de Janeiro,RJ,COLÉGIO PEDRO II,...,1.0,0.01,3.0,0.01,2.0,0.01,1.0,0.01,2.0,0.01
3,162888,1513990,HISTÓRIA,Licenciatura,Noturno,40,CAMPUS REALENGO II,Rio de Janeiro,RJ,COLÉGIO PEDRO II,...,1.0,0.01,3.0,0.01,2.0,0.01,1.0,0.01,2.0,0.01
4,176142,18864,ADMINISTRAÇÃO,Bacharelado,Integral,50,CEFET/RJ - UNIDADE MARACANÃ,Rio de Janeiro,RJ,CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO S...,...,2.0,444.7,1.0,453.8,1.0,432.4,4.0,300.0,3.0,418.04


## Nota máximas
Para observar o desempenho dos alunos, vamos utilizar o seguinte score: a nota obtida pelo aluno sobre a nota máxima possível considerando a oferta que o aluno foi selecionado

Observamos aqui que os alunos com notas acima de 900 muitas vezes possuem bonus altos, devido a regionalidade e especificidade do curso ofertado ou modalidade concursada


In [5]:
df_selecionados.sort_values('nota', ascending=False)

Unnamed: 0,nome,codigo_inscricao_enem,codigo_oferta,bonus,classificacao,nota,codigo_modalidade,modalidade
86532,VINICIUS BARROS COSTA MACEDO,20****6901999,171559,20.0,1,995.40,0,Ampla concorrência
87773,LAURA FROES NUNES DA SILVA,20****7046646,171557,20.0,1,993.14,0,Ampla concorrência
87774,NICOLE DA SILVA BRAGA,20****0665368,171557,20.0,2,990.17,0,Ampla concorrência
87775,GABRIE GERIA MELO LIMA,20****0082295,171557,20.0,3,989.23,0,Ampla concorrência
87776,LAYLA CAROLINA BARROS LEITE,20****2151662,171557,20.0,4,986.09,0,Ampla concorrência
...,...,...,...,...,...,...,...,...
46597,ANTONIO VESPASIANO DOS SANTOS FILHO,20****5030681,190134,0.0,1,244.88,14,Candidatos com deficiência autodeclarados pret...
95262,RODRIGO DE MORAES,20****8076161,166772,0.0,1,235.52,9,Candidatos com deficiência que tenham renda fa...
11590,WALLACE MONJARDIM BONINI,20****6881473,177808,0.0,1,234.18,10,Candidatos com deficiência autodeclarados pret...
21159,ANDRE VIANA DOS SANTOS,20****0453944,176772,0.0,1,227.98,14,Candidatos com deficiência autodeclarados pret...


### Relação das notas máximas do Enem de 2021

In [6]:
notas_maximas = {
    'linguagens': 801.1,
    'ciencias_humanas':862.6,
    'ciencias_natureza': 854.8,
    'matematica': 975,
    'redacao': 1000
}


## Obtendo os pesos dos cursos de cada aluno

Agora temos que recolher os pesos e calcular a nota máxima para cada aluno

In [7]:
colunas_pesos = ['peso_linguagens','peso_ciencias_humanas','peso_ciencias_natureza','peso_matematica','peso_redacao']

In [8]:
%%time

notas_percentuais = []
for codigo, index in zip(df_selecionados['codigo_oferta'], df_selecionados.index):
    codigo_curso_idx = df_cursos.loc[df_cursos['codigo_oferta'] == codigo][colunas_pesos].index
    
    pesos = df_cursos.loc[codigo_curso_idx[0], colunas_pesos].to_list()
    nota, bonus = df_selecionados.loc[index, 'nota'], 1 + (df_selecionados.loc[index, 'bonus']) / 100
    
    percentual_nota = df_selecionados.loc[index, 'nota'] / ((sum([n * p for n, p in zip(notas_maximas.values(), pesos)]) / sum(pesos)) * bonus)
    
    notas_percentuais.append(percentual_nota)
    

CPU times: user 3min 15s, sys: 227 ms, total: 3min 15s
Wall time: 3min 15s


In [10]:
df_selecionados['notas_percentuais'] = notas_percentuais
df_selecionados.sort_values('notas_percentuais', ascending=False).head(10)



Unnamed: 0,nome,codigo_inscricao_enem,codigo_oferta,bonus,classificacao,nota,codigo_modalidade,modalidade,notas_percentuais
194016,FELIPE COUTO AMENDOLA,20****9386642,182469,0.0,1,853.4,0,Ampla concorrência,0.950529
122001,JOAO GUILHERME REBUSSI MARCOMINI MACEDO CATELAN,20****0748560,176215,0.0,1,852.86,0,Ampla concorrência,0.948993
132454,MICHELLY MOREIRA CAMPOS,20****4959159,187735,0.0,1,863.45,0,Ampla concorrência,0.948525
58800,PEDRO BARBOSA DUARTE VIDAL,20****0807861,189245,0.0,1,851.5,0,Ampla concorrência,0.94748
63367,JULIA MOTTA COELHO DE CERQUEIRA PAES,20****3229947,152613,0.0,1,850.74,0,Ampla concorrência,0.946634
154458,FABIO LUIS BALDISSERA,20****9845891,158894,0.0,1,859.4,0,Ampla concorrência,0.946571
194017,NATAN AUGUSTO CUEL,20****5979361,182469,0.0,2,848.35,0,Ampla concorrência,0.944905
194018,FELIPE DIAS ARAUJO DE ALBUQUERQUE,20****2604223,182469,0.0,3,847.32,0,Ampla concorrência,0.943757
194019,ANA BRUNA SALLES FONSECA,20****7001037,182469,0.0,4,847.03,0,Ampla concorrência,0.943434
194020,EDUARDO CUNHA LOBATO,20****3921230,182469,0.0,5,846.34,0,Ampla concorrência,0.942666
