In [23]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import ipywidgets as widgets

In [24]:
#todas as turmas de 2013 até 2017
turma_periodo = ['dados/turmas-2013.1.csv','dados/turmas-2013.2.csv','dados/turmas-2014.1.csv','dados/turmas-2014.2.csv','dados/turmas-2015.1.csv',
                 'dados/turmas-2015.2.csv','dados/turmas-2016.1.csv', 'dados/turmas-2016.2.csv', 'dados/turmas-2017.1.csv', 'dados/turmas-2017.2.csv',]

In [25]:
#le todos os dados de todos os arquivos e salva em uma conjunto de datasets
frames = [pd.read_csv(periodo, sep=';', usecols=['id_turma','id_componente_curricular', 'ano', 'nivel_ensino', 'periodo','situacao_turma']) for periodo in turma_periodo]

In [26]:
#concatena os data sets
df_turmas = pd.concat(frames)
df_turmas.head()

Unnamed: 0,id_turma,id_componente_curricular,nivel_ensino,ano,periodo,situacao_turma
0,1196178,50280.0,LATO SENSU,2013,1.0,CONSOLIDADA
1,1196210,52540.0,TÉCNICO,2013,1.0,CONSOLIDADA
2,1196211,52540.0,TÉCNICO,2013,1.0,CONSOLIDADA
3,1196212,52540.0,TÉCNICO,2013,1.0,CONSOLIDADA
4,1196213,52540.0,TÉCNICO,2013,1.0,CONSOLIDADA


In [27]:
# filtrar apenas disciplinas com código "CONSOLIDADA"
df_turmas_consolidadas = df_turmas[df_turmas.situacao_turma == 'CONSOLIDADA']
df_turmas_consolidadas.dropna(inplace=True)
df_turmas_consolidadas.head()

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  This is separate from the ipykernel package so we can avoid doing imports until


Unnamed: 0,id_turma,id_componente_curricular,nivel_ensino,ano,periodo,situacao_turma
0,1196178,50280.0,LATO SENSU,2013,1.0,CONSOLIDADA
1,1196210,52540.0,TÉCNICO,2013,1.0,CONSOLIDADA
2,1196211,52540.0,TÉCNICO,2013,1.0,CONSOLIDADA
3,1196212,52540.0,TÉCNICO,2013,1.0,CONSOLIDADA
4,1196213,52540.0,TÉCNICO,2013,1.0,CONSOLIDADA


In [28]:
#muda o nome da coluna do componente e muda o tipo para int64 - para fazer o merge com as disciplinas
df_turmas_consolidadas.rename(columns={'id_componente_curricular': 'id_componente'}, inplace=True)
df_turmas_consolidadas.id_componente = df_turmas_consolidadas.id_componente.astype(np.int64)

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  return super(DataFrame, self).rename(**kwargs)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  self[name] = value


In [29]:
#armazena os dados das disciplinas
disciplinas_url = 'dados/componentes-curriculares-presenciais.csv'
df_disciplinas = pd.read_csv(disciplinas_url, sep=';',usecols=["id_componente","codigo","nome"])
df_disciplinas.dropna(inplace=True)
df_disciplinas.head()

Unnamed: 0,id_componente,codigo,nome
0,18643,MUT508,COMPOSIÇÃO EM MÚSICA POPULAR III
1,18644,MUT516,CO-REPETIÇÃO
2,18645,MUT520,CONTRABAIXO ACÚSTICO I
3,18646,MUT165,PIANO COMPLEMENTAR I
4,18647,MUT167,PIANO COMPLEMENTAR III


In [30]:
#filtra apenas as disciplinas do imd
disciplinas_imd = df_disciplinas[df_disciplinas.codigo.str.contains("IMD")]
disciplinas_imd.id_componente = disciplinas_imd.id_componente.astype(np.int64)
disciplinas_imd.head()

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  self[name] = value


Unnamed: 0,id_componente,codigo,nome
20970,51954,IMD0001,INOVAÇÃO TECNOLÓGICA
21229,52247,IMD0002,INOVAÇÃO TECNOLÓGICA
21230,52248,IMD0003,PROCESSO E QUALIDADE DE SOFTWARE
21231,52249,IMD0004,GERÊNCIA DE PROJETOS
21371,52390,IMD0005,INOVAÇÃO TECNOLÓGICA


In [9]:
#merge entre turmas e disciplinas
colunas = ["id_turma","id_componente","codigo","nome","nivel_ensino","ano","periodo","situacao_turma"]
turmas_disciplinas = pd.merge(df_turmas_consolidadas, disciplinas_imd , on='id_componente')[colunas]
turmas_disciplinas = turmas_disciplinas[~turmas_disciplinas.id_turma.duplicated()]
turmas_disciplinas.head()

Unnamed: 0,id_turma,id_componente,codigo,nome,nivel_ensino,ano,periodo,situacao_turma
0,1196210,52540,IMD0901,INTRODUÇÃO ÀS TECNOLOGIAS DA INFORMAÇÃO,TÉCNICO,2013,1.0,CONSOLIDADA
1,1196211,52540,IMD0901,INTRODUÇÃO ÀS TECNOLOGIAS DA INFORMAÇÃO,TÉCNICO,2013,1.0,CONSOLIDADA
2,1196212,52540,IMD0901,INTRODUÇÃO ÀS TECNOLOGIAS DA INFORMAÇÃO,TÉCNICO,2013,1.0,CONSOLIDADA
3,1196213,52540,IMD0901,INTRODUÇÃO ÀS TECNOLOGIAS DA INFORMAÇÃO,TÉCNICO,2013,1.0,CONSOLIDADA
4,1196214,52540,IMD0901,INTRODUÇÃO ÀS TECNOLOGIAS DA INFORMAÇÃO,TÉCNICO,2013,1.0,CONSOLIDADA


In [31]:
# armazena as avaliações dos professores da ufrn
avaliacao = pd.read_csv("dados/avaliacaodocencia.csv", sep=';')
avaliacao.head()

Unnamed: 0,id_docente,nome_docente,id_turma,ano,periodo,qtd_discentes,postura_profissional_media,postura_profissional_DP,atuacao_profissional_media,atuacao_profissional_DP,autoavaliacao_aluno_media,autoavaliacao_aluno_DP
0,15370,FERNANDO MOREIRA DA SILVA,1209923,2013,2,14,9.17,1.34,8.13,2.7,7.61,2.53
1,15370,FERNANDO MOREIRA DA SILVA,1222008,2014,1,15,9.44,0.92,7.17,3.08,8.71,1.72
2,15370,FERNANDO MOREIRA DA SILVA,1222218,2014,1,38,9.19,1.67,6.77,3.29,8.12,2.53
3,15370,FERNANDO MOREIRA DA SILVA,1229520,2014,2,13,9.06,1.16,7.68,2.51,7.62,2.77
4,15370,FERNANDO MOREIRA DA SILVA,1229545,2014,2,24,9.27,1.28,8.45,1.72,8.48,1.86


In [32]:
colunas = ["id_turma","id_componente","codigo","nome","nivel_ensino","nome_docente","ano_y","postura_profissional_media","postura_profissional_DP","atuacao_profissional_media","atuacao_profissional_DP","autoavaliacao_aluno_media","autoavaliacao_aluno_DP"]
av_imd = pd.merge(turmas_disciplinas, avaliacao, on='id_turma')[colunas]
av_imd.head()

Unnamed: 0,id_turma,id_componente,codigo,nome,nivel_ensino,nome_docente,ano_y,postura_profissional_media,postura_profissional_DP,atuacao_profissional_media,atuacao_profissional_DP,autoavaliacao_aluno_media,autoavaliacao_aluno_DP
0,1210347,52656,IMD0014,INTRODUÇÃO AO CÁLCULO,GRADUAÇÃO,SAMYR SILVA BEZERRA JACOME,2013,9.19,2.02,8.51,2.53,7.48,2.63
1,1211547,52656,IMD0014,INTRODUÇÃO AO CÁLCULO,GRADUAÇÃO,SAMYR SILVA BEZERRA JACOME,2013,9.72,0.66,8.82,2.09,7.96,2.61
2,1210362,52651,IMD0012.0,INTRODUÇÃO ÀS TÉCNICAS DE PROGRAMAÇÃO,GRADUAÇÃO,ADJA FERREIRA DE ANDRADE,2013,9.08,1.44,7.35,3.02,8.73,2.19
3,1211551,52651,IMD0012.0,INTRODUÇÃO ÀS TÉCNICAS DE PROGRAMAÇÃO,GRADUAÇÃO,ADJA FERREIRA DE ANDRADE,2013,9.63,0.87,8.7,2.18,8.07,2.72
4,1217933,52651,IMD0012.0,INTRODUÇÃO ÀS TÉCNICAS DE PROGRAMAÇÃO,GRADUAÇÃO,ANDRE MAURICIO CUNHA CAMPOS,2014,9.69,0.6,8.92,1.37,8.61,1.81


In [33]:
lista_prof = av_imd.nome_docente.unique()
lista_prof.sort()

In [34]:
from __future__ import print_function
from ipywidgets import interact

def evolucao(x):
    dados_prof = av_imd.loc[av_imd['nome_docente'] == x]
    return (dados_prof)

interact(evolucao, x=lista_prof,);

In [35]:
def evolucaoGrafico(x):
    dados_prof = av_imd.loc[av_imd['nome_docente'] == x]
    g = sns.lmplot(x="ano_y",y="postura_profissional_media",hue="nome", data=dados_prof, size=7)
    sns.despine(left=True, bottom=True)
    plt.show()
  
    
interactive_plot = interact(evolucaoGrafico, x=lista_prof,)

In [36]:
av_imd['avaliacao completa'] = (av_imd['postura_profissional_media']+ av_imd['atuacao_profissional_media'])/2
av_imd.sort_values(by='avaliacao completa',ascending=True)

Unnamed: 0,id_turma,id_componente,codigo,nome,nivel_ensino,nome_docente,ano_y,postura_profissional_media,postura_profissional_DP,atuacao_profissional_media,atuacao_profissional_DP,autoavaliacao_aluno_media,autoavaliacao_aluno_DP,avaliacao completa
153,57576571,55031,IMD0019,RESOLUÇÃO DE PROBLEMAS MATEMÁTICOS PARA TI,GRADUAÇÃO,PAULO ROBERTO BELTRAO MAIA,2016,7.39,1.97,6.46,3.29,7.67,2.72,6.925
260,57586303,55022,IMD0028,FUNDAMENTOS MATEMÁTICOS DA COMPUTAÇÃO I,GRADUAÇÃO,PAULO ROBERTO BELTRAO MAIA,2016,7.57,2.37,7.02,3.02,8.11,2.68,7.295
471,57565057,55041,IMD0325,INTRODUÇÃO A SISTEMAS DE CONTROLE,GRADUAÇÃO,EDUARDO NOGUEIRA CUNHA,2015,8.67,2.07,6.04,3.41,7.90,1.87,7.355
443,57587373,52790,IMD0401,BANCO DE DADOS,GRADUAÇÃO,MARCIA JACYNTHA NUNES RODRIGUES LUCENA,2016,7.79,2.67,7.29,2.96,7.61,3.31,7.540
239,57579396,55082,IMD0020,TECNOLOGIA DA INFORMAÇÃO E SOCIEDADE,GRADUAÇÃO,GILIARD FAUSTINO DA SILVA,2016,7.96,2.21,7.13,3.12,7.94,2.61,7.545
34,1239519,52652,IMD0012.1,PRÁTICAS DE TÉCNICAS DE PROGRAMAÇÃO,GRADUAÇÃO,WELLINGTON SILVA DE SOUZA,2015,8.50,1.93,6.65,2.94,7.73,2.93,7.575
98,57576591,52662,IMD0024,CÁLCULO DIFERENCIAL E INTEGRAL I,GRADUAÇÃO,RAFAELA HORACINA SILVA ROCHA SOARES,2016,7.38,2.12,7.83,2.22,7.76,2.70,7.605
236,57576582,55082,IMD0020,TECNOLOGIA DA INFORMAÇÃO E SOCIEDADE,GRADUAÇÃO,GILIARD FAUSTINO DA SILVA,2016,7.95,2.04,7.54,2.92,7.76,3.23,7.745
120,1217945,52785,IMD0025,LABORATÓRIO DE PROGRAMAÇÃO I,GRADUAÇÃO,CHARLES ANDRYE GALVAO MADEIRA,2014,8.88,2.01,6.72,3.09,7.60,2.50,7.800
282,1217956,52665,IMD0034,VETORES E GEOMETRIA ANALÍTICA,GRADUAÇÃO,PRISCILLA TELES DE OLIVEIRA,2014,7.76,2.29,7.92,2.62,8.04,2.58,7.840


In [37]:
% matplotlib inline
from ipywidgets import interactive
import matplotlib.pyplot as plt
import numpy as np

def evolucaoGrafico(x):
    dados_prof = av_imd.loc[av_imd['nome_docente'] == x]
    plt.barh(dados_prof['nome'],dados_prof['avaliacao completa'], 0.2)
    plt.xlim(xmax=10,xmin=5) 
    plt.xlabel("Notas")
    plt.ylabel("Disciplinas")
    plt.show()
    
interactive_plot = interact(evolucaoGrafico, x=lista_prof,)