In [1]:
!pip install pandas
!pip install seaborn

# boas práticas: criar uma célula com todas as bibliotecas necessárias
# importando as bibliotecas necessárias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

[33mYou are using pip version 9.0.3, however version 10.0.1 is available.
You should consider upgrading via the 'pip install --upgrade pip' command.[0m
[33mYou are using pip version 9.0.3, however version 10.0.1 is available.
You should consider upgrading via the 'pip install --upgrade pip' command.[0m


In [72]:
# Turmas 2017.2
# http://dados.ufrn.br/dataset/turmas

# turmas
turmas_url = 'http://bit.do/turmas_ufrn_2017_2'

# matrículas em componentes em 2017.2
notas_url = 'http://bit.do/notas_ufrn_2017_2'

# componentes curriculares presenciais
disciplinas_url = 'http://bit.do/componentes_curriculares_ufrn'

# docentes da ufrn atualizado em 2018
docentes_url = 'http://bit.do/docentes_ufrn_2018'

# turmas 2017.2
turmas = pd.read_csv(turmas_url, sep=';')

# matriculas em componentes em 2017.2
notas = pd.read_csv(notas_url, sep=';')

# componentes curriculares presenciais
# por alguma razão ou outra, esse dataset tinha algum lixo em linhas que ocasionava 
# erros de leitura, dessa forma foi realizado um filtro apenas por colunas mais importantes
disciplinas = pd.read_csv(disciplinas_url, 
                          sep=';', 
                          usecols=["id_componente","codigo","nivel","nome","unidade_responsavel"])

docentes = pd.read_csv(docentes_url, sep=';')

In [73]:
# Adaptando o dataframe turma e disciplinas para o merge
# Esse procedimento é necessário pois o dataframe turma está codificado com ids

# A coluna id_componente precisa ser a mesma em ambos os dataframes
turmas.rename(columns={'id_componente_curricular': 'id_componente'}, inplace=True)

# id_componente em ambos os dataframes precisam ser do mesmo tipo
turmas.id_componente = turmas.id_componente.astype(str)

# Limpando o dataframe disciplinas com linhas desnecessárias
disciplinas = disciplinas[~disciplinas.id_componente.duplicated()]

# Pegando apenas as disciplinas do IMD
disciplinas = disciplinas[disciplinas.unidade_responsavel == 'INSTITUTO METROPOLE DIGITAL']

In [74]:
# Fazendo um merge entre o dataframe turmas e disciplinas utilizando como base a coluna id_componente
# https://pandas.pydata.org/pandas-docs/stable/merging.html
colunas = ["id_turma","codigo","nivel_ensino","nome","unidade_responsavel",
          "situacao_turma","capacidade_aluno","descricao_horario", "ano", "periodo"]

# merge os dois dataframes utilizando como base a coluna id_componenteb
disciplinas_turma = pd.merge(turmas, disciplinas, on='id_componente')[colunas]
# Caso a disciplina tenha mais de um docente ela aparece mais de uma vez, esse trecho faz com que cada turma apareça
# apenas uma vez.
disciplinas_turma = disciplinas_turma[~disciplinas_turma.id_turma.duplicated()]

In [88]:
colunas_relevantes = ["id_turma", "codigo", "nome", "descricao_horario", "ano", 
                      "periodo", "media_final", "numero_total_faltas", "descricao", "discente"]
# Merge de turma com as notas
notas_turma = pd.merge(disciplinas_turma, notas, on='id_turma')[colunas_relevantes]

# Como são 3 unidades, cada aluno aparece 3 vezes, porém estamos interessados apenas no resultado final
notas_turma = notas_turma[~notas_turma.discente.duplicated()]

In [91]:
notas_fmc = notas_turma[notas_turma.nome == 'FUNDAMENTOS MATEMÁTICOS DA COMPUTAÇÃO II']
notas_lp1 = notas_turma[notas_turma.nome == 'LINGUAGEM DE PROGRAMAÇÃO I']
notas_lp2 = notas_turma[notas_turma.nome == 'LINGUAGEM DE PROGRAMAÇÃO II']
notas_ple1 = notas_turma[notas_turma.nome == 'PRÁTICAS DE LEITURA E ESCRITA EM PORTUGUÊS I']

resultado_fmc = notas_fmc.groupby("descricao").aggregate({"numero_total_faltas": "mean"})
resultado_lp1 = notas_lp1.groupby("descricao").aggregate({"numero_total_faltas": "mean"})
resultado_lp2 = notas_lp2.groupby("descricao").aggregate({"numero_total_faltas": "mean"})
resultado_ple1 = notas_ple1.groupby("descricao").aggregate({"numero_total_faltas": "mean"})

resultado_fmc

Unnamed: 0_level_0,numero_total_faltas
descricao,Unnamed: 1_level_1
APROVADO,22.0
APROVADO POR NOTA,8.0
CANCELADO,35.333333
DESISTENCIA,
REPROVADO,24.75
REPROVADO POR MÉDIA E POR FALTAS,52.333333


In [None]:
!git add .
!git commit -m "Adicionado agregação de algumas turmas"
!git push origin master 

[master 6ff62e1] Adicionado agregação de algumas turmas
 51 files changed, 2096 insertions(+), 2622 deletions(-)
 create mode 100644 .bash_logout
 create mode 100644 .bashrc
 create mode 100644 .cache/fontconfig/3830d5c3ddfd5cd38a049b759396e72e-le64.cache-7
 create mode 100644 .cache/fontconfig/7ef2298fde41cc6eeb7af42e48b7d293-le64.cache-7
 create mode 100644 .cache/fontconfig/CACHEDIR.TAG
 create mode 100644 .cache/fontconfig/d589a48862398ed80a3d6066f4f56f4c-le64.cache-7
 create mode 100644 .cache/matplotlib/fontList.json
 create mode 100644 .cache/pip/http/1/7/b/b/4/17bb4c359c58b8944aba924db1f952f1ebf83975f86088985f70f836
 create mode 100644 .cache/pip/http/1/d/f/f/a/1dffa36c1139937cf739ab9bd630dfe7e1186e6191f77437142ea774
 create mode 100644 .cache/pip/http/3/5/8/d/9/358d9164fbffff48dd2beae0acf1ea26f4118d7610c16b731b69dcec
 create mode 100644 .cache/pip/http/4/1/b/c/0/41bc05aa331fd0cde3aff54717d1d6b8a2eea9ac70158411b9550e3f
 create mode 100644 .cache/pip/http/4/3/4/7/c/4347ce8b60a90