## Dados dos docentes

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

In [2]:
# Recuperando o CSV dos docentes
url_docentes = 'data/docentes.csv'

# Cria dataframe dos docentes
df_docentes = pd.read_csv(url_docentes, sep=';')

In [3]:
# Limpando os index
df_docentes.reset_index(drop=True,inplace=True)

In [4]:
# verificando inicialmente os dados importados
df_docentes.tail()

Unnamed: 0,id_servidor,siape,nome,formacao,tipo_jornada_trabalho,vinculo,categoria,classe_funcional,id_unidade_lotacao,lotacao,admissao
2388,17994,346866,ZIVANILSON TEIXEIRA E SILVA,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe D - Associado ...,160,DEPARTAMENTO DE ECONOMIA - DEPEC,1977-03-01 00:00:00
2389,5755561,2374871,ZORAIDE SOUZA PESSOA,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe C - Adjunto ...,1824,DEPARTAMENTO DE POLÍTICAS PÚBLICAS,2013-02-18 00:00:00
2390,21727,350630,ZORANO SERGIO DE SOUZA,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe E - Titular ...,123,DEPARTAMENTO DE GEOLOGIA,1989-01-26 00:00:00
2391,25964,2177287,ZULEIDE MARIA CARVALHO LIMA,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe D - Associado ...,142,DEPARTAMENTO DE GEOGRAFIA/CCHLA,2004-07-14 00:00:00
2392,5753039,1753896,ZULMARA VIRGINIA DE CARVALHO,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe D - Associado ...,4885,ESCOLA DE CIÊNCIAS E TECNOLOGIA,2010-01-26 00:00:00


## Aplicando filtros

Precisamos filtrar apenas os professores de nível superior

Nessa análise iremos abordar apenas os docentes que pertencem ao IMD ou ao DIMAP

In [5]:
# Tipos de categoria
print(df_docentes.categoria.unique())

['PROFESSOR DE 1  E 2  GRAUS              '
 'PROFESSOR DE ENSINO BASICO DE EX-TERRITORIO'
 'PROFESSOR DE ENSINO BASICO TECNICO E TECNOLOGICO'
 'PROFESSOR DO MAGISTERIO SUPERIOR']


In [6]:
# Recuperando os professores de graduação

docentes_graduacao = df_docentes[df_docentes.categoria == 'PROFESSOR DO MAGISTERIO SUPERIOR']
docentes_graduacao.reset_index(drop=True, inplace=True)
docentes_graduacao.head()

Unnamed: 0,id_servidor,siape,nome,formacao,tipo_jornada_trabalho,vinculo,categoria,classe_funcional,id_unidade_lotacao,lotacao,admissao
0,5752188,1679394,ABDO FARRET NETO,DOUTORADO,20 horas semanais,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe C - Adjunto ...,427,DEPARTAMENTO DE MEDICINA INTEGRADA,2009-02-09 00:00:00
1,16930,345783,ABMAEL BEZERRA DE OLIVEIRA,MESTRADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe C - Adjunto ...,112,DEPARTAMENTO DE ENGENHARIA ELÉTRICA,1973-03-01 00:00:00
2,5758354,1668850,ABRAHAO SANDERSON NUNES FERNANDES DA SILVA,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe C - Adjunto ...,5486,CERES - DEPARTAMENTO DE HISTÓRIA,2016-04-08 00:00:00
3,23906,1222082,ADA CRISTINA SCUDELARI,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe E - Titular ...,52,DEPARTAMENTO DE ENGENHARIA CIVIL,1997-04-22 00:00:00
4,5754609,6345784,ADAILDO GOMES D ASSUNCAO,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe E - Titular ...,5204,DEPARTAMENTO DE ENGENHARIA DE COMUNICACOES,2011-12-01 00:00:00


In [7]:
# Verificando todos os departamentos

print(docentes_graduacao.lotacao.unique())

['DEPARTAMENTO DE MEDICINA INTEGRADA'
 'DEPARTAMENTO DE ENGENHARIA ELÉTRICA' 'CERES - DEPARTAMENTO DE HISTÓRIA'
 'DEPARTAMENTO DE ENGENHARIA CIVIL'
 'DEPARTAMENTO DE ENGENHARIA DE COMUNICACOES'
 'ESCOLA MULTICAMPI DE CIÊNCIAS MÉDICAS DO RIO GRANDE DO NORTE'
 'ESCOLA DE CIÊNCIAS E TECNOLOGIA'
 'DEPARTAMENTO DE ENGENHARIA DE COMPUTACAO E AUTOMACAO'
 'INSTITUTO DE QUÍMICA' 'DEPARTAMENTO DE GEOFÍSICA'
 'DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS - DCC'
 'DEPARTAMENTO DE ENGENHARIA MECANICA'
 'DEPARTAMENTO DE FUNDAMENTOS E POLÍTICAS DA EDUCAÇÃO'
 'INSTITUTO METROPOLE DIGITAL' 'DEPARTAMENTO DE FARMACIA'
 'DEPARTAMENTO DE ANÁLISES CLÍNICAS E TOXICOLÓGICAS'
 'DEPARTAMENTO DE ODONTOLOGIA'
 'FACULDADE DE CIÊNCIAS DA SAÚDE DO TRAIRI - FACISA'
 'DEPARTAMENTO DE BIOLOGIA CELULAR E GENÉTICA'
 'DEPARTAMENTO DE LINGUAS E LITERATURAS ESTRANGEIRAS MODERNAS'
 'DEPARTAMENTO DE ECOLOGIA' 'DEPARTAMENTO DE BOTÂNICA E ZOOLOGIA'
 'DEPARTAMENTO DE COMPUTAÇÃO E TECNOLOGIA' 'INSTITUTO DO CÉREBRO'
 'DEPARTAMENTO DE COMUNI

In [8]:
# Recuperando docentes do imd ou dimap

docentes_imd = docentes_graduacao[(docentes_graduacao.lotacao == 'DEPARTAMENTO DE INFORMÁTICA E MATEMÁTICA APLICADA') | (docentes_graduacao.lotacao ==  'INSTITUTO METROPOLE DIGITAL')]
docentes_imd.reset_index(drop=True, inplace=True)
docentes_imd.head()

Unnamed: 0,id_servidor,siape,nome,formacao,tipo_jornada_trabalho,vinculo,categoria,classe_funcional,id_unidade_lotacao,lotacao,admissao
0,5755281,2451906,ADJA FERREIRA DE ANDRADE,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe C - Adjunto ...,6069,INSTITUTO METROPOLE DIGITAL,2012-11-01 00:00:00
1,5755819,2645969,ANDERSON PAIVA CRUZ,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe C - Adjunto ...,6069,INSTITUTO METROPOLE DIGITAL,2013-04-25 00:00:00
2,5757969,2278573,ANDRE LUIZ DA SILVA SOLINO,MESTRADO,20 horas semanais,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe A - Assistente A ...,6069,INSTITUTO METROPOLE DIGITAL,2016-01-19 00:00:00
3,24949,1363515,ANDRE MAURICIO CUNHA CAMPOS,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe D - Associado ...,125,DEPARTAMENTO DE INFORMÁTICA E MATEMÁTICA APLICADA,2002-10-08 00:00:00
4,5759298,1885001,ANNA GISELLE CAMARA DANTAS RIBEIRO RODRIGUES,DOUTORADO,Dedicação exclusiva,Ativo Permanente,PROFESSOR DO MAGISTERIO SUPERIOR,Classe A - Adjunto A ...,6069,INSTITUTO METROPOLE DIGITAL,2017-05-26 00:00:00


## Dados das Matriculas

In [9]:
#Importa turmas ingressantes de 2017 a 2015
url_ingressantes2017_1 = 'data/matricula-componente-20171.csv'
url_ingressantes2017_2 = 'data/matricula-componente-20172.csv'
url_ingressantes2016_1 = 'data/matriculas-de-2016.1.csv'
url_ingressantes2016_2 = 'data/matriculas-de-2016.2.csv'
url_ingressantes2015_1 = 'data/matriculas-de-2015.1.csv'
url_ingressantes2015_2 = 'data/matriculas-de-2015.2.csv'

#Cria dataframe com as turmas importadas
df_ingressantes2017_1 = pd.read_csv(url_ingressantes2017_1, sep=';')
df_ingressantes2017_2 = pd.read_csv(url_ingressantes2017_2, sep=';')
df_ingressantes2016_1 = pd.read_csv(url_ingressantes2016_1, sep=';')
df_ingressantes2016_2 = pd.read_csv(url_ingressantes2016_2, sep=';')
df_ingressantes2015_1 = pd.read_csv(url_ingressantes2015_1, sep=';')
df_ingressantes2015_2 = pd.read_csv(url_ingressantes2015_2, sep=';')

In [10]:
#Inserindo dados em uma lista
matriculas = []

for i in range(15,18):
    for j in range (1,2):
        matriculas.append(vars()['df_ingressantes20%d_%d' % (i, j)])

In [11]:
# concatenando todas as listas em um dataframe
df_matriculas = pd.concat(matriculas)

# limpandos os index após o merge
df_matriculas.reset_index(drop=True,inplace=True)

of pandas will change to not sort by default.

To accept the future behavior, pass 'sort=True'.


  


In [12]:
# verificando inicialmente os dados importados
df_matriculas.tail()

Unnamed: 0,Unnamed: 10,descricao,discente,faltas_unidade,id_curso,id_turma,media_final,nota,numero_total_faltas,reposicao,unidade
2184750,,APROVADO,7bdfaae8ed8e5bd0a485ac9ea36f9b0b,0.0,107700483.0,57609573,10.0,10.0,0.0,f,2.0
2184751,,APROVADO,7bdfaae8ed8e5bd0a485ac9ea36f9b0b,0.0,107700483.0,57609573,10.0,10.0,0.0,f,1.0
2184752,,APROVADO,88a36d9161c908f6869b5a53a2dcae78,0.0,107700483.0,57609573,10.0,10.0,0.0,f,3.0
2184753,,APROVADO,88a36d9161c908f6869b5a53a2dcae78,0.0,107700483.0,57609573,10.0,10.0,0.0,f,2.0
2184754,,APROVADO,88a36d9161c908f6869b5a53a2dcae78,0.0,107700483.0,57609573,10.0,10.0,0.0,f,1.0


In [13]:
# Filtrar o curso de tecnologia da informação, que o código é 92127264

matriculas_imd = df_matriculas[df_matriculas.id_curso == 92127264]
matriculas_imd.reset_index(drop=True, inplace=True)
matriculas_imd.head()

Unnamed: 0,Unnamed: 10,descricao,discente,faltas_unidade,id_curso,id_turma,media_final,nota,numero_total_faltas,reposicao,unidade
0,,EXCLUIDA,3a3517f48b6be60b7f3a037b5903a1ce,,92127264.0,1239422,,,,,
1,,REPROVADO,5dac5cab88de4928bbc3095150f768ff,0.0,92127264.0,1239422,4.4,4.2,14.0,f,1.0
2,,REPROVADO,5dac5cab88de4928bbc3095150f768ff,0.0,92127264.0,1239422,4.4,4.4,14.0,f,2.0
3,,REPROVADO,5dac5cab88de4928bbc3095150f768ff,0.0,92127264.0,1239422,4.4,4.5,14.0,f,3.0
4,,CANCELADO,24292b4819c3eca27d1e7dfadc935a4b,0.0,92127264.0,1239422,,0.0,0.0,f,1.0


In [14]:
# Investigando a descrição das matriculas

print(matriculas_imd.descricao.unique())

['EXCLUIDA' 'REPROVADO' 'CANCELADO' 'APROVADO' 'APROVADO POR NOTA'
 'INDEFERIDO' 'REPROVADO POR MÉDIA E POR FALTAS' 'DESISTENCIA' 'TRANCADO'
 'REPROVADO POR FALTAS' 'REPROVADO POR NOTA' 'REPROVADO POR NOTA E FALTA']


In [15]:
# Removendo matriculas que foram excluidas
matriculas_consolidadas = matriculas_imd[(matriculas_imd.descricao != 'EXCLUIDA') & (matriculas_imd.descricao != 'CANCELADO')]
matriculas_consolidadas.reset_index(drop=True, inplace=True)
matriculas_consolidadas.head()

Unnamed: 0,Unnamed: 10,descricao,discente,faltas_unidade,id_curso,id_turma,media_final,nota,numero_total_faltas,reposicao,unidade
0,,REPROVADO,5dac5cab88de4928bbc3095150f768ff,0.0,92127264.0,1239422,4.4,4.2,14.0,f,1.0
1,,REPROVADO,5dac5cab88de4928bbc3095150f768ff,0.0,92127264.0,1239422,4.4,4.4,14.0,f,2.0
2,,REPROVADO,5dac5cab88de4928bbc3095150f768ff,0.0,92127264.0,1239422,4.4,4.5,14.0,f,3.0
3,,APROVADO,bcd9e4d861acc00fac216bbe953c63b8,0.0,92127264.0,1239422,7.9,7.6,2.0,f,2.0
4,,APROVADO,bcd9e4d861acc00fac216bbe953c63b8,0.0,92127264.0,1239422,7.9,8.4,2.0,f,1.0


## Dados das turmas

In [16]:
#Importa turmas ingressantes de 2017 a 2015
url_ingressantes2017_1 = 'data/turmas-2017.1.csv'
url_ingressantes2017_2 = 'data/turmas-2017.2.csv'
url_ingressantes2016_1 = 'data/turmas-2016.1.csv'
url_ingressantes2016_2 = 'data/turmas-2016.2.csv'
url_ingressantes2015_1 = 'data/turmas-2015.1.csv'
url_ingressantes2015_2 = 'data/turmas-2015.2.csv'

#Cria dataframe com as turmas importadas
df_ingressantes2017_1 = pd.read_csv(url_ingressantes2017_1, sep=';')
df_ingressantes2017_2 = pd.read_csv(url_ingressantes2017_2, sep=';')
df_ingressantes2016_1 = pd.read_csv(url_ingressantes2016_1, sep=';')
df_ingressantes2016_2 = pd.read_csv(url_ingressantes2016_2, sep=';')
df_ingressantes2015_1 = pd.read_csv(url_ingressantes2015_1, sep=';')
df_ingressantes2015_2 = pd.read_csv(url_ingressantes2015_2, sep=';')

In [17]:
#Inserindo dados em uma lista
ingressantes = []

for i in range(15,18):
    for j in range (1,2):
        ingressantes.append(vars()['df_ingressantes20%d_%d' % (i, j)])

In [18]:
# concatenando todas as listas em um dataframe
df_ingressantes = pd.concat(ingressantes)

# limpandos os index após o merge
df_ingressantes.reset_index(drop=True,inplace=True)

In [19]:
# verificando inicialmente os dados importados
df_ingressantes.tail()

Unnamed: 0,id_turma,codigo_turma,id_docente_interno,id_docente_externo,observacao,id_componente_curricular,nivel_ensino,campus_turma,local,ano,...,tipo,distancia,data_consolidacao,agrupadora,id_turma_agrupadora,qtd_aulas_lancadas,situacao_turma,convenio,modalidade_participantes,Unnamed: 25
43164,57612971,1,,109527932.0,,57952,TÉCNICO,,MACAÍBA,2017,...,REGULAR,f,2018-01-26 14:05:35.037,f,,0.0,CONSOLIDADA,,Presencial,
43165,57613796,1,,119896305.0,,66448,FORMAÇÃO COMPLEMENTAR,,,2017,...,REGULAR,t,,f,,,ABERTA,,A Distância,
43166,57613796,1,,101052958.0,,66448,FORMAÇÃO COMPLEMENTAR,,,2017,...,REGULAR,t,,f,,,ABERTA,,A Distância,
43167,57613798,2,,101052958.0,,66448,FORMAÇÃO COMPLEMENTAR,,,2017,...,REGULAR,t,,f,,,ABERTA,,A Distância,
43168,57613798,2,,119896305.0,,66448,FORMAÇÃO COMPLEMENTAR,,,2017,...,REGULAR,t,,f,,,ABERTA,,A Distância,


In [20]:
# niveis de ensino
df_ingressantes.nivel_ensino.unique()

array(['LATO SENSU', 'TÉCNICO', 'GRADUAÇÃO', 'STRICTO SENSU',
       'RESIDÊNCIA', 'FORMAÇÃO COMPLEMENTAR'], dtype=object)

In [21]:
# filtrando apenas os alunos da graduação
graduacao = df_ingressantes[df_ingressantes.nivel_ensino == 'GRADUAÇÃO']
graduacao.reset_index(drop=True, inplace=True)
graduacao.head()

Unnamed: 0,id_turma,codigo_turma,id_docente_interno,id_docente_externo,observacao,id_componente_curricular,nivel_ensino,campus_turma,local,ano,...,tipo,distancia,data_consolidacao,agrupadora,id_turma_agrupadora,qtd_aulas_lancadas,situacao_turma,convenio,modalidade_participantes,Unnamed: 25
0,1239272,1,5756213.0,,,52656,GRADUAÇÃO,Campus Central,B203 no CIVT,2015,...,REGULAR,f,,f,,,EXCLUÍDA,,Presencial,
1,1239275,1,5757161.0,,,2041854,GRADUAÇÃO,Campus Central,DNUT / Sala 2,2015,...,REGULAR,f,2015-06-23 09:49:33.375,f,,34.0,CONSOLIDADA,,Presencial,
2,1239275,1,22932.0,,,2041854,GRADUAÇÃO,Campus Central,DNUT / Sala 2,2015,...,REGULAR,f,2015-06-23 09:49:33.375,f,,34.0,CONSOLIDADA,,Presencial,
3,1239275,1,1574976.0,,,2041854,GRADUAÇÃO,Campus Central,DNUT / Sala 2,2015,...,REGULAR,f,2015-06-23 09:49:33.375,f,,34.0,CONSOLIDADA,,Presencial,
4,1239276,1,5752774.0,,,2045600,GRADUAÇÃO,Campus Central,DNUT / Sala 1,2015,...,REGULAR,f,2015-06-19 10:28:09.708,f,,87.0,CONSOLIDADA,,Presencial,


In [22]:
#Tipo de turmas
graduacao.tipo.unique()

array(['REGULAR', 'REPOSIÇÃO NO PERÍODO REGULAR', 'ENSINO INDIVIDUAL'],
      dtype=object)

In [23]:
# Filtrando apenas turmas regulares
turmas = graduacao[graduacao.tipo == 'REGULAR']
turmas.reset_index(drop=True, inplace=True)
turmas.head()

Unnamed: 0,id_turma,codigo_turma,id_docente_interno,id_docente_externo,observacao,id_componente_curricular,nivel_ensino,campus_turma,local,ano,...,tipo,distancia,data_consolidacao,agrupadora,id_turma_agrupadora,qtd_aulas_lancadas,situacao_turma,convenio,modalidade_participantes,Unnamed: 25
0,1239272,1,5756213.0,,,52656,GRADUAÇÃO,Campus Central,B203 no CIVT,2015,...,REGULAR,f,,f,,,EXCLUÍDA,,Presencial,
1,1239275,1,5757161.0,,,2041854,GRADUAÇÃO,Campus Central,DNUT / Sala 2,2015,...,REGULAR,f,2015-06-23 09:49:33.375,f,,34.0,CONSOLIDADA,,Presencial,
2,1239275,1,22932.0,,,2041854,GRADUAÇÃO,Campus Central,DNUT / Sala 2,2015,...,REGULAR,f,2015-06-23 09:49:33.375,f,,34.0,CONSOLIDADA,,Presencial,
3,1239275,1,1574976.0,,,2041854,GRADUAÇÃO,Campus Central,DNUT / Sala 2,2015,...,REGULAR,f,2015-06-23 09:49:33.375,f,,34.0,CONSOLIDADA,,Presencial,
4,1239276,1,5752774.0,,,2045600,GRADUAÇÃO,Campus Central,DNUT / Sala 1,2015,...,REGULAR,f,2015-06-19 10:28:09.708,f,,87.0,CONSOLIDADA,,Presencial,


In [24]:
#Verifica situações das turmas
turmas.situacao_turma.unique()

array(['EXCLUÍDA', 'CONSOLIDADA', 'INTERROMPIDA', 'ABERTA'], dtype=object)

In [25]:
#Filtrando apenas as turmas consolidadas

turmas_consolidadas = turmas[turmas.situacao_turma == 'CONSOLIDADA']
turmas_consolidadas.reset_index(drop=True, inplace=True)
turmas_consolidadas.head()

Unnamed: 0,id_turma,codigo_turma,id_docente_interno,id_docente_externo,observacao,id_componente_curricular,nivel_ensino,campus_turma,local,ano,...,tipo,distancia,data_consolidacao,agrupadora,id_turma_agrupadora,qtd_aulas_lancadas,situacao_turma,convenio,modalidade_participantes,Unnamed: 25
0,1239275,1,5757161.0,,,2041854,GRADUAÇÃO,Campus Central,DNUT / Sala 2,2015,...,REGULAR,f,2015-06-23 09:49:33.375,f,,34.0,CONSOLIDADA,,Presencial,
1,1239275,1,22932.0,,,2041854,GRADUAÇÃO,Campus Central,DNUT / Sala 2,2015,...,REGULAR,f,2015-06-23 09:49:33.375,f,,34.0,CONSOLIDADA,,Presencial,
2,1239275,1,1574976.0,,,2041854,GRADUAÇÃO,Campus Central,DNUT / Sala 2,2015,...,REGULAR,f,2015-06-23 09:49:33.375,f,,34.0,CONSOLIDADA,,Presencial,
3,1239276,1,5752774.0,,,2045600,GRADUAÇÃO,Campus Central,DNUT / Sala 1,2015,...,REGULAR,f,2015-06-19 10:28:09.708,f,,87.0,CONSOLIDADA,,Presencial,
4,1239276,1,5757037.0,,,2045600,GRADUAÇÃO,Campus Central,DNUT / Sala 1,2015,...,REGULAR,f,2015-06-19 10:28:09.708,f,,87.0,CONSOLIDADA,,Presencial,


## Filtragem de taxa de aprovação de professores

A relação que temos é: Docentes 1..n Turmas 1..n Matriculas 
Então trabalhando com um id de componente específico podemos recuperar as turmas, quem estavam matriculados nela e quem dava aula

In [26]:
#FMC1 55022
#FMC2 55025
id_componente = 55025

# FIltrando turmas pelo id_componente

turmas_filtradas = turmas[turmas.id_componente_curricular == 55025]
turmas_filtradas = turmas_filtradas.filter(items=['id_turma', 'id_componente_curricular', 'ano', 'id_docente_interno'])
turmas_filtradas.head()

Unnamed: 0,id_turma,id_componente_curricular,ano,id_docente_interno
797,1239537,55025,2015,25889.0
800,1239541,55025,2015,24798.0
16288,57576738,55025,2016,5757768.0
20166,57579587,55025,2016,24798.0
20167,57579588,55025,2016,5757958.0


In [29]:
teste.head()

Unnamed: 0,id_turma,id_componente_curricular,ano,id_docente_interno,id_servidor,nome,formacao,aprovacao,total_alunos
0,1239537,55025,2015,25889.0,25889,LOURENA KARIN DE MEDEIROS ROCHA,MESTRADO,,
1,1239541,55025,2015,24798.0,24798,REGIVAN HUGO NUNES SANTIAGO,DOUTORADO,,
2,57579587,55025,2016,24798.0,24798,REGIVAN HUGO NUNES SANTIAGO,DOUTORADO,,
3,57576738,55025,2016,5757768.0,5757768,UMBERTO RIVIECCIO,DOUTORADO,,
4,57579588,55025,2016,5757958.0,5757958,ATHANASIOS TSOUANAS,DOUTORADO,,


In [32]:
matriculas_imd.head()

Unnamed: 0,Unnamed: 10,descricao,discente,faltas_unidade,id_curso,id_turma,media_final,nota,numero_total_faltas,reposicao,unidade
0,,EXCLUIDA,3a3517f48b6be60b7f3a037b5903a1ce,,92127264.0,1239422,,,,,
1,,REPROVADO,5dac5cab88de4928bbc3095150f768ff,0.0,92127264.0,1239422,4.4,4.2,14.0,f,1.0
2,,REPROVADO,5dac5cab88de4928bbc3095150f768ff,0.0,92127264.0,1239422,4.4,4.4,14.0,f,2.0
3,,REPROVADO,5dac5cab88de4928bbc3095150f768ff,0.0,92127264.0,1239422,4.4,4.5,14.0,f,3.0
4,,CANCELADO,24292b4819c3eca27d1e7dfadc935a4b,0.0,92127264.0,1239422,,0.0,0.0,f,1.0


In [None]:
teste.a

In [48]:
# .filter(items=[])
docentes_imd = df_docentes[['id_servidor', 'nome', 'formacao']]

# Turmas FC2
turmas_fmc_ii = pd.merge(turmas_filtradas, docentes_imd, left_on='id_docente_interno', right_on='id_servidor', how='inner')

turmas_fmc_ii['aprovacao'] = 'NaN'
turmas_fmc_ii['total_alunos'] = 'NaN'

for index, row in teste.iterrows():
    turmas_fmc_ii.loc[index, 'aprovacao'] = matriculas_imd[np.logical_and(
        matriculas_imd['id_turma'] == row['id_turma'],
        matriculas_imd['descricao'].isin(['APROVADO', 'APROVADO POR NOTA'])
    )]['discente'].count() * 100)
    matriculas_imd[
            matriculas_imd['id_turma'] == row['id_turma']
    ]['discente'].count()

turmas_fmc_ii

SyntaxError: invalid syntax (<ipython-input-48-b8659daef67e>, line 15)