## Estudo inicial

A conclusão de um curso de graduação envolve a aprovação em uma sequência de matérias, muitas das quais com requisitos entre si. Em cursos de exatas, dado a complexidade dos assuntos é usual cadeias longas formadas pela matérias do ciclo básico e seguidas das dependências do ciclo das áreas específicas.

Com base no relatório de pesquisa de egressos da graduação de 2021, é percebido que cerca de $91\%$ dos alunos de engenharia mecatrônica levaram pelo menos 2 semestres a mais para formar e $38,6\%$ [$^{[1]}$][^unb-ras-2021-controle-e-automacao]. Sendo portando algo que afeta uma taxa significativa dos alunos e sendo portanto necessário um estudo para avaliar formas de mitigar o problema ou ajustar as expectativas de tempo esperado de formatura para algo um dado mais realista.

Diantes disto a proposta deste estudo é a avaliar as seguintes questões em aberto:

1. Qual o efeito de cadeias longas de dependências de matérias no tempo médio de conclusão do curso?
2. Qual o efeito da taxa de reprovação média nas matérias no tempo médio de conclusão?
3. Qual o efeito de uma alta reprovação uma matéria na quantidade de alunos por turma?

[^unb-ras-2021-controle-e-automacao]: https://avaliacao.unb.br/avaliacao-interna/pesquisa-de-egressos

### Analise a partir de distribuição Binomial

Analisando somente a cadeia mais longa e supondo:

1. Todas as matérias tenham a mesma taxa de reprovação.
2. O processo de aprovação seja aleatório e definido por um taxa de sucesso $p_{success}$ medida por $p_{success} = 1- p_{fail}$, em que $p_{fail}$ é taxa de reprovação média.

Podemos estimar a taxa de sucesso de aprovação após N matérias de forma similar ao lançamento de uma moeda N vezes.

#### Estudo taxa de sucesso

In [22]:
from scipy.stats import binom 

n = 7
p = 0.7

# defining the list of r values 
r_values = list(range(n + 1)) 

# obtaining the mean and variance  
mean, var = binom.stats(n, p) 

# list of pmf values 
dist = [binom.pmf(r, n, p) for r in r_values ]

# printing the table 
print("r\tp(r)") 
for i in range(n + 1): 
    print(str(r_values[i]) + "\t" + str(dist[i])) 

# printing mean and variance 
print("mean = "+str(mean)) 
print("variance = "+str(var))


r	p(r)
0	0.00021870000000000055
1	0.0035721000000000034
2	0.02500470000000003
3	0.0972405000000001
4	0.22689449999999997
5	0.3176523000000003
6	0.24706290000000009
7	0.08235429999999996
mean = 4.8999999999999995
variance = 1.4699999999999998


#### Distribuição de alunos após N semestres

Com base nas chances podemos estimar qual será a distribuição dos alunos de uma turma após N semestres:


In [23]:
n_students = 40
n = 7
p = 0.7

r_values = list(range(n + 1))
dist_students = [round(n_students * binom.pmf(r, n, p),0) for r in r_values]

# printing the table 
print("r\t# students(r)") 
for i in range(n + 1): 
    print(f"{r_values[i]}\t{dist_students[i]:.0f}")

r	# students(r)
0	0
1	0
2	1
3	4
4	9
5	13
6	10
7	3


Nesta primeira estimativa, teriamos que após 7 semestre com uma taxa de reprovação por matéria de $30\%$ apenas 3 estudantes teriam concluído as 7 matérias de uma turma de 40 alunos.