In [1]:
%%html

<!-- Configurando os estilos para este documento, similar à uma página web -->
<link href="https://cdn.jsdelivr.net/npm/bootstrap@5.0.1/dist/css/bootstrap.min.css" rel="stylesheet" integrity="sha384-+0n0xVW2eSR5OomGNYDnhzAbDsOXxcvSN1TPprVMTNDbiYZCxYbOOl7+AMvyTG2x" crossorigin="anonymous">
<script src="https://cdn.jsdelivr.net/npm/bootstrap@5.0.1/dist/js/bootstrap.bundle.min.js" integrity="sha384-gtEjrD/SeCtmISkJkNUaaKMoLD0//ElJ19smozuHV6z3Iehds+3Ulb9Bn9Plx0x4" crossorigin="anonymous"></script>

<style>
   .center {
      display: block;
      margin-left: auto;
      margin-right: auto;
    }
    mark {
        background-color: yellow;
        color: black;
        font-weigth: bold;
    }
    strong {
        color: red;
        font-weigth: bold;
    }
</style>

# Configurações e imports

## Configurando atalhos para o ipython

In [2]:
# %magic -brief

In [3]:
# execute %docs para abrir a documentação no chrome
%alias docs chrome doc/build/html/index.html > /dev/null

# execute %outs para abrir a pasta out
%alias outs chrome ../out/ > /dev/null

# alias to delete (under windows)
%alias rm del

# habilita o autocomplete
%config IPCompleter.greedy = True

# exibe todas as funcões disponíveis
# %magic -brief

## Imports globais (compartilhados)

In [4]:
# Utilities
from importlib import reload
from itertools import takewhile

# Pretty print
from pprint import pprint

# copy
from copy import deepcopy

# Import function to handle with paths
import os
from os import path

# Dataframe"
import pandas as pd

# math library
import numpy as np

# typings
from typing import List,Dict, Tuple, final, Final, Union

# logger configs
import logging, logging.config

# plotling functions
from modules import Plot, util

# date
from datetime import datetime

## Configurações default do ambiente

In [5]:
# current date
DATE: str = datetime.now().strftime("%Y-%m-%d")

# configuring default round places to this project
ROUND_PLACES: int = 3

# mongodb connection string
#CONNECTION_STRING: Final[str] = "mongodb://ppcamp:DRrPaRrHqmaWo43D@localhost:27017/?authSource=admin"
CONNECTION_STRING: Final[str] = ""

# Graph's plot directory
GRAPHS_DIR: Final[str] = path.realpath('../out/competency_graphs')
COMPETENCES_DIR: Final[str] = path.realpath('../out/competency_barplots')

# Output directory
OUT_DIR: Final[str] = path.realpath('../out')

# getting logger configs
logging.config.fileConfig('logging.conf', defaults={ 'logfilename': DATE })
# choosing logger
log: Final[logging.Logger] = logging.getLogger('main')

### Removendo arquivos de saídas (plots)

In [6]:
# %rm ../out/graphs/*
# %rm ../out/gsheets_competences_plot/*

# Análise sobre o perfil dos alunos formandos/formados do curso de Engenharia de Computação

## Obtendo a grade

Obtendo a grade do curso de computação 2015, com pré e có requisitos

In [7]:
# Módulo usado para obter a grade (do banco ou realiza raspagem)
from modules.grid import Grid
from networkx import DiGraph

# Não deve alterar estes grafos
pre: DiGraph
co: DiGraph
pre, co = Grid.get_grid(
    '0192015', 
    CONNECTION_STRING
)

## Obtêm os pesos das competências

### Lendo os arquivos CSVs

Obtidos através das "planilhas do Google"

In [8]:
from modules import Skillset

# Google sheet's (csv's) directory
SHEETS_DIR: Final[str] = path.realpath('../assets/sheets')

# Faz a leitura dos arquivos csvs
_csvs:Skillset.DataFrames = Skillset.read_csvs(SHEETS_DIR)

del SHEETS_DIR

### Juntando as competências em um único dataframe

Atualmente, realiza a média das competências, isso quer dizer que, nos cenários onde os alunos não responderam, a média irá afetar o negativamente o cenário que houveram respostas.

Em suma, realiza a média das células (posições ixj) com base nas entradas de dataframes

In [9]:
# Realiza a média dos arquivos de competências
out:pd.DataFrame = Skillset.merge_data(_csvs)

# Remove os csvs não utilizados
del _csvs

### Normalizando as competências

Num primeiro momento, é requisitado ao usuário que preencha as planilhas - `</assets/sheets>` - com valores 
até 10 para cada linha, ou seja, que cada matéria seja dividida entre competências internas, de forma que a 
soma destas competências, represente a matéria.

Uma vez que as linhas estejam "normalizadas", deverá ser feito a normalização por colunas, garantindo que 
uma determinada competência seja adquirida até um certo máximo, ou seja, 100%, no decorrer do curso

Ao normalizar por coluna<sup>1</sup>, temos que, a cada período, uma porcentagem do valor final que será analisada.

---

<sup>1</sup>.: Observe também que, ao normalizar por colunas, fazemos a seguinte convenção:
> Uma vez que a disciplina exista na grade, o peso relacionado é de acordo com esta
> competência, i.e, se a competência possuía 0.25 em apenas uma _única_ matéria, estaremos
> assumindo que a competência irá existir, e no curso, o maior valor possível será 100% de
> aproveitamento nesta. Analisando por exemplo, o cenário de _Desenvolvimento Web e Mobile_
>
> <cite> -- Pedro</cite>

In [10]:
# obtém a soma de cada coluna
_column_sum = out.apply(np.sum, axis=0)

# normaliza pelo maior valor cada coluna
for col in out.columns:
    out.loc[:, col] /= _column_sum[col]

# arredondando
out = out.round(4)

# conferindo se cada coluna (competência) terá sido propagada em seu máximo (100%)
# out.apply(np.sum,axis=0)

del col, _column_sum

Outros códigos úteis

```python
# exportando o dataframe
out.to_csv(path.realpath('../out/df_competencias_gsheet.csv'))
# soma de colunas
out.sum()
# exibindo onde é diferente de 0
out.loc[out['Desenvolvimento Web e Mobile'] != 0, 'Desenvolvimento Web e Mobile']
# somando uma coluna em específico
out['Desenvolvimento Web e Mobile'].sum()
```

## Gerando um grafo da grade com base na relação de competências

- Cada competência gera um único _grafo_, assim, é necessário propagar os nós para todos os grafos e atribuir os vértices de acordo com a entrada dos alunos nos arquivos de **competências**

In [11]:
from networkx import DiGraph

# Obtendo uma cópia do grafo de pré requisito (este grafo possui o período de cada disciplina)
nodes:DiGraph = pre.copy()

# Removendo os vértices (conexões, que nates eram os pré requisitos)
nodes.remove_edges_from(list(nodes.edges()))

# Removendo os nós que não constam naquela planilha
nos_para_remocao:List[str] = [no for no in list(nodes.nodes()) if no not in out.index.to_list()]
nodes.remove_nodes_from(nos_para_remocao)

# remove variáveis que não serão mais utilizadas
del nos_para_remocao, pre, co

### Gerando os grafos de competências

Os grafos são montados para cada competência obtida do dataframe da média dos _csvs_

É feita uma normalização por período também, de forma que, para cada período, o máximo que pode ser propagado de uma competência para outra é 100%

> Confira a documentação da função para obter uma melhor visualização do funcionamento desta.
<figure>
    <img 
         al="Exemplo de um grafo"
         class="img-fluid rounded"
         weight="100%"
         src="./doc/source/_static/img/graph_example_desenvolvimento_web_2.png" />
    <figcaption class="text-center">Grafo, versão para o <i>BFS</i></figcaption>
</figure>

In [12]:
# visualizando os plots de competências (gsheets_competences_plot)
# %gchrome ../out/gsheets_competences_plot

In [13]:
from modules.grid import Competence

grafos = Competence.BFS.generate_graphs(out, nodes)
# storing the graph
# nx.write_gpickle(grafos['Desenvolvimento Web e Mobile'], '../out/web_graph.gpickle')
# nx.read_gpickle('../out/web_graph.gpickle')

del nodes, out

### Realizando o plot destes grafos

In [14]:
# Realiza o plot do grafo/grade
from modules.grid import Plot as PltGraph

# Itera sobre cada grafo de competencia
for competencia in grafos.keys():
    # Gera um plot para cada um com o peso saindo de cada matéria
    PltGraph.weighted_graph(
        grafos[competencia].nodes(),
        list(grafos[competencia].edges(data=True)),
        competencia.title().replace(' ','').replace('.',''),
        path.join(OUT_DIR,'competency_graphs'))

del competencia

sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found
sh: 1: dot: not found


In [15]:
# visualizando os grafmateria_atual = out.where(out == 1.0).dropna(how='all').index.tolist()[0]os (graphs)
# %gchrome ../out/graphs

## Obtendo a nota do aluno através do json

In [24]:
from modules import Score
import json

student_grid_str: str = path.join('..','assets','parsed_scores','2016001942.json')

# obtém o histórico de um único estudante
student_grid = Score.read_json(student_grid_str)

### Lendo o arquivo JSON que contém a nota

In [25]:
# abre a pasta que fica os arquivos de histórico já convertidos (do pdf para json)
# %gchrome ../assets/parsed_scores

### Obtendo apenas um dicionário relacionando nota e matérias

Também realiza a modificação dos dados para o cenário de reprovação

No **caso de bomba**, para não afetar a percepção de competência quanto ao que o aluno sabe, **será propagado a maior nota**, sendo esta, a que o aluno obteve êxito.

Uma vez que desejamos saber apenas a relação de competências, pressupõe-se que o aluno, ao ser aprovado, adiquiriu tais competências, desta forma, seu índice não deve ser penalizado pelas vezes que reprovou na disciplina

In [26]:
# Dicionário que irá obter a maior nota para cada disciplina que o aluno fez
notas: Dict[str,float] = {}

# anda sobre os períodos
for periodo in student_grid:
    # obtêm as matérias do período
    periodo_vetor = student_grid[periodo]
    
    # itera sobre as matérias"
    for materia in periodo_vetor:
        # obtém a nota de uma determinada matéria
        score = periodo_vetor[materia]['scores']

        # pode ser uma string ("--") se ainda está cursando a matéria, ignora
        if type(score) is str:
            continue
        score = float(score)

        # Verifica se o aluno já fez a matéria
        if materia in notas:
            # Coloca a maior nota do aluno, caso este já tenha repetido a matéria
            notas[materia]: float = max(notas[materia], score)
        else:
            # Primeira vez que fez a matéria
            notas[materia]: float = score

del (
    periodo,
    periodo_vetor,
    materia,
    score,
    student_grid)

### Obtendo a nota do aluno ideal

O aluno ideal fez todas as disciplinas possíveis e passou com 10 em tudo

In [27]:
# peguei um grafo qualquer, uma vez que todos possuem todos os nós
aluno_ideal = {key: 10.0 for key in grafos['Matemática e física'].nodes()}

### Função que gera a as notas de alunos bons em hardware/software

Disciplinas com base no tipo

In [76]:
hu = np.union1d(Score.DISCIPLINES['HARDWARE'],Score.DISCIPLINES['UNCLASSIFIED'])
su = np.union1d(Score.DISCIPLINES['SOFTWARE'],Score.DISCIPLINES['UNCLASSIFIED'])

In [78]:
def getval(k: str, l: List[str]) -> float:
  """
  Generate values basing on list.

  Args
  ----
  `k`:
    The keyword (student class)
  `l`:
    The focused classes

  Note
  ----
  Since that the student will be focused in the values on the list, the score
  itself should be more biased.
  """
  return Score.gen_score(start=7.5,end=10.0) if k in l else Score.gen_score(start=6.0, end=9.0)

In [79]:
aluno_ideal_hardware = {key: getval(key,hu) for key in grafos['Matemática e física'].nodes()}
aluno_ideal_software = {key: getval(key,su) for key in grafos['Matemática e física'].nodes()}

In [136]:
aluno_ideal_software

{'ECOI01': 7.65,
 'ECOI02': 8.81,
 'ECOI03': 7.57,
 'EMEI02': 7.86,
 'FISI01': 9.75,
 'HUMI01': 8.23,
 'HUMI02': 9.3,
 'MATI01': 8.3,
 'MATI02': 8.05,
 'ECOI04': 8.92,
 'EELI02': 8.03,
 'EELI03': 7.27,
 'EMEI06': 9.21,
 'EMTI02': 9.58,
 'EMTI03': 9.81,
 'FISI02': 7.73,
 'FISI03': 9.08,
 'MATI03': 7.56,
 'ECOI08': 8.88,
 'ECOI61': 7.76,
 'EMBI02': 8.53,
 'EMEI07': 8.83,
 'EMEI08': 7.68,
 'FISI04': 8.11,
 'HUMI06': 9.5,
 'MATI06': 8.34,
 'MATI07': 9.84,
 'ECOI09': 9.17,
 'EELI07': 6.54,
 'FISI05': 7.88,
 'FISI07': 8.22,
 'MATI04': 9.43,
 'MATI05': 7.6,
 'MATI08': 9.03,
 'ECAI26': 8.64,
 'ECOI10': 8.83,
 'ECOI11': 9.44,
 'ECOI12': 6.97,
 'ECOI14': 7.51,
 'EELI10': 8.18,
 'EELI11': 7.04,
 'FISI06': 8.44,
 'ECAI29': 9.76,
 'ECOI15': 8.52,
 'ECOI16': 9.59,
 'ECOI32': 7.57,
 'EELI12': 8.99,
 'EELI13': 6.4,
 'EELI14': 6.98,
 'EELI15': 7.52,
 'ECAI04': 8.99,
 'ECAI11': 6.69,
 'ECAI13': 6.96,
 'ECAI44': 6.46,
 'ECOI13': 9.75,
 'ECOI18': 7.07,
 'ECOI19': 8.99,
 'ECOI33': 6.05,
 'ECAI05': 6.85,
 '

## DEBUG: Calculando a distribuição normal das notas

In [82]:
norm_notas = np.array(list(notas.values()))

### Média

In [83]:
np.mean(norm_notas)

7.59041095890411

### Mediana

In [84]:
aux = np.sort(norm_notas)
if aux.size %2 != 0:
    print(aux[aux.size//2 + 1])
else:
    print(np.average([aux[aux.size//2], aux[aux.size//2 + 1]]))

7.5


### Variância

In [85]:
np.var(norm_notas)

1.5159354475511355

### Dispersão

In [86]:
max(norm_notas) - min(norm_notas)

6.4

### Desvio padrão

In [87]:
np.std(norm_notas)

1.2312333034608574

### Distribuição de intervalos de notas

In [88]:
from itertools import count

In [89]:
freq = []
val = np.arange(0,10.5,0.5)
for i in range(1,len(val)):
    count = len(list(filter(lambda x: x > val[i-1] and x <= val[i], norm_notas)))
    print(f'Entre {val[i-1]} e {val[i]} == {count}')
    freq.append(count)

Entre 0.0 e 0.5 == 0
Entre 0.5 e 1.0 == 0
Entre 1.0 e 1.5 == 0
Entre 1.5 e 2.0 == 0
Entre 2.0 e 2.5 == 0
Entre 2.5 e 3.0 == 0
Entre 3.0 e 3.5 == 0
Entre 3.5 e 4.0 == 1
Entre 4.0 e 4.5 == 0
Entre 4.5 e 5.0 == 0
Entre 5.0 e 5.5 == 0
Entre 5.5 e 6.0 == 4
Entre 6.0 e 6.5 == 13
Entre 6.5 e 7.0 == 8
Entre 7.0 e 7.5 == 12
Entre 7.5 e 8.0 == 10
Entre 8.0 e 8.5 == 10
Entre 8.5 e 9.0 == 8
Entre 9.0 e 9.5 == 1
Entre 9.5 e 10.0 == 6


In [90]:
k = list(filter(lambda k: notas[k]==6, notas))
for i in k:
    print(i, notas[i])

EELI02 6.0
EMEI07 6.0
EMBI02 6.0
ECAI04 6.0


In [91]:
import plotly.graph_objects as go
fig = go.Figure(data=[go.Bar(x=val[6:], y=freq[6:], text=freq[6:], textposition='auto')])
fig.update_layout(
    xaxis = dict(
        tickmode = 'array',
        tickvals = val[6:],
        ticktext =[
 '(3.0-3.5]', '(3.5-4.0]', 
 '(4.0-4.5]', '(4.5-5.0]',
 '(5.0-5.5]', '(5.5-6.0]',
 '(6.0-6.5]', '(6.5-7.0]',
 '(7.0-7.5]', '(7.5-8.0]',
 '(8.0-8.5]', '(8.5-9.0]',
 '(9.0-9.5]', '(9.5-10.0]']
    )
)
fig.show()

---

## Andando no grafo e propagando os valores das notas sobre cada competência

$\forall$ Competência $\to$ anda no seu grafo, propagando o valor da nota de um aluno sobre cada aresta -- que contém pesos -- de uma competência

Não importa se passou (nota maior que 6) ou não, propaga a competência.

Note que pode ser 1 ou mais **subgrafos** independentes, i.e, pode ter 1 única disciplina que origina todo o grafo, ou pode ser 2+ grafos independentes

In [92]:
# anda sobre o grafo para o(s) aluno(s) ideal (grafos)
notas_aluno_ideal = Competence.BFS.walk(grafos, aluno_ideal)

# notas simuladas
notas_aluno_ideal_software = Competence.BFS.walk(grafos, aluno_ideal_software)
notas_aluno_ideal_hardware = Competence.BFS.walk(grafos, aluno_ideal_hardware)

# anda sobre o grafo para o(s) aluno(s)
notas_aluno = Competence.BFS.walk(grafos, notas)


# remove
del grafos, aluno_ideal, notas

### DEBUG: Visualizando as notas dos alunos

In [None]:
notas_aluno, notas_aluno_ideal

## Insere os valores do mercado

### Carrega as respostas do banco

In [93]:
# importa o módulo que carrega os dados do banco mongo
from modules.ahp import Database
# importa o enum que indica o tipo do filtro
from modules.ahp.Types import FormDataType,FormData

# carrega o módulo que calcula o ahp
from modules.ahp import Ahp

# connecta no db
ahp_connection = Database.AhpForm(CONNECTION_STRING)

ahp_teacher_responses = ahp_connection.findByType(FormDataType.TEACHER)
ahp_market_responses = ahp_connection.findByType(FormDataType.MARKET)

del ahp_connection

### Respostas do banco

#### Professores

In [94]:
# for response in ahp_teacher_responses:
#     name = response.getName()
#     matrices = response.getMatrices()
#     print(f"Nome: {name}\n{'-'*100}")
#     pprint(matrices)
#     print('\n')

#### Mercado

In [95]:
# for response in ahp_market_responses:
#     name = response.getName()
#     matrices = response.getMatrices()
#     print(f"Nome: {name}\n{'-'*100}")
#     pprint(matrices)
#     print('\n')

### Obtém uma relação de competências por resposta do banco

Monta dois dataframes, um com a consistência, e o outro com o resultado do ahp para cada matriz de cada respondente


Obtêm as competências e seus valores. Atualmente **aceita** *CRs* **inválidos**, caso não queira aceitar mais, será necessário:
- Descartar toda a `resposta`
- Ou, colocar todas as competências da matriz cujo CR é inválido, como -1 ou 0

Note que no cenário onde a matriz é <mark>q15</mark>, está colocando o valor original, deve ser uma relação, ao invés disso.

#### Calculando o AHP e obtendo os índices

In [96]:
# Calcula o ahp e faz o mapeamento para cada respondente
a1, b1 = util.get_competences_and_consistency(ahp_teacher_responses,FormDataType.TEACHER)
a2, b2 = util.get_competences_and_consistency(ahp_market_responses,FormDataType.MARKET)

mongo_competences = pd.concat([a1,a2]).reset_index(drop=True)
mongo_competences_consistency = pd.concat([b1,b2]).reset_index(drop=True)

del a1,b1, a2, b2

In [97]:
# mongo_competences

In [98]:
# mongo_competences_consistency

In [99]:
# removendo colunas que não existiam na planilha
mongo_competences = mongo_competences.drop(columns=[
    'Conhecimento, métodos e ferramentas fundamentais de computação básica',
    'Conhecimento, métodos e ferramentas na área de sistemas de software',
    'Conhecimentos básicos em sistemas de comunicação'])

<div class="bg-warning text-dark card p-2">
Note que, como há competências que não foram mapeadas nas planilhas, estas foram descartadas
</div>

#### DEBUG: Vendo os indíces que deram erro

O dataframe de *consistência de competências*, mostra as respostas erradas do sistema para cada matriz e cada respondente. **NOTA**: No cenário onde não houveram respostas, foi colocado o valor 0.

In [100]:
# obtém todas as posições "inversas"
a = mongo_competences_consistency.drop(columns=['type','name'])
b = a!=0.0
c = (b & (a<0.1))

In [101]:
def amnt_teacher_and_market(df: pd.DataFrame) -> None:
    """
    Uma função usada apenas para debug e print da quantidade de cada um dos tipos

    Args
    ----
    `df`:
        Dataframe de professores ou mercado
    
    Note
    ----
    Usado para exibir o número de válidos sobre o número de incorretos
    """
    global mongo_competences_consistency
    total_of_teachers = len(mongo_competences_consistency.query('type == "teacher"'))
    total_of_market = len(mongo_competences_consistency.query('type == "market"'))
    
    valid_teachers = len(df.query('type == "teacher"'))
    valid_market = len(df.query('type == "market"'))
    print('Respostas corretas')
    print(f'Professores: {valid_teachers}/{total_of_teachers}')
    print(f'Mercado: {valid_market}/{total_of_market}')

##### Pessoas que responderam o root (*Visão Geral*) corretamente

In [102]:
aux = mongo_competences_consistency[c['root']]
amnt_teacher_and_market(aux)
# aux

Respostas corretas
Professores: 10/12
Mercado: 4/7


##### Pessoas que responderam o q1 corretamente

In [103]:
aux = mongo_competences_consistency[c['q1']]
amnt_teacher_and_market(aux)
# aux

Respostas corretas
Professores: 11/12
Mercado: 4/7


##### Pessoas que responderam o q12 corretamente

In [104]:
aux = mongo_competences_consistency[c['q12']]
amnt_teacher_and_market(aux)
# aux

Respostas corretas
Professores: 12/12
Mercado: 5/7


##### Pessoas que responderam o q13 corretamente

In [105]:
aux = mongo_competences_consistency[c['q13']]
amnt_teacher_and_market(aux)
# aux

Respostas corretas
Professores: 8/12
Mercado: 4/7


##### Pessoas que responderam o q2 corretamente

In [106]:
aux = mongo_competences_consistency[c['q2']]
amnt_teacher_and_market(aux)
# aux

Respostas corretas
Professores: 10/12
Mercado: 5/7


##### Pessoas que responderam o q3 corretamente

In [107]:
aux = mongo_competences_consistency[c['q3']]
amnt_teacher_and_market(aux)
# aux

Respostas corretas
Professores: 10/12
Mercado: 5/7


In [108]:
# Remove as variáveis não utilizadas desta seção

del a,b,c,aux

## Calcula a resposta "média" para os professores e para o mercado

Itera sobre <strong>todas</strong> as respostas:

<ol>
    <li> Verificando se estas respostas <mark>são válidas</mark> (CR < 0.1). <strong>Observações</strong>:
        <ul>
            <li class="font-weight-light"> Caso o ahp dê >= 0.1, descarta da análise </li>
            <li class="font-weight-light"> Caso a matriz não tenha sido preenchida, descarta da análise </li>
        </ul>
    <li> Gerando a média das matrizes válidas e adicionando estas num dicionário que, futuramente, será usado para o cálculo do ahp </li>
</ol>

Ao final deste processo, será obtido um dicionário, relacionando as matrizes para suas equivalentes médias

In [109]:
teacher_matrices = util.calc_mean_matrix(ahp_teacher_responses)
market_matrices = util.calc_mean_matrix(ahp_market_responses)

del ahp_teacher_responses, ahp_market_responses

> Lembre que, como as perguntas são feitas em pares, desta forma, um item na diagonal principal sempre será 1, e.g, (0,0), (1,1), (2,2), (3,3)

## Calcula o AHP para as matrizes da resposta "média"


Calcula o AHP sobre cada matriz obtida no passo anterior.

<div class="p-3 mb-2 bg-danger text-white" style="border-radius:5px">
    No cenário de ser apenas uma única questão, deve ser calculado o seu percentual. Como fazer isso?
    <br/>
    <hr class="mx-5"/>
    <p align="center">
        <u><i>Vetor de possíveis valores</i></u> dentro do ahp no sistema = [1/9, 1/7, 1/5, 1/3, 1, 3, 5, 7, 9]
    </p>
</div>




__Solução:__ atualmente, irei fazer o seguinte cálculo:

$$
    x(n) = \frac{V(n) - 1/9}{9-1/9} \\
    \therefore \begin{cases}
                        x(1/9) = 0 \\
                        x(9) = 0.99
                      \end{cases}
$$

Cujo qual, ao arredondar em 2 casas decimais, me retorna 0.99 para o cenário máximo.
Todavia, uma vez que  `Redes de computadores` for extramemente baixo, o valor de 
`Software para sistemas de comunicação` será alto:

$$
    \text{Redes} = \text{get_q15_value}(v) \\
    \text{Sof. Com.} = 1 - \text{Redes}
$$

<strong><sup>1</sup></strong> Checar se está correto esta abordagem. Uma vez que o ahp, dificilmente irá gerar valores extramemente desproporcionais (v >= 50%), a resposta do mercado irá tender a ser bem menor que a do aluno (com exceção ao cenário da resposta citada em (3)).

Ver a função `modules.ahp.Ahp.get_q15_value`
Com exceção do cenário da pergunta única (onde o AHP não é aplicado), todos os dados estão normalizados entre 0 e 1, desta forma, apenas esta pergunta precisaria ser tratada num primeiro momento.

In [110]:
sec_teacher = util.calc_ahp_for_new_mat(teacher_matrices)
sec_teacher
del teacher_matrices

In [111]:
sec_market = util.calc_ahp_for_new_mat(market_matrices)
sec_market
del market_matrices

## Realiza o mapping de competências (para o aluno)

Esse mapping apenas abre cada posição de cada matriz e faz uma relação com a sua competência equivalente.



<div class="p-3 mb-2 bg-light text-black" style="border-radius:5px">
    <p class="text-uppercase" style="font-size:1.5em">Problema deste mapping direto </p>
    <p class="text-right">(18/05/21)</p>
    <hr style="border: 1px solid"/>
    <p>
        Note que, esse mapping não é feito com base no nível hierárquico do AHP, isso implica em dizer que, ao final, <mark> a somatória do vetor final será igual à quantidade de matrizes</mark>, uma vez que cada matriz/conjunto de perguntas tem seu valor distribuído entre 0 e 1. Então, q1|q12|q13|q15|q2|q3|root, possuem valores cuja soma, será 1 para cada uma, portanto, a soma geral dá 7.
    </p>
    <p>
        Observe também que, cada nível/matriz, irá de 0 à 1, embora no cálculo do estudante este valor esteja contemplado entre 0 à 1 para cada competência, assim, num cenário onde 5 competências sejam analisadas no ahp, eu teria uma matriz 5x5 onde a somatória estaria entre [0,1], enquanto no caso do aluno, eu teria uma somatória de 5
    </p>
    <br/><br/>
    <p class="text-uppercase" style="font-size:1.5em">Possível solução: </p>
    <hr style="border: 1px solid"/>
    <p>
        Uma possível solução é <mark>separar pelos níveis do ahp</mark>, i.e, cada matriz deve ser analisada separadamente.
    </p>
    <p>
        Juntamente com isso, <mark>a nota final do estudante deverá ser "dividida" pelo número de linhas/colunas da matriz referente aquele nível</mark>, de modo que seria o equivalente à "agrupar" cada conjunto de grafos à possíveis respostas
    </p>
    <hr style="border: 1px solid"/>
    <p class="text-white" style="font-size:1.2em">Como fazer isso? </p>
    <p>
        <ol>
            <li> Multiplica cada matriz do AHP pelo número de colunas/linhas </li>
            <li> 
                <mark>Faz um mapeamento reverso para o vetor de competência do estudante e então divide este para cada matriz</mark>
            </li>
        </ol>
    </p>
</div>

### Competências aluno $\rightarrow$ seções do AHP

Agrupa (clusteriza) as competências do aluno para seções do AHP. Desta forma, as notas estarão "proporcionais"

In [112]:
aluno_sec = Ahp.Mapping.to_sections(notas_aluno)
aluno_sec

aluno_ideal_sec = Ahp.Mapping.to_sections(notas_aluno_ideal)
aluno_ideal_sec

# alunos simulados
aluno_ideal_hardware_sec = Ahp.Mapping.to_sections(notas_aluno_ideal_hardware)
aluno_ideal_hardware_sec
aluno_ideal_software_sec = Ahp.Mapping.to_sections(notas_aluno_ideal_software)
aluno_ideal_software_sec


# del notas_aluno, notas_aluno_ideal

{'q1': [0.84, 0.73, 0.76],
 'q12': [0.86, 0.87, 0.88],
 'q13': [0.81, 0.81, 0.84, 0.85, 0.86, 0.88],
 'q15': [0.79, 0.84],
 'q2': [0.84, 0.83, 0.84, 0.83, 0.87],
 'q3': [0.83, 0.83, 0.87, 0.85]}

O máximo seria a quantidade de perguntas da seção no seu valor "máximo", ou seja:

$$
\text{Valor_pergunta}_j = \\frac{\\text{pergunta}_j}{\\sum_{i=0}^N\\text{pergunta}_i}
$$

In [115]:
def new_val(el: float) -> float:
    """
    Função pela qual cada nota do aluno é dividida pelo número de elementos na seção do AHP equivalente
    
    Args
    ----
    `el`:
        Elemento a ser dividido
    
    Globals
    -------
    `amount`
    
    Returns
    -------
    float
        O elemento dividio e arrendondado para a seção
    
    Notes
    -----
    Esta função utiliza a variável global ROUND_PLACES para o arrendondamento
    """
    global amount

    # print(f'Amount {amount}')
    return round(el/amount, ROUND_PLACES)


# ------------------------------------------------------------------------------

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_FORM_Q1)
aluno_sec['q1'] = list(map(new_val, aluno_sec['q1']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q12)
aluno_sec['q12'] = list(map(new_val, aluno_sec['q12']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q13)
aluno_sec['q13'] = list(map(new_val, aluno_sec['q13']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q15)
aluno_sec['q15'] = list(map(new_val, aluno_sec['q15']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q2)
aluno_sec['q2'] = list(map(new_val, aluno_sec['q2']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q3)
aluno_sec['q3'] = list(map(new_val, aluno_sec['q3']))


# ---
amount = len(Ahp.Mapping.COMPETENCES_MATRIX_FORM_Q1)
aluno_ideal_sec['q1'] = list(map(new_val, aluno_ideal_sec['q1']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q12)
aluno_ideal_sec['q12'] = list(map(new_val, aluno_ideal_sec['q12']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q13)
aluno_ideal_sec['q13'] = list(map(new_val, aluno_ideal_sec['q13']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q15)
aluno_ideal_sec['q15'] = list(map(new_val, aluno_ideal_sec['q15']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q2)
aluno_ideal_sec['q2'] = list(map(new_val, aluno_ideal_sec['q2']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q3)
aluno_ideal_sec['q3'] = list(map(new_val, aluno_ideal_sec['q3']))


# ~~~~~~~~~~~~~~~~
amount = len(Ahp.Mapping.COMPETENCES_MATRIX_FORM_Q1)
aluno_ideal_hardware_sec['q1'] = list(map(new_val, aluno_ideal_hardware_sec['q1']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q12)
aluno_ideal_hardware_sec['q12'] = list(map(new_val, aluno_ideal_hardware_sec['q12']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q13)
aluno_ideal_hardware_sec['q13'] = list(map(new_val, aluno_ideal_hardware_sec['q13']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q15)
aluno_ideal_hardware_sec['q15'] = list(map(new_val, aluno_ideal_hardware_sec['q15']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q2)
aluno_ideal_hardware_sec['q2'] = list(map(new_val, aluno_ideal_hardware_sec['q2']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q3)
aluno_ideal_hardware_sec['q3'] = list(map(new_val, aluno_ideal_hardware_sec['q3']))



# ~~~~~~~~~~~~~~~~
amount = len(Ahp.Mapping.COMPETENCES_MATRIX_FORM_Q1)
aluno_ideal_software_sec['q1'] = list(map(new_val, aluno_ideal_software_sec['q1']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q12)
aluno_ideal_software_sec['q12'] = list(map(new_val, aluno_ideal_software_sec['q12']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q13)
aluno_ideal_software_sec['q13'] = list(map(new_val, aluno_ideal_software_sec['q13']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q15)
aluno_ideal_software_sec['q15'] = list(map(new_val, aluno_ideal_software_sec['q15']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q2)
aluno_ideal_software_sec['q2'] = list(map(new_val, aluno_ideal_software_sec['q2']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q3)
aluno_ideal_software_sec['q3'] = list(map(new_val, aluno_ideal_software_sec['q3']))



del amount

In [None]:
aluno_sec, aluno_ideal_sec

## Seções do AHP $\rightarrow$ Competências

In [116]:
# montando o vetor do mercado com base no dicionário esperado
visao_mercado = Ahp.Mapping.to_competences(sec_market)
visao_professores = Ahp.Mapping.to_competences(sec_teacher)

# montando visão dos alunos
visao_aluno = Ahp.Mapping.to_competences(aluno_sec)
visao_aluno_ideal = Ahp.Mapping.to_competences(aluno_ideal_sec)
visao_aluno_ideal_hw = Ahp.Mapping.to_competences(aluno_ideal_hardware_sec)
visao_aluno_ideal_sw = Ahp.Mapping.to_competences(aluno_ideal_software_sec)

del sec_teacher,sec_market, aluno_sec, aluno_ideal_sec

## Remoção de algumas chaves

`Redes de computadores` e `Software para sistemas de comunicação` foram descartados porque não foi utilizado o AHP, desta forma, pode ocorrer uma descrepância muito grande entre seus elementos no plot

### Removendo a seção na qual o AHP não é aplicado

In [117]:
# removendo redes e softwares
visao_mercado.pop('Redes de computadores')
visao_mercado.pop('Software para sistemas de comunicação')

visao_professores.pop('Redes de computadores')
visao_professores.pop('Software para sistemas de comunicação')

visao_aluno_ideal.pop('Redes de computadores')
visao_aluno_ideal.pop('Software para sistemas de comunicação')


visao_aluno_ideal_hw.pop('Redes de computadores')
visao_aluno_ideal_hw.pop('Software para sistemas de comunicação')
visao_aluno_ideal_sw.pop('Redes de computadores')
visao_aluno_ideal_sw.pop('Software para sistemas de comunicação')

visao_aluno.pop('Redes de computadores')
visao_aluno.pop('Software para sistemas de comunicação')

0.39

### Removendo as seções que não estavam no Gsheets

Seção `root`, por exemplo

In [118]:
visao_mercado = dict(filter(lambda e: e[0] in visao_aluno, visao_mercado.items()))
visao_professores = dict(filter(lambda e: e[0] in visao_aluno, visao_professores.items()))

### Verificando se todos tem as mesmas competências

In [119]:
# com isso também verifico se está na mesma ordem (necessário em seções futuras), 
# ... podendo assim, somente dar um get na lista de valores depois
aux = [
    # len(visao_aluno_ideal.keys()) é 21 ,
    len(list(takewhile(lambda x: x[0] == x[1], zip(visao_aluno_ideal, visao_aluno)))),
    len(list(takewhile(lambda x: x[0] == x[1], zip(visao_aluno_ideal, visao_mercado)))),
    len(list(takewhile(lambda x: x[0] == x[1], zip(visao_aluno_ideal, visao_professores))))]

# obtendo os tamanhos
aux = map(lambda i: i == len(visao_aluno_ideal.keys()), aux)
# checando se todos tem os mesmos tamanhos (mesmas keys)
assert all(aux) is True

del aux

## :DEBUG: Normalizando o aluno pelo ideal

<div class="text-right"> Data: 13/06/2021</div>

Para cada competência do aluno normal, divide esta competência pelo ideal, a fim de obter uma relação sobre o ideal

In [120]:
# visao_aluno = dict(map(lambda k: (k, round(visao_aluno[k]/visao_aluno_ideal[k], 4)), visao_aluno))
# visao_aluno

In [121]:
visao_aluno, visao_aluno_ideal

({'Matemática e física': 0.123,
  'Sistemas microprocessados': 0.113,
  'Conhecimento em sistemas de automação ': 0.117,
  'Lógica, algoritmos, teoria da comp,  estruras de dados.': 0.25,
  'Linguagens e paradigmas.': 0.253,
  'PAA': 0.247,
  'Configurar plataformas para softwares e serviços.': 0.125,
  'Arquiteturas de computadores': 0.13,
  'Segurança de sis. de comp.': 0.125,
  'Engenharia de software': 0.128,
  'Inteligência artificial': 0.125,
  'Desenvolvimento Web e Mobile': 0.133,
  'Gerenciar projetos e sistemas de computação': 0.144,
  'Engenharia-econômica': 0.144,
  'Compreender e resolver problemas': 0.148,
  'Autoaprendizado': 0.148,
  'Criatividade e Inovação': 0.152,
  'Comunicação oral e escrita': 0.188,
  'Língua inglesa': 0.192,
  'Empreender e exercer liderança': 0.182,
  'Trabalho em equipe': 0.195},
 {'Matemática e física': 0.167,
  'Sistemas microprocessados': 0.167,
  'Conhecimento em sistemas de automação ': 0.167,
  'Lógica, algoritmos, teoria da comp,  estrur

## Calcula a proximidade

### Converte os dicionários do aluno e do mercado para vetores de escalares

Como é utilizada a mesma função de mapping, os valores estarão ordenados corretamente, de forma que não há motivos para se preocupar com isto

In [122]:
# Converte para um vetor
vetor_mercado = list(visao_mercado.values())
vetor_professores = list(visao_professores.values())
vetor_aluno = list(visao_aluno.values())
vetor_aluno_ideal = list(visao_aluno_ideal.values())

vetor_aluno_ideal_hw = list(visao_aluno_ideal_hw.values())
vetor_aluno_ideal_sw = list(visao_aluno_ideal_sw.values())

### Calcula a proximidade entre os vetores

In [123]:
# inclui um iterador de permutações
from itertools import combinations

vetores = {
    'aluno': vetor_aluno,
    'aluno ideal': vetor_aluno_ideal,
    'mercado': vetor_mercado, 
    'professores': vetor_professores,
    'aluno hardware': vetor_aluno_ideal_hw,
    'aluno software': vetor_aluno_ideal_sw}

# Exibe a proximidade
for i,j in combinations(vetores, 2):
    percent = util.dist_vectors(vetores[i], vetores[j])
    print(f'"{i}" vs "{j}" são, aproximadamente, {percent}% iguais.')

del vetores, percent, i,j

"aluno" vs "aluno ideal" são, aproximadamente, 98.1% iguais.
"aluno" vs "mercado" são, aproximadamente, 70.76% iguais.
"aluno" vs "professores" são, aproximadamente, 77.3% iguais.
"aluno" vs "aluno hardware" são, aproximadamente, 96.52% iguais.
"aluno" vs "aluno software" são, aproximadamente, 97.83% iguais.
"aluno ideal" vs "mercado" são, aproximadamente, 70.92% iguais.
"aluno ideal" vs "professores" são, aproximadamente, 77.31% iguais.
"aluno ideal" vs "aluno hardware" são, aproximadamente, 97.61% iguais.
"aluno ideal" vs "aluno software" são, aproximadamente, 97.62% iguais.
"mercado" vs "professores" são, aproximadamente, 81.16% iguais.
"mercado" vs "aluno hardware" são, aproximadamente, 71.32% iguais.
"mercado" vs "aluno software" são, aproximadamente, 70.48% iguais.
"professores" vs "aluno hardware" são, aproximadamente, 77.21% iguais.
"professores" vs "aluno software" são, aproximadamente, 76.93% iguais.
"aluno hardware" vs "aluno software" são, aproximadamente, 95.78% iguais.


## Plots

In [124]:
from modules import Plot

categorias:List[str] = list(visao_aluno_ideal.keys())

### Plot do AHP sobre todas as respostas do sistema

Inclui respostas **inválidas** e **matrizes que não houveram respostas**

In [None]:
# realiza o bar_plot para cada competência
mongo_competences = mongo_competences.drop(columns=['name'])

# Plot.all_competencies(mongo_competences)

## Plot comparando os alunos ideias (inventados)

In [134]:
fig = Plot.bar_plot(
    categorias,
    ['Aluno real', 'Aluno focado em hardware', 'Aluno focado em software'],
    [
        list(visao_aluno.values()),
        list(visao_aluno_ideal_hw.values()),
        list(visao_aluno_ideal_sw.values()),
    ])
# fig.write_html(path.join(OUT_DIR, 'bar_plot_alunos.html'))
fig.write_image(path.join(OUT_DIR, 'bar_plot_alunos.pdf'), format='pdf')
fig

### Plot comparando os dois alunos

In [125]:
fig = Plot.bar_plot(
    categorias,
    ['Aluno', 'Aluno ideal'],
    [
        list(visao_aluno.values()),
        list(visao_aluno_ideal.values()),
    ])
# fig.write_html(path.join(OUT_DIR, 'bar_plot_alunos.html'))
fig.write_image(path.join(OUT_DIR, 'bar_plot_alunos.pdf'), format='pdf')
fig

### Plot da diferença entre os professores e o mercado


In [126]:
fig = Plot.bar_plot(
    categorias,
    ['Professores', 'Mercado', 'Aluno'],
    [
        list(visao_mercado.values()), 
        list(visao_professores.values()),
        list(visao_aluno.values()),
    ])
# fig.write_html(path.join(OUT_DIR, 'bar_plot_visoes.html'))
fig.write_image(path.join(OUT_DIR, 'bar_plot_visoes.pdf'), format='pdf')
fig

### Plots radial/spyder

#### Aluno

Propagadas sobre os grafos

In [127]:
fig = Plot.spider_plot(
    categorias,
    "Visão do aluno",
    list(visao_aluno.values()))
fig

#### Mercado vs Aluno Ideal vs Aluno

$$ \text{Visão_aluno} \cup\text{Visão_mercado} $$

In [128]:
fig = Plot.spider_plot(
    categorias,
    ["Mercado", "Aluno"], # "Aluno Ideal"],
    [
        list(visao_mercado.values()),
        list(visao_aluno.values()),
        # list(visao_aluno_ideal.values()),
    ])
#fig.write_html(path.join(OUT_DIR, 'radial_plot_visoes.html'))
fig.write_image(path.join(OUT_DIR, 'radial_plot_visoes.pdf'), format='pdf')
fig

### Realiza o pollarplot das visões

In [129]:
# # Obtém os valores para serem inseridos nessa visualização
# student_1 = list(notas_aluno.values())
# teachers = mongo_competences[notas_aluno.keys()].values.tolist()

# cols:List = ["class_color", *list(notas_aluno.keys())]
# df = pd.DataFrame(columns=cols)

# # add for teachers
# for i,v in enumerate(teachers):
#     nl = [2.5, *v]
#     df = df.append(pd.DataFrame([nl], columns=cols), ignore_index=True)

# # add for student
# df = df.append( pd.DataFrame([[1.0, *student_1]], columns=cols), ignore_index=True)

# # Generate the plot itself
# Plot.parallel_plot(df, "class_color", show=False)