In [1]:
%%html

<!-- Configurando os estilos para este documento, similar à uma página web -->
<link href="https://cdn.jsdelivr.net/npm/bootstrap@5.0.1/dist/css/bootstrap.min.css" rel="stylesheet" integrity="sha384-+0n0xVW2eSR5OomGNYDnhzAbDsOXxcvSN1TPprVMTNDbiYZCxYbOOl7+AMvyTG2x" crossorigin="anonymous">
<script src="https://cdn.jsdelivr.net/npm/bootstrap@5.0.1/dist/js/bootstrap.bundle.min.js" integrity="sha384-gtEjrD/SeCtmISkJkNUaaKMoLD0//ElJ19smozuHV6z3Iehds+3Ulb9Bn9Plx0x4" crossorigin="anonymous"></script>

<style>
   .center {
      display: block;
      margin-left: auto;
      margin-right: auto;
    }
    mark {
        background-color: yellow;
        color: black;
        font-weigth: bold;
    }
    strong {
        color: yellow;
        font-weigth: bold;
    }
</style>

# Configurações e imports

## Configurando atalhos para o ipython

In [2]:
# %magic -brief

In [3]:
# execute %docs para abrir a documentação no chrome
%alias docs chrome doc/build/html/index.html > /dev/null

# execute %outs para abrir a pasta out
%alias outs chrome ../out/ > /dev/null

# alias to delete (under windows)
%alias rm del

# habilita o autocomplete
%config IPCompleter.greedy = True

# exibe todas as funcões disponíveis
# %magic -brief

## Imports globais (compartilhados)

In [4]:
# Utilities
from importlib import reload

# Pretty print
from pprint import pprint

# copy
from copy import deepcopy

# Import function to handle with paths
import os
from os import path

# Dataframe"
import pandas as pd

# math library
import numpy as np

# typings
from typing import List,Dict, Tuple, final, Final, Union

# logger configs
#import logging, logging.config

# plotling functions
from modules import Plot, util

# date
from datetime import datetime

## Configurações default do ambiente

In [5]:
# current date
DATE: str = datetime.now().strftime("%Y-%m-%d")

# configuring default round places to this project
ROUND_PLACES: int = 3

# mongodb connection string
CONNECTION_STRING: Final[str] = "mongodb://ppcamp:DRrPaRrHqmaWo43D@localhost:27017/?authSource=admin"
    
# Google sheet's (csv's) directory
SHEETS_DIR: Final[str] = path.realpath('../assets/sheets')

# Graph's plot directory
GRAPHS_DIR: Final[str] = path.realpath('../out/competency_graphs')
COMPETENCES_DIR: Final[str] = path.realpath('../out/competency_barplots')

# getting logger configs
#logging.config.fileConfig('logging.conf', defaults={ 'logfilename': DATE })
# choosing logger
#log: Final[logging.Logger] = logging.getLogger('main')

### Removendo arquivos de saídas (plots)

In [6]:
# %rm ../out/graphs/*
# %rm ../out/gsheets_competences_plot/*

# Análise sobre o perfil dos alunos formandos/formados do curso de Engenharia de Computação

## Obtendo a grade

Obtendo a grade do curso de computação 2015, com pré e có requisitos

In [7]:
# Módulo usado para obter a grade (do banco ou realiza raspagem)
from modules.grid import Grid
from networkx import DiGraph

# Não deve alterar estes grafos
pre: DiGraph
co: DiGraph
pre, co = Grid.get_grid(
    '0192015', 
    CONNECTION_STRING
)

## Obtêm os pesos das competências

### Lendo os arquivos CSVs

Obtidos através das "planilhas do Google"

In [8]:
from modules import Skillset

# Faz a leitura dos arquivos csvs
_csvs:Skillset.DataFrames = Skillset.read_csvs(SHEETS_DIR)

### Juntando as competências em um único dataframe

Atualmente, realiza a média das competências, isso quer dizer que, nos cenários onde os alunos não responderam, a média irá afetar o negativamente o cenário que houveram respostas.

Em suma, realiza a média das células (posições ixj) com base nas entradas de dataframes

In [9]:
# Realiza a média dos arquivos de competências
out:Final[pd.DataFrame] = Skillset.merge_data(_csvs)

# Remove os csvs não utilizados
del _csvs

### Normalizando as competências

Num primeiro momento, é requisitado ao usuário que preencha as planilhas - `</assets/sheets>` - com valores 
até 10 para cada linha, ou seja, que cada matéria seja dividida entre competências internas, de forma que a 
soma destas competências, represente a matéria.

Uma vez que as linhas estejam "normalizadas", deverá ser feito a normalização por colunas, garantindo que 
uma determinada competência seja adquirida até um certo máximo, ou seja, 100%, no decorrer do curso

Ao normalizar por coluna<sup>1</sup>, temos que, a cada período, uma porcentagem do valor final que será analisada.

---

<sup>1</sup>.: Observe também que, ao normalizar por colunas, fazemos a seguinte convenção:
> Uma vez que a disciplina exista na grade, o peso relacionado é de acordo com esta
> competência, i.e, se a competência possuía 0.25 em apenas uma _única_ matéria, estaremos
> assumindo que a competência irá existir, e no curso, o maior valor possível será 100% de
> aproveitamento nesta. Analisando por exemplo, o cenário de _Desenvolvimento Web e Mobile_
>
> <cite> -- Pedro</cite>

In [10]:
# obtém a soma de cada coluna
_column_sum = out.apply(np.sum, axis=0)

# normaliza pelo maior valor cada coluna
for col in out.columns:
    out.loc[:, col] /= _column_sum[col]

# arredondando
out = out.round(4)

# conferindo se cada coluna (competência) terá sido propagada em seu máximo (100%)
# out.apply(np.sum,axis=0)

del col

In [11]:
# exportando o dataframe
out.to_csv(path.realpath('../out/df_competencias_gsheet.csv'))

In [12]:
out.sum()

Matemática e física                                        1.0001
Lógica, algoritmos, teoria da comp,  estruras de dados.    0.9998
Linguagens e paradigmas.                                   1.0001
PAA                                                        1.0002
Configurar plataformas para softwares e serviços.          0.9998
Arquiteturas de computadores                               1.0001
Segurança de sis. de comp.                                 0.9996
Engenharia de software                                     1.0001
Inteligência artificial                                    1.0001
Desenvolvimento Web e Mobile                               1.0000
Sistemas microprocessados                                  1.0001
Redes de computadores                                      1.0000
Software para sistemas de comunicação                      1.0005
Conhecimento em sistemas de automação                      1.0001
Gerenciar projetos e sistemas de computação                1.0000
Engenharia

In [13]:
out.loc[out['Desenvolvimento Web e Mobile'] != 0, 'Desenvolvimento Web e Mobile']

Sigla
ECOI04    0.0220
ECOI09    0.1398
ECOI11    0.0379
ECOI14    0.0128
ECOI15    0.0835
ECOI16    0.0982
ECOI25    0.4585
HUMI01    0.0137
MATI01    0.0556
MATI02    0.0363
MATI04    0.0417
Name: Desenvolvimento Web e Mobile, dtype: float64

In [14]:
# out['Desenvolvimento Web e Mobile'].sum()

### Plot de debug para cada competência


In [15]:
# for col in out.columns:
#     Plot.bar_plot(
#         out, col, 
#         filename=path.join(COMPETENCES_DIR, f'{col}.svg'))
# del col

## Gerando um grafo da grade com base na relação de competências

- Cada competência gera um único _grafo_, assim, é necessário propagar os nós para todos os grafos e atribuir os vértices de acordo com a entrada dos alunos nos arquivos de **competências**

In [16]:
from networkx import DiGraph

# Obtendo uma cópia do grafo de pré requisito (este grafo possui o período de cada disciplina)
nodes:DiGraph = pre.copy()

# Removendo os vértices (conexões, que nates eram os pré requisitos)
nodes.remove_edges_from(list(nodes.edges()))

# Removendo os nós que não constam naquela planilha
nos_para_remocao:List[str] = [no for no in list(nodes.nodes()) if no not in out.index.to_list()]
nodes.remove_nodes_from(nos_para_remocao)

# remove variáveis que não serão mais utilizadas
del nos_para_remocao

### Gerando os grafos de competências

Os grafos são montados para cada competência obtida do dataframe da média dos _csvs_

É feita uma normalização por período também, de forma que, para cada período, o máximo que pode ser propagado de uma competência para outra é 100%

> Confira a documentação da função para obter uma melhor visualização do funcionamento desta.

<p class="text-center h6"> Exemplo de um possível grafo </p>

<img 
     al="Exemplo de um grafo"
     class="img-fluid rounded"
     weight="100%"
     src="./doc/source/_static/img/graph_example_desenvolvimento_web.png" />

In [17]:
# visualizando os plots de competências (gsheets_competences_plot)
# %gchrome ../out/gsheets_competences_plot

In [18]:
from modules.grid import Competence

grafos = Competence.generate_competency_graphs(out, nodes)

### Realizando o plot destes grafos

In [19]:
# Realiza o plot do grafo/grade
from modules.grid import Plot as PltGraph

# Itera sobre cada grafo de competencia
for competencia in grafos.keys():
    # Gera um plot para cada um com o peso saindo de cada matéria
    PltGraph.weighted_graph(
        grafos[competencia].nodes(),
        list(grafos[competencia].edges(data=True)),
        competencia.title().replace(' ','').replace('.',''),
        GRAPHS_DIR)

del competencia

In [20]:
# visualizando os grafmateria_atual = out.where(out == 1.0).dropna(how='all').index.tolist()[0]os (graphs)
# %gchrome ../out/graphs

## Obtendo a nota do aluno através do json

In [21]:
from modules import Score
import json

student_grid: str = path.join('..','assets','parsed_scores','2016001942.json')

# obtém o histórico de um único estudante
student_grid: json = Score.read_json(student_grid)

### Lendo o arquivo JSON que contém a nota

In [22]:
# abre a pasta que fica os arquivos de histórico já convertidos (do pdf para json)
# %gchrome ../assets/parsed_scores

### Obtendo apenas um dicionário relacionando nota e matérias

Também realiza a modificação dos dados para o cenário de reprovação

No **caso de bomba**, para não afetar a percepção de competência quanto ao que o aluno sabe, **será propagado a maior nota**, sendo esta, a que o aluno obteve êxito.

Uma vez que desejamos saber apenas a relação de competências, pressupõe-se que o aluno, ao ser aprovado, adiquiriu tais competências, desta forma, seu índice não deve ser penalizado pelas vezes que reprovou na disciplina

In [23]:
# Dicionário que irá obter a maior nota para cada disciplina que o aluno fez
notas: Dict[str,float] = {}

# anda sobre os períodos
for periodo in student_grid:
    # obtêm as matérias do período
    periodo_vetor = student_grid[periodo]
    
    # itera sobre as matérias"
    for materia in periodo_vetor:
        # obtém a nota de uma determinada matéria
        score = periodo_vetor[materia]['scores']

        # pode ser uma string ("--") se ainda está cursando a matéria, ignora
        if type(score) is str:
            continue
        score = float(score)

        # Verifica se o aluno já fez a matéria
        if materia in notas:
            # Coloca a maior nota do aluno, caso este já tenha repetido a matéria
            notas[materia]: float = max(notas[materia], score)
        else:
            # Primeira vez que fez a matéria
            notas[materia]: float = score

del (
    periodo_vetor,
    periodo,
    materia,
    score,
    # com isso, não é mais necessário manter a grade do estudante
    student_grid)

### Obtendo a nota do aluno ideal

O aluno ideal fez todas as disciplinas possíveis e passou com 10 em tudo

In [24]:
aluno_ideal = {key: 10.0 for key in nodes.nodes()}

## Andando no grafo e propagando os valores das notas sobre cada competência

$\forall$ Competência $\to$ anda no seu grafo, propagando o valor da nota de um aluno sobre cada aresta -- que contém pesos -- de uma competência

Não importa se passou (nota maior que 6) ou não, propaga a competência.

Note que pode ser 1 ou mais **subgrafos** independentes, i.e, pode ter 1 única disciplina que origina todo o grafo, ou pode ser 2+ grafos independentes

In [25]:
# anda sobre o grafo para o(s) aluno(s)
notas_aluno = Competence.walk(grafos, aluno_ideal)

KeyboardInterrupt: 

In [None]:
%%html

alert('Acabou')

In [None]:
notas_aluno, len(notas_aluno)

## Andando no grafo para o aluno ideal

O aluno ideal <mark>neste cenário</mark>, é aquele que fez todas as disciplinas e obteve total em todas

In [None]:
# aluno ideal
# notas_ideais = list(grafos[list(grafos.keys())[0]].nodes())
# notas_ideais = {k: 10 for k in notas_ideais[:-1]}

# # anda sobre o grafo para o(s) aluno(s) ideal(is)
# notas_ideais = GC.walk_through_graph(grafos, notas_ideais)


# # Nota de desenvolvimento WEB (que, até então, só possui uma única matéria)
# print('A nota de desenvolvimento web precisa ser igual ao peso. No cenário do aluno ideal (100%): {}'.format(notas['ECOI15']/10), end='\n\n\n')

# # verifica se no cenário de nota ideal, houve algum erro
# if list(filter(lambda n: n != 1.0, notas_ideais.values())):
#     raise Exception("Some error occurred. Check all code. All values should be 1.0")

# print("Notas do aluno:")
# for competencia, resultado in notas_aluno.items():
#     print(competencia, resultado)

# del competencia,resultado

## Insere os valores do mercado

### Carrega as respostas do banco

In [None]:
# importa o módulo que carrega os dados do banco mongo
from modules.ahp import Database
# importa o enum que indica o tipo do filtro
from modules.ahp.Types import FormDataType,FormData

# carrega o módulo que calcula o ahp
from modules.ahp import Ahp

# connecta no db
ahp_connection = Database.AhpForm(CONNECTION_STRING)

ahp_teacher_responses = ahp_connection.findByType(FormDataType.TEACHER)
ahp_market_responses = ahp_connection.findByType(FormDataType.MARKET)

### Respostas do banco

#### Professores

In [None]:
for response in ahp_teacher_responses:
    name = response.getName()
    matrices = response.getMatrices()
    print(f"Nome: {name}\n{'-'*100}")
    pprint(matrices)
    print('\n')

#### Mercado

In [None]:
for response in ahp_market_responses:
    name = response.getName()
    matrices = response.getMatrices()
    print(f"Nome: {name}\n{'-'*100}")
    pprint(matrices)
    print('\n')

### Testando o AHP para ver se está funcionando corretamente

In [None]:
%%html

<div class="embed-responsive embed-responsive-16by9">
    <span class="text-center center text-uppercase font-weight-bold">O ahp foi testado e desenvolvido com base no vídeo abaixo</span>
    <iframe 
        width="560" 
        height="315"
        class="center embed-responsive-item" 
        src="https://www.youtube-nocookie.com/embed/J4T70o8gjlk?start=335" 
        title="YouTube video player" 
        frameborder="2" 
        allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" 
        allowfullscreen>
    </iframe>
</div>

In [None]:
ahp_testing_data = pd.DataFrame(
    data = {
        'Price or Cost': [1, 0.2, 0.25, 0.14],
        'Storage Space': [5, 1, 2, 0.33],
        'Camera': [4, 0.5, 1, 0.33],
        'Looks': [7, 3, 3, 1]
    },
    index = ['Price or Cost', 'Storage Space', 'Camera', 'Looks'])
ahp_testing_data

In [None]:
ahp_testing_data_matrix = list(
    map(list,ahp_testing_data.to_numpy()))
ahp_testing_data_matrix

In [None]:
ahp_test_ci, ahp_test_pv = Ahp.calculate(ahp_testing_data_matrix)

print(f'Índice: {ahp_test_ci}')
pprint(ahp_test_pv)

In [None]:
%%html

<div class="embed-responsive embed-responsive-16by9">
    <span class="text-center center text-uppercase font-weight-bold">O resultado foi comprovado como mostra o vídeo abaixo</span>
    <iframe 
        width="560" 
        height="315"
        class="center embed-responsive-item" 
        src="https://www.youtube-nocookie.com/embed/J4T70o8gjlk?start=569" 
        title="YouTube video player" 
        frameborder="2" 
        allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" 
        allowfullscreen>
    </iframe>
</div>

### Obtém uma relação de competências por resposta do banco

Monta dois dataframes, um com a consistência, e o outro com o resultado do ahp para cada matriz de cada respondente


Obtêm as competências e seus valores. Atualmente **aceita** *CRs* **inválidos**, caso não queira aceitar mais, será necessário:
- Descartar toda a `resposta`
- Ou, colocar todas as competências da matriz cujo CR é inválido, como -1 ou 0

Note que no cenário onde a matriz é <mark>q15</mark>, está colocando o valor original, deve ser uma relação, ao invés disso.

#### Calculando o AHP e obtendo os índices

In [None]:
# Calcula o ahp e faz o mapeamento para cada respondente
a1, b1 = util.get_competences_and_consistency(ahp_teacher_responses,FormDataType.TEACHER)
a2, b2 = util.get_competences_and_consistency(ahp_market_responses,FormDataType.MARKET)

mongo_competences = pd.concat([a1,a2]).reset_index(drop=True)
mongo_competences_consistency = pd.concat([b1,b2]).reset_index(drop=True)

<div class="bg-warning text-dark card p-2">
Note que, como há competências que não foram mapeadas nas planilhas, estas foram descartadas
</div>

In [None]:
mongo_competences

In [None]:
mongo_competences_consistency

#### Vendo os indíces que deram erro

O dataframe de *consistência de competências*, mostra as respostas erradas do sistema para cada matriz e cada respondente. **NOTA**: No cenário onde não houveram respostas, foi colocado o valor 0.

In [None]:
mongo_competences = mongo_competences.drop(columns=[
    'Conhecimento, métodos e ferramentas fundamentais de computação básica',
    'Conhecimento, métodos e ferramentas na área de sistemas de software',
    'Conhecimentos básicos em sistemas de comunicação'])

In [None]:
# obtém todas as posições "inversas"
a = mongo_competences_consistency.drop(columns=['type','name'])
b = a!=0.0
c = (b & (a<0.1))
c

In [None]:
def amnt_teacher_and_market(df: pd.DataFrame) -> None:
    """
    Uma função usada apenas para debug e print da quantidade de cada um dos tipos
    """
    total_of_teachers = len(mongo_competences_consistency.query('type == "teacher"'))
    total_of_market = len(mongo_competences_consistency.query('type == "market"'))
    
    valid_teachers = len(df.query('type == "teacher"'))
    valid_market = len(df.query('type == "market"'))
    print('Respostas corretas')
    print(f'Professores: {valid_teachers}/{total_of_teachers}')
    print(f'Mercado: {valid_market}/{total_of_market}')

##### Pessoas que responderam o root (*Visão Geral*) corretamente

In [None]:
aux = mongo_competences_consistency[c['root']]
amnt_teacher_and_market(aux)
aux

##### Pessoas que responderam o q1 corretamente

In [None]:
aux = mongo_competences_consistency[c['q1']]
amnt_teacher_and_market(aux)
aux

##### Pessoas que responderam o q12 corretamente

In [None]:
aux = mongo_competences_consistency[c['q12']]
amnt_teacher_and_market(aux)
aux

##### Pessoas que responderam o q13 corretamente

In [None]:
aux = mongo_competences_consistency[c['q13']]
amnt_teacher_and_market(aux)
aux

##### Pessoas que responderam o q2 corretamente

In [None]:
aux = mongo_competences_consistency[c['q2']]
amnt_teacher_and_market(aux)
aux

##### Pessoas que responderam o q3 corretamente

In [None]:
aux = mongo_competences_consistency[c['q3']]
amnt_teacher_and_market(aux)
aux

## Plot do AHP sobre todas as respostas do sistema

Inclui respostas **inválidas** e **matrizes que não houveram respostas**

In [None]:
# realiza o bar_plot para cada competência
Plot.all_competencies(mongo_competences)

## Calcula a resposta "média" para os professores e para o mercado

Itera sobre <strong>todas</strong> as respostas:

<ol>
    <li> Verificando se estas respostas <mark>são válidas</mark> (CR < 0.1). <strong>Observações</strong>:
        <ul>
            <li class="text-warning"> Caso o ahp dê >= 0.1, descarta da análise </li>
            <li class="text-warning"> Caso a matriz não tenha sido preenchida, descarta da análise </li>
        </ul>
    <li> Gerando a média das matrizes válidas e adicionando estas num dicionário que, futuramente, será usado para o cálculo do ahp </li>
</ol>

Ao final deste processo, será obtido um dicionário, relacionando as matrizes para suas equivalentes médias

<div class="p-2 mb-2 bg-warning text-dark card">
  <p>Tinha um erro aqui!</p>
  <p>Esse era o comportamento que estava acontecendo, i.e., apesar de ter muitas dimensões, o endereço de memória estava sendo compartilhado. Como documentado na função average, a causa foi algum erro interno no interpretador de compreenções do Python.</p>
</div>

Calculado pela função:
```python
'q1': [
  [1.8055, 3.5664, 4.1345, 2.6491, 1.1845, 1],
  [1.8055, 3.5664, 4.1345, 2.6491, 1.1845, 1],
  [1.8055, 3.5664, 4.1345, 2.6491, 1.1845, 1],
  [1.8055, 3.5664, 4.1345, 2.6491, 1.1845, 1],
  [1.8055, 3.5664, 4.1345, 2.6491, 1.1845, 1],
  [1.8055, 3.5664, 4.1345, 2.6491, 1.1845, 1]],
```

Calculado pelo python corretamente:
```python
'q1': [
 [1.0,     6.6,   6.2, 3.666,   4.6, 3.266],
 [0.164,   1.0,   1.4, 0.706, 1.666, 0.528],
 [0.19,  0.866,   1.0, 0.662, 0.546, 0.546],
 [0.914, 2.206, 3.418,   1.0, 0.706, 0.694],
 [0.24,  1.246, 3.006, 2.206,   1.0, 0.688],
 [0.94,  3.824, 3.006, 2.634, 3.024, 1.0  ]]
```

In [None]:
teacher_matrices = util.calc_mean_matrix(ahp_teacher_responses)
market_matrices = util.calc_mean_matrix(ahp_market_responses)

Lembre que, como as perguntas são feitas em pares, desta forma, um item na diagonal principal sempre será 1, e.g, (0,0), (1,1), (2,2), (3,3)

## Calcula o AHP para as matrizes da resposta "média"


Calcula o AHP sobre cada matriz obtida no passo anterior.

<div class="p-3 mb-2 bg-danger text-white" style="border-radius:5px">
    No cenário de ser apenas uma única questão, deve ser calculado o seu percentual. Como fazer isso?
</div>


<p align="center">
    Vetor de possíveis valores dentro do ahp no sistema = <i>[1/9 1/7 1/5 1/3 1 3 5 7 9]</i>
</p>

__Solução:__ atualmente, irei fazer o seguinte cálculo:

$$
    x(n) = \frac{V(n) - 1/9}{9-1/9} \\
    \therefore \begin{cases}
                        x(1/9) = 0 \\
                        x(9) = 0.99
                      \end{cases}
$$

Cujo qual, ao arredondar em 2 casas decimais, me retorna 0.99 para o cenário máximo.
Todavia, uma vez que _Redes de computadores_ for extramemente baixo, o valor de 
_Software para sistemas de comunicação_ será alto:

$$
    \text{Redes} = \text{get_q15_value}(v) \\
    \text{Sof. Com.} = 1 - \text{Redes}
$$

<strong><sup>1</sup></strong> Checar se está correto esta abordagem. Uma vez que o ahp, dificilmente irá gerar valores extramemente desproporcionais (v >= 50%), a resposta do mercado irá tender a ser bem menor que a do aluno (com exceção ao cenário da resposta citada em (3)).

Ver a função `modules.ahp.Ahp.get_q15_value`
Com exceção do cenário da pergunta única (onde o AHP não é aplicado), todos os dados estão normalizados entre 0 e 1, desta forma, apenas esta pergunta precisaria ser tratada num primeiro momento.

In [None]:
sec_teacher = util.calc_ahp_for_new_mat(teacher_matrices)
sec_teacher

In [None]:
sec_market = util.calc_ahp_for_new_mat(market_matrices)

sec_market

## Realiza o mapping de competências

Esse mapping apenas abre cada posição de cada matriz e faz uma relação com a sua competência equivalente.



<div class="p-3 mb-2 bg-danger text-white" style="border-radius:5px">
    <p class="text-white" style="font-size:1.5em">Problema deste mapping direto (18/05/21)</p>
    <hr style="border: 1px solid"/>
    <p>
        Note que, esse mapping não é feito com base no nível hierárquico do AHP, isso implica em dizer que, ao final, <mark> a somatória do vetor final será igual à quantidade de matrizes</mark>, uma vez que cada matriz/conjunto de perguntas tem seu valor distribuído entre 0 e 1. Então, q1|q12|q13|q15|q2|q3|root, possuem valores cuja soma, será 1 para cada uma, portanto, a soma geral dá 7.
    </p>
    <p>
        Observe também que, cada nível/matriz, irá de 0 à 1, embora no cálculo do estudante este valor esteja contemplado entre 0 à 1 para cada competência, assim, num cenário onde 5 competências sejam analisadas no ahp, eu teria uma matriz 5x5 onde a somatória estaria entre [0,1], enquanto no caso do aluno, eu teria uma somatória de 5
    </p>
</div>

<div class="p-3 mb-2 bg-success text-white" style="border-radius:5px">
    <p class="text-white" style="font-size:1.5em">Possível solução: </p>
    <hr style="border: 1px solid"/>
    <p>
        Uma possível solução é <mark>separar pelos níveis do ahp</mark>, i.e, cada matriz deve ser analisada separadamente.
    </p>
    <p>
        Juntamente com isso, <mark>a nota final do estudante deverá ser "dividida" pelo número de linhas/colunas da matriz referente aquele nível</mark>, de modo que seria o equivalente à "agrupar" cada conjunto de grafos à possíveis respostas
    </p>
    <hr style="border: 1px solid"/>
    <p class="text-white" style="font-size:1.2em">Como fazer isso? </p>
    <p>
        <ol>
            <li> Multiplica cada matriz do AHP pelo número de colunas/linhas </li>
            <li> Faz um mapeamento reverso para o vetor de competência do estudante e então divide este para cada matriz</li>
        </ol>
    </p>
</div>

### Normalizando a nota do aluno

Faz o mapping por seções

In [None]:
aluno_sec = Ahp.Mapping.to_sections(notas_aluno)
aluno_sec

O máximo seria a quantidade de perguntas da seção no seu valor "máximo", ou seja:

$$
\text{Valor_pergunta}_j = \frac{\text{pergunta}_j}{\sum_{i=0}^N\text{pergunta}_i}
$$

In [None]:
def new_val(el):
    # print(f'Amount {amount}')
    return round(el/amount, ROUND_PLACES)

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_FORM_Q1)
aluno_sec['q1'] = list(map(new_val, aluno_sec['q1']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q12)
aluno_sec['q12'] = list(map(new_val, aluno_sec['q12']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q13)
aluno_sec['q13'] = list(map(new_val, aluno_sec['q13']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q15)
aluno_sec['q15'] = list(map(new_val, aluno_sec['q15']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q2)
aluno_sec['q2'] = list(map(new_val, aluno_sec['q2']))

amount = len(Ahp.Mapping.COMPETENCES_MATRIX_Q3)
aluno_sec['q3'] = list(map(new_val, aluno_sec['q3']))

aluno_sec

In [None]:
for i in aluno_sec:
    print(i, sum(aluno_sec[i]))

In [None]:
notas_aluno

In [None]:
notas_aluno_antes_normalizar = notas_aluno
notas_aluno = Ahp.Mapping.to_competences(aluno_sec)
notas_aluno

In [None]:
# # TENTANDO A SOLUÇÃO (1) APRESENTADA ACIMA
# for key in sec_market:
#     if key != 'q15':
#         size: int = len(sec_market[key])
#         sec_market[key]: List[float] = list(map(lambda el: el*size, sec_market[key]))
#     else:
#         sec_market[key] *= 2 # existem duas competências para esta pergunta/seção

# for key in sec_teacher:
#     if key != 'q15':
#         size: int = len(sec_teacher[key])
#         sec_teacher[key]: List[float] = list(map(lambda el: el*size, sec_teacher[key]))
#     else:
#         sec_teacher[key] *= 2 # existem duas competências para esta pergunta/seção
        

In [None]:
# montando o vetor do mercado com base no dicionário esperado
visao_mercado = Ahp.Mapping.to_competences(sec_market)
visao_professores = Ahp.Mapping.to_competences(sec_teacher)

del sec_teacher,sec_market

## Realiza alguns plots comparativos

### Plot da diferença entre os professores e o mercado


In [None]:
from modules import Plot

Plot.grouped_bar_plot(
    list(visao_mercado.keys()),
    ('Professores','Mercado'),
    ( list(visao_mercado.values()), list(visao_professores.values())))

### Plot em barras do ahp para todas as competências do mercado

In [None]:
# realiza o bar_plot para cada competência
# import plotly.express as px

# fig = px.bar(x=visao_mercado.keys(), y=visao_mercado.values(), labels=dict(yaxis_title="Valores"))
# fig.show()

## Remove as chaves que não estão na interseção destes conjuntos

Competências cuja coluna foi vazia, foram descartadas de possíveis possibilidades de grafos.

In [None]:
# removendo redes e softwares
visao_mercado.pop('Redes de computadores')
visao_mercado.pop('Software para sistemas de comunicação')

visao_professores.pop('Redes de computadores')
visao_professores.pop('Software para sistemas de comunicação')

notas_aluno.pop('Redes de computadores')
notas_aluno.pop('Software para sistemas de comunicação')

In [None]:
# removendo as keys que não foram mapeadas pela planilha dos alunos (colunas vazias)
visao_mercado = {k: visao_mercado[k] for k in notas_aluno.keys()}
visao_professores = {k: visao_professores[k] for k in notas_aluno.keys()}

# visao_mercado

In [None]:
# verifica se as keys são iguais, caso não for, tem algum problema
for m,a,p in zip(visao_mercado.keys(), notas_aluno.keys(), visao_professores):
    # print(f"Chave --> {k}, {j}")
    if m!=a or a!=p or m!=p:
        print(f"Erro: {m}, {p}, {a}")
        raise Exception("MISMATCH DE KEYS. VERIFIQUE O CÓDIGO")

# o vetor precisa ter o mesmo tamanho
if len(visao_mercado) != len(notas_aluno) or len(visao_mercado) != len(notas_aluno):
    raise Exception("VETORES DE TAMANHO DIFERENTE. VERIFIQUE O CÓDIGO")

## Calcula a proximidade

### Converte os dicionários do aluno e do mercado para vetores de escalares

Como é utilizada a mesma função de mapping, os valores estarão ordenados corretamente, de forma que não há motivos para se preocupar com isto

In [None]:
# Converte para um vetor
vetor_mercado = list(visao_mercado.values())
vetor_professores = list(visao_professores.values())
vetor_aluno = list(notas_aluno.values())

### Calcula o produto interno e a proximidade entre os ângulos

No espaço *Euclidiano*, um vetor possui magnitude e direção. A magnitude de dois vetores, também chamada de módulo, é dada por:
$$
||\vec{a}|| = \frac{1}{\sqrt{a_i^2}}
$$

O **produto interno/escalar** de dois vetores *Euclidianos*, $\vec{a}$ e $\vec{b}$ é definido como:
$$
\vec{a} \bullet \vec{b} = ||\vec{a}||\cdot||\vec{b}||\cdot\cos(\theta)
$$

<br/>

Portanto, o ângulo (em graus) entre eles é:
$$
\theta_\text{em graus} = \cos^{-1}(\theta) \equiv \cos^{-1}\underbrace{\left(\frac{\vec{a} \bullet \vec{b}}{||\vec{a}||\cdot||\vec{b}||}\right)}_\varphi
$$
[wikipedia](https://en.wikipedia.org/wiki/Dot_product#Geometric_definition)

<br/>

A proximidade entre os dois vetores será:

<pre>
90º -- 100 % (extramente diferentes)
ang -- x   % 
x' = 100*ang/90
x  = 100% - 100*ang/90
</pre>

$$
p_\text{%} = 100_\text{%} - 100_\text{%} \cdot \frac{\thetaº}{90º}
$$

In [None]:
# numpy linear algebra functions
from numpy import linalg as LAF
# to get arccos
import math

# calcula o produto escalar dos vetores do mercado e do aluno
pi_mercado_aluno: float = np.dot(vetor_mercado,vetor_aluno)
pi_mercado_professores: float = np.dot(vetor_mercado,vetor_professores)
pi_aluno_professores: float = np.dot(vetor_aluno,vetor_professores)

# calcula a norma de cada vetor (é um escalar)
norma_vetor_mercado: float = LAF.norm(vetor_mercado)
norma_vetor_professores: float = LAF.norm(vetor_professores)
norma_vetor_aluno: float = LAF.norm(vetor_aluno)

# calcula o valor de phi (varphi na fórmula acima)
phi_mercado_aluno: float = pi_mercado_aluno / (norma_vetor_mercado * norma_vetor_aluno)
phi_mercado_professores: float = pi_mercado_professores / (norma_vetor_mercado * norma_vetor_professores)
phi_aluno_professores: float = pi_aluno_professores / (norma_vetor_aluno * norma_vetor_professores)

# calcula o ângulo entre eles (em graus)
ang_mercado_aluno:float = round(
    # entrada e saída são em radianos, necessita a conversão para graus
    math.degrees(math.acos(phi_mercado_aluno)),
    2)
ang_mercado_professores:float = round(
    # entrada e saída são em radianos, necessita a conversão para graus
    math.degrees(math.acos(phi_mercado_professores)),
    2)
ang_aluno_professores:float = round(
    # entrada e saída são em radianos, necessita a conversão para graus
    math.degrees(math.acos(phi_aluno_professores)),
    2)

# exibe o ângulo entre eles
# print(f"O ângulo entre os dois vetores é de {angulo}º")


# calcula a proximidade - em porcentagem:
def proximidade(angulo: float) -> float:
    """
    Get proximity between two angles
    
    :Args:
        - `angulo`: The angle itself
        
    :Returns:
        The proximity in percents
    """
    return round(100-100*angulo/90, 2)

# Exibe a proximidade

print(f"Os vetores: [mercado, professores] são, aproximidamente, {proximidade(ang_mercado_professores)}% iguais.")
print(f"Os vetores: [mercado, aluno] são, aproximidamente, {proximidade(ang_mercado_aluno)}% iguais.")
print(f"Os vetores: [aluno, professores] são, aproximidamente, {proximidade(ang_aluno_professores)}% iguais.")

## Plots

### Plots radial/spyder

In [None]:
# Labels
categorias:List[str] = list(notas_aluno.keys())

#### Visão de competências aluno

Propagadas sobre os grafos

In [None]:
fig = Plot.spider_plot(
    categorias, 
    r1=list(notas_aluno.values()), 
    r1_name="Visão do aluno")

#### Visão de competências do mercado e do aluno

$$
\text{Visão_aluno} \cup \text{Visão_mercado}
$$

In [None]:
fig = Plot.spider_plot(
    categorias,
    r1=list(notas_aluno.values()),
    r1_name='Visão do aluno',
    r2=list(visao_mercado.values()),
    r2_name="Visão do mercado")

In [None]:
import plotly.graph_objects as go

fig = go.Figure(data=[
    go.Bar(name='Aluno', x=categorias, y=list(notas_aluno.values())),
    go.Bar(name='Professores', x=categorias, y=list(visao_professores.values())),
    go.Bar(name='Mercado', x=categorias, y=list(visao_mercado.values())),
])
fig.update_layout(barmode='group')
fig.show()

### Plot pollar sobre todas as competências

#### Realiza o pollarplot das visões

In [None]:
# Obtém os valores para serem inseridos nessa visualização
student_1 = list(notas_aluno.values())
teachers = mongo_competences[notas_aluno.keys()].values.tolist()

cols:List = ["class_color", *list(notas_aluno.keys())]
df = pd.DataFrame(columns=cols)

# add for teachers
for i,v in enumerate(teachers):
    nl = [2.5, *v]
    df = df.append(pd.DataFrame([nl], columns=cols), ignore_index=True)

# add for student
df = df.append( pd.DataFrame([[1.0, *student_1]], columns=cols), ignore_index=True)

# Generate the plot itself
Plot.parallel_plot(df, "class_color", show=False)