# Questões que precisam ser discutidas:

1. O que fazer com as linhas que os alunos não responderam nas planilhas? 
Atualmente, realiza a média de todas as planilhas, de forma que, no cenário que não há respostas, 
a resposta obtida será divida pelo total de planilhas. __Em teoria, todas as linhas deveriam ser respondidas__

2. Inicialmente, tinha um erro na forma como o grafo era gerado pois, o código não levava em 
consideração o peso da última matéria. No caso do grafo de _Arquitetura de computadores_, ele 
não levaria em consideração o peso de ECOI23. Desta forma, para contornar este problema de uma maneira mais elegante,
foi adicionado um nó _Fim/Formou_, onde o peso das últimas matérias são alocados na transição para este nó.
Uma vez que esta "matéria" é "virtual", o código irá entrar no cenário que o aluno não fez a matéria, e apenas irá
aplicar o peso.

<p align="center">
    <img src="../assets/img/erro_grafo_antigo.png" width="700px"/>
</p>

<p align="center">
    <img src="../assets/img/grafos_peso_transf_prox_solucao.png" width="500px"/>
</p>

<br/>

3. O que fazer no cenário da resposta única <mark>q15</mark>, cujo valor estará entre:

<p align="center">
    V = [1/9 1/7 1/5 1/3 1 3 5 7 9]
</p>

__R.:__ atualmente, irei fazer o seguinte cálculo:

$$
    x(n) = \frac{V(n) - 1/9}{9-1/9} \\
    \therefore \begin{cases}
                        x(1/9) = 0 \\
                        x(9) = 0.99
                      \end{cases}
$$

Cujo qual, ao arredondar em 2 casas decimais, me retorna 0.99 para o cenário máximo.
Todavia, uma vez que _Redes de computadores_ for extramemente baixo, o valor de 
_Software para sistemas de comunicação_ será alto:

$$
    \text{Redes} = \text{get_q15_value}(v) \\
    \text{Sof. Com.} = 1 - \text{Redes}
$$

<br/>

4. Checar se está correto esta abordagem. Uma vez que o ahp, dificilmente irá gerar valores extramemente desproporcionais (v >= 50%), a resposta do mercado irá tender a ser bem menor que a do aluno (com exceção ao cenário da resposta citada em (3)).

Ver a função `modules.ahp.Ahp.get_q15_value`

<br/>
<br/>

---
---
---

#### Configurando atalhos para o ipython

In [1]:
# execute %docs para abrir a documentação no chrome
%alias docs google-chrome-stable doc/build/html/index.html > /dev/null

# execute %outs para abrir a pasta out
%alias outs google-chrome-stable ../out/ > /dev/null

# habilita o autocomplete
%config IPCompleter.greedy = True

# exibe todas as funcões disponíveis
# %magic -brief

#### Imports globais (compartilhados)

In [2]:
# Utilities
from importlib import reload

# Pretty print
from pprint import pprint

# copy
from copy import deepcopy

# Import function to handle with paths
import os
from os import path

# Dataframe
import pandas as pd

# math library
import numpy as np

# typings
from typing import List,Dict, Tuple, final, Final, Union

# logger configs
import logging, logging.config

# plotling functions
from modules import Plot, util

#### Configurações default

In [3]:
# configuring default round places to this project
%env ROUND_PLACES 3

# mongodb connection string
CONNECTION_STRING: Final[str] = "mongodb://ppcamp:DRrPaRrHqmaWo43D@localhost:27017/?authSource=admin"

# gettint logger configs
logging.config.fileConfig('logging.conf')
# choosing logger
log: Final[logging.Logger] = logging.getLogger('main')

env: ROUND_PLACES=3


#### Removendo arquivos de saídas (plots)

In [4]:
!!rm ../out/graphs/* > /dev/null
!!rm ../out/gsheets_competences_plot/* > /dev/null

[]

----

# Análise sobre o perfil dos alunos formandos/formados do curso de Engenharia de Computação

<br/>

## 1. Obtendo a grade

Obtendo a grade do curso de computação 2015, com pré e có requisitos


In [5]:
# Módulo usado para obter a grade (do banco ou realiza raspagem)
from modules.grid import Grid
from networkx import DiGraph

# Não deve alterar estes grafos
pre: DiGraph
co: DiGraph
pre, co = Grid.get_grid(
    '0192015', 
    CONNECTION_STRING
)

[2021-04-05_11:21:05|INFO|root|get_grid#35] Getting grid
[2021-04-05_11:21:05|INFO|root|get_grid#45] Returning grid 0192015 from database


## 2. Obtêm os pesos das competências

### 2.1 Lendo os arquivos CSVs

Obtidos através das "planilhas do Google"

In [6]:
from modules import Skillset

# Faz a leitura dos arquivos csvs
_csvs:Skillset.DataFrames = Skillset.read_csvs("../assets/sheets")

### 2.2 Juntando as competências em um único dataframe

Atualmente, realiza a média das competências, isso quer dizer que, nos cenários onde os alunos não responderam, a média irá afetar o negativamente o cenário que houveram respostas.
Em suma, realiza a média das células (posições ixj) com base nas entradas de dataframes

In [7]:
# Realiza a média dos arquivos de competências
out:Final[pd.DataFrame] = Skillset.merge_data(_csvs)

# Remove os csvs não utilizados
del _csvs

### 2.3 Normalizando as competências

Num primeiro momento, é requisitado ao usuário que preencha as planilhas - `</assets/sheets>` - com valores 
até 10 para cada linha, ou seja, que cada matéria seja dividida entre competências internas, de forma que a 
soma destas competências, represente a matéria.

Uma vez que as linhas estejam "normalizadas", deverá ser feito a normalização por colunas, garantindo que 
uma determinada competência seja adquirida até um certo máximo, ou seja, 100%, no decorrer do curso

Ao normalizar por coluna<sup>1</sup>, temos que, a cada período, uma porcentagem do valor final que será analisada.

---

<sup>1</sup>.: Observe também que, ao normalizar por colunas, fazemos a seguinte convenção:
> Uma vez que a disciplina exista na grade, o peso relacionado é de acordo com esta
> competência, i.e, se a competência possuía 0.25 em apenas uma _única_ matéria, estaremos
> assumindo que a competência irá existir, e no curso, o maior valor possível será 100% de
> aproveitamento nesta. Analisando por exemplo, o cenário de _Desenvolvimento Web e Mobile_
>
> <cite> -- Pedro</cite>

In [8]:
# obtém a soma de cada coluna
_column_sum = out.apply(np.sum, axis=0)

# normaliza pelo maior valor cada coluna
for col in out.columns:
    out.loc[:, col] /= _column_sum[col]

# arredondando
out = out.round(4)

# conferindo se cada coluna (competência) terá sido propagada em seu máximo (100%)
# out.apply(np.sum,axis=0)

# exportando o dataframe
out.to_markdown('../out/df_competencias_gsheet.md')
del col

### 2.4 Plot de debug para cada competência


In [9]:
for col in out.columns:
    Plot.bar_plot(out, col, filename=f'../out/gsheets_competences_plot/{col}.svg')
    # Plot.pie_plot(out, col, show=True, threshold=0.04)

del col

[2021-04-05_11:21:06|DEBUG|root|bar_plot#210] Starting a new bar_plot: ../out/gsheets_competences_plot/Matemática e física.svg
[2021-04-05_11:21:06|DEBUG|root|bar_plot#223] Generating image files for ../out/gsheets_competences_plot/Matemática e física.svg
[2021-04-05_11:21:07|DEBUG|root|bar_plot#210] Starting a new bar_plot: ../out/gsheets_competences_plot/Lógica, algoritmos, teoria da comp,  estruras de dados..svg
[2021-04-05_11:21:07|DEBUG|root|bar_plot#223] Generating image files for ../out/gsheets_competences_plot/Lógica, algoritmos, teoria da comp,  estruras de dados..svg
[2021-04-05_11:21:07|DEBUG|root|bar_plot#210] Starting a new bar_plot: ../out/gsheets_competences_plot/Linguagens e paradigmas..svg
[2021-04-05_11:21:07|DEBUG|root|bar_plot#223] Generating image files for ../out/gsheets_competences_plot/Linguagens e paradigmas..svg
[2021-04-05_11:21:07|DEBUG|root|bar_plot#210] Starting a new bar_plot: ../out/gsheets_competences_plot/PAA.svg
[2021-04-05_11:21:07|DEBUG|root|bar_plo

## 3. Gerando um grafo da grade com base na relação de competências

- Cada competência gera um único _grafo_, assim, é necessário propagar os nós para todos os grafos e atribuir os vértices de acordo com a entrada dos alunos nos arquivos de **competências**

In [10]:
from networkx import DiGraph

# Obtendo uma cópia do grafo de pré requisito (este grafo possui o período de cada disciplina)
nodes:DiGraph = pre.copy()

# Removendo os vértices (conexões, que nates eram os pré requisitos)
nodes.remove_edges_from(list(nodes.edges()))


# Obtêndo o nome de cada coluna (será utilizada no grafo novo) ...
# ... Equivale às competências que foram encontradas (não zeradas nos csvs) ...
# ... Serão todas as competências dos alunos
competencias:Final[List[str]] = out.columns.to_list()

# Removendo os nós que não constam naquela planilha
nos_para_remocao:List[str] = [no for no in list(nodes.nodes()) if no not in out.index.to_list()]
nodes.remove_nodes_from(nos_para_remocao)

# remove variáveis que não serão mais utilizadas
del nos_para_remocao

### 3.1 Gerando os grafos de competências

O acumulado é dado pela soma das propagações, ou seja, para cada período é feito o seguinte cálculo:
$$
x =
        \begin{cases}
            \text{acumulado}\cdot\text{peso}, \text{[I]} \\
            \left(\frac{\text{notas[materia]}}{10}+\text{acumulado}\right)\cdot\text{peso},\text{[II]} \\
        \end{cases}
$$

Onde:
- I. Caso o aluno não tenha feito a matéria<sup>1</sup>, apenas passa o acumulado para o próximo período
- II. O aluno cursou a matéria do período atual<sup>2</sup> e, portanto soma com o acumulado e propaga.

---
<sup>1</sup>.: Caso seja uma matéria virtual, "Fim/Formou", se encaixa neste cenário.
<sup>2</sup>.: Não importa se passou (nota maior que 6) ou não, propaga a competência.



In [11]:
# importa o módulo que contém as funções para andar na grade
from modules.grid import Common as GC

# Instância que irá ter todos os objetos de grafos indexados pelas competências
grafos: Dict[str,DiGraph] = {}

# Obtêm as matérias do período seguinte (ou do próximo) que tiver ...
# ... este requisito, gerando conexões entre essas disciplinas
for competencia in competencias:
    # Instancia um novo grafo (baseado no grafo que já possui os nós) ...
    # ... para essa competência
    grafos[competencia]: DiGraph = nodes.copy()

    # últimas matérias que possuem esta competência
    last:List[str] = []

     # Itera essa competência para os próximos períodos
    for periodo in GC.get_periodo():
        # Obtêm a lista de todas as matérias do período atual
        materias_periodo_atual: List[str] = GC.get_materias(nodes, periodo)

        # Se maior igual à zero, nenhuma das matérias do período ...
        # ...possui valor para essa competência
        if GC.check_competencia(out, materias_periodo_atual, competencia):
            # portanto, pode pular esta disciplina
            continue        
        
        # Lista para armazenar todos os nós de matérias que possuem o ...
        # ... mesmo requisito nos próximos períodos
        materias_herdeiras: List[str] = []

        # Itera sobre os próximos períodos
        prox_periodo: int = periodo
        while prox_periodo < 10:
            prox_periodo += 1
            # Obtêm a lista de todas as matérias do período atual
            materias_proximo_periodo: List[str] = GC.get_materias(nodes, prox_periodo)

            # Verifica se neste período possui alguma matéria que herda aquela competência
            if GC.check_competencia(out, materias_proximo_periodo, competencia):
                continue
            else:
                # Caso encontre alguma matéria neste período coloca ela na ...
                # ... lista de materias que irão herdar a competência
                for i in materias_proximo_periodo:
                    if out.loc[i][competencia] > 0:
                        materias_herdeiras.append(i)
                        last = deepcopy(materias_herdeiras)
                # Força a saída deste loop
                break

        # Para cada matéria atual que possui a competência e cada ...
        # ... matéria futura que irá herdar, realiza a "junção"
        for materia_atual in materias_periodo_atual:
            # Verifica se a matéria possui esta competência
            if not out.loc[materia_atual][competencia]:
                continue
            
            # o peso é calculado sobre as matérias de um dado período          
            peso: float = GC.get_peso_competencia(
                out,
                materias_periodo_atual,
                competencia,
                materia_atual)

            # adiciona as arestas
            for materia_herdeira in materias_herdeiras:
                grafos[competencia].add_edge(
                    materia_atual,
                    materia_herdeira, 
                    weight=peso
                )
    
    # adiciona o último nó
    grafos[competencia].add_node('Fim/Formou', period=periodo+1)
    if last:
        log.debug(f"{competencia}. Exists, at least, two classes, in different periods to this competence.")
        for materia_atual in last:
            peso = out.loc[materia_atual, competencia]            
            grafos[competencia].add_edge(
                materia_atual,
                'Fim/Formou',
                weight=peso)
    else:
        # busca a matéria que possui esta competência
        materia_atual = out.where(out == 1.0).dropna(how='all').index.tolist()[0]
        log.debug(f"{competencia} - Didn't found other class acronym. Value {materia_atual}")
        # adiciona a única matéria que tem uma determinada competência e liga ao final
        grafos[competencia].add_edge(
            materia_atual,
            'Fim/Formou',
            weight=1.0
        )

# remove variáveis que não serão mais utilizadas
del (
    last,
    competencia,
    materia_atual,
    materia_herdeira,
    materias_herdeiras,
    materias_periodo_atual,
    materias_proximo_periodo,
    periodo,
    peso,
    prox_periodo,
    i,
    nodes,
    # com isso não é necessário manter o grafo de pre e co requisito mais
    pre,
    co,
    # também não é necessário manter mais o dataframe equivalente dos csvs
    out,
    # tão pouco é necessário manter as competências
    competencias)

[2021-04-05_11:21:09|DEBUG|main|<module>#77] Matemática e física. Exists, at least, two classes, in different periods to this competence.
[2021-04-05_11:21:09|DEBUG|main|<module>#77] Lógica, algoritmos, teoria da comp,  estruras de dados.. Exists, at least, two classes, in different periods to this competence.
[2021-04-05_11:21:09|DEBUG|main|<module>#77] Linguagens e paradigmas.. Exists, at least, two classes, in different periods to this competence.
[2021-04-05_11:21:09|DEBUG|main|<module>#77] PAA. Exists, at least, two classes, in different periods to this competence.
[2021-04-05_11:21:09|DEBUG|main|<module>#77] Configurar plataformas para softwares e serviços.. Exists, at least, two classes, in different periods to this competence.
[2021-04-05_11:21:09|DEBUG|main|<module>#77] Arquiteturas de computadores. Exists, at least, two classes, in different periods to this competence.
[2021-04-05_11:21:09|DEBUG|main|<module>#77] Segurança de sis. de comp.. Exists, at least, two classes, in d

### 3.2 Realizando o plot destes grafos

In [12]:
# Realiza o plot do grafo/grade
from modules.grid import Plot as PltGraph

# Itera sobre cada grafo de competencia
for competencia in grafos.keys():
    # Gera um plot para cada um com o peso saindo de cada matéria
    PltGraph.weighted_graph(
        grafos[competencia].nodes(),
        list(grafos[competencia].edges(data=True)),
        competencia.title().replace(' ','').replace('.',''),
        "../out/graphs")

del competencia

[2021-04-05_11:21:10|DEBUG|graphviz.files|save#199] write 24336 bytes to '../out/graphs/MatemáticaEFísica.dot'
[2021-04-05_11:21:10|DEBUG|graphviz.files|save#199] write 12695 bytes to '../out/graphs/Lógica,Algoritmos,TeoriaDaComp,EstrurasDeDados.dot'
[2021-04-05_11:21:10|DEBUG|graphviz.files|save#199] write 10551 bytes to '../out/graphs/LinguagensEParadigmas.dot'
[2021-04-05_11:21:10|DEBUG|graphviz.files|save#199] write 9724 bytes to '../out/graphs/Paa.dot'
[2021-04-05_11:21:10|DEBUG|graphviz.files|save#199] write 9801 bytes to '../out/graphs/ConfigurarPlataformasParaSoftwaresEServiços.dot'
[2021-04-05_11:21:10|DEBUG|graphviz.files|save#199] write 10362 bytes to '../out/graphs/ArquiteturasDeComputadores.dot'
[2021-04-05_11:21:10|DEBUG|graphviz.files|save#199] write 9637 bytes to '../out/graphs/SegurançaDeSisDeComp.dot'
[2021-04-05_11:21:10|DEBUG|graphviz.files|save#199] write 9971 bytes to '../out/graphs/EngenhariaDeSoftware.dot'
[2021-04-05_11:21:10|DEBUG|graphviz.files|save#199] writ

## 4. Obtendo a nota do aluno através do json

In [13]:
from modules import Score
import json

student_grid: str = path.join('..','assets','parsed_scores','2016001942.json')

# obtém o histórico de um único estudante
student_grid: json = Score.read_json(student_grid)

### 4.1 Obtendo apenas um dicionário relacionando nota e matérias

Também realiza a modificação dos dados para o cenário de reprovação

No caso de bomba, para não afetar a percepção de competência quanto ao que o aluno sabe, será propagado a maior nota, sendo esta, a que o aluno obteve êxito.

Uma vez que desejamos saber apenas a relação de competências, pressupõe-se que o aluno, ao ser aprovado, adiquiriu tais competências, desta forma, seu índice não deve ser penalizado pelas vezes que reprovou na disciplina

In [14]:
# Dicionário que irá obter a maior nota para cada disciplina que o aluno fez
notas: Dict[str,float] = {}

# anda sobre os períodos
for periodo in student_grid:
    # obtêm as matérias do período
    periodo_vetor = student_grid[periodo]
    
    # itera sobre as matérias
    for materia in periodo_vetor:
        # obtém a nota de uma determinada matéria
        score = periodo_vetor[materia]['scores']

        # pode ser uma string ("--") se ainda está cursando a matéria, ignora
        if type(score) is str:
            continue
        score = float(score)

        # Verifica se o aluno já fez a matéria
        if materia in notas:
            # Coloca a maior nota do aluno, caso este já tenha repetido a matéria
            notas[materia]: float = max(notas[materia], score)
        else:
            # Primeira vez que fez a matéria
            notas[materia]: float = score

del (
    periodo_vetor,
    periodo,
    materia,
    score,
    # com isso, não é mais necessário manter a grade do estudante
    student_grid)

---

## 5. Andando no grafo e propagando os valores

$\forall$ Competência $\to$ anda no seu grafo, propagando o valor da competência

In [15]:
# anda sobre o grafo para o(s) aluno(s)
notas_aluno = GC.walk_through_graph(grafos, notas)

### 5.1 Debugging

In [16]:
# aluno ideal
notas_ideais = list(grafos[list(grafos.keys())[0]].nodes())
notas_ideais = {k: 10 for k in notas_ideais[:-1]}

# anda sobre o grafo para o(s) aluno(s) ideal(is)
notas_ideais = GC.walk_through_graph(grafos, notas_ideais)


# Nota de desenvolvimento WEB (que, até então, só possui uma única matéria)
print('A nota de desenvolvimento web precisa ser igual ao peso. No cenário do aluno ideal (100%): {}'.format(notas['ECOI15']/10), end='\n\n\n')

# verifica se no cenário de nota ideal, houve algum erro
if list(filter(lambda n: n != 1.0, notas_ideais.values())):
    raise Exception("Some error occurred. Check all code. All values should be 1.0")

print("Notas do aluno:")
for competencia, resultado in notas_aluno.items():
    print(competencia, resultado)

del competencia,resultado

A nota de desenvolvimento web precisa ser igual ao peso. No cenário do aluno ideal (100%): 0.82


Notas do aluno:
Matemática e física 0.9
Lógica, algoritmos, teoria da comp,  estruras de dados. 0.71
Linguagens e paradigmas. 0.9
PAA 0.63
Configurar plataformas para softwares e serviços. 0.9
Arquiteturas de computadores 0.83
Segurança de sis. de comp. 0.82
Engenharia de software 0.64
Inteligência artificial 0.78
Desenvolvimento Web e Mobile 0.82
Sistemas microprocessados 0.6
Redes de computadores 0.8
Software para sistemas de comunicação 0.36
Conhecimento em sistemas de automação  0.79
Gerenciar projetos e sistemas de computação 0.71
Engenharia-econômica 0.84
Compreender e resolver problemas 0.9
Autoaprendizado 0.71
Criatividade e Inovação 0.71
Comunicação oral e escrita 0.71
Língua inglesa 0.7
Empreender e exercer liderança 0.71
Trabalho em equipe 0.71


## 6. Insere os valores do mercado

### 6.1 Carrega as respostas do banco

In [17]:
# importa o módulo que carrega os dados do banco mongo
from modules.ahp import Database

# carrega o módulo que calcula o ahp
from modules.ahp import Ahp

# connecta no db
ahp_form_responses = Database.AhpForm(CONNECTION_STRING)

# obtém as respostas do mongo (respostas do site)
ahp_form_responses = ahp_form_responses.getAll()

### 6.2 Obtêm uma relação de competências por resposta do banco

Obtêm as competências e seus valores. Atualmente **aceita** *CRs* **inválidos**, caso não queira aceitar mais, será necessário:
- Descartar toda a `resposta`
- Ou, colocar todas as competências da matriz cujo CR é inválido, como -1 ou 0

Note que no cenário onde a matriz é <mark>q15</mark>, está colocando o valor original, deve ser uma relação, ao invés disso.

In [136]:
# dataframe de consistência para cada resposta
_dfconsist = [
    'root',
    'q1',
    'q12',
    'q13',
    'q2',
    'q3',
]
mongo_competences_consistency: pd.DataFrame = pd.DataFrame(columns = _dfconsist)

# cria um dataframe para armazenar a relação de respostas por competência
mongo_competences: pd.DataFrame = pd.DataFrame(columns = [
    # root
    "Conhecimento técnico",
    "Competências, habilidades e atributos pessoais e profissionais: gerenciar projetos, compreender problemas e autoaprendizado",
    "Competências e habilidades interpessoais: trabalho em equipe e comunicação",

    # q1
    "Matemática e física",
    "Conhecimento, métodos e ferramentas fundamentais de computação básica",
    "Conhecimento, métodos e ferramentas na área de sistemas de software",
    "Sistemas microprocessados",
    "Conhecimentos básicos em sistemas de comunicação",
    "Conhecimento em sistemas de automação ",

    # q12
    "Lógica, algoritmos, teoria da comp,  estruras de dados.",
    "Linguagens e paradigmas.",
    "PAA",

    # q13
    "Configurar plataformas para softwares e serviços.",
    "Arquiteturas de computadores",
    "Segurança de sis. de comp.",
    "Engenharia de software",
    "Inteligência artificial",
    "Desenvolvimento Web e Mobile",

    # q15
    "Redes de computadores",
    "Software para sistemas de comunicação",

    # q2
    "Gerenciar projetos e sistemas de computação",
    "Engenharia-econômica",
    "Compreender e resolver problemas",
    "Autoaprendizado",
    "Criatividade e Inovação",

    # q3
    "Comunicação oral e escrita",
    "Língua inglesa",
    "Empreender e exercer liderança",
    "Trabalho em equipe",
])


# anda sobre os valores obtidos do site (mongo)
for response in ahp_form_responses:
    _secoes = {}
    # anda sobre as matrizes desta resposta
    _matrices = response.getMatrices()
    _cline = {k:None for k in _dfconsist}

    for k,v in _matrices.items():
        # verifica se é um escalar
        if k == "q15":
            priority_vec = Ahp.get_q15_value(v)
            log.debug(f"q15: {v} -> {priority_vec}")
        else:
            # caso seja uma matriz, calcula o ahp.
            _cline[k], priority_vec = Ahp.calculate(v)
            # NOTE que aceita AHP errados

        # adiciona as competências para cada matriz
        _secoes[k]:Union[float, List[float]] = priority_vec

    mongo_competences_consistency = mongo_competences_consistency.append(
        _cline, ignore_index=True)
        
    # faz o mapping para essas competências
    _n:Dict[str,float] = Ahp.mapping_competences(_secoes)
    
    # adiciona o dicionário de competências ao dataframe
    mongo_competences = mongo_competences.append(_n, ignore_index=True)

del (
    _dfconsist)


[2021-04-05_12:53:29|DEBUG|main|<module>#70] q15: 3 -> 0.325
[2021-04-05_12:53:29|DEBUG|main|<module>#70] q15: 1 -> 0.1
[2021-04-05_12:53:29|DEBUG|main|<module>#70] q15: 3 -> 0.325
[2021-04-05_12:53:29|DEBUG|main|<module>#70] q15: 1 -> 0.1
[2021-04-05_12:53:29|DEBUG|main|<module>#70] q15: 0.2 -> 0.01


In [137]:
mongo_competences.head()

Unnamed: 0,Conhecimento técnico,"Competências, habilidades e atributos pessoais e profissionais: gerenciar projetos, compreender problemas e autoaprendizado",Competências e habilidades interpessoais: trabalho em equipe e comunicação,Matemática e física,"Conhecimento, métodos e ferramentas fundamentais de computação básica","Conhecimento, métodos e ferramentas na área de sistemas de software",Sistemas microprocessados,Conhecimentos básicos em sistemas de comunicação,Conhecimento em sistemas de automação,"Lógica, algoritmos, teoria da comp, estruras de dados.",...,Software para sistemas de comunicação,Gerenciar projetos e sistemas de computação,Engenharia-econômica,Compreender e resolver problemas,Autoaprendizado,Criatividade e Inovação,Comunicação oral e escrita,Língua inglesa,Empreender e exercer liderança,Trabalho em equipe
0,0.280471,0.072874,0.646654,0.260368,0.031426,0.065533,0.097729,0.266555,0.278389,0.109965,...,0.675,0.203847,0.203847,0.033425,0.033425,0.525457,0.038274,0.608953,0.176386,0.176386
1,0.141635,0.429183,0.429183,0.378278,0.050411,0.040457,0.245231,0.091248,0.194375,0.333333,...,0.9,0.452093,0.177469,0.213832,0.063049,0.093557,0.097191,0.482128,0.21034,0.21034
2,0.180473,0.748519,0.071008,0.092765,0.092765,0.189625,0.21761,0.189625,0.21761,0.157859,...,0.675,0.206279,0.44092,0.111769,0.111769,0.129263,0.108952,0.524748,0.208449,0.157851
3,0.65596,0.186181,0.157859,0.275252,0.107851,0.053057,0.177787,0.178562,0.207491,0.141635,...,0.9,0.2,0.2,0.2,0.2,0.2,0.106953,0.411175,0.362073,0.119799
4,0.198803,0.198803,0.602394,0.277778,0.055556,0.055556,0.055556,0.277778,0.277778,0.333333,...,0.99,0.257856,0.436284,0.105911,0.094039,0.105911,0.16625,0.50125,0.16625,0.16625


In [138]:
mongo_competences_consistency

Unnamed: 0,root,q1,q12,q13,q2,q3
0,0.054903,0.14721,-0.005516,0.205168,0.093955,0.091662
1,-0.000143,0.056589,-0.000259,0.110835,0.064445,0.056089
2,0.019391,0.046239,0.022048,0.000194,0.072933,0.042251
3,0.022048,0.050406,-0.000143,0.032895,0.0,0.010073
4,-1.8e-05,0.000426,-0.000259,0.047272,0.028031,-0.002151


### 6.3 Plot do AHP sobre as antigas matrizes

In [139]:
# realiza o bar_plot para cada competência
Plot.all_competencies(mongo_competences)

### 6.4 Realiza uma média ponderada sobre as respostas do banco

Itera sobre todas as respostas:

1. Verificando se estas respostas são válidas (CR < 0.1)
2. Gerando a média das matrizes válidas e adicionando estas num dicionário que, futuramente,
será usado para o cálculo do ahp

In [140]:
# dicionário de matrizes (que irão conter a média das matrizes )
matrices:Dict[str, Union[List[List[float]], float]] = {}

# obtém as possiveis keys do questionário (ids das matrizes)
matrices_ids:List[str] = list(ahp_form_responses[0].getMatrices().keys())

# calcula a média ponderada das matrizes
for matrix in matrices_ids:
    _mats = []

    # anda sobre uma determinada "matrix" sobre todas as respostas
    for response in ahp_form_responses:
        # obtêm a matriz
        _m:List[List] = response.getMatrices()[matrix]

        # verifica se é uma matriz com base na chave (q15 é um escalar)
        if matrix != 'q15':
            # verifica se a matriz atual é um AHP válido ...
            # ... se for, adiciona essa matriz válida ...
            # ... dessa forma, futuramente, ela será incluída no cálculo da média
            cr,_comp = Ahp.calculate(_m)
            if cr <= 0.1:
                _mats.append(_m)
        # caso contrário, se trata de um escalar e, portanto, deverá ...
        # ... ser encontrado o seu equivalente
        else:
            _mats.append(Ahp.get_q15_value(_m))

    # calcula a média ponderada para cada matriz válida
    matrices[matrix] = util.average(*_mats)

### 6.5 Calcula o AHP sobre as novas matrizes

Calcula o AHP sobre cada matriz obtida no passo anterior

No cenário de ser apenas uma única questão, deve ser calculado o seu percentual. Como fazer isso?

Com exceção do cenário da pergunta única (onde o AHP não é aplicado), todos os dados estão normalizados entre 0 e 1, desta forma, apenas esta pergunta precisaria ser tratada num primeiro momento.

<p align="center">
    Matrix: <mark>q15</mark>
</p>

In [141]:
secoes:Dict[str,List or float] = {}

for matrix in matrices:
    # print(f"Matrix: {matrix}\n{'-'*100}")
    cr, priorityVec = 0, matrices[matrix]

    # se for uma matriz, calcula o ahp
    if matrix != 'q15':
        cr, priorityVec = Ahp.calculate(matrices[matrix])
        # arredonda o vetor de saída (resultante) para 2 casas decimais
        priorityVec = list(np.round(priorityVec, 2))
    
    # adiciona este dado no vetor de competências do mercado
    secoes[matrix] = priorityVec

    # print(f"CR: {cr}\n\tVetor de pesos:")
    # pprint(priorityVec)
    # print("\n\n")

### 6.5 Realiza o mapping de competências

Note que, como o AHP fornece valores para cada matriz entre \[0..1\], estou assumindo que já estará normalizado. Nas notas ideias, cada competência poderá alcançar um máximo de 1, ou seja, se existem 23 disciplinas, o somatório seria 23.

In [142]:
# montando o vetor do mercado com base no dicionário esperado
visao_mercado = Ahp.mapping_competences(secoes)

del secoes

In [143]:
visao_mercado

{'Conhecimento técnico': 0.33,
 'Competências, habilidades e atributos pessoais e profissionais: gerenciar projetos, compreender problemas e autoaprendizado': 0.33,
 'Competências e habilidades interpessoais: trabalho em equipe e comunicação': 0.33,
 'Conhecimento, métodos e ferramentas fundamentais de computação básica': 0.17,
 'Conhecimento, métodos e ferramentas na área de sistemas de software': 0.17,
 'Conhecimentos básicos em sistemas de comunicação': 0.17,
 'Desenvolvimento Web e Mobile': 0.17,
 'Matemática e física': 0.17,
 'Lógica, algoritmos, teoria da comp,  estruras de dados.': 0.33,
 'Linguagens e paradigmas.': 0.33,
 'PAA': 0.33,
 'Configurar plataformas para softwares e serviços.': 0.17,
 'Arquiteturas de computadores': 0.17,
 'Segurança de sis. de comp.': 0.17,
 'Engenharia de software': 0.17,
 'Inteligência artificial': 0.17,
 'Sistemas microprocessados': 0.17,
 'Redes de computadores': 0.172,
 'Software para sistemas de comunicação': 0.8280000000000001,
 'Conhecimento 

### 6.6 Plot do AHP sobre as novas matrizes

In [148]:
# realiza o bar_plot para cada competência
import plotly.express as px

fig = px.bar(x=visao_mercado.keys(), y=visao_mercado.values(), labels=dict(yaxis_title="Valores"))
fig.show()

### 6.7 Remove as chaves que não estão na interseção destes conjuntos

Competências cuja coluna foi vazia, foram descartadas de possíveis possibilidades de grafos.

In [149]:
# removendo as keys que não foram mapeadas pela planilha dos alunos (colunas vazias)
visao_mercado = {k: visao_mercado[k] for k in notas_aluno.keys()}

visao_mercado

{'Matemática e física': 0.17,
 'Lógica, algoritmos, teoria da comp,  estruras de dados.': 0.33,
 'Linguagens e paradigmas.': 0.33,
 'PAA': 0.33,
 'Configurar plataformas para softwares e serviços.': 0.17,
 'Arquiteturas de computadores': 0.17,
 'Segurança de sis. de comp.': 0.17,
 'Engenharia de software': 0.17,
 'Inteligência artificial': 0.17,
 'Desenvolvimento Web e Mobile': 0.17,
 'Sistemas microprocessados': 0.17,
 'Redes de computadores': 0.172,
 'Software para sistemas de comunicação': 0.8280000000000001,
 'Conhecimento em sistemas de automação ': 0.17,
 'Gerenciar projetos e sistemas de computação': 0.2,
 'Engenharia-econômica': 0.2,
 'Compreender e resolver problemas': 0.2,
 'Autoaprendizado': 0.2,
 'Criatividade e Inovação': 0.2,
 'Comunicação oral e escrita': 0.25,
 'Língua inglesa': 0.25,
 'Empreender e exercer liderança': 0.25,
 'Trabalho em equipe': 0.25}

In [153]:
# verifica se as keys são iguais, caso não for, tem algum problema
for k,j in zip(visao_mercado.keys(), notas_aluno.keys()):
    # print(f"Chave --> {k}, {j}")
    if k != j:
        print(f"Erro: {k}, {j}")
        raise Exception("MISMATCH DE KEYS. VERIFIQUE O CÓDIGO")

# o vetor precisa ter o mesmo tamanho
if len(visao_mercado) != len(notas_aluno):
    raise Exception("VETORES DE TAMANHO DIFERENTE. VERIFIQUE O CÓDIGO")

## 7. Converte os dicionários do aluno e do mercado para vetores de escalares

Como é utilizada a mesma função de mapping, os valores estarão ordenados, de forma que não há motivos para se preocupar com isto por hora

In [154]:
# Converte para um vetor
vetor_mercado = list(visao_mercado.values())
vetor_aluno = list(notas_aluno.values())

## 8. Calcula a proximidade

No espaço *Euclidiano*, um vetor possui magnitude e direção. A magnitude de dois vetores, também chamada de módulo, é dada por:
$$
||\vec{a}|| = \frac{1}{\sqrt{a_i^2}}
$$

O **produto interno/escalar** de dois vetores *Euclidianos*, $\vec{a}$ e $\vec{b}$ é definido como:
$$
\vec{a} \bullet \vec{b} = ||\vec{a}||\cdot||\vec{b}||\cdot\cos(\theta)
$$

<br/>

Portanto, o ângulo (em graus) entre eles é:
$$
\theta_\text{em graus} = \cos^{-1}(\theta) \equiv \cos^{-1}\underbrace{\left(\frac{\vec{a} \bullet \vec{b}}{||\vec{a}||\cdot||\vec{b}||}\right)}_\varphi
$$
[wikipedia](https://en.wikipedia.org/wiki/Dot_product#Geometric_definition)

<br/>

A proximidade entre os dois vetores será:

<pre>
90º -- 100 % (extramente diferentes)
ang -- x   % 
x' = 100*ang/90
x  = 100% - 100*ang/90
</pre>

$$
p_\text{%} = 100_\text{%} - 100_\text{%} \cdot \frac{\thetaº}{90º}
$$


In [155]:
# numpy linear algebra functions
from numpy import linalg as LAF
# to get arccos
import math

# calcula o produto escalar dos vetores do mercado e do aluno
produto_interno:float = np.dot(vetor_mercado,vetor_aluno)

# calcula a norma de cada vetor (é um escalar)
norma_vetor_mercado:float = LAF.norm(vetor_mercado)
norma_vetor_aluno:float = LAF.norm(vetor_aluno)

# calcula o valor de phi (varphi na fórmula acima)
phi:float = produto_interno / (norma_vetor_mercado * norma_vetor_aluno)

# calcula o ângulo entre eles (em graus)
angulo:float = round(
    # entrada e saída são em radianos, necessita a conversão para graus
    math.degrees(math.acos(phi)),
    2)

# exibe o ângulo entre eles
print(f"O ângulo entre os dois vetores é de {angulo}º")


# calcula a proximidade - em porcentagem:
proximidade:float = round(
    100-100*angulo/90, 
    2)

# Exibe a proximidade
print(f"Os vetores são, aproximidamente, {proximidade}% iguais.")

O ângulo entre os dois vetores é de 36.52º
Os vetores são, aproximidamente, 59.42% iguais.


## 10. Realiza os plots de competências (radial/spyder plot)

In [158]:
# Labels
categorias:List[str] = list(notas_aluno.keys())

### 10.1 Visão de competências aluno

Propagadas sobre os grafos

In [167]:
fig = Plot.spider_plot(
    categorias, 
    r1=list(notas_aluno.values()), 
    r1_name="Visão do aluno")

[2021-04-05_13:10:01|DEBUG|root|spider_plot#39] Starting a new plot


### 10.2 Visão de competências do mercado e do aluno

$$
\text{Visão_aluno} \cup \text{Visão_mercado}
$$

In [162]:
fig = Plot.spider_plot(
    categorias,
    r1=list(notas_aluno.values()),
    r1_name='Visão do aluno',
    r2=list(visao_mercado.values()),
    r2_name="Visão do mercado")

[2021-04-05_13:08:52|DEBUG|root|spider_plot#39] Starting a new plot


### 10.3 Realiza o pollarplot das visões

In [166]:
# Obtém os valores para serem inseridos nessa visualização
student_1 = list(notas_aluno.values())
teachers = mongo_competences[notas_aluno.keys()].values.tolist()

cols:List = ["class_color", *list(notas_aluno.keys())]
df = pd.DataFrame(columns=cols)

# add for teachers
for i,v in enumerate(teachers):
    nl = [2.5, *v]
    df = df.append(pd.DataFrame([nl], columns=cols), ignore_index=True)

# add for student
df = df.append( pd.DataFrame([[1.0, *student_1]], columns=cols), ignore_index=True)

# Generate the plot itself
Plot.parallel_plot(df, "class_color", show=False)

<br/>
<br/>

---
---
---

# Outras funções métodos

## - Buscando as notas através do bot de raspagem

Mandando o `spyder` rodar com os parâmetros abaixo:
```bash
curl -u 9a357fcfff6341378238837dcce40bdf: https://app.scrapinghub.com/api/run.json \
  -d project=460296 \
  -d spider=history \
  -d user='NUMERO_CPF' \
  -d pswd='SENHA_SIGAA' \
  -d course='NÃO_É_ÚTIL_AQUI' 
```

You can get the **Api key** [here](https://app.scrapinghub.com/account/apikey)

Os dados obtidos estão em um formato do tipo
```javascript
{
    "CourseName": "ENGENHARIA DE COMPUTAÇÃO/ICT - Itabira - BACHARELADO - MT",
    "CurrentYearPeriod": "2020.2",
    "StartYearPeriod": "2016.1",
    "RA": "2016001942",
    "Semester": {
      "2020.2": {
        "ECOI32.1": {
          "Name": "CIRCUITOS INTEGRADOS ANALÓGICOS",
          "Score": "6,7",
          "Fouls": "0",
          "Situation": "APROVADO",
          "Class": "01",
          "Hours": "32h"
        },
        ...
      },
      ...
    }
}
```

In [None]:
# Loads the credentials file
from json import load

# Load credentials json
credentials = None
with open('credentials.json') as file:
    credentials = load(file)
    
    
# Scrapping
from scrapinghub import ScrapinghubClient
from time import sleep as Wait

# Run job
apikey = '9a357fcfff6341378238837dcce40bdf'
client = ScrapinghubClient(apikey)
project = client.get_project(460296)
job = project.jobs.run('history', 
    job_args={
        'user': credentials['user.login'],
        'pswd': credentials['user.senha'],
        # 'course':'0192015'
})

# Check if job is running
job_state = 'running'
while job_state != 'finished':
    # Check for job state at each 1.5 min
    Wait(60*1.5)
    # Get job state from scrapyhub
    job_state = job.finish()

In [None]:
## Obtendo somente uma relação de notas para as matérias
periodos = {}
# Obtendo as notas
for items in job.items.iter():
    periodos = items[b'Semester']
    
# Threating the data
notas = {}
# Convertendo os dados
for periodo in periodos:
    periodoVetor = periodos[periodo]
    for materia in periodoVetor:
        materiaUtf8 = materia.decode('utf-8')
        # Se encontrar uma disciplina que tenha um ponto, trata-se de um bloco
        if materiaUtf8[-2] == '.':
            # Então ignora, pois ela já está contabilizada na disciplina final (sem o ponto)
            continue
        

        score = periodoVetor[materia][b'Score']
        # Ignora as matérias que ainda estão sendo feitas
        if b'--' in score:
            continue
        
        # Converte para float
        score = float(score.decode('utf-8').replace(',','.'))
        
        # Verifica se o aluno já fez a matéria
        if materiaUtf8 in notas:
            # Verifica se já repetiu mais de uma vez
            if type(notas[materiaUtf8]) is list:
                # Se já tiver repetido mais de uma vez, adiciona ao vetor
                notas[materiaUtf8].append(score)
            else:
                # Primeira vez que repetiu
                notas[materiaUtf8] = [notas[materiaUtf8], score]
        else:
            # Primeira vez que fez a matéria
            notas[materiaUtf8] = score


# Para cada elemento no dicionário de notas, verifica se repetiu, caso tenha, realiza média
for materia in notas:
    if type(notas[materia]) is list:
        total = sum(notas[materia])
        numero_elementos = len(notas[materia])
        notas[materia] = round(total/numero_elementos, 2)

## - Raspagem por pdf

Raspa e joga na pasta de json

In [None]:
from modules.score import Score

Score.parse_pdf('2016001942', path.join('..', 'assets', 'scores'))

## - Preenchimento de dados no mongo

In [None]:
from modules.ahp.Types import FormData
from modules.ahp import Database

ahp = Database.AhpForm(connection_string)

# lRoot, q1s2, q1sec5, q3

new_response = FormData() \
.setName("") \
.setEmail("") \
.setDate("") \
.setMatrixRoot([
    [1,1,0.33],
    [1,1,0.33],
    [3.03,3.03,1],
]) \
.setMatrixQ1([
    [1,5,5,5,1,1],
    [0.2,1,1,1,0.2,0.2],
    [0.2,1,1,1,0.2,0.2],
    [0.2,1,1,1,0.2,0.2],
    [1,5,5,5,1,1],
    [1,5,5,5,1,1],
]) \
.setMatrixQ1sec2([
    [1,1,1],
    [1,1,1],
    [1,1,1],
]) \
.setMatrixQ1sec3([
    [1,3,1,5,3,5],
    [0.33,1,0.33,5,1,3],
    [1,3.03,1,5,1,3],
    [0.2,0.2,0.2,1,0.2,0.33],
    [0.33,1,1,5,1,3],
    [0.2,0.33,0.33,3.03,0.33,1],
]) \
.setMatrixQ1sec5(0.2) \
.setMatrixQ2([
    [1,0.33,3,3,3],
    [3.03,1,3,5,3],
    [0.33,0.33,1,1,1],
    [0.33,0.2,1,1,1],
    [0.33,0.33,1,1,1],
]) \
.setMatrixQ3([
    [1,0.33,1,1],
    [3.03,1,3,3],
    [1,0.33,1,1],
    [1,0.33,1,1],
])

ahp.insert(new_response.toDict())