# Anotações

**Questões que precisam ser discutidas:**

1. O que fazer com as linhas que os alunos não responderam nas planilhas? 
Atualmente, realiza a média de todas as planilhas, de forma que, no cenário que não há respostas, 
a resposta obtida será divida pelo total de planilhas. __Em teoria, todas as linhas deveriam ser respondidas__

2. Inicialmente, tinha um erro na forma como o grafo era gerado pois, o código não levava em 
consideração o peso da última matéria. No caso do grafo de _Arquitetura de computadores_, ele 
não levaria em consideração o peso de ECOI23. Desta forma, para contornar este problema de uma maneira mais elegante,
foi adicionado um nó _Fim/Formou_, onde o peso das últimas matérias são alocados na transição para este nó.
Uma vez que esta "matéria" é "virtual", o código irá entrar no cenário que o aluno não fez a matéria, e apenas irá
aplicar o peso.

<a href="../assets/img/erro_grafo_antigo.png">
    <img align="center" src="../assets/img/erro_grafo_antigo.png" width="500px" class="center"/>
</a>
<br/>
<a href="../assets/img/grafos_peso_transf_prox_solucao.png">
    <img src="../assets/img/grafos_peso_transf_prox_solucao.png" width="300px" class="center"/>
</a>

<br/>

3. O que fazer no cenário da resposta única <mark>q15</mark>, cujo valor estará entre:

<p align="center">
    V = [1/9 1/7 1/5 1/3 1 3 5 7 9]
</p>

__R.:__ atualmente, irei fazer o seguinte cálculo:

$$
    x(n) = \frac{V(n) - 1/9}{9-1/9} \\
    \therefore \begin{cases}
                        x(1/9) = 0 \\
                        x(9) = 0.99
                      \end{cases}
$$

Cujo qual, ao arredondar em 2 casas decimais, me retorna 0.99 para o cenário máximo.
Todavia, uma vez que _Redes de computadores_ for extramemente baixo, o valor de 
_Software para sistemas de comunicação_ será alto:

$$
    \text{Redes} = \text{get_q15_value}(v) \\
    \text{Sof. Com.} = 1 - \text{Redes}
$$

<br/>

4. Checar se está correto esta abordagem. Uma vez que o ahp, dificilmente irá gerar valores extramemente desproporcionais (v >= 50%), a resposta do mercado irá tender a ser bem menor que a do aluno (com exceção ao cenário da resposta citada em (3)).

Ver a função `modules.ahp.Ahp.get_q15_value`

<br/>
<br/>

---
---

# Outras funções métodos

## - Buscando as notas através do bot de raspagem


Mandando o `spyder` rodar com os parâmetros abaixo:
```bash
curl -u 9a357fcfff6341378238837dcce40bdf: https://app.scrapinghub.com/api/run.json \
  -d project=460296 \
  -d spider=history \
  -d user='NUMERO_CPF' \
  -d pswd='SENHA_SIGAA' \
  -d course='NÃO_É_ÚTIL_AQUI' 
```

You can get the **Api key** [here](https://app.scrapinghub.com/account/apikey)

Os dados obtidos estão em um formato do tipo
```javascript
{
    "CourseName": "ENGENHARIA DE COMPUTAÇÃO/ICT - Itabira - BACHARELADO - MT",
    "CurrentYearPeriod": "2020.2",
    "StartYearPeriod": "2016.1",
    "RA": "2016001942",
    "Semester": {
      "2020.2": {
        "ECOI32.1": {
          "Name": "CIRCUITOS INTEGRADOS ANALÓGICOS",
          "Score": "6,7",
          "Fouls": "0",
          "Situation": "APROVADO",
          "Class": "01",
          "Hours": "32h"
        },
        ...
      },
      ...
    }
}
```

In [None]:
# Loads the credentials file
from json import load

# Load credentials json
credentials = None
with open('credentials.json') as file:
    credentials = load(file)
    
    
# Scrapping
from scrapinghub import ScrapinghubClient
from time import sleep as Wait

# Run job
apikey = '9a357fcfff6341378238837dcce40bdf'
client = ScrapinghubClient(apikey)
project = client.get_project(460296)
job = project.jobs.run('history', 
    job_args={
        'user': credentials['user.login'],
        'pswd': credentials['user.senha'],
        # 'course':'0192015'
})

# Check if job is running
job_state = 'running'
while job_state != 'finished':
    # Check for job state at each 1.5 min
    Wait(60*1.5)
    # Get job state from scrapyhub
    job_state = job.finish()

In [None]:
## Obtendo somente uma relação de notas para as matérias
periodos = {}
# Obtendo as notas
for items in job.items.iter():
    periodos = items[b'Semester']
    
# Threating the data
notas = {}
# Convertendo os dados
for periodo in periodos:
    periodoVetor = periodos[periodo]
    for materia in periodoVetor:
        materiaUtf8 = materia.decode('utf-8')
        # Se encontrar uma disciplina que tenha um ponto, trata-se de um bloco
        if materiaUtf8[-2] == '.':
            # Então ignora, pois ela já está contabilizada na disciplina final (sem o ponto)
            continue
        

        score = periodoVetor[materia][b'Score']
        # Ignora as matérias que ainda estão sendo feitas
        if b'--' in score:
            continue
        
        # Converte para float
        score = float(score.decode('utf-8').replace(',','.'))
        
        # Verifica se o aluno já fez a matéria
        if materiaUtf8 in notas:
            # Verifica se já repetiu mais de uma vez
            if type(notas[materiaUtf8]) is list:
                # Se já tiver repetido mais de uma vez, adiciona ao vetor
                notas[materiaUtf8].append(score)
            else:
                # Primeira vez que repetiu
                notas[materiaUtf8] = [notas[materiaUtf8], score]
        else:
            # Primeira vez que fez a matéria
            notas[materiaUtf8] = score


# Para cada elemento no dicionário de notas, verifica se repetiu, caso tenha, realiza média
for materia in notas:
    if type(notas[materia]) is list:
        total = sum(notas[materia])
        numero_elementos = len(notas[materia])
        notas[materia] = round(total/numero_elementos, 2)

## - Raspagem por pdf

Raspa e joga na pasta de json

In [None]:
from modules import Score
from os import path

Score.parse_pdf(
    '2016001942', 
    path.join('..', 'assets', 'scores'), 
    path.join('assets', 'parsed_scores'))

## - Preenchimento de dados no mongo

Preenchimento do database do sistema, que alimenta o sistema original

In [26]:
from modules.ahp.Types import FormData, FormDataType
from modules.ahp import Database
# mongodb connection string
CONNECTION_STRING = "mongodb://ppcamp:DRrPaRrHqmaWo43D@localhost:27017/?authSource=admin"

ahp = Database.AhpForm(CONNECTION_STRING)
# lRoot, q1s2, q1sec5, q3

new_response = FormData() \
.setName("") \
.setType(FormDataType.MARKET) \
.setEmail("") \
.setDate("Fri May 14 2021 13:17:50 GMT+0000 (Coordinated Universal Time)") \
.setMatrixRoot([
    [1,1,3],
    [1,1,3],
    [0.33,0.33,1],
]) \
.setMatrixQ1([
    [1,7,7,5,5,5],
    [0.14,1,5,0.2,0.33,0.33],
    [0.14,0.2,1,0.14,0.2,0.33],
    [0.2,5,7.14,1,3,3],
    [0.2,3.03,5,0.33,1,1],
    [0.2,3.03,3.03,0.33,1,1],
]) \
.setMatrixQ1sec2([
    [1,1,5],
    [1,1,3],
    [0.2,0.33,1],
]) \
.setMatrixQ1sec3([
    [1,0.33,3,3,5,5],
    [3.03,1,3,3,7,3],
    [0.33,0.33,1,3,5,1],
    [0.33,0.33,0.33,1,7,1],
    [0.2,0.14,0.2,0.14,1,0.33],
    [0.2,0.33,1,1,3.03,1],
]) \
.setMatrixQ1sec5(5) \
.setMatrixQ2([
    [1,1,5,5,5],
    [1,1,3,3,3],
    [0.2,0.33,1,1,1],
    [0.2,0.33,1,1,1],
    [0.2,0.33,1,1,1],
]) \
.setMatrixQ3([
    [1,0.2,1,0.2],
    [5,1,3,3],
    [1,0.33,1,0.2],
    [5,0.33,5,1],
])

ahp.insert(new_response.toDict())

<pymongo.results.InsertOneResult object at 0x7ff058174ac0>

## Atualização de dados no mongo

In [3]:
from pymongo import MongoClient

CONNECTION_STRING = "mongodb://ppcamp:DRrPaRrHqmaWo43D@localhost:27017/?authSource=admin&readPreference=primary&appname=MongoDB%20Compass&ssl=false"

# Create a mongoclient
client = MongoClient(CONNECTION_STRING)
db = client.sigaadb

In [23]:
from pprint import pprint
fields = { "name": "" }
data = db.AhpForm.find_one(fields)
# pprint(data)
pprint(data['matrices'])

{'q1': [[1, 5, 3, 1, 5, 1],
        [0.2, 1, 3, 1, 1, 1],
        [0.33, 0.33, 1, 1, 1, 1],
        [1, 1, 1, 1, 1, 1],
        [0.2, 1, 1, 1, 1, 1],
        [1, 1, 1, 1, 1, 1]],
 'q12': [[1, 0.2, 0.33], [5, 1, 3], [3.03, 0.33, 1]],
 'q13': [[1, 3, 3, 3, 5, 3],
         [0.33, 1, 5, 3, 5, 0.33],
         [0.33, 0.2, 1, 1, 1, 0.33],
         [0.33, 0.33, 1, 1, 5, 0.33],
         [0.2, 0.2, 1, 0.2, 1, 0.14],
         [0.33, 3.03, 3.03, 3.03, 7.14, 1]],
 'q15': 0.2,
 'q2': [[0, 0, 0, 0, 0],
        [0, 0, 0, 0, 0],
        [0, 0, 0, 0, 0],
        [0, 0, 0, 0, 0],
        [0, 0, 0, 0, 0]],
 'q3': [[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]],
 'root': [[1, 0.2, 0.33], [5, 1, 1], [3.03, 1, 1]]}


In [25]:
db.AhpForm.update_one(fields,{
    "$set": {
        "matrices.q2": [
            [1,1,1,3,1],
            [1,1,3,3,1],
            [1,0.33,1,1,0.33],
            [0.33,0.33,1,1,0.33],
            [1,1,3.03,3.03,1],
        ],
        "matrices.q3": [
            [1,3,1,5],
            [0.33,1,1,3],
            [1,1,1,3],
            [0.2,0.33,0.33,1],
        ]
    }})
data = db.AhpForm.find_one(fields)
pprint(data['matrices'])

{'q1': [[1, 5, 3, 1, 5, 1],
        [0.2, 1, 3, 1, 1, 1],
        [0.33, 0.33, 1, 1, 1, 1],
        [1, 1, 1, 1, 1, 1],
        [0.2, 1, 1, 1, 1, 1],
        [1, 1, 1, 1, 1, 1]],
 'q12': [[1, 0.2, 0.33], [5, 1, 3], [3.03, 0.33, 1]],
 'q13': [[1, 3, 3, 3, 5, 3],
         [0.33, 1, 5, 3, 5, 0.33],
         [0.33, 0.2, 1, 1, 1, 0.33],
         [0.33, 0.33, 1, 1, 5, 0.33],
         [0.2, 0.2, 1, 0.2, 1, 0.14],
         [0.33, 3.03, 3.03, 3.03, 7.14, 1]],
 'q15': 0.2,
 'q2': [[1, 1, 1, 3, 1],
        [1, 1, 3, 3, 1],
        [1, 0.33, 1, 1, 0.33],
        [0.33, 0.33, 1, 1, 0.33],
        [1, 1, 3.03, 3.03, 1]],
 'q3': [[1, 3, 1, 5], [0.33, 1, 1, 3], [1, 1, 1, 3], [0.2, 0.33, 0.33, 1]],
 'root': [[1, 0.2, 0.33], [5, 1, 1], [3.03, 1, 1]]}


# Preenchimento de planilhas

In [1]:
import logging, logging.config
logging.config.fileConfig('logging.conf')

In [6]:
from modules import Skillset

# Faz a leitura dos arquivos csvs
_csvs:Skillset.DataFrames = Skillset.read_csvs("../assets/sheets")
    
# Realiza a média dos arquivos de competências
out = Skillset.merge_data(_csvs)

[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: Eduardo Yan - Página1 - Eduardo Yan - Página1.csv.csv
[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: DGroh - Página1.csv
[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: Jean Carlos - Página1 - Jean Carlos - Página1.csv.csv
[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: karol16 - Página1.csv
[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: ALeles - Página1.csv
[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: MRocha - Página1.csv
[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: lorraine16 - Página1 - corrigido.csv
[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: V16 - Página1.csv
[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: Victor Alvarenga - Página1 - Victor Alvarenga - Página1.csv.csv
[2021-05-24_13:05:24|DEBUG|root|read_csvs#35] Reading file: Thomaz Campos - 34486 - corrigido.csv


In [None]:
a = set()

for i in _csvs:
    for j in i.columns:
        a.add(j)
    #     print(len(i.columns), len(i), i.index[-1])
a

# Testing elements

In [None]:
# reload(Database)FormDataType.TEACHER
from modules.ahp.Types import FormData, FormDataType
from modules.ahp import Database

# mongodb connection string
CONNECTION_STRING = "mongodb://ppcamp:DRrPaRrHqmaWo43D@localhost:27017/?authSource=admin"

ahp = Database.AhpForm(CONNECTION_STRING)

ahp.findByType(FormDataType.MARKET)

In [None]:
FormDataType.TEACHER.value[0]