# Verification

# Imports

In [1]:
# De benodigde packages
import getpass         # Package om een paswoordveldje te genereren.
import mysql.connector # MySQL package
import os
import sys
import pandas as pd

from IPython.display import display, Markdown
from os.path import dirname

# Imports van binnen onze eigen repository (verbetertools)
this_dir = os.getcwd()
root_dir = dirname(this_dir)
docs_dir = os.path.join(root_dir, 'docs')
source_dir = os.path.join(root_dir, 'src')
script_dir = os.path.join(root_dir, 'scripts')
solution_dir = os.path.join(root_dir, 'solution')

verification_file = os.path.join(docs_dir, '05-verification.md')

sys.path.append(source_dir)
from basics import verbind_met_GB, run_query, res_to_df # Basic functionalities, explained in introduction.
from execution import run_external_script
from evaluation import evaluate_script
from custom_parsers import parse_markdown

In [2]:
display(Markdown(parse_markdown(verification_file, section_number=[1,2]))) # Lees tekst in uit docs folder.

## 1. Inleiding

In deze notebook kan je je oplossingen voor de eerste 3 queries testen. 

- Eerst wordt je script automatisch gerund met verschillende parameters
- De resultaten worden opgeslagen in `.csv` files (in de `out` folder)
- Die `.csv` files worden vergeleken met de `.csv` files van de oplossing (te vinden in de `solution` folder).
- Elke query krijgt een score toegekend. Cf. https://en.wikipedia.org/wiki/F1_score.  
- Een kort rapport wordt weergegeven die je pointers kan geven over wat er mis is met je query. 
    - TP: True Positives
    - TN: True Negatives
    - FP: False Positives
    
Na release van de modeloplossingen kan je natuurlijk alles controleren.
    
## 2. Uitvoeren

Dit proces bestaat uit 3 stappen.

1. Eerst dien je terug verbinding te maken met de gegevensbank.
2. Dan dien je de filename van je ingevulde script in te vullen. Je "ingevulde script" is het bestand dat **ALLE INGEVULDE FUNCTIES EN NIETS ANDERS** bevat. Hieronder importeren we het script `example.py` van in de `scripts` folder.
3. Run het script. Dit doen we met behulp van de `run_external_script` functie die we eerder importeerden. (De parameters en de kolomnamen worden automatisch ingelezen uit de `.json` files in de `solution` folder.)
    
    


In [3]:
# STAP 01: Verbindingsobject aanmaken

username = 'root'      # Vervang dit als je via een andere user queries stuurt
hostname = 'localhost' # Als je een databank lokaal draait, is dit localhost.
db = 'db1819'          # Naam van de gegevensbank op je XAMPP Mysql server

# We verbinden met de gegevensbank
c = verbind_met_GB(username, hostname, db, password='')

In [4]:
# STAP 02: Specifieer filename 

filename = '../scripts/demo-drie-queries.py' # Vul filename van je ingevuld script hier in

In [5]:
# STAP 03: Run je oplossingen

run_external_script(filename, c)

In [6]:
display(Markdown(parse_markdown(verification_file, section_number=3)))

## 3. Evaluatie

Het externe script is nu uitgevoerd met de door ons vastgelegde parameters. Op die manier zijn er `.csv` files gemaakt in de `out` directory.

Die `.csv` files worden nu vergeleken met door ons aangemaakte `.csv` files van de correcte oplossingen. Op die manier wordt de score berekend. Alleen de eerste 3 queries kan je nu al controleren.



In [7]:
print(evaluate_script(filename))

Evaluating query 1
Evaluating query 2
Evaluating query 3
Evaluating query 4
Evaluating query 5
Evaluating query 6
Evaluating query 7
Evaluating query 8
Evaluating query 9
Evaluating query 10
None


In [8]:
display(Markdown(parse_markdown(verification_file, section_number=4)))

## 4. Reports

Om te kijken wat je score was, cf. de `out` folder:
   - in `out/reports` vind je gegeneerde reports. Het `execution_report` is een log van het uitvoeren van je script. Het `evaluation_report` is een kleine samenvatting van je behaalde scores.
   - in `out/results` vind je de `.csv` files die je queries geproduceerd hebben.


        
