# Verification

In deze notebook kan je je oplossingen voor de eerste 3 queries testen. 

- Eerst wordt je script automatisch gerund met verschillende parameters
- De resultaten worden opgeslagen in `.csv` files (in de `out` folder)
- Die `.csv` files worden vergeleken met de `.csv` files van de oplossing (te vinden in de `solution` folder).
- Elke query krijgt een score toegekend. Cf. https://en.wikipedia.org/wiki/F1_score.  
- Een kort rapport wordt weergegeven die je pointers kan geven over wat er mis is met je query. 
    - TP: True Positives
    - TN: True Negatives
    - FP: False Positives
        

## Preliminaries

In [2]:
# De benodigde packages
import getpass         # Package om een paswoordveldje te genereren.
import mysql.connector # MySQL package
import os
import sys
import pandas as pd

In [3]:
# Importeren van de verbetertools

sys.path.append(os.path.join(os.path.dirname(os.getcwd()), 'src')) # Add src folder to our PATH variable

from execution import *
from evaluation import *

In [4]:
def verbind_met_GB(username, hostname, gegevensbanknaam, password=None):
    """
    Maak verbinding met een externe gegevensbank

    Parameters
    ----------
    
    username:           str
                        Username van de gebruiker
    hostname            str
                        Naam van de host. In het geval van lokale server 'localhost'
    gegevensbanknaam    str
                        Naam van de gegevensbank
    password            str, None
                        Wachtwoord kan al meegegeven worden. Indien niet, wordt
                        een wachtwoordveldje gegenereerd waar de gebruiker het
                        kan ingeven.
    Returns
    -------
    connection          connection object
                        Dit is het soort object dat wordt teruggeven door
                        connect() methods van packages die voldoen aan de DB-API

    """

    if password is None:
        password = getpass.getpass()  # Genereer vakje voor wachtwoord in te geven
    else:
        password = password

    connection = mysql.connector.connect(host=hostname,
                                         user=username,
                                         passwd=password,
                                         db=gegevensbanknaam)
    return connection

## Execution

Eerst dien je terug verbinding te maken met de gegevensbank.

In [20]:
username = 'pcy'      # Vervang dit als je via een andere user queries stuurt
hostname = 'localhost' # Als je een gegevensbank lokaal hebt opgezet, is dit localhost.
db = 'pcy_lahman2016'       # Naam van de gegevensbank op je XAMPP Mysql server

# We verbinden met de gegevensbank
c = verbind_met_GB(username, hostname, db)

········


Dan dien je de filename van je ingevulde script in te vullen. Je "ingevulde script" is het bestand dat **ALLE INGEVULDE FUNCTIES EN NIETS ANDERS** bevat.

In [15]:
filename = '../scripts/example.py' # Vul filename van je ingevuld script hier in

Nu runnen we het script. 

De parameters en de kolomnamen worden automatisch ingelezen uit de `.json` files in de `solution` folder.

In [21]:
run_external_script(filename, c) # Run script with provided parameters and column names

## 3. Evaluation

Het externe script is nu uitgevoerd met de door ons vastgelegde parameters. Op die manier zijn er `.csv` files gemaakt in de `out` directory.

Die `.csv` files worden nu vergeleken met door ons aangemaakte `.csv` files van de correcte oplossingen. Op die manier wordt de score berekend. Alleen de eerste 3 queries kan je nu al controleren.



In [22]:
print(evaluate_script(filename))

Evaluating query 1
Evaluating query 2
Evaluating query 3
None


# 4. Reports

Om te kijken wat je score was, cf. de `out` folder:
   - in `out/reports` vind je gegeneerde reports. Het `execution_report` is een log van het uitvoeren van je script. Het `evaluation_report` is een kleine samenvatting van je behaalde scores.
   - in `out/results` vind je de `.csv` files die je queries geproduceerd hebben.