# Verification

Voor de eerste 3 queries kan je je oplossing al testen via deze verification notebook! 

- Eerst wordt je script automatisch gerund met verschillende parameters
    - Deze worden ingeladen van `all_q_param.json` in de `solution` folder.
- De (eventuele) resultaten worden opgeslagen in csv files (in de `out` folder)
- Die csv files worden vergeleken met de csv files van de oplossing (te vinden in de `solution` folder).
- Elke query krijgt een score toegekend. Cf. https://en.wikipedia.org/wiki/F1_score.  
- Een kort rapport wordt weergegeven die je pointers kan geven over wat er mis is met je query. 
    - TP: True Positives
    - TN: True Negatives
    - FP: False Positives

## Preliminaries

In [1]:
# De benodigde packages
import getpass         # Package om een paswoordveldje te genereren.
import mysql.connector # MySQL package
import os
import sys
import pandas as pd

In [2]:
# Importeren van onze custom tools
sys.path.append(os.path.join(os.getcwd(), 'src')) # Add src folder to our PATH variable
from execution import *
from evaluation import *

In [3]:
def verbind_met_GB(username, hostname, gegevensbanknaam):
    """
    Maak verbinding met een externe gegevensbank
    
    :param  username:          username van de gebruiker, string
    :param  hostname:          naam van de host, string.
                               Dit is in het geval van een lokale server gewoon 'localhost'
    :param  gegevensbanknaam:  naam van de gegevensbank, string.
    :return connection:        connection object, dit is wat teruggeven wordt 
                               door connect() methods van packages die voldoen aan de DB-API
    """
    
    password = getpass.getpass() # Genereer vakje voor wachtwoord in te geven
    
    connection = mysql.connector.connect(host=hostname,
                                         user=username,
                                         passwd=password,
                                         db=gegevensbanknaam)
    return connection

## Execution

Eerst dien je terug verbinding te maken met de gegevensbank.

In [4]:
username = 'root'      # Vervang dit als je via een andere user queries stuurt
hostname = 'localhost' # Als je een gegevensbank lokaal hebt opgezet, is dit localhost.
db = 'lahman2016'      # Naam van de gegevensbank op je XAMPP Mysql server

# We verbinden met de gegevensbank
c = verbind_met_GB(username, hostname, db)

········


Dan dien je de filename van je ingevuld script in te vullen.

In [12]:
# filename = os.path.join(os.getcwd(), 'scripts', 'example.py') # Dummy example

filename = os.path.join(os.getcwd(),'assignment.ipynb') # Vul filename van je ingevuld script hier in

Nu runnen we het script. 

De parameters en de kolomnamen worden automatisch ingelezen uit de json files in de `solution` folder.

In [13]:
run_external_script(filename, c) # Run script with provided parameters and column names

AttributeError: 'NoneType' object has no attribute 'loader'

## 3. Evaluation

Het externe script is nu uitgevoerd met de door ons vastgelegde parameters. Op die manier zijn er csv files gemaakt in de `out` directory.

Die csv files worden nu vergeleken met door ons aangemaakte csv files van de correcte oplossingen. Op die manier wordt de score berekend.

1. Load all solution csvs
2. Collect them in a dict
3. Verify that you have a df for each parameter setting

In [8]:
print(evaluate_script(filename))




---  ---  --- -- ---  ---  ---

Result for query: 01

With parameters:
Overall score: 100%
Breakdown:
	Perfect match = Congratulations!



---  ---  --- -- ---  ---  ---

Result for query: 02

With parameters:
	datum = 1980-01-16
Overall score: 100%
Breakdown:
	Perfect match = Congratulations!



---  ---  --- -- ---  ---  ---

Result for query: 02

With parameters:
	datum = 1985-01-16
Overall score: 100%
Breakdown:
	Perfect match = Congratulations!



---  ---  --- -- ---  ---  ---

Result for query: 03

With parameters:
Overall score: 90.0%
Breakdown:
	TP        = 906
	FP        = 0
	FN        = 0
	precision = 1.0
	recall    = 1.0
	F1        = 1.0
	Remark    = 
    Your result was not a perfect match. Therefore your score is calculated as (F1*0.9).
    If you had a perfect F1 score, this means that you returned all tuples perfectly,
    but forgot to order them.
    

