# Misure per il test
Per ogni domanda factoid è necessario restituire una lista di 5 entità in ordine decrescente di confidenza. Le misure con cui valutare sono 3
* strict accuracy (SAcc) 
* lenient accuracy (LAcc)
* mean reciprocal rank

Citando il documento:
*Strict accuracy* counts a question as correctly answered if the golden entity name (or a synonym of that name) is the first element of the list returned by the system. By contrast, *lenient accuracy*
counts a question as correctly answered if the golden entity name (or synonym ) is included, not necessarily as the first element, in the list returned by the system.

$S A c c=\frac{c_{1}}{n}$
$L A c c=\frac{c_{5}}{n}$

Dove c1 è il numero di domande in cui la prima risposta coincide con l'esatta e c5 è il numero di domande in cui la risposta esatta è contenuta nella lista di 5 entità fornita.

Per quanto riguarda il mean reciprocal rank
Citando il documento:
for each factoid question $q_{i}$ we search the returned list looking for the topmost position that contains the golden entity name (or one of its synonyms). If the topmost position is the $j$ -th one, then $r(i)=j ;$ otherwise $r(i) \rightarrow+\infty,$ i.e., $\frac{1}{r(i)}=0$

$M R R=\frac{1}{n} \cdot \sum_{i=1}^{n} \frac{1}{r(i)}$



Facciamo un esempio di due vettori

In [27]:
predicted=[["cane","z","z","z","z"],["z","z","z","z","z"],["z","z","cipolla","z","z"],["z","melanzane","z","z","z"],["birra","z","z","z","z"],["z","z","z","calippo","z"]]
target=["cane","gatto","cipolla", "melanzane", "birra", "calippo"]

## Accuracy


In [17]:
c_1=0
c_5=0
for i,elem in enumerate(target):
    if predicted[i][0]==target[i]:
        c_1+=1
    if target[i] in predicted[i]:
        c_5+=1
print(c_1/len(target),c_5/len(target))

0.3333333333333333 1.0


## Mean Reciprocal rank



In [31]:
summation=0
for i, elem in enumerate(target):
    try:
        pos = predicted[i].index(target[i])
        summation+=1/(pos+1)
    except ValueError:
        pass

print(summation/len(target))

0.5138888888888888


## Funzione finale per accorpare tutte le misure

In [36]:
def evaluate_factoid(predicted, target):
    c_1=0
    c_5=0
    rank_sum=0
    for i,elem in enumerate(target):
        #Accuracy
        if predicted[i][0]==target[i]:
            c_1+=1
        if target[i] in predicted[i]:
            c_5+=1

        #Mean reciprocal rank
        try:
            pos = predicted[i].index(target[i])
            rank_sum+=1/(pos+1)
        except ValueError:
            pass

    return {"strict_accuracy" : c_1/len(target),"lenient_accuracy" : c_5/len(target), "mean_reciprocal_rank" : rank_sum/len(target)}

In [37]:
evaluate_factoid(predicted,target)

{'strict_accuracy': 0.3333333333333333,
 'lenient_accuracy': 0.8333333333333334,
 'mean_reciprocal_rank': 0.5138888888888888}