# Precision och recall

Utifrån ett antal sökningar i ett söksystem ska vi utvärdera söksystemets förmåga att ge oss relevanta träffar. Detta görs med hjälp av precision och recall, eller precision och återgivning.



## Sökning

Vi börjar med att anteckna vilka dokument från våra sökningar som vi anser är relevanta. 

Varje dokument från representeras av **1** (ett relevant dokument) och **0** (ett irrelevant dokument).

Relevansbedömningen för varje sökning sparas i en lista som vi kallar **query**; en behållare som vi kan räkna på.

### Sökning med relevansbedömning



In [None]:
query = [0,1,0,0,1,0,1,0,0,1,0,0,1,0,0,0,0,0,0,1]

## Precision

Precision är proportionen återvunna dokument som är relevanta. 

Svarar på frågan *hur precis är sökfrågan*? 

Beräknas genom relevanta återvunna dokument dividerat med alla återvunna dokument.

In [None]:
relevant_docs_in_query = query.count(1)
print("Antal relevanta dokument:", relevant_docs_in_query)

retrieved_docs = len(query)
print("Antal återvunna dokument:", retrieved_docs)

precision = relevant_docs_in_query/retrieved_docs
print("Precision för sökningen =", precision, "≈", round(precision * 100), "%.")

## Recall

Recall är proportionen relevanta dokument som har återvunnits.

Svarar på frågan *Hur många av de relevanta dokumenten har återvunnits från sökfrågan*?

Beräknas genom relevanta återvunna dokument dividerat med alla relevanta dokument i dokumentsamlingen.

Låt oss anta att det finns 15 relevanta dokument i dokumentsamlingen.

In [None]:
all_relevant_docs = 15

recall = relevant_docs_in_query / all_relevant_docs

print("Recall för sökningen är", recall, "≈", round(recall * 100), "%.")

## Precision at n

Precision at n (eller p @ n) anger antalet relevanta resultat vid en given nivå (n).

Uppmäts vid återgivningsnivåer om 5, 10 och 20 då dessa nivåer vanligtvis överensstämmer med det antal dokument som dyker upp på förstasidan av ett sökresultat.

Nedan mäter vi p @ n där n = 10

In [None]:
n = 10

In [None]:
relevant_docs_in_query_at_n = sum(query[:n])
print("Antal relevanta dokument =", relevant_docs_in_query_at_n)

p_at_n = relevant_docs_in_query_at_n / n
print("Precision at n =", p_at_n, "≈", round(p_at_n * 100), "%.")

## R-precision

Precisionen vid den R:e positionen i svarsmängden, där R är det totala antalet relevanta dokument för en sökfråga.

In [None]:
print("Totalt antal relevanta dokument för sökfrågan (R):", relevant_docs_in_query)

r_position = sum(query[:relevant_docs_in_query])
print("Antalet relevanta dokument vid R:", r_position)

r_precision = r_position / relevant_docs_in_query
print("R-precision =", r_precision, "≈", round(r_precision * 100), "%.")

## Average precision at document cut off value

Används för att mäta rankningseffektivitet för en sökfråga.

Nedan mäter vi AP/DCV där (DCV) = 10.

In [None]:
dcv = 10

Vi inleder med att hämta en numrerad lista på de relevanta dokumenten.

In [None]:
relevant_docs_in_query_at_dcv = sum(query[:dcv])
index_zero_list = list(range(relevant_docs_in_query_at_dcv))

doc_list = []

for document_position in range(len(index_zero_list)):
  doc_list.append(index_zero_list[document_position] + 1)

print("Dokumentlista för sökningen:", doc_list)

Sedan undersöker vi på vilka positioner vardera relevant dokument finns.

In [None]:
recall_levels = []

for document, relevance in enumerate(query[:dcv]):
  if relevance == 1: 
    recall_levels.append(document + 1)

print("Recallnivåer för sökningen:", recall_levels)

Därefter beräknar vi precision vid varje recallnivå.

In [None]:
precision_at_recall = []

for each_precision, each_recall in zip(doc_list, recall_levels):
  precision_at_recall.append(each_precision / each_recall)

print("Precision vid varje recallnivå:", precision_at_recall)

Vi slår ihop samtliga precisionsvärden vid varje recallnivå.

In [None]:
sum_precision = sum(precision_at_recall)

print("Sammanlagd precision:", sum_precision)

Vi beräknar det totala antalet relevanta dokument inom DCV.

In [None]:
relevant_docs_at_dcv = query[:dcv].count(1)

print("Relevanta dokument vid document cut off value:", relevant_docs_at_dcv)

Till sist beräknar vi AP/DCV för sökningen.

In [None]:
ap_dcv = sum_precision/dcv

print("AP/DCV för sökningen =", ap_dcv, "≈", round(ap_dcv * 100), "%.")

## F1-mått

F1-måttet är ett mått som kombinerar recall och precision för att beräkna det harmoniska medelvärdet mellan precision och recall.

2 / ((1/r) + (1/p))


In [None]:
recall_f1 = 1/recall

precision_f1 = 1/precision

precision_recall_f1 = recall_f1 + precision_f1

f1 = 2 / precision_recall_f1

print("F1-måttet för sökningen =", f1, "≈", round(f1 * 100), "%.")

## Sammanfattning

In [None]:
print("Precision ≈", round(precision * 100), "%.")

print("Recall ≈", round(recall * 100), "%.")

print("Precision @ n ≈", round(p_at_n * 100), "%.")

print("R-precision ≈", round(r_precision * 100), "%.")

print("AP/DCV ≈", round(ap_dcv * 100), "%")

print("F1 ≈", round(f1 * 100), "%.")