In [1]:
import sys
import os
sys.path.append(os.path.abspath('..'))


# Implementación de Métricas de Evaluación de IR

Este notebook implementa diversas métricas de evaluación de recuperación de información utilizando Python y Numpy. Se abordarán las siguientes métricas:

1. Precision
2. Precision at K
3. Recall at K
4. Average Precision
5. Mean Average Precision (MAP)
6. DCG at K
7. NDCG at K


## 1. Precision (la relevancia es binaria)

La métrica de precisión mide la proporción de documentos relevantes recuperados en relación con el total de documentos recuperados.


In [2]:
from algorithms.metrics.precision import precision

relevance_query_1 = [0, 0, 0, 1]
precision_value = precision(relevance_query_1)
print(f"Precision: {precision_value}")


Precision: 0.25


## 2. Precision at K (la relevancia es binaria)

Precision at K mide la proporción de documentos relevantes entre los primeros K documentos recuperados.


In [3]:
from algorithms.metrics.precision import precision_at_k

relevance_query_1 = [0, 0, 0, 1]
k = 1
precision_at_k_value = precision_at_k(relevance_query_1, k)
print(f"Precision at K: {precision_at_k_value}")


Precision at K: 0.0


## 3. Recall at K (la relevancia es binaria)

Recall at K mide la proporción de documentos relevantes recuperados entre los primeros K documentos en comparación con el total de documentos relevantes.


In [4]:
from algorithms.metrics.recall import recall_at_k

relevance_query_1 = [0, 0, 0, 1]
k = 1
number_relevant_docs = 4
recall_at_k_value = recall_at_k(relevance_query_1, number_relevant_docs, k)
print(f"Recall at K: {recall_at_k_value}")


Recall at K: 0.0


## 4. Average Precision (la relevancia es binaria)

Average Precision mide la precisión promedio en los puntos de recuperación donde se encuentra un documento relevante.


In [5]:
from algorithms.metrics.average_precision import average_precision

relevance_query_2 = [0, 1, 0, 1, 1, 1, 1]
average_precision_value = average_precision(relevance_query_2)
print(f"Average Precision: {average_precision_value}")


Average Precision: 0.5961904761904762


## 5. Mean Average Precision (MAP) (la relevancia es binaria)

MAP calcula la precisión promedio para un conjunto de consultas.


In [6]:
from algorithms.metrics.mean_average_precision import MAP

relevance_queries = [
    [0, 1, 0, 1, 1, 1, 1],
    [1, 0, 1, 0, 1, 1, 1]
]
map_value = MAP(relevance_queries)
print(f"Mean Average Precision (MAP): {map_value}")


Mean Average Precision (MAP): 0.6628571428571428


## 6. DCG at K (la relevancia es un número natural)

DCG (Discounted Cumulative Gain) at K mide la relevancia de los documentos recuperados teniendo en cuenta la posición de los documentos relevantes.


In [7]:
from algorithms.metrics.dcg import dcg_at_k

relevance_query_3 = [4, 4, 3, 0, 0, 1, 3, 3, 3, 0]
k = 6
dcg_value = dcg_at_k(relevance_query_3, k)
print(f"DCG at K: {dcg_value}")


DCG at K: 10.279642067948915


## 7. NDCG at K (la relevancia es un número natural)

NDCG (Normalized Discounted Cumulative Gain) at K normaliza el valor de DCG a un rango de 0 a 1, comparando el DCG con el valor máximo posible (IDCG).


In [8]:
from algorithms.metrics.ndcg import ndcg_at_k

relevance_query_3 = [4, 4, 3, 0, 0, 1, 3, 3, 3, 0]
k = 6
ndcg_value = ndcg_at_k(relevance_query_3, k)
print(f"NDCG at K: {ndcg_value}")


NDCG at K: 0.7424602308163405
