# El MPJPE (Mean Per Joint Position Error) 

Es una métrica comúnmente utilizada para evaluar la precisión de los modelos de estimación de pose. Calcula la distancia promedio entre las posiciones predichas y las posiciones reales (ground truth) de las articulaciones (joints) en un espacio 3D o 2D.

La distancia euclidiana se calcula con la siguiente formula

![distancia euclidiana](distancia_euclidiana.png)

Donde:
- _p,q_ son dos puntos en el espacio n euclidiano
- _qi, pi_ son vectores euclidianos a partir del origen del espacio
- _n_ es el espacio

In [1]:
import os
import importlib , mpjpe, pandas as pd # Importar importlib para recargar módulos
from dotenv import load_dotenv

dotenv_path = os.path.join(os.getcwd(), '..', '.env')
importlib.reload(mpjpe)
from mpjpe import MPJPE

# Configuracion
images_path = os.path.join(os.getenv('BASE_PATH'), os.getenv('IMAGES_SUBPATH'))
labels_path = os.path.join(os.getenv('BASE_PATH'), os.getenv('LABELS_SUBPATH'))
evaluator = MPJPE(os.getenv('BASE_PATH'), images_path, labels_path)
thresholds = [0.1, 0.5, 0.9]

# Evaluando una imagen

In [2]:
image = 'imagen_011_jpg.rf.efc4f6570869d250cc6316a35f6b4b26.jpg'
results = []

for threshold in thresholds:
    results = evaluator.evaluate_image(image, threshold, results)


image 1/1 /Users/apple/Documents/pose_estimation/dataset/images/imagen_011_jpg.rf.efc4f6570869d250cc6316a35f6b4b26.jpg: 640x384 1 person, 84.2ms
Speed: 2.8ms preprocess, 84.2ms inference, 1.3ms postprocess per image at shape (1, 3, 640, 384)
Results saved to [1mruns/pose/predict[0m

image 1/1 /Users/apple/Documents/pose_estimation/dataset/images/imagen_011_jpg.rf.efc4f6570869d250cc6316a35f6b4b26.jpg: 640x384 1 person, 65.4ms
Speed: 1.1ms preprocess, 65.4ms inference, 1.0ms postprocess per image at shape (1, 3, 640, 384)
Results saved to [1mruns/pose/predict[0m

image 1/1 /Users/apple/Documents/pose_estimation/dataset/images/imagen_011_jpg.rf.efc4f6570869d250cc6316a35f6b4b26.jpg: 640x384 1 person, 66.5ms
Speed: 0.9ms preprocess, 66.5ms inference, 1.0ms postprocess per image at shape (1, 3, 640, 384)
Results saved to [1mruns/pose/predict[0m


# Evaluando multiples imagenes

In [3]:
# Obtener la lista de todas las imágenes en la carpeta
image_files = [f for f in os.listdir(images_path) if f.endswith('.jpg')]
image_files_sorted = sorted(image_files)
results = []

for image in image_files_sorted:
    for threshold in thresholds:
        results = evaluator.evaluate_image(image, threshold, results)


image 1/1 /Users/apple/Documents/pose_estimation/dataset/images/imagen_002_jpg.rf.39766b197a04d8d1569b3e546fd07390.jpg: 640x384 1 person, 79.6ms
Speed: 1.3ms preprocess, 79.6ms inference, 0.8ms postprocess per image at shape (1, 3, 640, 384)
Results saved to [1mruns/pose/predict[0m

image 1/1 /Users/apple/Documents/pose_estimation/dataset/images/imagen_002_jpg.rf.39766b197a04d8d1569b3e546fd07390.jpg: 640x384 1 person, 68.6ms
Speed: 1.0ms preprocess, 68.6ms inference, 0.9ms postprocess per image at shape (1, 3, 640, 384)
Results saved to [1mruns/pose/predict[0m

image 1/1 /Users/apple/Documents/pose_estimation/dataset/images/imagen_002_jpg.rf.39766b197a04d8d1569b3e546fd07390.jpg: 640x384 1 person, 64.7ms
Speed: 1.0ms preprocess, 64.7ms inference, 0.9ms postprocess per image at shape (1, 3, 640, 384)
Results saved to [1mruns/pose/predict[0m

image 1/1 /Users/apple/Documents/pose_estimation/dataset/images/imagen_003_jpg.rf.212077a70b1de84df04262b03db57f65.jpg: 640x384 1 person, 63.

# Generando XLS con informacion

In [4]:
# Crear un DataFrame con los resultados
df_results = pd.DataFrame(results)
output_excel_path = os.path.join(os.getenv('BASE_PATH'), os.getenv('YOLO_SUBPATH'), 'precision', 'MPJPE', 'yolov11_mpjpe_results.xlsx')
df_results.to_excel(output_excel_path, index=False, engine='openpyxl')

print(f"Los resultados se han guardado en {output_excel_path}")

Los resultados se han guardado en /Users/apple/Documents/pose_estimation/YOLOv11/precision/MPJPE/yolov11_mpjpe_results.xlsx


# Interpretacion de resultados

Si el MPJPE es alto o bajo se debe considerar que
- Las coordenadas ya se encuentran normalizadas en un valor de 0 y 1
- En terminos de pixeles, si la imagen tiene un tamanho de 256 x 256, el error promedio (5.54%) seria **mpjep x pixeles**, ej. 0.055465 x 256 = 14.19, esto significa que las predicciones estan desviadas por aproximadamente 14.19 pixeles de las reales