# Extracción de landmarks y features con MediaPipe

Este notebook procesa los videos de `data/raw/`, extrae los landmarks con MediaPipe, calcula features cinemáticas y exporta un archivo tabular listo para modelado.

In [6]:
import cv2
import mediapipe as mp
import numpy as np
import pandas as pd
from pathlib import Path
import json

# Directorio de videos y etiquetas
videos_dir = Path('../data/raw')
etiquetas_path = Path('../results/labels_por_rango.csv')

# Cargar etiquetas por rango de frames
df_labels = pd.read_csv(etiquetas_path)
df_labels.head()

Unnamed: 0,video,start_frame,end_frame,actividad
0,a327f941-Video_1.mp4,18,37,parandose
1,a327f941-Video_1.mp4,1,18,sentado
2,a327f941-Video_1.mp4,37,40,parado
3,a327f941-Video_1.mp4,40,119,caminando adelante
4,a327f941-Video_1.mp4,120,155,girando


## Funciones auxiliares para extracción de features

Incluye funciones para calcular ángulos, distancias y buscar la etiqueta de actividad para cada frame.

In [7]:
def get_activity_for_frame(df_labels, video_file, frame_idx):
    """Busca la etiqueta de actividad para un frame dado de un video."""
    rows = df_labels[df_labels['video'] == video_file]
    for _, row in rows.iterrows():
        if row['start_frame'] <= frame_idx <= row['end_frame']:
            return row['actividad']
    return None

def calculate_angle(a, b, c):
    """Calcula el ángulo (en grados) entre tres puntos (b es el vértice)."""
    a = np.array(a)
    b = np.array(b)
    c = np.array(c)
    ba = a - b
    bc = c - b
    cos_angle = np.dot(ba, bc) / (np.linalg.norm(ba) * np.linalg.norm(bc) + 1e-6)
    angle = np.arccos(np.clip(cos_angle, -1.0, 1.0))
    return np.degrees(angle)

def calculate_distance(p1, p2):
    p1 = np.array(p1)
    p2 = np.array(p2)
    return np.linalg.norm(p1 - p2)

## Extracción de features por ventana

Procesa cada video, extrae landmarks con MediaPipe y calcula features agregadas por ventana (media, std, min, max de ángulos, distancias, inclinaciones, etc.).

In [9]:
mp_pose = mp.solutions.pose

# Parámetros de la ventana
target_fps = 30  # Ajusta según tus videos
window_size = int(0.5 * target_fps)  # 0.5 segundos
step_size = int(0.25 * target_fps)   # 50% solapamiento

features_list = []

for video_path in videos_dir.glob('*.mp4'):
    print("Video: ",video_path)
    cap = cv2.VideoCapture(str(video_path))
    video_file = video_path.name
    frame_landmarks = []
    frame_idx = 0
    with mp_pose.Pose(static_image_mode=False, min_detection_confidence=0.5) as pose:
        while True:
            ret, frame = cap.read()
            if not ret:
                break
            frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            results = pose.process(frame_rgb)
            if results.pose_landmarks:
                # Extraer solo los landmarks relevantes (ejemplo: cadera, rodilla, tobillo, hombro)
                lm = results.pose_landmarks.landmark
                # Ejemplo: cadera izq (23), rodilla izq (25), tobillo izq (27), hombro izq (11)
                coords = {
                    'hip': (lm[23].x, lm[23].y),
                    'knee': (lm[25].x, lm[25].y),
                    'ankle': (lm[27].x, lm[27].y),
                    'shoulder': (lm[11].x, lm[11].y)
                }
                frame_landmarks.append(coords)
            else:
                frame_landmarks.append(None)
            frame_idx += 1
    cap.release()

    # Procesar por ventana
    n_frames = len(frame_landmarks)
    for start in range(0, n_frames - window_size + 1, step_size):
        window = frame_landmarks[start:start+window_size]
        # Filtrar frames válidos
        window = [f for f in window if f is not None]
        if len(window) < window_size * 0.7:
            continue  # Demasiados frames perdidos
        # Calcular features agregadas
        hips = np.array([f['hip'] for f in window])
        knees = np.array([f['knee'] for f in window])
        ankles = np.array([f['ankle'] for f in window])
        shoulders = np.array([f['shoulder'] for f in window])
        # Ángulo rodilla (media, std)
        knee_angles = [calculate_angle(hip, knee, ankle) for hip, knee, ankle in zip(hips, knees, ankles)]
        # Inclinación tronco (ángulo entre hombro-cadera y vertical)
        trunk_incl = [np.degrees(np.arctan2(s[0]-h[0], h[1]-s[1])) for s, h in zip(shoulders, hips)]
        # Distancia hombro-cadera
        dist_sh_hip = [calculate_distance(s, h) for s, h in zip(shoulders, hips)]
        # Features agregadas
        feats = {
            'video': video_file,
            'start_frame': start,
            'end_frame': start+window_size-1,
            'knee_angle_mean': np.mean(knee_angles),
            'knee_angle_std': np.std(knee_angles),
            'trunk_incl_mean': np.mean(trunk_incl),
            'trunk_incl_std': np.std(trunk_incl),
            'dist_sh_hip_mean': np.mean(dist_sh_hip),
            'dist_sh_hip_std': np.std(dist_sh_hip)
        }
        # Etiqueta de actividad para la ventana (mayoría de frames)
        labels = [get_activity_for_frame(df_labels, video_file, f) for f in range(start, start+window_size)]
        feats['actividad'] = max(set(labels), key=labels.count) if labels else None
        features_list.append(feats)

# Guardar features
features_df = pd.DataFrame(features_list)
features_df = features_df.dropna()
features_df.to_csv('../results/features.csv', index=False)
features_df.head()

Video:  ..\data\raw\Video 1.mp4




Video:  ..\data\raw\Video 10.mp4
Video:  ..\data\raw\Video 11.mp4
Video:  ..\data\raw\Video 11.mp4
Video:  ..\data\raw\Video 12.mp4
Video:  ..\data\raw\Video 12.mp4
Video:  ..\data\raw\Video 13.mp4
Video:  ..\data\raw\Video 13.mp4
Video:  ..\data\raw\Video 14.mp4
Video:  ..\data\raw\Video 14.mp4
Video:  ..\data\raw\Video 15.mp4
Video:  ..\data\raw\Video 15.mp4
Video:  ..\data\raw\Video 16.mp4
Video:  ..\data\raw\Video 16.mp4
Video:  ..\data\raw\Video 17.mp4
Video:  ..\data\raw\Video 17.mp4
Video:  ..\data\raw\Video 18.mp4
Video:  ..\data\raw\Video 18.mp4
Video:  ..\data\raw\Video 2.mp4
Video:  ..\data\raw\Video 2.mp4
Video:  ..\data\raw\Video 3.mp4
Video:  ..\data\raw\Video 3.mp4
Video:  ..\data\raw\Video 4.mp4
Video:  ..\data\raw\Video 4.mp4
Video:  ..\data\raw\Video 5.mp4
Video:  ..\data\raw\Video 5.mp4
Video:  ..\data\raw\Video 6.mp4
Video:  ..\data\raw\Video 6.mp4
Video:  ..\data\raw\Video 7.mp4
Video:  ..\data\raw\Video 7.mp4
Video:  ..\data\raw\Video 8.mp4
Video:  ..\data\raw\Vid

Unnamed: 0,video,start_frame,end_frame,knee_angle_mean,knee_angle_std,trunk_incl_mean,trunk_incl_std,dist_sh_hip_mean,dist_sh_hip_std,actividad
