In [1]:
import cv2
import mediapipe as mp
import pandas as pd
import os
import ast

In [2]:

# Inicialización de MediaPipe Pose.
mp_pose = mp.solutions.pose
pose = mp_pose.Pose(static_image_mode=False, model_complexity=2, enable_segmentation=True, min_detection_confidence=0.5)

# Directorio que contiene los videos.
video_directory = 'D:/Codes/EFBA/DataEfba/videos'
video_files = [os.path.join(video_directory, f) for f in os.listdir(video_directory) if os.path.isfile(os.path.join(video_directory, f))]
excel_directory = 'D:/Codes/EFBA/DataEfba/keypoints'

# Procesar cada video en el directorio.
for video_file in video_files:
    cap = cv2.VideoCapture(video_file)
    keypoints_list = []
    
    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break

        # Conversión del color del frame de BGR a RGB.
        frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        
        # Procesamiento del frame para detectar la pose.
        results = pose.process(frame_rgb)
        
        if results.pose_landmarks:
            # Extracción de las coordenadas de los puntos clave.
            keypoints = []
            for landmark in results.pose_landmarks.landmark:
                keypoints.append((landmark.x, landmark.y, landmark.z, landmark.visibility))
            keypoints_list.append(keypoints)

    cap.release()
    
    # Opcional: Convertir la lista de puntos clave a un DataFrame de pandas para un análisis más fácil.
    df_keypoints = pd.DataFrame(keypoints_list, columns=[f'x{i}' for i in range(11)] + [f'y{i}' for i in range(11)] + [f'z{i}' for i in range(11)])
    
    # Aquí puedes guardar o procesar df_keypoints como prefieras.
    # Por ejemplo, guardar en un archivo CSV.
    output_filename = os.path.splitext(os.path.basename(video_file))[0] + '_keypoints.csv'
    df_keypoints.to_csv(os.path.join(excel_directory, output_filename), index=False)

    print(f"Procesado {video_file}, resultados guardados en {output_filename}.")


Procesado D:/Codes/EFBA/DataEfba/videos\allen.mp4, resultados guardados en allen_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\bird.mp4, resultados guardados en bird_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\curry1.mp4, resultados guardados en curry1_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\curry2.mp4, resultados guardados en curry2_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\harden.mp4, resultados guardados en harden_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\jj.mp4, resultados guardados en jj_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\jordan.mp4, resultados guardados en jordan_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\kd.mp4, resultados guardados en kd_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\kerr.mp4, resultados guardados en kerr_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\klay.mp4, resultados guardados en klay_keypoints.csv.
Procesado D:/Codes/EFBA/DataEfba/videos\korver.mp4

In [3]:
def process_column(data):
    try:
        # Usa ast.literal_eval para convertir la cadena a una tupla
        return pd.DataFrame([ast.literal_eval(x) for x in data])
    except ValueError:
        # En caso de error, regresa un DataFrame vacío
        return pd.DataFrame()

def process_csv(file_path):
    df = pd.read_csv(file_path)
    
    # Preparar un diccionario para recopilar las nuevas columnas
    new_data = {}
    
    # Iterar sobre las columnas originales y procesar cada una
    for column in df.columns:
        # Si la columna es de tipo object (cadena), procesar su contenido
        if df[column].dtype == object:
            processed_data = process_column(df[column])
            # Si el procesamiento fue exitoso y el DataFrame no está vacío
            if not processed_data.empty:
                # Crear nuevas columnas para 'x', 'y', 'z' y 'visibility'
                new_data[f'{column}_x'] = processed_data[0]
                new_data[f'{column}_y'] = processed_data[1]
                new_data[f'{column}_z'] = processed_data[2]
                new_data[f'{column}_visibility'] = processed_data[3]
    
    # Crear un nuevo DataFrame con las nuevas columnas
    new_df = pd.DataFrame(new_data)
    
    # Guardar el nuevo DataFrame en un archivo CSV
    output_file_path = os.path.join(output_directory, os.path.basename(file_path).replace('.csv', '_processed.csv'))
    new_df.to_csv(output_file_path, index=False)
    print(f"Archivo procesado y guardado: {output_file_path}")

# Define el directorio donde se encuentran tus archivos CSV
directory_path = 'D:/Codes/EFBA/DataEfba/keypoints'
output_directory = 'D:/Codes/EFBA/DataEfba/pkeypoints'

if not os.path.exists(output_directory):
    os.makedirs(output_directory)

# Lista todos los archivos CSV en el directorio
csv_files = [os.path.join(directory_path, f) for f in os.listdir(directory_path) if f.endswith('.csv')]

# Procesa cada archivo CSV en el directorio
for file in csv_files:
    process_csv(file)


Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\allen_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\bird_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\curry1_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\curry2_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\harden_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\jj_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\jordan_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\kd_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\kerr_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\klay_keypoints_processed.csv
Archivo procesado y guardado: D:/Codes/EFBA/DataEfba/pkeypoints\k

In [2]:
from sklearn.model_selection import train_test_split

In [4]:
import os
import pandas as pd
from sklearn.preprocessing import StandardScaler

def normalize_features(file_path, output_directory):
    # Cargar el DataFrame
    df = pd.read_csv(file_path)
    
    # Define las columnas de características que deseas normalizar
    feature_columns = [
        'y0_x', 'y0_y', 'y0_z', 'y0_visibility',
'y1_x', 'y1_y', 'y1_z', 'y1_visibility',
'y2_x', 'y2_y', 'y2_z', 'y2_visibility',
'y3_x', 'y3_y', 'y3_z', 'y3_visibility',
'y4_x', 'y4_y', 'y4_z', 'y4_visibility',
'y5_x', 'y5_y', 'y5_z', 'y5_visibility',
'y6_x', 'y6_y', 'y6_z', 'y6_visibility',
'y7_x', 'y7_y', 'y7_z', 'y7_visibility',
'y8_x', 'y8_y', 'y8_z', 'y8_visibility',
'y9_x', 'y9_y', 'y9_z', 'y9_visibility',
'y10_x', 'y10_y', 'y10_z', 'y10_visibility',
'z0_x', 'z0_y', 'z0_z', 'z0_visibility',
'z1_x', 'z1_y', 'z1_z', 'z1_visibility',
'z2_x', 'z2_y', 'z2_z', 'z2_visibility',
'z3_x', 'z3_y', 'z3_z', 'z3_visibility',
'z4_x', 'z4_y', 'z4_z', 'z4_visibility',
'z5_x', 'z5_y', 'z5_z', 'z5_visibility',
'z6_x', 'z6_y', 'z6_z', 'z6_visibility',
'z7_x', 'z7_y', 'z7_z', 'z7_visibility',
'z8_x', 'z8_y', 'z8_z', 'z8_visibility',
'z9_x', 'z9_y', 'z9_z', 'z9_visibility',
'z10_x', 'z10_y', 'z10_z', 'z10_visibility'
        # Asegúrate de incluir todas tus características aquí
    ]
    
    # Instancia el objeto StandardScaler
    scaler = StandardScaler()
    
    # Aplica la normalización
    df[feature_columns] = scaler.fit_transform(df[feature_columns])
    
    # Construir el path de salida
    output_file_path = os.path.join(output_directory, os.path.basename(file_path).replace('.csv', '_normalized.csv'))
    
    # Guardar el DataFrame normalizado
    df.to_csv(output_file_path, index=False)
    print(f"Archivo normalizado guardado en: {output_file_path}")

# Define la carpeta donde se encuentran tus archivos CSV y la carpeta de salida
input_folder_path = 'D:/Codes/EFBA/DataEfba/pkeypoints/'
output_folder_path = 'D:/Codes/EFBA/DataEfba/nkeypoints/'

# Crea el directorio de salida si no existe
if not os.path.exists(output_folder_path):
    os.makedirs(output_folder_path)

# Obtener una lista de todos los archivos CSV en la carpeta de entrada
csv_files = [os.path.join(input_folder_path, f) for f in os.listdir(input_folder_path) if f.endswith('.csv')]

# Normalizar las características de cada archivo CSV
for file in csv_files:
    normalize_features(file, output_folder_path)


Archivo normalizado guardado en: D:/Codes/EFBA/DataEfba/nkeypoints/allen_keypoints_processed_normalized.csv
Archivo normalizado guardado en: D:/Codes/EFBA/DataEfba/nkeypoints/bird_keypoints_processed_normalized.csv
Archivo normalizado guardado en: D:/Codes/EFBA/DataEfba/nkeypoints/curry1_keypoints_processed_normalized.csv
Archivo normalizado guardado en: D:/Codes/EFBA/DataEfba/nkeypoints/curry2_keypoints_processed_normalized.csv
Archivo normalizado guardado en: D:/Codes/EFBA/DataEfba/nkeypoints/harden_keypoints_processed_normalized.csv
Archivo normalizado guardado en: D:/Codes/EFBA/DataEfba/nkeypoints/jj_keypoints_processed_normalized.csv
Archivo normalizado guardado en: D:/Codes/EFBA/DataEfba/nkeypoints/jordan_keypoints_processed_normalized.csv
Archivo normalizado guardado en: D:/Codes/EFBA/DataEfba/nkeypoints/kd_keypoints_processed_normalized.csv
Archivo normalizado guardado en: D:/Codes/EFBA/DataEfba/nkeypoints/kerr_keypoints_processed_normalized.csv
Archivo normalizado guardado en:

In [5]:

# Ruta al directorio con los archivos normalizados
normalized_folder_path = 'D:/Codes/EFBA/DataEfba/nkeypoints/'

# Lista todos los archivos en el directorio
files = [os.path.join(normalized_folder_path, f) for f in os.listdir(normalized_folder_path) if f.endswith('_normalized.csv')]

# Carga todos los archivos en un DataFrame
df_features = pd.concat([pd.read_csv(file) for file in files], ignore_index=True)


In [2]:

# Definir la ruta al directorio con los archivos normalizados
input_directory = 'D:/Codes/EFBA/DataEfba/nkeypoints/'
output_directory = 'D:/Codes/EFBA/DataEfba/nkeypoints_wframe'

# Crear el directorio de salida si no existe
if not os.path.exists(output_directory):
    os.makedirs(output_directory)

# Definir la tasa de frames
frame_rate = 30  # reemplaza con la tasa de frames real de tus videos

# Lista todos los archivos CSV en el directorio de entrada
files = [f for f in os.listdir(input_directory) if f.endswith('.csv')]

# Procesar cada archivo
for file in files:
    # Cargar el archivo CSV
    df = pd.read_csv(os.path.join(input_directory, file))
    
    # Añadir la columna de frame asumiendo que la primera fila corresponde al frame 0
    df['frame'] = df.index / frame_rate
    
    # Guardar el DataFrame actualizado en el directorio de salida
    df.to_csv(os.path.join(output_directory, file), index=False)

print("Proceso completado. Los archivos actualizados están en:", output_directory)


Proceso completado. Los archivos actualizados están en: D:/Codes/EFBA/DataEfba/nkeypoints_wframe


In [8]:
import pandas as pd

# Asumiendo que la ruta al archivo es correcta
df_annotations = pd.read_csv('D:/Codes/EFBA/DataEfba/Efba_criterios_temp.csv')

# Verificar las columnas
print("Columnas en df_annotations:", df_annotations.columns)

# Si el nombre de la columna está mal escrito o no como lo esperabas, aquí lo verás


Columnas en df_annotations: Index([' frame_inicio', 'frame_final', 'nombre_del_video', 'criterio',
       'correcto_o_incorrecto', 'm_tiempo', 'jugador'],
      dtype='object')


In [9]:

# Caminos a las carpetas
features_directory = 'D:/Codes/EFBA/DataEfba/nkeypoints_wframe'
annotations_path = 'D:/Codes/EFBA/DataEfba/Efba_criterios_temp.csv'
output_directory = 'D:/Codes/EFBA/DataEfba'

# Cargar las anotaciones
df_annotations = pd.read_csv(annotations_path)

# Expandir las anotaciones a cada frame relevante
expanded_annotations = []
for _, row in df_annotations.iterrows():
    for frame in range(row['frame_inicio'], row['frame_final'] + 1):
        expanded_annotations.append({
            'nombre_del_video': row['nombre_del_video'],
            'frame': frame,
            'criterio': row['criterio'],
            'correcto_o_incorrecto': row['correcto_o_incorrecto'],
            'jugador': row['jugador']
        })

# Convertir la lista expandida de anotaciones a un DataFrame
df_expanded_annotations = pd.DataFrame(expanded_annotations)

# Procesar cada archivo de características
for filename in os.listdir(features_directory):
    if filename.endswith('.csv'):
        df_features = pd.read_csv(os.path.join(features_directory, filename))
        
        # Fusionar los DataFrames basado en 'nombre_del_video' (ajustar si el nombre del archivo es el ID) y 'frame'
        df_merged = pd.merge(df_features, df_expanded_annotations, on=['nombre_del_video', 'frame'], how='left')
        
        # Guardar el DataFrame combinado
        df_merged.to_csv(os.path.join(output_directory, f"{filename[:-4]}_merged.csv"), index=False)

print("Todos los archivos han sido procesados y fusionados.")


KeyError: 'nombre_del_video'

In [6]:
print(df_annotations.columns)


Index([' frame_inicio', 'frame_final', 'nombre_del_video', 'criterio',
       'correcto_o_incorrecto', 'm_tiempo', 'jugador'],
      dtype='object')


In [8]:
# Ruta al archivo de etiquetas anotadas
labels_file_path = 'D:/Codes/EFBA/DataEfba/Efba_criterios_temp.csv'

# Cargar las etiquetas
df_labels = pd.read_csv(labels_file_path)

In [9]:
# Asegúrate de que ambos DataFrames estén alineados y tengan la misma longitud
if len(df_features) == len(df_labels):
    df = pd.concat([df_features, df_labels], axis=1)
else:
    print("Error: El número de filas en las características y las etiquetas no coincide.")


Error: El número de filas en las características y las etiquetas no coincide.


In [None]:
from sklearn.model_selection import train_test_split

# Definir las columnas de características y etiquetas
features_columns = list(df_features.columns)  # Lista de todas tus columnas de características
label_columns = list(df_labels.columns)  # Lista de todas tus columnas de etiquetas

X = df[features_columns]  # Características
y = df[label_columns]  # Etiquetas

# Dividir los datos
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
