In [20]:
import pandas as pd
import numpy as np
from sklearn.metrics import classification_report
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from tslearn.clustering import TimeSeriesKMeans
from sqlalchemy import create_engine

def connect_to_db(connection_string):
    engine = create_engine(connection_string)
    return engine

def cargar_datos(engine):
    ejercicios = pd.read_sql_table('Ejercicios', engine)
    series = pd.read_sql_table('Serie', engine)
    repeticiones = pd.read_sql_table('Repeticion', engine)
    return ejercicios, series, repeticiones

def preprocesar_datos(ejercicios, series, repeticiones):
    data = repeticiones.merge(series, on=['Id_ejercicio', 'Num_Serie'])
    data = data.merge(ejercicios, on='Id_ejercicio')
    data = data[['NombreEjercicio', 'Tiempo', 'Fuerza', 'Posicion', 'Velocidad']]
    data = data[data['NombreEjercicio'].isin(['Abducción', 'Aducción', 'Flexión', 'Extensión', 'Rotación interna', 'Rotación externa'])]
    return data

def transformar_datos(data):
    grouped = data.groupby(['NombreEjercicio', 'Tiempo'])
    max_length = max(grouped.apply(lambda x: max(len(x['Fuerza']), len(x['Posicion']), len(x['Velocidad']))))
    
    X, y = [], []
    
    for (name, tiempo), group in grouped:
        # Convertir a listas de arrays numéricos si es necesario
        fuerzas = group['Fuerza'].apply(lambda x: np.array(x) if isinstance(x, list) else np.array([x])).tolist()
        posiciones = group['Posicion'].apply(lambda x: np.array(x) if isinstance(x, list) else np.array([x])).tolist()
        velocidades = group['Velocidad'].apply(lambda x: np.array(x) if isinstance(x, list) else np.array([x])).tolist()
        
        # Aplicar padding si son listas de arrays
        fuerzas = [np.pad(arr, (0, max_length - len(arr)), 'constant') for arr in fuerzas]
        posiciones = [np.pad(arr, (0, max_length - len(arr)), 'constant') for arr in posiciones]
        velocidades = [np.pad(arr, (0, max_length - len(arr)), 'constant') for arr in velocidades]
        
        X.extend(list(zip(fuerzas, posiciones, velocidades)))
        y.extend([name] * len(fuerzas))
    
    X = np.array(X)
    scaler = TimeSeriesScalerMeanVariance()
    X_scaled = scaler.fit_transform(X)
    
    return X_scaled, y

def predecir(modelo, datos_nuevos, max_length, scaler):
    X = []
    for tiempo, group in datos_nuevos.groupby('Tiempo'):
        fuerzas = []
        posiciones = []
        velocidades = []
        
        for f, p, v in zip(group['Fuerza'], group['Posicion'], group['Velocidad']):
            if isinstance(f, list):
                fuerzas.append(np.pad(f, (0, max_length - len(f)), 'constant'))
            else:
                fuerzas.append(np.pad([f], (0, max_length - 1), 'constant'))  # Convertir float a lista de un elemento
        
            if isinstance(p, list):
                posiciones.append(np.pad(p, (0, max_length - len(p)), 'constant'))
            else:
                posiciones.append(np.pad([p], (0, max_length - 1), 'constant'))  # Convertir float a lista de un elemento
        
            if isinstance(v, list):
                velocidades.append(np.pad(v, (0, max_length - len(v)), 'constant'))
            else:
                velocidades.append(np.pad([v], (0, max_length - 1), 'constant'))  # Convertir float a lista de un elemento
        
        # Calcular la media de cada serie temporal y añadir a X
        X.append(np.mean(list(zip(fuerzas, posiciones, velocidades)), axis=0))
    
    X = np.array(X)
    
    # Escalar los nuevos datos utilizando el mismo scaler
    X_scaled = scaler.transform(X)
    X_flattened = X_scaled.reshape(X_scaled.shape[0], -1)
    
    prediccion = modelo.predict(X_flattened)
    
    return prediccion

if __name__ == "__main__":
    # 1. Conexión a la base de datos
    engine = connect_to_db('mysql+pymysql://root:8963alex@localhost:3306/MyTrainer')
    
    # 2. Cargar y preprocesar los datos
    ejercicios, series, repeticiones = cargar_datos(engine)
    datos_procesados = preprocesar_datos(ejercicios, series, repeticiones)
    
    # 3. Transformar los datos
    X, y = transformar_datos(datos_procesados)
    
    # 4. Entrenar el modelo
    modelo, kmeans = entrenar_modelo(X, y)
    
    # 5. Predicción con nuevos datos
    archivo_nuevos_datos = '017_Cin_RotEx_Dom.xlsx - Serie 1.csv'  # Nombre del archivo con nuevos datos
    nuevos_datos = pd.read_csv(archivo_nuevos_datos)
    nuevos_datos.rename(columns={'Tiempo (s)': 'Tiempo', 'Fuerza (Kg)': 'Fuerza', 'Posición (cm)': 'Posicion', 'Velocidad (cm/s)': 'Velocidad'}, inplace=True)
    
    # Asegúrate de que los nombres de columnas sean los mismos que se esperan
    if 'Tiempo' not in nuevos_datos.columns or 'Fuerza' not in nuevos_datos.columns or 'Posicion' not in nuevos_datos.columns or 'Velocidad' not in nuevos_datos.columns:
        raise ValueError("Los nombres de las columnas en nuevos_datos no coinciden con lo esperado.")
    
    max_length = X.shape[1]
    scaler = TimeSeriesScalerMeanVariance()
    scaler.fit(X)
    prediccion = predecir(modelo, nuevos_datos, max_length, scaler)
    print(f'Predicción final: {prediccion}')


  max_length = max(grouped.apply(lambda x: max(len(x['Fuerza']), len(x['Posicion']), len(x['Velocidad']))))


                  precision    recall  f1-score   support

       Abducción       0.24      0.15      0.19     22834
       Extensión       0.24      0.15      0.19     24558
         Flexión       0.22      0.14      0.17     23426
Rotación externa       0.21      0.55      0.30     21163
Rotación interna       0.19      0.11      0.14     20457

        accuracy                           0.22    112438
       macro avg       0.22      0.22      0.20    112438
    weighted avg       0.22      0.22      0.20    112438



ValueError: Dimensions of the provided timeseries(except first) must match those of the fitted data! ((374793, 3, 94) and (671, 3, 3) are passed shapes)