In [2]:
#My First Notebook

In [9]:
import numpy as np
import pandas as pd
from sqlalchemy import create_engine
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report
from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from tslearn.clustering import TimeSeriesKMeans

In [10]:
#Conectar a la base de datos SQL
def connect_to_db(connection_string):
    engine = create_engine(connection_string)
    return engine

In [11]:
#Obtener los datos de la BD 
def cargar_datos(engine):
    ejercicios = pd.read_sql_table('Ejercicios', engine)
    series = pd.read_sql_table('Serie', engine)
    repeticiones = pd.read_sql_table('Repeticion', engine)
    
    return ejercicios, series, repeticiones

In [12]:
def preprocesar_datos(ejercicios, series, repeticiones):
    data = repeticiones.merge(series, on=['Id_ejercicio', 'Num_Serie'])
    data = data.merge(ejercicios, on='Id_ejercicio')
    data = data[['NombreEjercicio', 'Tiempo', 'Fuerza']]
    
    print("Datos después de la unión de tablas:")
    print(data.head())
    
    # Normalizar etiquetas correctamente
    data['NombreEjercicio'] = data['NombreEjercicio'].apply(lambda x: 0 if 'Rotación interna' in x.lower() else (1 if 'Rotación externa' in x.lower() else np.nan))
    data = data.dropna(subset=['NombreEjercicio'])  # Eliminar filas con etiquetas no especificadas
    
    print("Datos después de normalizar etiquetas:")
    print(data.head())
    
    return data


In [14]:
#Transformación de datos
def transformar_datos(data):
    grouped = data.groupby(['NombreEjercicio', 'Tiempo'])['Fuerza'].apply(list).reset_index()
    max_length = max(grouped['Fuerza'].apply(len))
    X, y = [], []

    for name, group in grouped.groupby('NombreEjercicio'):
        series = group['Fuerza'].apply(lambda x: np.pad(x, (0, max_length - len(x)), 'constant')).tolist()
        X.extend(series)
        y.extend([name] * len(series))

    X = np.array(X)
    scaler = TimeSeriesScalerMeanVariance()
    X_scaled = scaler.fit_transform(X)

    return X_scaled, y 

In [15]:
#Entrenamiento del modelo
def entrenar_modelo(X, y):
    y = np.array(y)
    X_flattened = X.reshape(X.shape[0], -1)
    X_train, X_test, y_train, y_test = train_test_split(X_flattened, y, test_size=0.3, random_state=42)
    
    unique, counts = np.unique(y_train, return_counts=True)
    print("Distribución de clases en el conjunto de entrenamiento:", dict(zip(unique, counts)))

    kmeans = TimeSeriesKMeans(n_clusters=2, metric="euclidean")
    kmeans.fit(X_train.reshape(X_train.shape[0], X.shape[1], X.shape[2]))

    clf = RandomForestClassifier()
    clf.fit(X_train, y_train)
    y_pred = clf.predict(X_test)
    print(classification_report(y_test, y_pred))
    
    return clf, kmeans

In [55]:
# Predecir con nuevos datos
def predecir(modelo, datos_nuevos, max_length, scaler):
    # Asumimos que 'datos_nuevos' ya contiene 'Tiempo' y 'Fuerza' sin 'NombreEjercicio'
    X = []
    for f in datos_nuevos['Fuerza']:
        if isinstance(f, list):
            X.append(np.pad(f, (0, max_length - len(f)), 'constant'))
        else:
            X.append(np.zeros(max_length))  # Si 'f' es NaN, se rellena con ceros
    X = np.array(X)
    
    X_scaled = scaler.transform(X)
    X_flattened = X_scaled.reshape(X_scaled.shape[0], -1)
    prediccion = modelo.predict(X_flattened)
    return prediccion


In [56]:
# Ejecución del proceso
# Creamos el engine
if __name__ == "__main__":
    engine = connect_to_db('mysql+pymysql://root:8963alex@localhost:3306/MyTrainer')
    ejercicios, series, repeticiones = cargar_datos(engine)
    datos_procesados = preprocesar_datos(ejercicios, series, repeticiones)

    if datos_procesados.empty:
        print("No hay datos disponibles después del preprocesamiento.")
    else:
        X, y = transformar_datos(datos_procesados)
        modelo, kmeans = entrenar_modelo(X, y)

        archivo_nuevos_datos = '040_Cin_RotIn_Dom.xlsx - Serie 1.csv'
        nuevos_datos = pd.read_csv(archivo_nuevos_datos)
        if 'Fuerza (Kg)' not in nuevos_datos.columns:
            raise ValueError("El archivo de nuevos datos debe contener una columna 'Fuerza (Kg)'.")
        nuevos_datos.rename(columns={'Tiempo (s)': 'Tiempo', 'Fuerza (Kg)': 'Fuerza'}, inplace=True)

        max_length = X.shape[1]
        scaler = TimeSeriesScalerMeanVariance()
        scaler.fit(X)

        print("Estructura de los nuevos datos antes de la predicción:")
        print(nuevos_datos.head())

        prediccion = predecir(modelo, nuevos_datos, max_length, scaler)
        
        # Imprimir todas las predicciones realizadas
        for i, pred in enumerate(prediccion):
            print(f'Predicción {i + 1}: {"Rotación Interna" if pred == 0 else "Rotación Externa"}')

Ejercicios:
   Id_ejercicio   NombreEjercicio  Id_Modo Informes Lateralidad Dominante
0             1         Abducción        1           Unilateral        Si
1             3           Flexión        1           Unilateral        Si
2             4  Rotación Externa        3           Unilateral        Si
3             5  Rotación Interna        4           Unilateral        Si
4             6           Flexión        1           Unilateral        Si
Series:
   Num_Serie  Id_ejercicio Tipo_Archivo Tipo_Ejercicio  Tiempo_Recuperacion  \
0          1             8            D       Cinetico                  0.0   
1          1             9            D       Cinetico                  0.0   
2          1            10            D       Cinetico                  0.0   
3          1            11            D       Cinetico                  0.0   
4          1            12            D       Cinetico                  0.0   

   Duracion  Repeticiones  Recorrido  Incremento_Carga_InterS

In [54]:
import numpy as np
import pandas as pd
from sqlalchemy import create_engine
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report
from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from tslearn.clustering import TimeSeriesKMeans

# Conexión a la base de datos
def connect_to_db(connection_string):
    engine = create_engine(connection_string)
    return engine

# Cargar datos de las tablas de la base de datos
def cargar_datos(engine):
    ejercicios = pd.read_sql_table('Ejercicios', engine)
    series = pd.read_sql_table('Serie', engine)
    repeticiones = pd.read_sql_table('Repeticion', engine)
    
    print("Ejercicios:")
    print(ejercicios.head())
    print("Series:")
    print(series.head())
    print("Repeticiones:")
    print(repeticiones.head())

    return ejercicios, series, repeticiones

# Preprocesar los datos
def preprocesar_datos(ejercicios, series, repeticiones):
    # Verificar que las tablas no estén vacías
    if ejercicios.empty or series.empty or repeticiones.empty:
        raise ValueError("Una o más tablas están vacías.")
    
    # Realizar las uniones necesarias
    data = repeticiones.merge(series, on=['Id_ejercicio', 'Num_Serie'])
    data = data.merge(ejercicios, on='Id_ejercicio')
    
    # Filtrar las columnas necesarias
    data = data[['NombreEjercicio', 'Tiempo', 'Fuerza']]
    
    print("Datos después de la unión de tablas:")
    print(data.head())
    
    # Filtrar solo los ejercicios "Rotación Interna" y "Rotación Externa"
    data = data[data['NombreEjercicio'].isin(['Rotación interna', 'Rotación externa'])]
    
    if data.empty:
        raise ValueError("No hay datos después de filtrar 'Rotación interna' y 'Rotación externa'.")
    
    print("Datos después de filtrar por 'Rotación Interna' y 'Rotación Externa':")
    print(data.head())
    print("Distribución de ejercicios después del filtrado:")
    print(data['NombreEjercicio'].value_counts())
    
    return data

# Transformar los datos
def transformar_datos(data):
    if data.empty:
        raise ValueError("El conjunto de datos está vacío después del preprocesamiento.")
    
    grouped = data.groupby(['NombreEjercicio', 'Tiempo'])['Fuerza'].apply(list).reset_index()
    
    if grouped.empty:
        raise ValueError("El conjunto de datos agrupado está vacío.")
    
    max_length = max(grouped['Fuerza'].apply(len))
    X, y = [], []

    for name, group in grouped.groupby('NombreEjercicio'):
        series = group['Fuerza'].apply(lambda x: np.pad(x, (0, max_length - len(x)), 'constant')).tolist()
        X.extend(series)
        y.extend([name] * len(series))

    if not X:
        raise ValueError("No se encontraron series de datos válidas.")
    
    X = np.array(X)
    scaler = TimeSeriesScalerMeanVariance()
    X_scaled = scaler.fit_transform(X)

    return X_scaled, y

# Entrenar el modelo
def entrenar_modelo(X, y):
    y = np.array(y)
    X_flattened = X.reshape(X.shape[0], -1)
    X_train, X_test, y_train, y_test = train_test_split(X_flattened, y, test_size=0.3, random_state=42)
    
    unique, counts = np.unique(y_train, return_counts=True)
    print("Distribución de clases en el conjunto de entrenamiento:", dict(zip(unique, counts)))

    kmeans = TimeSeriesKMeans(n_clusters=2, metric="euclidean")
    kmeans.fit(X_train.reshape(X_train.shape[0], X.shape[1], X.shape[2]))

    clf = RandomForestClassifier()
    clf.fit(X_train, y_train)
    y_pred = clf.predict(X_test)
    print(classification_report(y_test, y_pred))
    
    return clf, kmeans

# Predecir con nuevos datosdef 
def predecir(modelo, datos_nuevos, max_length, scaler):
    # Asumimos que 'datos_nuevos' ya contiene 'Tiempo' y 'Fuerza' sin 'NombreEjercicio'
    X = []
    for tiempo, group in datos_nuevos.groupby('Tiempo'):
        # Verificar si hay valores de 'Fuerza' que no sean listas
        fuerzas = []
        for f in group['Fuerza']:
            if isinstance(f, list):
                fuerzas.append(np.pad(f, (0, max_length - len(f)), 'constant'))
            else:
                fuerzas.append(np.pad([f], (0, max_length - 1), 'constant'))  # Tratar 'f' como lista de un solo elemento
        
        X.append(np.mean(fuerzas, axis=0))  # Promedio de todas las series de fuerza para cada tiempo
    
    X = np.array(X)
    X_scaled = scaler.transform(X)
    X_flattened = X_scaled.reshape(X_scaled.shape[0], -1)
    
    # Realizar la predicción con el modelo
    prediccion = modelo.predict(X_flattened)
    
    return prediccion


# Ejecución del código
if __name__ == "__main__":
    engine = connect_to_db('mysql+pymysql://root:8963alex@localhost:3306/MyTrainer')
    ejercicios, series, repeticiones = cargar_datos(engine)
    datos_procesados = preprocesar_datos(ejercicios, series, repeticiones)

    if datos_procesados.empty:
        print("No hay datos disponibles después del preprocesamiento.")
    else:
        X, y = transformar_datos(datos_procesados)
        modelo, kmeans = entrenar_modelo(X, y)

        archivo_nuevos_datos = '017_Cin_RotEx_Dom.xlsx - Serie 1.csv'
        nuevos_datos = pd.read_csv(archivo_nuevos_datos)
        if 'Fuerza (Kg)' not in nuevos_datos.columns:
            raise ValueError("El archivo de nuevos datos debe contener una columna 'Fuerza (Kg)'.")
        nuevos_datos.rename(columns={'Tiempo (s)': 'Tiempo', 'Fuerza (Kg)': 'Fuerza'}, inplace=True)

        max_length = X.shape[1]
        scaler = TimeSeriesScalerMeanVariance()
        scaler.fit(X)

        print("Estructura de los nuevos datos antes de la predicción:")
        print(nuevos_datos.head())

        prediccion = predecir(modelo, nuevos_datos, max_length, scaler)
        print(f'Predicción final: {prediccion}')





Ejercicios:
   Id_ejercicio   NombreEjercicio  Id_Modo Informes Lateralidad Dominante
0             1         Abducción        1           Unilateral        Si
1             3           Flexión        1           Unilateral        Si
2             4  Rotación Externa        3           Unilateral        Si
3             5  Rotación Interna        4           Unilateral        Si
4             6           Flexión        1           Unilateral        Si
Series:
   Num_Serie  Id_ejercicio Tipo_Archivo Tipo_Ejercicio  Tiempo_Recuperacion  \
0          1             8            D       Cinetico                  0.0   
1          1             9            D       Cinetico                  0.0   
2          1            10            D       Cinetico                  0.0   
3          1            11            D       Cinetico                  0.0   
4          1            12            D       Cinetico                  0.0   

   Duracion  Repeticiones  Recorrido  Incremento_Carga_InterS