NO acierta ninguno

In [2]:
import numpy as np
import pandas as pd
from sqlalchemy import create_engine
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report
from tslearn.preprocessing import TimeSeriesScalerMeanVariance
from sklearn.cluster import KMeans

# Conexión a la base de datos
def connect_to_db(connection_string):
    engine = create_engine(connection_string)
    return engine

# Cargar datos de las tablas de la base de datos
def cargar_datos(engine):
    ejercicios = pd.read_sql_table('Ejercicios', engine)
    repeticiones = pd.read_sql_table('Repeticion', engine)
    return ejercicios, repeticiones

# Preprocesar los datos
def preprocesar_datos(ejercicios, repeticiones):
    data = repeticiones.merge(ejercicios, on='Id_ejercicio')
    
    # Seleccionar características relevantes y el objetivo
    X = data[['Id_ejercicio', 'Num_Serie', 'Num_repeticion', 'Tiempo', 'Fuerza', 'Posicion', 'Velocidad', 'Trig']]
    y = data['NombreEjercicio']

    # Convertir características categóricas a numéricas si es necesario
    le = LabelEncoder()
    y = le.fit_transform(y)

    # Normalizar los datos
    scaler = StandardScaler()
    X_scaled = scaler.fit_transform(X)

    return X, y, le, scaler

# Transformar los datos para series temporales
def transformar_datos(data):
    grouped = data.groupby(['NombreEjercicio', 'Tiempo']).agg({
        'Fuerza': list,
        'Posicion': list,
        'Velocidad': list
    }).reset_index()
    max_length = max(grouped['Fuerza'].apply(len))
    X, y = [], []

    for name, group in grouped.groupby('NombreEjercicio'):
        series_fuerza = group['Fuerza'].apply(lambda x: np.pad(x, (0, max_length - len(x)), 'constant')).tolist()
        series_posicion = group['Posicion'].apply(lambda x: np.pad(x, (0, max_length - len(x)), 'constant')).tolist()
        series_velocidad = group['Velocidad'].apply(lambda x: np.pad(x, (0, max_length - len(x)), 'constant')).tolist()
        
        combined_series = [np.stack([f, p, v], axis=-1) for f, p, v in zip(series_fuerza, series_posicion, series_velocidad)]
        X.extend(combined_series)
        y.extend([name] * len(combined_series))
    
    X = np.array(X)
    scaler = TimeSeriesScalerMeanVariance()
    X_scaled = scaler.fit_transform(X)

    return X_scaled, y

# Entrenar el modelo
def entrenar_modelo(X, y):
    y = np.array(y)
    X_flattened = X.reshape(X.shape[0], -1)
    X_train, X_test, y_train, y_test = train_test_split(X_flattened, y, test_size=0.3, random_state=42)
    
    clf = RandomForestClassifier()
    
    # Validación cruzada
    scores = cross_val_score(clf, X_flattened, y, cv=5)
    print(f"Cross-validation scores: {scores}")
    print(f"Mean cross-validation score: {scores.mean()}")
    
    clf.fit(X_train, y_train)
    y_pred = clf.predict(X_test)
    print("Accuracy:", accuracy_score(y_test, y_pred))
    print(classification_report(y_test, y_pred))
    
    # Revisión de predicciones en el conjunto de entrenamiento
    y_pred_train = clf.predict(X_train)
    print("Train Set Predictions:", y_pred_train)
    
    return clf

# Aplicar clustering
def aplicar_clustering(X, y):
    num_clusters = len(np.unique(y))  # Usar el número de ejercicios como número de clusters
    kmeans = KMeans(n_clusters=num_clusters, random_state=42)
    X_clustered = kmeans.fit_predict(X)
    
    # Análisis de clusters
    print("Cluster Centers:", kmeans.cluster_centers_)
    
    return kmeans, X_clustered

# Predecir con nuevos datos
def predecir(modelo, kmeans, datos_nuevos, max_length, scaler):
    X = []
    for tiempo, group in datos_nuevos.groupby('Tiempo'):
        fuerzas = []
        posiciones = []
        velocidades = []
        for f, p, v in zip(group['Fuerza'], group['Posicion'], group['Velocidad']):
            if isinstance(f, list):
                fuerzas.append(np.pad(f, (0, max_length - len(f)), 'constant'))
                posiciones.append(np.pad(p, (0, max_length - len(p)), 'constant'))
                velocidades.append(np.pad(v, (0, max_length - len(v)), 'constant'))
            else:
                fuerzas.append(np.pad([f], (0, max_length - 1), 'constant'))
                posiciones.append(np.pad([p], (0, max_length - 1), 'constant'))
                velocidades.append(np.pad([v], (0, max_length - 1), 'constant'))
        
        combined_series = np.stack([np.mean(fuerzas, axis=0), np.mean(posiciones, axis=0), np.mean(velocidades, axis=0)], axis=-1)
        X.append(combined_series)
    
    X = np.array(X)
    X_scaled = scaler.transform(X)
    X_flattened = X_scaled.reshape(X_scaled.shape[0], -1)

    # Aplicar clustering a los nuevos datos
    nuevos_datos_clustered = kmeans.predict(X_flattened)
    X_flattened = np.hstack((X_flattened, nuevos_datos_clustered.reshape(-1, 1)))
    
    prediccion = modelo.predict(X_flattened)
    
    return prediccion

# Ejecución del código
if __name__ == "__main__":
    engine = connect_to_db('mysql+pymysql://root:8963alex@localhost:3306/MyTrainer')
    ejercicios, repeticiones = cargar_datos(engine)

    # Verificar balance de clases
    print("Distribución de clases:")
    print(ejercicios['NombreEjercicio'].value_counts())

    X, y, le, scaler = preprocesar_datos(ejercicios, repeticiones)

    if repeticiones.empty:
        print("No hay datos disponibles después del preprocesamiento.")
    else:
        X_series, y_series = transformar_datos(repeticiones.merge(ejercicios, on='Id_ejercicio'))

        # Aplicar clustering a los datos de entrenamiento
        kmeans, X_clustered = aplicar_clustering(X_series.reshape(X_series.shape[0], -1), y_series)
        X_series_clustered = np.hstack((X_series.reshape(X_series.shape[0], -1), X_clustered.reshape(-1, 1)))

        modelo = entrenar_modelo(X_series_clustered, y_series)

        archivo_nuevos_datos = '040_Cin_RotIn_Dom.xlsx - Serie 1.csv'
        nuevos_datos = pd.read_csv(archivo_nuevos_datos)
        nuevos_datos.rename(columns={'Tiempo (s)': 'Tiempo', 'Fuerza (Kg)': 'Fuerza', 'Posición (cm)': 'Posicion', 'Velocidad (cm/s)': 'Velocidad'}, inplace=True)

        max_length = X_series.shape[1]
        scaler = TimeSeriesScalerMeanVariance()
        scaler.fit(X_series)

        prediccion = predecir(modelo, kmeans, nuevos_datos, max_length, scaler)
        nombre_ejercicio_final = pd.Series(prediccion).mode()[0]

        df_resultado = pd.DataFrame([nombre_ejercicio_final], columns=['NombreEjercicio'])
        print(df_resultado)


Distribución de clases:
NombreEjercicio
Flexión             129
Adducción           129
Abducción           128
Extensión           128
Rotación externa    120
Rotación interna    118
Rotación Externa      1
Rotación Interna      1
Name: count, dtype: int64
Cluster Centers: [[ 3.56826592 -0.33090601 -0.47285374 ... -0.61739465 -0.27939593
  -0.06010442]
 [ 8.66995307  8.58074875 -8.58818537 ... -0.11808309 -0.11390114
   0.10849708]
 [ 9.56895063 -8.36723863  8.32942177 ... -0.10763609  0.07849424
  -0.09055917]
 [ 8.31305911  8.93066712  8.85528462 ... -0.12154862 -0.11460121
  -0.10082801]
 [ 3.09753883  2.41517869 -0.01924332 ... -0.15924442 -0.1371667
   0.01223987]
 [ 1.53150808  1.74970158 -0.13170167 ... -0.42376858 -0.34789658
   0.05208021]]
