In [1]:
import pandas as pd
import sqlalchemy
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.multioutput import MultiOutputClassifier
import numpy as np
from sklearn.model_selection import cross_val_score, KFold


# Conectar a la base de datos MySQL
engine = sqlalchemy.create_engine('mysql+pymysql://root:8963alex@localhost:3306/PRUEBA')
query_ejercicios = "SELECT * FROM Ejercicios"
query_repeticiones = "SELECT * FROM Repeticion"

# Obtener datos de ejercicios y repeticiones
df_ejercicios = pd.read_sql(query_ejercicios, engine)
df_repeticiones = pd.read_sql(query_repeticiones, engine)

# Fusionar tablas para obtener nombres de ejercicios
df = df_repeticiones.merge(df_ejercicios, on='Id_ejercicio', how='left')

# Seleccionar características relevantes y los objetivos
X = df[['Id_ejercicio', 'Num_Serie', 'Num_repeticion', 'Tiempo', 'Fuerza', 'Posicion', 'Velocidad', 'Trig']]
y = df[['NombreEjercicio', 'Id_Modo', 'Dominante']]

# Convertir características categóricas a numéricas si es necesario
le_nombre = LabelEncoder()
y['NombreEjercicio'] = le_nombre.fit_transform(y['NombreEjercicio'])

le_modo = LabelEncoder()
y['Id_Modo'] = le_modo.fit_transform(y['Id_Modo'])

le_dominante = LabelEncoder()
y['Dominante'] = le_dominante.fit_transform(y['Dominante'])

# Normalizar los datos
scaler = StandardScaler()
X = scaler.fit_transform(X)

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

kf = KFold(n_splits=5, shuffle=True, random_state=68)

# Entrenar el modelo
model = RandomForestClassifier(n_estimators=100, random_state=42)
model = MultiOutputClassifier(model, n_jobs=1)


cv_scores = cross_val_score(model, X_train, y_train, cv=kf)
print(f'Scores de la validación cruzada: {cv_scores}')
print(f'Precisión media: {cv_scores.mean()}')
print(f'Desviación estándar: {cv_scores.std()}')


model.fit(X_train, y_train)

# Realizar predicciones
y_pred = model.predict(X_test)

# Evaluar el modelo
accuracy_nombre = accuracy_score(y_test['NombreEjercicio'], y_pred[:, 0])
accuracy_modo = accuracy_score(y_test['Id_Modo'], y_pred[:, 1])
accuracy_dominante = accuracy_score(y_test['Dominante'], y_pred[:, 2])

print("Accuracy (NombreEjercicio):", accuracy_nombre)
print("Accuracy (Id_Modo):", accuracy_modo)
print("Accuracy (Dominante):", accuracy_dominante)

print("Classification Report (NombreEjercicio):")
print(classification_report(y_test['NombreEjercicio'], y_pred[:, 0], target_names=le_nombre.classes_))

print("Classification Report (Id_Modo):")
modo_target_names = [str(cls) for cls in le_modo.classes_]
print(classification_report(y_test['Id_Modo'], y_pred[:, 1], target_names=modo_target_names))

print("Classification Report (Dominante):")
dominante_target_names = [str(cls) for cls in le_dominante.classes_]
print(classification_report(y_test['Dominante'], y_pred[:, 2], target_names=dominante_target_names))



# Cargar los nuevos datos
nuevos_datos = pd.read_csv('../SQL/055/055_Cin_Add_Dom_Reps.csv')

# Renombrar las columnas del CSV para que coincidan con las utilizadas en el modelo
nuevos_datos.columns = ['Id_ejercicio', 'Num_Serie', 'Num_repeticion', 'Fase', 'Tiempo', 'Posicion', 'Fuerza', 'Velocidad', 'Trig', 'Nota']

# Seleccionar solo las columnas relevantes para el modelo
nuevos_datos = nuevos_datos[['Id_ejercicio', 'Num_Serie', 'Num_repeticion', 'Tiempo', 'Fuerza', 'Posicion', 'Velocidad', 'Trig']]

# Preprocesar los nuevos datos de manera similar a los datos de entrenamiento
nuevos_datos_scaled = scaler.transform(nuevos_datos)

# Realizar predicciones
predicciones = model.predict(nuevos_datos_scaled)
nombres_ejercicios = le_nombre.inverse_transform(predicciones[:, 0])
modos = le_modo.inverse_transform(predicciones[:, 1])
dominantes = le_dominante.inverse_transform(predicciones[:, 2])

# Determinar el nombre del ejercicio más frecuente en las predicciones
nombre_ejercicio_final = pd.Series(nombres_ejercicios).mode()[0]
modo_final = pd.Series(modos).mode()[0]
dominante_final = pd.Series(dominantes).mode()[0]

# Crear un DataFrame con los resultados finales
df_resultado = pd.DataFrame([[nombre_ejercicio_final, modo_final, dominante_final]], columns=['NombreEjercicio', 'Id_Modo', 'Dominante'])

print(df_resultado)


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  y['NombreEjercicio'] = le_nombre.fit_transform(y['NombreEjercicio'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  y['Id_Modo'] = le_modo.fit_transform(y['Id_Modo'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  y['Dominante'] = le_dominante.fit_transform(y['Dominante'])


Scores de la validación cruzada: [0.86603399 0.86638573 0.86602709 0.864427   0.8673582 ]
Precisión media: 0.8660464025601412
Desviación estándar: 0.0009443449280544154
Accuracy (NombreEjercicio): 0.9185499889649084
Accuracy (Id_Modo): 0.9992661664091812
Accuracy (Dominante): 0.9625193114102847
Classification Report (NombreEjercicio):
                  precision    recall  f1-score   support

       Abducción       0.88      0.93      0.90     30405
       Adducción       0.91      0.90      0.91     30929
       Extensión       0.95      0.95      0.95     32777
         Flexión       0.92      0.91      0.91     31422
Rotación externa       0.92      0.91      0.91     28677
Rotación interna       0.94      0.92      0.93     27030

        accuracy                           0.92    181240
       macro avg       0.92      0.92      0.92    181240
    weighted avg       0.92      0.92      0.92    181240

Classification Report (Id_Modo):
              precision    recall  f1-score   s