In [1]:
import pandas as pd
import sqlalchemy
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.multioutput import MultiOutputClassifier
import numpy as np

# Conectar a la base de datos MySQL
engine = sqlalchemy.create_engine('mysql+pymysql://root:8963alex@localhost:3306/PRUEBA')
query_ejercicios = "SELECT * FROM Ejercicios"
query_repeticiones = "SELECT * FROM Repeticion"

# Obtener datos de ejercicios y repeticiones
df_ejercicios = pd.read_sql(query_ejercicios, engine)
df_repeticiones = pd.read_sql(query_repeticiones, engine)

# Fusionar tablas para obtener nombres de ejercicios
df = df_repeticiones.merge(df_ejercicios, on='Id_ejercicio', how='left')

# Seleccionar características relevantes y los objetivos
X = df[['Id_ejercicio', 'Num_Serie', 'Num_repeticion', 'Tiempo', 'Fuerza', 'Posicion', 'Velocidad', 'Trig']]
y = df[['NombreEjercicio', 'Id_Modo', 'Dominante']]

# Convertir características categóricas a numéricas si es necesario
le_nombre = LabelEncoder()
y['NombreEjercicio'] = le_nombre.fit_transform(y['NombreEjercicio'])

le_modo = LabelEncoder()
y['Id_Modo'] = le_modo.fit_transform(y['Id_Modo'])

le_dominante = LabelEncoder()
y['Dominante'] = le_dominante.fit_transform(y['Dominante'])

# Normalizar los datos
scaler = StandardScaler()
X = scaler.fit_transform(X)

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Entrenar el modelo
model = RandomForestClassifier(n_estimators=100, random_state=42)
multi_target_classifier = MultiOutputClassifier(model, n_jobs=1)

multi_target_classifier.fit(X_train, y_train)

# Realizar predicciones
y_pred = multi_target_classifier.predict(X_test)

# Evaluar el modelo
for i in range(y_test.shape[1]):
    print(f"Output {i+1}:")
    print(classification_report(y_test.iloc[:, i], y_pred[:, i]))

# Calcular el accuracy para cada salida individualmente y luego promediar
accuracies = []
for i in range(y_test.shape[1]):
    acc = accuracy_score(y_test.iloc[:, i], y_pred[:, i])
    accuracies.append(acc)
    print(f"Accuracy for output {i+1}: {acc:.2f}")

average_accuracy = np.mean(accuracies)
print(f"Average Accuracy: {average_accuracy:.2f}")

# Cargar los nuevos datos
nuevos_datos = pd.read_csv('../SQL/055/055_Cin_Abd_Dom.csv')

# Renombrar las columnas del CSV para que coincidan con las utilizadas en el modelo
nuevos_datos.columns = ['Id_ejercicio', 'Num_Serie', 'Num_repeticion', 'Fase', 'Tiempo', 'Posicion', 'Fuerza', 'Velocidad', 'Trig', 'Nota']

# Seleccionar solo las columnas relevantes para el modelo
nuevos_datos = nuevos_datos[['Id_ejercicio', 'Num_Serie', 'Num_repeticion', 'Tiempo', 'Fuerza', 'Posicion', 'Velocidad', 'Trig']]

# Preprocesar los nuevos datos de manera similar a los datos de entrenamiento
nuevos_datos_scaled = scaler.transform(nuevos_datos)

# Realizar predicciones
predicciones = multi_target_classifier.predict(nuevos_datos_scaled)

print(predicciones)


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  y['NombreEjercicio'] = le_nombre.fit_transform(y['NombreEjercicio'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  y['Id_Modo'] = le_modo.fit_transform(y['Id_Modo'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  y['Dominante'] = le_dominante.fit_transform(y['Dominante'])


Output 1:
              precision    recall  f1-score   support

           0       0.88      0.93      0.90     30405
           1       0.91      0.90      0.91     30929
           2       0.95      0.95      0.95     32777
           3       0.92      0.91      0.91     31422
           4       0.92      0.91      0.91     28677
           5       0.94      0.92      0.93     27030

    accuracy                           0.92    181240
   macro avg       0.92      0.92      0.92    181240
weighted avg       0.92      0.92      0.92    181240

Output 2:
              precision    recall  f1-score   support

           0       1.00      1.00      1.00    109608
           1       1.00      1.00      1.00     71632

    accuracy                           1.00    181240
   macro avg       1.00      1.00      1.00    181240
weighted avg       1.00      1.00      1.00    181240

Output 3:
              precision    recall  f1-score   support

           0       0.95      0.94      0.95  