# Ejercicio Grupo E8FP

**Integrantes:**
- Maxim Polyak
- Jesús Gómez

## Objetivo
El objetivo de esta actividad es proporcionar experiencia en el manejo de datos y clasificación de gestos de la mano utilizando diferentes modelos de aprendizaje.

## Importación de librerías

In [9]:
import glob
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis, QuadraticDiscriminantAnalysis
from sklearn.metrics import classification_report, accuracy_score, confusion_matrix


## Carga y preparación de datos
Se cargan los archivos CSV sin encabezados, se concatenan y se separan características y etiqueta.

In [10]:
file_paths = glob.glob('data/HandGesture*.csv')
dfs = [pd.read_csv(fp, header=None) for fp in file_paths]

df = pd.concat(dfs, ignore_index=True)
X = df.iloc[:, :-1]
y = df.iloc[:, -1]
print('Datos cargados:', df.shape)

Datos cargados: (11678, 65)


## División del conjunto de datos
Se divide en entrenamiento (80%) y prueba (20%).

In [11]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
print('Tamaño entrenamiento:', X_train.shape, 'Tamaño prueba:', X_test.shape)

Tamaño entrenamiento: (9342, 64) Tamaño prueba: (2336, 64)


## Modelo 1: Bosque Aleatorio

In [12]:
# Entrenamiento
erf = RandomForestClassifier(random_state=42)
erf.fit(X_train, y_train)
# Evaluación
y_pred_rf = erf.predict(X_test)
print('Accuracy RF:', accuracy_score(y_test, y_pred_rf))
print(classification_report(y_test, y_pred_rf))

Accuracy RF: 0.9238013698630136
              precision    recall  f1-score   support

           0       0.95      0.97      0.96       557
           1       0.96      0.92      0.94       575
           2       0.92      0.92      0.92       611
           3       0.88      0.89      0.89       593

    accuracy                           0.92      2336
   macro avg       0.92      0.92      0.92      2336
weighted avg       0.92      0.92      0.92      2336



## Modelo 2: Análisis de Discriminación Lineal

In [13]:
# Entrenamiento
lda = LinearDiscriminantAnalysis()
lda.fit(X_train, y_train)
# Evaluación
y_pred_lda = lda.predict(X_test)
print('Accuracy LDA:', accuracy_score(y_test, y_pred_lda))
print(classification_report(y_test, y_pred_lda))

Accuracy LDA: 0.3407534246575342
              precision    recall  f1-score   support

           0       0.48      0.39      0.43       557
           1       0.32      0.35      0.33       575
           2       0.28      0.29      0.28       611
           3       0.32      0.34      0.33       593

    accuracy                           0.34      2336
   macro avg       0.35      0.34      0.34      2336
weighted avg       0.35      0.34      0.34      2336



## Modelo 3: Análisis de Discriminación Radial (QDA)

In [14]:
# Asumimos 'discriminación radial' como Quadratic Discriminant Analysis
qda = QuadraticDiscriminantAnalysis()
qda.fit(X_train, y_train)
y_pred_qda = qda.predict(X_test)
print('Accuracy QDA:', accuracy_score(y_test, y_pred_qda))
print(classification_report(y_test, y_pred_qda))

Accuracy QDA: 0.9370719178082192
              precision    recall  f1-score   support

           0       0.94      0.95      0.94       557
           1       0.94      0.98      0.96       575
           2       0.96      0.94      0.95       611
           3       0.91      0.88      0.89       593

    accuracy                           0.94      2336
   macro avg       0.94      0.94      0.94      2336
weighted avg       0.94      0.94      0.94      2336



## Conclusiones
En función de las métricas obtenidas, discutimos qué modelo se adapta mejor a los datos de EMG.