# Análisis, diseño, y simulación de un sistema de clasificación basado en técnicas de aprendizaje de máquina para Human Activity Recognition


---


## Descripcion del problema
El reconocimiento automático de actividades humanas a partir de datos de sensores móviles es un desafío fundamental para desarrollar aplicaciones inteligentes que mejoren la calidad de vida. Identificar con precisión qué actividad está realizando una persona, como caminar, sentarse o subir escaleras, permite crear sistemas personalizados para monitoreo de salud, asistencia a personas mayores, control deportivo y entornos de interacción adaptativa.

El uso de técnicas de Machine Learning (ML) ofrece un enfoque efectivo para resolver este problema, ya que permite construir modelos capaces de aprender automáticamente las características discriminativas de las actividades a partir de grandes volúmenes de datos. Estos modelos pueden adaptarse a diferentes usuarios y condiciones, ofreciendo precisión y robustez en entornos reales.

## Estado del arte
A partir de los experimentos realizados en otros artículos, podemos observar que existen factores clave en la obtención de buenos resultados usando modelos de inteligencia artificial para la clasificación de HAR, como son la posición de los sensores en el cuerpo humano, las características físicas del sujeto y la utilización de métodos de validación cruzada robustos.

In [None]:
import zipfile
import os

# Nombre del archivo ZIP
zip_file = "UCI_HAR_Dataset.zip"

# Carpeta de destino
extract_dir = "UCI_HAR_Dataset"

# Extraer contenido del ZIP
with zipfile.ZipFile(zip_file, 'r') as zip_ref:
    zip_ref.extractall(extract_dir)

print("✅ Descomprimido exitosamente")


✅ Descomprimido exitosamente


In [None]:
for root, dirs, files in os.walk(extract_dir):
    level = root.replace(extract_dir, '').count(os.sep)
    indent = ' ' * 4 * level
    print(f"{indent}{os.path.basename(root)}/")
    subindent = ' ' * 4 * (level + 1)
    for f in files:
        print(f"{subindent}{f}")


UCI_HAR_Dataset/
    __MACOSX/
        ._UCI HAR Dataset
        UCI HAR Dataset/
            ._activity_labels.txt
            ._features.txt
            ._train
            ._test
            ._.DS_Store
            ._features_info.txt
            ._README.txt
            test/
                ._X_test.txt
                ._subject_test.txt
                ._y_test.txt
                ._Inertial Signals
                Inertial Signals/
                    ._total_acc_x_test.txt
                    ._body_acc_x_test.txt
                    ._body_gyro_y_test.txt
                    ._body_acc_y_test.txt
                    ._total_acc_y_test.txt
                    ._body_acc_z_test.txt
                    ._body_gyro_x_test.txt
                    ._total_acc_z_test.txt
                    ._body_gyro_z_test.txt
            train/
                ._subject_train.txt
                ._y_train.txt
                ._Inertial Signals
                ._X_train.txt
                Inertia

In [None]:
import pandas as pd

# Ruta base
base_path = "UCI_HAR_Dataset/UCI HAR Dataset/train/"

# Cargar los datos
X_train = pd.read_csv(base_path + "X_train.txt", delim_whitespace=True, header=None)
y_train = pd.read_csv(base_path + "y_train.txt", delim_whitespace=True, header=None)
subject_train = pd.read_csv(base_path + "subject_train.txt", delim_whitespace=True, header=None)

# Mostrar las primeras filas
print("📊 X_train:")
display(X_train.head())

print("🏷️ y_train:")
display(y_train.head())

print("🧑 subject_train:")
display(subject_train.head())

# Traer los nombres de las columnas
features_path = "UCI_HAR_Dataset/UCI HAR Dataset/features.txt"
features = pd.read_csv(features_path, delim_whitespace=True, header=None)
feature_names = features[1].tolist()

# Asignar nombres a las columnas
X_train.columns = feature_names

# Verificar
X_train.head()

# Verificar valores faltantes en X_train
missing_values = X_train.isnull().sum().sum()

print(f"Existen valores faltantes en X_train? {'Sí' if missing_values > 0 else 'No'}")
print(f"Total de valores faltantes: {missing_values}")

  X_train = pd.read_csv(base_path + "X_train.txt", delim_whitespace=True, header=None)


📊 X_train:


  y_train = pd.read_csv(base_path + "y_train.txt", delim_whitespace=True, header=None)
  subject_train = pd.read_csv(base_path + "subject_train.txt", delim_whitespace=True, header=None)


Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,551,552,553,554,555,556,557,558,559,560
0,0.288585,-0.020294,-0.132905,-0.995279,-0.983111,-0.913526,-0.995112,-0.983185,-0.923527,-0.934724,...,-0.074323,-0.298676,-0.710304,-0.112754,0.0304,-0.464761,-0.018446,-0.841247,0.179941,-0.058627
1,0.278419,-0.016411,-0.12352,-0.998245,-0.9753,-0.960322,-0.998807,-0.974914,-0.957686,-0.943068,...,0.158075,-0.595051,-0.861499,0.053477,-0.007435,-0.732626,0.703511,-0.844788,0.180289,-0.054317
2,0.279653,-0.019467,-0.113462,-0.99538,-0.967187,-0.978944,-0.99652,-0.963668,-0.977469,-0.938692,...,0.414503,-0.390748,-0.760104,-0.118559,0.177899,0.100699,0.808529,-0.848933,0.180637,-0.049118
3,0.279174,-0.026201,-0.123283,-0.996091,-0.983403,-0.990675,-0.997099,-0.98275,-0.989302,-0.938692,...,0.404573,-0.11729,-0.482845,-0.036788,-0.012892,0.640011,-0.485366,-0.848649,0.181935,-0.047663
4,0.276629,-0.01657,-0.115362,-0.998139,-0.980817,-0.990482,-0.998321,-0.979672,-0.990441,-0.942469,...,0.087753,-0.351471,-0.699205,0.12332,0.122542,0.693578,-0.615971,-0.847865,0.185151,-0.043892


🏷️ y_train:


Unnamed: 0,0
0,5
1,5
2,5
3,5
4,5


🧑 subject_train:


Unnamed: 0,0
0,1
1,1
2,1
3,1
4,1


¿Existen valores faltantes en X_train? No
Total de valores faltantes: 0


  features = pd.read_csv(features_path, delim_whitespace=True, header=None)
