# Informe de Análisis y Modelado con MLP

## 1. Introducción

Este informe detalla las etapas realizadas durante el análisis y modelado de un conjunto de datos utilizando técnicas de aprendizaje automático, con énfasis en un modelo de Perceptrón Multicapa (MLP). El objetivo principal fue predecir las actividades humanas (como caminar, sentarse, estar de pie, etc.) a partir de datos sensoriales. El proceso incluyó la limpieza y preprocesamiento de los datos, un análisis no supervisado mediante técnicas de reducción de dimensionalidad y clustering, y finalmente el entrenamiento y evaluación de un modelo MLP para clasificación.

## 2. Preprocesamiento de Datos

El preprocesamiento de los datos es esencial para asegurar la calidad de las predicciones. En esta fase se llevaron a cabo las siguientes acciones:

- **Eliminación de valores faltantes**: Se limpiaron los datos eliminando cualquier fila con valores nulos.
- **Escalado de datos**: Las características numéricas fueron normalizadas utilizando un escalador estándar para asegurar que todas las características tuvieran el mismo peso durante el entrenamiento del modelo.
- **Codificación de etiquetas**: Las etiquetas categóricas de las actividades fueron convertidas en valores numéricos utilizando codificación de etiquetas.

Se visualizó la distribución de las características después de la normalización utilizando un gráfico de dispersión.

## 3. Análisis No Supervisado

### 3.1. Análisis de Componentes Principales (PCA)

Se utilizó **PCA** (Análisis de Componentes Principales) para reducir la dimensionalidad del conjunto de datos y facilitar la visualización. Se identificaron dos componentes principales que explican la mayor parte de la variabilidad en los datos.

### 3.2. K-means Clustering

Se aplicó **K-means clustering** para agrupar las observaciones en clusters. Este análisis ayudó a entender la estructura subyacente en los datos y proporcionó una forma adicional de explorar las relaciones entre las características.

## 4. Modelado con MLP

Se entrenó un modelo **MLP (Perceptrón Multicapa)** utilizando el conjunto de datos procesado. El modelo utilizó dos capas ocultas con 64 y 32 neuronas respectivamente, y fue entrenado con un optimizador Adam y una función de activación ReLU.

- **División de datos**: El conjunto de datos se dividió en conjuntos de entrenamiento (80%) y prueba (20%).
- **Evaluación**: El modelo fue evaluado en el conjunto de prueba, obteniendo una **precisión del 96.13%** y un **error de 3.875%**.

## 5. Evaluación y Resultados

### 5.1. Reporte de Clasificación

El modelo de MLP logró una clasificación exitosa de las actividades, con una alta precisión y recall para todas las clases. A continuación, se presentan los resultados del reporte de clasificación:

- **Precisión general**: 96.13%
- **Error**: 3.875%
- **Matriz de confusión**: La matriz de confusión mostró un buen desempeño del modelo, con pocos falsos positivos y falsos negativos.

### 5.2. Visualización

Se generaron visualizaciones de las primeras dos componentes principales y de los clusters obtenidos con K-means. Estas visualizaciones facilitaron la comprensión de la estructura de los datos y de los resultados del análisis.

## 6. Conclusiones

- **Preprocesamiento adecuado**: Se realizó una limpieza de datos exhaustiva, lo que permitió obtener un conjunto de datos consistente y listo para el modelado.
- **Análisis no supervisado**: El uso de PCA y K-means clustering ayudó a identificar patrones subyacentes en los datos que mejoraron la comprensión del problema.
- **Modelo MLP eficiente**: El modelo de MLP entrenado mostró un rendimiento sobresaliente, alcanzando una alta precisión y baja tasa de error, lo que confirma la eficacia de este enfoque para la clasificación de actividades humanas.
- **Próximos pasos**: Se recomienda explorar técnicas adicionales de optimización y ajuste de hiperparámetros para seguir mejorando el rendimiento del modelo.

En resumen, el análisis realizado ha demostrado que el modelo MLP es efectivo para este tipo de problemas de clasificación, y el proceso de preprocesamiento y análisis exploratorio jugó un papel crucial en el éxito del modelo.

