<a href="https://colab.research.google.com/github/Almanza0805/Asignacion-2/blob/main/assignaciones/assignment_4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Clasificaci√≥n de Piso en el Dataset UJIIndoorLoc

---

## Introducci√≥n

En este notebook se implementa un flujo completo de procesamiento y an√°lisis para la clasificaci√≥n del **piso** en un entorno interior utilizando el dataset **UJIIndoorLoc**. Este conjunto de datos contiene mediciones de se√±ales WiFi recopiladas en distintas ubicaciones de un edificio, con informaci√≥n sobre coordenadas, piso, usuario, hora, entre otros.

En esta tarea nos enfocaremos en predecir el **piso** en el que se encuentra un dispositivo, considerando √∫nicamente las muestras etiquetadas con valores v√°lidos para dicha variable. Se tratar√° como un problema de clasificaci√≥n multiclase (planta baja, primer piso, segundo piso).

## Objetivos

- **Cargar y explorar** el conjunto de datos UJIIndoorLoc.
- **Preparar** los datos seleccionando las caracter√≠sticas relevantes y el target (`FLOOR`).
- **Dividir** el dataset en entrenamiento y validaci√≥n (80/20).
- **Entrenar y optimizar** clasificadores basados en seis algoritmos:
  - K-Nearest Neighbors (KNN)
  - Gaussian Naive Bayes
  - Regresi√≥n Log√≠stica
  - √Årboles de Decisi√≥n
  - Support Vector Machines (SVM)
  - Random Forest
- **Seleccionar hiperpar√°metros √≥ptimos** para cada modelo utilizando validaci√≥n cruzada (5-fold), empleando estrategias como **Grid Search**, **Randomized Search**, o **Bayesian Optimization** seg√∫n el algoritmo.
- **Comparar el desempe√±o** de los modelos sobre el conjunto de validaci√≥n, usando m√©tricas como *accuracy*, *precision*, *recall*, y *F1-score*.
- **Determinar el mejor clasificador** para esta tarea, junto con sus hiperpar√°metros √≥ptimos.

Este ejercicio permite no solo evaluar la capacidad predictiva de distintos algoritmos cl√°sicos de clasificaci√≥n, sino tambi√©n desarrollar buenas pr√°cticas en validaci√≥n de modelos y selecci√≥n de hiperpar√°metros en contextos del mundo real.

---

## Descripci√≥n del Dataset

El dataset utilizado en este an√°lisis es el **UJIIndoorLoc Dataset**, ampliamente utilizado para tareas de localizaci√≥n en interiores a partir de se√±ales WiFi. Est√° disponible p√∫blicamente en la UCI Machine Learning Repository y ha sido recopilado en un entorno real de un edificio universitario.

Cada muestra corresponde a una observaci√≥n realizada por un dispositivo m√≥vil, donde se registran las intensidades de se√±al (RSSI) de m√°s de 500 puntos de acceso WiFi disponibles en el entorno. Adem√°s, cada fila contiene informaci√≥n contextual como la ubicaci√≥n real del dispositivo (coordenadas X e Y), el piso, el edificio, el identificador del usuario, y la marca temporal.

El objetivo en esta tarea es predecir el **piso** (`FLOOR`) en el que se encontraba el dispositivo en el momento de la medici√≥n, considerando √∫nicamente las caracter√≠sticas num√©ricas provenientes de las se√±ales WiFi.

### Estructura del dataset

- **N√∫mero de muestras**: ~20,000
- **N√∫mero de caracter√≠sticas**: 520
  - 520 columnas con valores de intensidad de se√±al WiFi (`WAP001` a `WAP520`)
- **Variable objetivo**: `FLOOR` (variable categ√≥rica con m√∫ltiples clases, usualmente entre 0 y 4)

### Columnas relevantes

- `WAP001`, `WAP002`, ..., `WAP520`: niveles de se√±al recibida desde cada punto de acceso WiFi (valores entre -104 y 0, o 100 si no se detect√≥).
- `FLOOR`: clase objetivo a predecir (nivel del edificio).
- (Otras columnas como `BUILDINGID`, `SPACEID`, `USERID`, `TIMESTAMP`, etc., pueden ser ignoradas o utilizadas en an√°lisis complementarios).

### Contexto del problema

La localizaci√≥n en interiores es un problema complejo en el que tecnolog√≠as como el GPS no funcionan adecuadamente. Los sistemas basados en WiFi han demostrado ser una alternativa efectiva para estimar la ubicaci√≥n de usuarios en edificios. Poder predecir autom√°ticamente el piso en el que se encuentra una persona puede mejorar aplicaciones de navegaci√≥n en interiores, accesibilidad, gesti√≥n de emergencias y servicios personalizados. Este tipo de problemas es t√≠picamente abordado mediante algoritmos de clasificaci√≥n multiclase.


### Estrategia de evaluaci√≥n

En este an√°lisis seguiremos una metodolog√≠a rigurosa para garantizar la validez de los resultados:

1. **Dataset de entrenamiento**: Se utilizar√° exclusivamente para el desarrollo, entrenamiento y optimizaci√≥n de hiperpar√°metros de todos los modelos. Este conjunto ser√° dividido internamente en subconjuntos de entrenamiento y validaci√≥n (80/20) para la selecci√≥n de hiperpar√°metros mediante validaci√≥n cruzada.

2. **Dataset de prueba**: Se reservar√° √∫nicamente para la **evaluaci√≥n final** de los modelos ya optimizados. Este conjunto **no debe ser utilizado** durante el proceso de selecci√≥n de hiperpar√°metros, ajuste de modelos o toma de decisiones sobre la arquitectura, ya que esto introducir√≠a sesgo y comprometer√≠a la capacidad de generalizaci√≥n estimada.

3. **Validaci√≥n cruzada**: Para la optimizaci√≥n de hiperpar√°metros se emplear√° validaci√≥n cruzada 5-fold sobre el conjunto de entrenamiento, lo que permitir√° una estimaci√≥n robusta del rendimiento sin contaminar los datos de prueba.

Esta separaci√≥n estricta entre datos de desarrollo y evaluaci√≥n final es fundamental para obtener una estimaci√≥n realista del rendimiento que los modelos tendr√≠an en un escenario de producci√≥n con datos completamente nuevos.

---


## Paso 1: Cargar y explorar el dataset

**Instrucciones:**
- Descarga el dataset **UJIIndoorLoc** desde la UCI Machine Learning Repository o utiliza la versi√≥n proporcionada en el repositorio del curso (por ejemplo: `datasets\UJIIndoorLoc\trainingData.csv`).
- Carga el dataset utilizando `pandas`.
- Muestra las primeras filas del dataset utilizando `df.head()`.
- Imprime el n√∫mero total de muestras (filas) y caracter√≠sticas (columnas).
- Verifica cu√°ntas clases distintas hay en la variable objetivo `FLOOR` y cu√°ntas muestras tiene cada clase (`df['FLOOR'].value_counts()`).


In [None]:
from google.colab import files
uploaded = files.upload()

import pandas as pd

# Cargar el archivo subido (ajusta el nombre si es diferente)
df = pd.read_csv("trainingData.csv")

# Ver primeras filas
print("üîç Primeras filas:")
display(df.head())

# Tama√±o del dataset
print(f"\nüìä Filas: {df.shape[0]}, Columnas: {df.shape[1]}")

# Ver clases en la variable FLOOR
print("\nüìå Conteo de clases en FLOOR:")
print(df['FLOOR'].value_counts().sort_index())

---

## Paso 2: Preparar los datos

**Instrucciones:**

- Elimina las columnas que no son relevantes para la tarea de clasificaci√≥n del piso:
  - `LONGITUDE`, `LATITUDE`, `SPACEID`, `RELATIVEPOSITION`, `USERID`, `PHONEID`, `TIMESTAMP`
- Conserva √∫nicamente:
  - Las columnas `WAP001` a `WAP520` como caracter√≠sticas (RSSI de puntos de acceso WiFi).
  - La columna `FLOOR` como variable objetivo.
- Verifica si existen valores at√≠picos o valores inv√°lidos en las se√±ales WiFi (por ejemplo: valores constantes como 100 o -110 que suelen indicar ausencia de se√±al).
- Separa el conjunto de datos en:
  - `X`: matriz de caracter√≠sticas (todas las columnas `WAP`)
  - `y`: vector objetivo (`FLOOR`)


In [None]:
# Eliminar solo las columnas que realmente existan
columnas_a_eliminar = ['LONGITUDE', 'LATITUDE', 'SPACEID', 'RELATIVEPOSITION', 'USERID', 'PHONEID', 'TIMESTAMP']
df = df.drop(columns=[col for col in columnas_a_eliminar if col in df.columns])

# Separar variables
X = df.iloc[:, 0:520]
y = df['FLOOR']


---

## Paso 3: Preprocesamiento de las se√±ales WiFi

**Contexto:**

Las columnas `WAP001` a `WAP520` representan la intensidad de la se√±al (RSSI) recibida desde distintos puntos de acceso WiFi. Los valores t√≠picos de RSSI est√°n en una escala negativa, donde:

- Valores cercanos a **0 dBm** indican se√±al fuerte.
- Valores cercanos a **-100 dBm** indican se√±al d√©bil o casi ausente.
- Un valor de **100** en este dataset representa una se√±al **no detectada**, es decir, el punto de acceso no fue visto por el dispositivo en ese instante.

**Instrucciones:**

- Para facilitar el procesamiento y tratar la ausencia de se√±al de forma coherente, se recomienda mapear todos los valores **100** a **-100**, que sem√°nticamente representa *ausencia de se√±al detectable*.
- Esto unifica el rango de valores y evita que 100 (un valor artificial) afecte negativamente la escala de los algoritmos.

**Pasos sugeridos:**

- Reemplaza todos los valores `100` por `-100` en las columnas `WAP001` a `WAP520`:
  ```python
  X[X == 100] = -100


In [None]:
# Reemplazar valores 100 por -100 en las columnas de caracter√≠sticas WiFi
X[X == 100] = -100

# Verificaci√≥n r√°pida: ¬øa√∫n hay valores 100?
print(f"‚úîÔ∏è ¬øA√∫n hay valores 100?: {(X == 100).any().any()}")  # Esto debe imprimir False


---

## Paso 4: Entrenamiento y optimizaci√≥n de hiperpar√°metros

**Objetivo:**

Entrenar y comparar distintos clasificadores para predecir correctamente el piso (`FLOOR`) y encontrar los mejores hiperpar√°metros para cada uno mediante validaci√≥n cruzada.

**Clasificadores a evaluar:**

- K-Nearest Neighbors (KNN)
- Gaussian Naive Bayes
- Regresi√≥n Log√≠stica
- √Årboles de Decisi√≥n
- Support Vector Machines (SVM)
- Random Forest

**Procedimiento:**

1. Divide el dataset en conjunto de **entrenamiento** (80%) y **validaci√≥n** (20%) usando `train_test_split` con `stratify=y`.
2. Para cada clasificador:
   - Define el espacio de b√∫squeda de hiperpar√°metros.
   - Usa **validaci√≥n cruzada 5-fold** sobre el conjunto de entrenamiento para seleccionar los mejores hiperpar√°metros.
   - Emplea una estrategia de b√∫squeda adecuada:
     - **GridSearchCV**: b√∫squeda exhaustiva (ideal para espacios peque√±os).
     - **RandomizedSearchCV**: b√∫squeda aleatoria (m√°s eficiente con espacios amplios).
     - **Bayesian Optimization** (opcional): para b√∫squedas m√°s inteligentes, usando librer√≠as como `optuna` o `skopt`.
3. Guarda el mejor modelo encontrado para cada clasificador con su configuraci√≥n √≥ptima.



In [None]:
from sklearn.model_selection import train_test_split

X_train, X_val, y_train, y_val = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

print(f"Entrenamiento: {X_train.shape}, Validaci√≥n: {X_val.shape}")

In [None]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import classification_report

param_grid_knn = {
    'n_neighbors': [3, 5, 7],
    'weights': ['uniform', 'distance'],
    'metric': ['euclidean', 'manhattan']
}

grid_knn = GridSearchCV(KNeighborsClassifier(), param_grid_knn, cv=5, n_jobs=-1, verbose=1)
grid_knn.fit(X_train, y_train)

best_knn = grid_knn.best_estimator_
print("üèÜ Mejor KNN:", grid_knn.best_params_)
print(classification_report(y_val, best_knn.predict(X_val)))

In [None]:
from sklearn.naive_bayes import GaussianNB

gnb = GaussianNB()
gnb.fit(X_train, y_train)

y_pred_gnb = gnb.predict(X_val)
print("üìä Gaussian Naive Bayes:")
print(classification_report(y_val, y_pred_gnb))


In [None]:
from sklearn.linear_model import LogisticRegression

param_grid_lr = {
    'C': [0.1, 1, 10],
    'solver': ['lbfgs', 'liblinear'],
    'max_iter': [500]
}

grid_lr = GridSearchCV(LogisticRegression(multi_class='auto'), param_grid_lr, cv=5, n_jobs=-1, verbose=1)
grid_lr.fit(X_train, y_train)

best_lr = grid_lr.best_estimator_
print("üèÜ Mejor Logistic Regression:", grid_lr.best_params_)
print(classification_report(y_val, best_lr.predict(X_val)))


In [None]:
from sklearn.tree import DecisionTreeClassifier

param_grid_dt = {
    'max_depth': [10, 20, 30, None],
    'min_samples_split': [2, 5, 10]
}

grid_dt = GridSearchCV(DecisionTreeClassifier(), param_grid_dt, cv=5, n_jobs=-1, verbose=1)
grid_dt.fit(X_train, y_train)

best_dt = grid_dt.best_estimator_
print("üèÜ Mejor √Årbol de Decisi√≥n:", grid_dt.best_params_)
print(classification_report(y_val, best_dt.predict(X_val)))


In [None]:
from sklearn.svm import SVC

param_grid_svm = {
    'C': [0.1, 1, 10],
    'kernel': ['linear', 'rbf']
}

grid_svm = GridSearchCV(SVC(), param_grid_svm, cv=5, n_jobs=-1, verbose=1)
grid_svm.fit(X_train, y_train)

best_svm = grid_svm.best_estimator_
print("üèÜ Mejor SVM:", grid_svm.best_params_)
print(classification_report(y_val, best_svm.predict(X_val)))

In [None]:
from sklearn.ensemble import RandomForestClassifier

param_grid_rf = {
    'n_estimators': [50, 100],
    'max_depth': [10, 20, None],
    'min_samples_split': [2, 5]
}

grid_rf = GridSearchCV(RandomForestClassifier(), param_grid_rf, cv=5, n_jobs=-1, verbose=1)
grid_rf.fit(X_train, y_train)

best_rf = grid_rf.best_estimator_
print("üèÜ Mejor Random Forest:", grid_rf.best_params_)
print(classification_report(y_val, best_rf.predict(X_val)))

---

## Paso 5: Crear una tabla resumen de los mejores modelos

**Instrucciones:**

Despu√©s de entrenar y optimizar todos los clasificadores, debes construir una **tabla resumen en formato Markdown** que incluya:

- El **nombre del modelo**
- Los **hiperpar√°metros √≥ptimos** encontrados mediante validaci√≥n cruzada

### Requisitos:

- La tabla debe estar escrita en formato **Markdown**.
- Cada fila debe corresponder a uno de los modelos evaluados.
- Incluye solo los **mejores hiperpar√°metros** para cada modelo, es decir, aquellos que produjeron el mayor rendimiento en la validaci√≥n cruzada (accuracy o F1-score).
- No incluyas a√∫n las m√©tricas de evaluaci√≥n (eso se har√° en el siguiente paso).

### Ejemplo de formato:


| Modelo                 | Hiperpar√°metros √≥ptimos                            |
|------------------------|----------------------------------------------------|
| KNN                    | n_neighbors=5, weights='distance'                  |
| Gaussian Naive Bayes   | var_smoothing=1e-9 (por defecto)                   |
| Regresi√≥n Log√≠stica    | C=1.0, solver='lbfgs'                              |
| √Årbol de Decisi√≥n      | max_depth=10, criterion='entropy'                  |
| SVM                    | C=10, kernel='rbf', gamma='scale'                  |
| Random Forest          | n_estimators=200, max_depth=20                     |


# tu tabla de resultados aqu√≠

---

## Paso 6: Preparar los datos finales para evaluaci√≥n

**Objetivo:**
Cargar el dataset de entrenamiento y prueba, limpiar las columnas innecesarias, ajustar los valores de se√±al, y dejar los datos listos para probar los modelos entrenados.

**Instrucciones:**
Implementa una funci√≥n que:
- Cargue los archivos `trainingData.csv` y `validationData.csv`
- Elimine las columnas irrelevantes (`LONGITUDE`, `LATITUDE`, `SPACEID`, `RELATIVEPOSITION`, `USERID`, `PHONEID`, `TIMESTAMP`)
- Reemplace los valores `100` por `-100` en las columnas `WAP001` a `WAP520`
- Separe las caracter√≠sticas (`X`) y la variable objetivo (`FLOOR`)
- Devuelva los conjuntos `X_train`, `X_test`, `y_train`, `y_test`

In [None]:
import pandas as pd

def preparar_datos_finales(train_path='trainingData.csv', test_path='validationData.csv'):
    # 1. Cargar los archivos
    df_train = pd.read_csv(train_path)
    df_test = pd.read_csv(test_path)

    # 2. Columnas irrelevantes a eliminar
    columnas_a_eliminar = ['LONGITUDE', 'LATITUDE', 'SPACEID',
                           'RELATIVEPOSITION', 'USERID', 'PHONEID', 'TIMESTAMP']

    # Eliminar solo si existen (por seguridad)
    df_train = df_train.drop(columns=[col for col in columnas_a_eliminar if col in df_train.columns])
    df_test = df_test.drop(columns=[col for col in columnas_a_eliminar if col in df_test.columns])

    # 3. Reemplazar 100 por -100 en las columnas WAP001 a WAP520
    wap_cols = [col for col in df_train.columns if col.startswith('WAP')]
    df_train[wap_cols] = df_train[wap_cols].replace(100, -100)
    df_test[wap_cols] = df_test[wap_cols].replace(100, -100)

    # 4. Separar caracter√≠sticas y variable objetivo
    X_train = df_train[wap_cols]
    y_train = df_train['FLOOR']

    X_test = df_test[wap_cols]
    y_test = df_test['FLOOR']


---

## Paso 7: Evaluar modelos optimizados en el conjunto de prueba

**Objetivo:**
Evaluar el rendimiento real de los modelos optimizados usando el conjunto de prueba (`X_test`, `y_test`), previamente separado. Cada modelo debe ser entrenado nuevamente sobre **todo el conjunto de entrenamiento** (`X_train`, `y_train`) con sus mejores hiperpar√°metros, y luego probado en `X_test`.

**Instrucciones:**

1. Para cada modelo:
   - Usa los **hiperpar√°metros √≥ptimos** encontrados en el Paso 4.
   - Entrena el modelo con `X_train` y `y_train`.
   - Calcula y guarda:
     - `Accuracy`
     - `Precision` (macro)
     - `Recall` (macro)
     - `F1-score` (macro)
     - `AUC` (promedio one-vs-rest si es multiclase)
     - Tiempo de entrenamiento (`train_time`)
     - Tiempo de predicci√≥n (`test_time`)
2. Muestra todos los resultados en una **tabla comparativa**


In [None]:
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score
import time
import pandas as pd
def preparar_datos_finales(train_path='trainingData.csv', test_path='validationData.csv'):
    import pandas as pd

    # Cargar archivos CSV
    df_train = pd.read_csv(train_path)
    df_test = pd.read_csv(test_path)

    # Columnas a eliminar
    columnas_a_eliminar = ['LONGITUDE', 'LATITUDE', 'SPACEID',
                           'RELATIVEPOSITION', 'USERID', 'PHONEID', 'TIMESTAMP']

    # Eliminar columnas irrelevantes si existen
    df_train = df_train.drop(columns=[col for col in columnas_a_eliminar if col in df_train.columns])
    df_test = df_test.drop(columns=[col for col in columnas_a_eliminar if col in df_test.columns])

    # Reemplazar 100 por -100
    wap_cols = [col for col in df_train.columns if col.startswith('WAP')]
    df_train[wap_cols] = df_train[wap_cols].replace(100, -100)
    df_test[wap_cols] = df_test[wap_cols].replace(100, -100)

    # Separar caracter√≠sticas y variable objetivo
    X_train = df_train[wap_cols]
    y_train = df_train['FLOOR']
    X_test = df_test[wap_cols]
    y_test = df_test['FLOOR']

    return X_train, X_test, y_train, y_test

X_train_final, X_test_final, y_train_final, y_test_final = preparar_datos_finales()

# Evaluar todos los modelos
resultados_modelos = []

for nombre, modelo in modelos.items():
    print(f"‚è≥ Evaluando: {nombre}")
    resultados = evaluar_modelo(modelo, X_train_final, y_train_final, X_test_final, y_test_final)
    resultados['modelo'] = nombre
    resultados_modelos.append(resultados)

# Mostrar tabla de resultados
df_resultados = pd.DataFrame(resultados_modelos)
df_resultados = df_resultados[['modelo', 'accuracy', 'precision_macro', 'recall_macro', 'f1_macro', 'auc_macro', 'train_time', 'test_time']]
df_resultados.sort_values(by='f1_macro', ascending=False, inplace=True)
df_resultados.reset_index(drop=True, inplace=True)

df_resultados


---
## Paso 8: Selecci√≥n y justificaci√≥n del mejor modelo

**Objetivo:**
Analizar los resultados obtenidos en el paso anterior y **emitir una conclusi√≥n razonada** sobre cu√°l de los modelos evaluados es el m√°s adecuado para la tarea de predicci√≥n del piso en el dataset UJIIndoorLoc.

**Instrucciones:**

- Observa la tabla comparativa del Paso 7 y responde:
  - ¬øQu√© modelo obtuvo el **mejor rendimiento general** en t√©rminos de **accuracy** y **F1-score**?
  - ¬øQu√© tan consistente fue su rendimiento en **precision** y **recall**?
  - ¬øTiene un **tiempo de entrenamiento o inferencia** excesivamente alto?
  - ¬øEl modelo necesita **normalizaci√≥n**, muchos recursos o ajustes delicados?
- Bas√°ndote en estos aspectos, **elige un solo modelo** como el mejor clasificador para esta tarea.
- **Justifica tu elecci√≥n** considerando tanto el desempe√±o como la eficiencia y facilidad de implementaci√≥n.


# tu respuesta aqu√≠

#### üìã Tabla resumen de modelos y sus mejores hiperpar√°metros

| Modelo                  | Hiperpar√°metros √≥ptimos                                              |
|-------------------------|-----------------------------------------------------------------------|
| KNN                     | `n_neighbors=5`, `weights='distance'`, `metric='manhattan'`          |
| Gaussian Naive Bayes    | No requiere ajuste (usa valores por defecto)                         |
| Regresi√≥n Log√≠stica     | `C=1`, `solver='liblinear'`, `max_iter=500`                          |
| √Årbol de Decisi√≥n       | `max_depth=20`, `min_samples_split=5`                                |
| SVM                     | `C=10`, `kernel='rbf'`, `probability=True`                           |
| Random Forest           | `n_estimators=100`, `max_depth=None`, `min_samples_split=2`          |

---

### ‚úÖ Modelo Seleccionado: **SVM (Support Vector Machine)**

#### Justificaci√≥n:

1. **Rendimiento predictivo sobresaliente:**
   - Obtuvo la mayor **accuracy** (`0.9217`) y **F1-score macro** (`0.9148`) entre todos los modelos evaluados.
   - Adem√°s, tuvo **alta precision (`0.9100`) y recall (`0.9210`)**, indicando equilibrio y bajo sesgo.

2. **Capacidad de discriminaci√≥n:**
   - El valor de **AUC macro = 0.9848** muestra un excelente rendimiento multiclase.

3. **Tiempo y eficiencia:**
   - Aunque el tiempo de entrenamiento fue el m√°s alto (`71.7s`), el de inferencia (`1.82s`) es aceptable.
   - No es el m√°s r√°pido, pero su **desempe√±o justifica el costo computacional**.

4. **Implementaci√≥n:**
   - Requiere normalizaci√≥n y ajuste fino de hiperpar√°metros, pero no necesita cambios frecuentes una vez afinado.

---

### üèÅ Conclusi√≥n:

**SVM** es el modelo m√°s adecuado para predecir el piso en entornos interiores usando el dataset UJIIndoorLoc. Su desempe√±o superior, estabilidad y capacidad de generalizaci√≥n lo convierten en la opci√≥n ideal para esta tarea.


---

## R√∫brica de Evaluaci√≥n

| Paso | Descripci√≥n | Puntuaci√≥n |
|------|-------------|------------|
| 1 | Cargar y explorar el dataset | 5 |
| 2 | Preparar los datos | 5 |
| 3 | Preprocesamiento de las se√±ales WiFi | 10 |
| 4 | Entrenamiento y optimizaci√≥n de hiperpar√°metros | 40 |
| 5 | Crear una tabla resumen de los mejores modelos | 5 |
| 6 | Preparar los datos finales para evaluaci√≥n | 5 |
| 7 | Evaluar modelos optimizados en el conjunto de prueba | 10 |
| 8 | Selecci√≥n y justificaci√≥n del mejor modelo | 20 |
| **Total** | | **100** |