<a href="https://colab.research.google.com/github/luismiguelcasadodiaz/IBM_SkillsBuild_IA_325/blob/main/IA_325_py_cod_ex_23_s.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Seguridad en Dispositivos IoT


## Contexto
Imagina que formas parte del equipo de defensa digital de un hogar inteligente.

Con cada vez más dispositivos conectados a internet, se vuelve crucial **detectar cuáles son seguros y cuáles podrían representar una amenaza**.

Tu tarea será construir un modelo que aprenda a clasificar dispositivos IoT (Internet de las Cosas) como **seguros (1)** o **peligrosos (0)** según su tráfico de red, utilizando el algoritmo **k-Nearest Neighbors (KNN)**.



##🧠 Instrucciones

Crea una clase llamada `IoTKNNClassifier` que simule un sistema de detección para dispositivos IoT basado en aprendizaje automático.



### 🔧 1. Constructor: __init__(self, n_neighbors=3, n_samples=50)

Genera un conjunto de datos sintéticos de tamaño n_samples que simulen tráfico de red para varios dispositivos.

  + Atributos
  
    + **paquetes_por_segundo**: un entero entre 10 y 1000
    + **bytes_por_paquete**: un entero entre 50 y 1500
    + **protocolo**: valores posibles 1 (TCP), 2 (UDP), o 3 (HTTP)
    + **seguro**: valor 0 (peligroso) o 1 (seguro), generado aleatoriamente

Guarda los datos en un DataFrame de pandas.

Divide los datos en entrenamiento y prueba (80% - 20%) usando train_test_split.

```python
self.X = self.df.drop(columns=["seguro"])
self.y = self.df["seguro"]
```

### 🏋️‍♂️ 2. Método train(self)

Entrena un modelo de KNeighborsClassifier de sklearn con los datos de entrenamiento (self.X_train, self.y_train).



### 📈 3. Método evaluate(self)

Evalúa el modelo sobre los datos de prueba.

Calcula y retorna la precisión del modelo (valor entre 0 y 1) usando accuracy_score.



### 🔍 4. Método predict(self, nuevo_dispositivo)

Recibe una lista con 3 valores: [paquetes_por_segundo, bytes_por_paquete, protocolo].

Retorna la predicción del modelo: 1 si el dispositivo es seguro, o 0 si es peligroso.



## Ejemplo de uso
```python
clasificador = IoTKNNClassifier(n_neighbors=3, n_samples=50)
clasificador.train()
print("Precisión del modelo:", clasificador.evaluate())
```

#### Nuevo dispositivo IoT
```python
nuevo = [300, 1000, 1]  # 300 paquetes/segundo, 1000 bytes/paquete, protocolo TCP
resultado = clasificador.predict(nuevo)

if resultado == 1:
    print("✅ Dispositivo seguro")
else:
    print("⚠️ Dispositivo peligroso")

```
#### Salida esperada

Precisión del modelo: 0.6

⚠️ Dispositivo peligroso






## Importación de librerías

In [55]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

## Definición de la clase

In [56]:
class IoTKNNClassifier:
    """
    Clasificador k-NN para identificar dispositivos IoT seguros o peligrosos
    basándose en el tráfico de red.

    Inicializa el clasificador con el número de vecinos y el número de
    muestras para generar el conjunto de datos sintético inicial.
    Realiza la división de datos en entrenamiento y prueba, y entrena
    un modelo KNeighborsClassifier de scikit-learn.
    """
    def __init__(self, n_neighbors=3, n_samples=50):
        """
        Inicializa el IoTKNNClassifier.

        Args:
            n_neighbors (int): El número de vecinos a utilizar en el
                               algoritmo k-NN (por defecto: 3).
            n_samples (int): El número de muestras a generar para el
                             conjunto de datos inicial (por defecto: 50).
        """
        self.n_neighbors = n_neighbors
        self.n_samples = n_samples
        self.df = self._generate_data(self.n_samples)
        self.X = self.df.drop(columns=["seguro"])
        self.y = self.df["seguro"]
        self.X_train, self.X_test, self.y_train, self.y_test = \
            train_test_split(self.X, self.y, test_size=0.2, random_state=42)
        self.model = KNeighborsClassifier(n_neighbors=self.n_neighbors)


    def _generate_data(self, n_samples):
        """
        Genera un conjunto de datos sintético para el entrenamiento.

        Args:
            n_samples (int): El número de muestras a generar.

        Returns:
            pd.DataFrame: Un DataFrame con datos simulados de tráfico de red
                          y la etiqueta 'seguro'.
        """
        np.random.seed(42)
        paquetes_por_segundo = np.random.randint(10, 1000, size=n_samples)
        bytes_por_paquete = np.random.randint(50, 1500, size=n_samples)
        protocolo = np.random.randint(1, 4, size=n_samples)  # Corrección: 1, 2 o 3
        seguro = np.random.randint(0, 2, size=n_samples)
        df = pd.DataFrame({"paquetes_por_segundo": paquetes_por_segundo,
                           "bytes_por_paquete": bytes_por_paquete,
                           "protocolo": protocolo,
                           "seguro": seguro})
        return df


    def train(self):
        """
        Entrena el modelo k-NN con los datos de entrenamiento.
        """
        self.model.fit(self.X_train, self.y_train)


    def evaluate(self):
        """
        Evalúa el rendimiento del modelo utilizando los datos de prueba.

        Returns:
            float: La precisión del modelo en los datos de prueba.
        """
        predicciones = self.model.predict(self.X_test)
        precision = accuracy_score(self.y_test, predicciones)
        return precision


    def predict(self, nuevo_dispositivo: list) -> int:
        """
        Predice si un nuevo dispositivo IoT es seguro o peligroso.

        Args:
            nuevo_dispositivo (list): Una lista con tres valores:
                                      [paquetes_por_segundo, bytes_por_paquete,
                                       protocolo].

        Returns:
            int: 1 si el dispositivo se predice como seguro, 0 si es
                 peligroso.
        """
        df_nuevo = pd.DataFrame([nuevo_dispositivo], columns=["paquetes_por_segundo",
                                                           "bytes_por_paquete",
                                                           "protocolo"])
        return self.model.predict(df_nuevo)[0]

## Caso de uso

In [57]:
clasificador = IoTKNNClassifier(n_neighbors=3, n_samples=50)
clasificador.train()
print("Precisión del modelo:", clasificador.evaluate())

nuevo = [300, 1000, 1]  # 300 paquetes/segundo, 1000 bytes/paquete, protocolo TCP
resultado = clasificador.predict(nuevo)

if resultado == 1:
    print("✅ Dispositivo seguro")
else:
    print("⚠️ Dispositivo peligroso")

Precisión del modelo: 0.6
⚠️ Dispositivo peligroso


In [58]:
resultado

np.int64(0)