# **Deep Learning - Proyecto de Clasificaci√≥n Multiclase**

## üìå Introducci√≥n
Este proyecto tiene como objetivo desarrollar un modelo de clasificaci√≥n multiclase utilizando t√©cnicas de **Deep Learning**. Se realiza con fines educativos y est√° dise√±ado para ser compartido con la comunidad, fomentando el aprendizaje y la colaboraci√≥n.

---

üë®‚Äçüíª **Autor:** [Diego Fernando Lojan](https://github.com/DiegoFernandoLojanTN)  
üìÖ **Fecha de creaci√≥n:** 12 Enero Del 2025   
üìù **Licencia:** MIT

---

## üìñ Descripci√≥n
- üîç **Objetivo:** Desarrollar y entrenar un modelo de clasificaci√≥n multiclase.
- üõ† **Tecnolog√≠as utilizadas:** Python, TensorFlow/Keras, Pandas, NumPy, Matplotlib.

---

In [4]:
# Importamos las librer√≠as necesarias
import tensorflow as tf
import logging

# Configuramos TensorFlow para eliminar los warnings innecesarios
logging.getLogger("tensorflow").setLevel(logging.ERROR)

# Verificamos la versi√≥n de TensorFlow
print(f"‚úÖ TensorFlow versi√≥n: {tf.__version__}")

‚úÖ TensorFlow versi√≥n: 2.13.0


---
### 1Ô∏è‚É£ Importar conjunto de datos y funciones.
---

In [19]:
# Importamos las librer√≠as necesarias
import tensorflow as tf  # Framework para Deep Learning
import pandas as pd  # Manejo y an√°lisis de datos

# Librer√≠as de Keras para construir la red neuronal
from tensorflow.keras.models import Sequential  # Modelo secuencial de Keras
from tensorflow.keras.layers import Dense  # Capa densa (fully connected) para la red
from scikeras.wrappers import KerasClassifier  # Envoltorio para usar Keras con scikit-learn
from tensorflow.keras.utils import to_categorical  # Utilidades para transformaci√≥n de etiquetas en one-hot encoding

# Librer√≠as de scikit-learn para preprocesamiento y validaci√≥n
from sklearn.model_selection import cross_val_score  # Evaluaci√≥n cruzada del modelo
from sklearn.model_selection import KFold  # Validaci√≥n cruzada con K-fold
from sklearn.preprocessing import LabelEncoder  # Codificaci√≥n de etiquetas categ√≥ricas en n√∫meros

In [12]:
# Cargamos el dataset Iris desde un archivo CSV
file_path = "Datasets/iris.csv"  # Ruta del archivo
df = pd.read_csv(file_path, header=None)  # Leemos el archivo sin encabezados

# Convertimos el DataFrame a un array de NumPy para su procesamiento
dataset = df.values

In [13]:
# Mostramos las primeras filas del dataset para inspecci√≥n
print("üìä Primeras 5 filas del dataset:")
print(df.head())

üìä Primeras 5 filas del dataset:
     0    1    2    3            4
0  5.1  3.5  1.4  0.2  Iris-setosa
1  4.9  3.0  1.4  0.2  Iris-setosa
2  4.7  3.2  1.3  0.2  Iris-setosa
3  4.6  3.1  1.5  0.2  Iris-setosa
4  5.0  3.6  1.4  0.2  Iris-setosa


In [14]:
# Verificamos las dimensiones del dataset
print(f"\nüîπ Dimensiones del dataset: {df.shape}")


üîπ Dimensiones del dataset: (150, 5)


In [15]:
# Separamos las caracter√≠sticas (X) y la variable objetivo (y)
X = dataset[:, 0:4].astype(float)  # Tomamos las primeras 4 columnas como features y las convertimos a tipo float
y = dataset[:, 4]  # La √∫ltima columna representa las etiquetas de clase

# Mostramos informaci√≥n b√°sica de los datos procesados
print(f"üîπ Dimensiones de X (caracter√≠sticas): {X.shape}")
print(f"üîπ Dimensiones de y (etiquetas): {y.shape}")

üîπ Dimensiones de X (caracter√≠sticas): (150, 4)
üîπ Dimensiones de y (etiquetas): (150,)


---
### 2Ô∏è‚É£ Codificar la variable de salida
---

En Machine Learning, los modelos no pueden procesar variables categ√≥ricas directamente. Por ello, convertimos la columna de especies del dataset de **Iris** en una representaci√≥n num√©rica usando **One-Hot Encoding**.  

### üîπ Transformaci√≥n  
| Especie            | One-Hot Encoding |
|--------------------|----------------|
| Iris-setosa       | **1,0,0** |
| Iris-versicolor   | **0,1,0** |
| Iris-virginica    | **0,0,1** |

In [16]:
encoder = LabelEncoder()  # Inicializa el codificador de etiquetas
encoder.fit(y)  # Ajusta el codificador a los valores de y
encoded_y = encoder.transform(y)  # Transforma las etiquetas a valores num√©ricos
print(encoded_y)  # Muestra las etiquetas codificadas

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]


 Despu√©s de aplicar **Label Encoding**, las clases se representan num√©ricamente de la siguiente manera:  

| C√≥digo | Especie           |
|--------|------------------|
| **0**  | Iris-setosa      |
| **1**  | Iris-versicolor  |
| **2**  | Iris-virginica   |

In [24]:
# Los valores enteros no son adecuados para redes neuronales, se deben convertir a valores tipo dummy
dummy_y = to_categorical(encoded_y)  # Convierte las etiquetas codificadas a formato dummy (One-Hot Encoding)
print(dummy_y)  # Muestra las etiquetas convertidas a formato dummy

[[1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [1. 0. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0. 1. 0.]
 [0.

Despu√©s de aplicar **One-Hot Encoding**, las etiquetas codificadas se transforman en un formato de vector binario:

| Valor Original | Representaci√≥n One-Hot |
|----------------|------------------------|
| **0** (Iris-setosa)     | `1, 0, 0`             |
| **1** (Iris-versicolor) | `0, 1, 0`             |
| **2** (Iris-virginica)  | `0, 0, 1`             |

Este formato es adecuado para redes neuronales, ya que evita interpretaciones ordinales y permite que el modelo procese correctamente las etiquetas.

---
### 3Ô∏è‚É£ Definir comportamiento de la red Neuronal
---

### üîπ Definici√≥n de la Red Neuronal

Para el modelo de clasificaci√≥n, se implementar√° una red neuronal simple con las siguientes caracter√≠sticas:

1. **Capa Oculta:**  
   - Se utilizar√° una capa oculta con **8 neuronas**.  
   - La **funci√≥n de activaci√≥n** ser√° **ReLU** (Rectified Linear Unit), que ayuda a introducir no linealidad en el modelo.

2. **Capa de Salida:**  
   - La capa de salida tendr√° **3 valores** de salida, uno para cada clase, ya que hemos utilizado **One-Hot Encoding** para las etiquetas.
   - El **valor m√°s alto** en la capa de salida representar√° la clase predicha por el modelo.

3. **Funci√≥n de Activaci√≥n en la Capa de Salida:**  
   - La funci√≥n de activaci√≥n ser√° **Softmax**, lo que permite convertir los valores de salida en probabilidades que suman 1, facilitando la clasificaci√≥n de las clases.

4. **Optimizaci√≥n y P√©rdida:**  
   - Se utilizar√° **Adam** como el optimizador, que es eficiente y ampliamente utilizado en problemas de clasificaci√≥n.  
   - La funci√≥n de **p√©rdida** ser√° **categorical crossentropy**, adecuada para tareas de clasificaci√≥n multiclase.

Este dise√±o de red neuronal permite una clasificaci√≥n precisa de las clases en funci√≥n de las probabilidades obtenidas en la capa de salida.

In [25]:
def baseline_model():
    # Inicializa el modelo secuencial
    model = Sequential()

    # Capa oculta con 8 neuronas y activaci√≥n ReLU
    model.add(Dense(8, input_dim=4, activation='relu'))

    # Capa de salida con 3 neuronas y activaci√≥n Softmax para clasificaci√≥n multiclase
    model.add(Dense(3, activation='softmax'))

    # Compilaci√≥n del modelo con funci√≥n de p√©rdida categorical_crossentropy y optimizador Adam
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

    return model

## üîπ Uso de KerasClassifier con scikit-learn

Ahora utilizaremos **KerasClassifier** para integrar el modelo de Keras con **scikit-learn**. Esto nos permitir√° entrenar y evaluar el modelo de manera m√°s flexible utilizando herramientas de scikit-learn.

### üî∏ Modificaci√≥n de Par√°metros
Al entrenar el modelo, ajustaremos los siguientes par√°metros:

- **N√∫mero de √©pocas:** Se establecer√° en **200** √©pocas para asegurar un entrenamiento adecuado.
- **Tama√±o del batch:** Se establecer√° en **5** para controlar el tama√±o de los lotes de entrenamiento.

Con estas modificaciones, el modelo ser√° entrenado de manera m√°s eficiente y controlada.

In [28]:
# Crear el clasificador de Keras con los par√°metros modificados
estimator = KerasClassifier(model=baseline_model, epochs=200, batch_size=5, verbose=0)

---
### 4Ô∏è‚É£ Evaluar modelo
---

## üîπ Validaci√≥n del Modelo con Validaci√≥n Cruzada

En este paso, vamos a evaluar nuestro modelo (**estimator**) utilizando el procedimiento de **validaci√≥n cruzada**. 

Realizaremos **10 pliegues** de validaci√≥n cruzada para asegurarnos de que el modelo generaliza bien en diferentes subconjuntos del conjunto de datos. Utilizaremos los conjuntos de datos **X** y **dummy_y** para este proceso.

Este enfoque ayuda a obtener una mejor estimaci√≥n del rendimiento del modelo y reduce el sesgo en la evaluaci√≥n.

In [29]:
# Definir la validaci√≥n cruzada con 10 pliegues y aleatorizaci√≥n
kfold = KFold(n_splits=10, shuffle=True, random_state=42)
# Realizar la validaci√≥n cruzada sin mostrar informaci√≥n de verbose
results = cross_val_score(estimator, X, dummy_y, cv=kfold, verbose=0)
# Mostrar el rendimiento del modelo: media y desviaci√≥n est√°ndar de la precisi√≥n
print("Accuracy: %.2f%% (%.2f%%)" % (results.mean() * 100, results.std() * 100))

Accuracy: 97.33% (3.27%)
