# Guía Práctica de TensorFlow: Clasificación del Dataset Iris

## Instalación e Importación de Librerías

### Instalación

Primero, debemos asegurarnos de tener TensorFlow y otras librerías necesarias instaladas. Puedes hacerlo ejecutando el siguiente comando en una celda de Jupyter Notebook:

In [None]:
!pip install tensorflow pandas scikit-learn

### Importación de Librerías

Una vez instaladas las librerías, importamos las necesarias para nuestro proyecto. Esto incluye TensorFlow para la creación y entrenamiento del modelo, pandas para el manejo de datos en formato de DataFrame, y algunas herramientas de scikit-learn para la preparación de datos.

In [36]:
import tensorflow as tf
import pandas as pd
import matplotlib.pyplot as plt

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris


- `tensorflow` es la biblioteca principal que usaremos para crear y entrenar nuestro modelo de red neuronal.
- `pandas` se utiliza para manejar y manipular datos de manera eficiente.
- `train_test_split` de `sklearn.model_selection` nos permite dividir los datos en conjuntos de entrenamiento y prueba.
- `StandardScaler` de `sklearn.preprocessing` se usa para normalizar las características de los datos, asegurando que todas las características tengan una escala similar.
- `load_iris` de `sklearn.datasets` carga el dataset Iris, que utilizaremos para entrenar y evaluar nuestro modelo.

## Carga y Preparación de Datos

### Carga del Dataset

El dataset Iris se puede cargar usando la función `load_iris` de `sklearn.datasets`.

In [38]:
# Cargar el dataset Iris

iris = load_iris()
x = iris.data
y = iris.target

- `X` contiene las características de las flores (longitud y ancho del sépalo y pétalo).
- `y` contiene las etiquetas de clase (0, 1 o 2 para las tres especies de Iris).

### Conversión a DataFrame

Convertimos los datos a un DataFrame para facilitar su manejo:

In [40]:
# Convertir a un DataFrame para facilitar el manejo

df = pd.DataFrame(x, columns=iris.feature_names)
df['species'] = y

display(df)

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),species
0,5.1,3.5,1.4,0.2,0
1,4.9,3.0,1.4,0.2,0
2,4.7,3.2,1.3,0.2,0
3,4.6,3.1,1.5,0.2,0
4,5.0,3.6,1.4,0.2,0
...,...,...,...,...,...
145,6.7,3.0,5.2,2.3,2
146,6.3,2.5,5.0,1.9,2
147,6.5,3.0,5.2,2.0,2
148,6.2,3.4,5.4,2.3,2


### División de Datos

Dividimos los datos en conjuntos de entrenamiento y prueba:

In [42]:
# Dividir en conjuntos de entrenamiento y prueba
X_train, X_test, Y_train, Y_test = train_test_split(x, y, test_size=0.2, random_state=15)



- `test_size=0.2` significa que el 20% de los datos se utilizarán para pruebas y el 80% para entrenamiento.
- `random_state=42` asegura que la división sea reproducible.

### Normalización de Datos

Normalizamos los datos para que todas las características tengan una escala similar:

In [43]:
# Normalizar los datos
scaler = StandardScaler()

X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

- `fit_transform` ajusta el escalador a los datos de entrenamiento y transforma estos datos.
- `transform` aplica la misma transformación a los datos de prueba.

## Creación del Modelo

### Definición del Modelo

Creamos un modelo de red neuronal secuencial usando `tf.keras.Sequential` y añadimos capas densas (`Dense`) para formar la red. La última capa tiene 3 neuronas (una por cada clase de iris) y una función de activación softmax para la clasificación.

In [52]:
# Definir el modelo
model = tf.keras.Sequential(
    [tf.keras.layers.Dense(10, activation='relu', input_shape=(X_train.shape[1],)),
    tf.keras.layers.Dense(10, activation='relu'),
    tf.keras.layers.Dense(3, activation='softmax')]
)

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


- `Dense(10, activation='relu', input_shape=(X_train.shape[1],))` crea una capa densa con 10 neuronas y función de activación ReLU. `input_shape` especifica la forma de entrada de los datos (número de características).
- `Dense(10, activation='relu')` añade otra capa densa con 10 neuronas y función de activación ReLU.
- `Dense(3, activation='softmax')` crea la capa de salida con 3 neuronas (una por cada clase) y función de activación softmax para la clasificación multiclase.

### Compilación del Modelo

Compilamos el modelo especificando el optimizador, la función de pérdida y las métricas a monitorizar durante el entrenamiento.

In [51]:
# Compilar el modelo

model.compile(
    optimizer = 'adam',
    loss = 'sparse_categorical_crossentropy',
    metrics = ['accuracy']
)

- `optimizer='adam'` especifica que usaremos el optimizador Adam, que es eficiente y popular para muchas tareas de aprendizaje automático.
- `loss='sparse_categorical_crossentropy'` define la función de pérdida apropiada para problemas de clasificación multiclase con etiquetas enteras.
- `metrics=['accuracy']` especifica que queremos monitorizar la exactitud del modelo durante el entrenamiento.

## Entrenamiento del Modelo

### Proceso de Entrenamiento

Entrenamos el modelo usando los datos de entrenamiento. Establecemos el número de épocas (`epochs`) y el tamaño del lote (`batch_size`).

In [53]:
# Entrenar el modelo
history = model.fit()

ValueError: You must call `compile()` before using the model.

- `epochs=50` indica que el modelo entrenará durante 50 épocas.
- `batch_size=32` define el tamaño del lote que se usará durante cada iteración de entrenamiento.
- `validation_split=0.2` significa que el 20% de los datos de entrenamiento se usarán para validación.

### Visualización del Proceso de Entrenamiento

Podemos visualizar la evolución de la precisión y la pérdida durante el entrenamiento:

In [30]:
# Graficar la precisión del entrenamiento y validación

# Graficar la pérdida del entrenamiento y validación

## Evaluación del Modelo

### Evaluación en Datos de Prueba

Evaluamos el modelo entrenado usando los datos de prueba para obtener la precisión final.

In [31]:
# Evaluar el modelo

### Predicción con el Modelo

Realizamos predicciones con el modelo entrenado y comparamos las etiquetas predichas con las etiquetas verdaderas.

In [33]:
# Realizar predicciones

# Comparar etiquetas predichas con las etiquetas verdaderas

- `predict` realiza predicciones con el modelo entrenado.
- `tf.argmax` devuelve el índice de la clase con la mayor probabilidad.
- `numpy()` convierte el tensor de TensorFlow en un array de NumPy para facilitar su visualización.

## Guardar y Cargar el Modelo

### Guardar el Modelo

Podemos guardar el modelo entrenado para uso futuro.

In [34]:
# Guardar el modelo

### Cargar el Modelo

Para cargar el modelo guardado y usarlo para predicciones, hacemos lo siguiente:

In [35]:
# Cargar el modelo guardado

# Usar el modelo cargado para hacer predicciones

## Conclusión

En esta guía, hemos aprendido a construir, entrenar y evaluar un modelo de red neuronal utilizando TensorFlow para la clasificación del dataset Iris. También hemos cubierto cómo guardar y cargar el modelo para uso futuro.