# <font style="color:rgb(50, 120, 229);"> Proyecto 1: Clasificación de frutas </font>

**Objetivo:**

El objetivo de este proyecto es utilizar el dataset **Fresh and Rotten Fruits** para crear un modelo de clasificación que permita diferenciar entre frutas frescas y frutas podridas.

El dataset contiene imágenes de las siguientes frutas:

- Fresh apples
- Fresh bananas
- Fresh oranges
- Rotten apples
- Rotten bananas
- Rotten oranges

**Puedes utilizar un modelo pre-entrenado o entrenar tu propio modelo desde cero.**

<font style="color:rgb(50, 120, 229);">Recomedaciones:</font>

- Entrena el modelo en Google Colab.
- Recuerda activar la GPU en Google Colab para acelerar el entrenamiento. Para hacerlo ve a `Entorno de ejecución` -> `Cambiar tipo de entorno de ejecución` -> Selecciona `GPU`.

In [None]:
#Actualizar TensorFlow a la última versión
%pip install tensorflow --upgrade -q

## <font style="color:rgb(50, 120, 229);"> 1. Descargar el dataset </font>

El dataset se encuentra en kaggle por lo que es importante que cuentes con tu archivo `kaggle.json` para poder descargar el dataset.

In [None]:
%pip install -q kaggle

In [None]:
from google.colab import files

uploaded = files.upload()

In [None]:
!mkdir -p ~/.kaggle
!mv kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json

In [None]:
!kaggle datasets download -d pedrodavidjuarez/fresh-vs-rotten-fruits
!unzip fresh-vs-rotten-fruits.zip

## <font style="color:rgb(50, 120, 229);"> 2. Importar el dataset </font>

Una vez descargado el dataset, importa las librerías necesarias y realiza la importación del dataset utilizando la función `image_dataset_from_directory` de Keras.

El dataset tiene la siguiente estructura:

```bash
fruits/
    │
    └───train/
    └───valid/
```

## <font style="color:rgb(50, 120, 229);"> 3. Explorar el dataset </font>

Muestra las clases del dataset utilizando el atributo `class_names` del dataset.

Con esto tendrás una idea de cuántas clases hay en el dataset y que orden siguen.

Toma un `batch` de imágenes del dataset utilizando la función `take` y visualiza algunas imágenes.

Esto te permitirá conocer la estructura del dataset y verificar que las imágenes se han importado correctamente.

## <font style="color:rgb(50, 120, 229);"> 4. Crear el modelo </font>

Crea un modelo de clasificación que permita diferenciar entre frutas frescas y frutas podridas.

**Se recomienda utilizar un modelo pre-entrenado.**

## <font style="color:rgb(50, 120, 229);"> 5. Entrenar el modelo </font>

Entrena el modelo utilizando el dataset de entrenamiento y valida el modelo utilizando el dataset de validación.

Debes incluir lo siguiente:

- El uso de `EarlyStopping` para evitar el sobreajuste.
- El uso de `ModelCheckpoint` para guardar el mejor modelo.

El modelo debe de guardarse con la extensión `.keras`. Para versiones anteriores de TensorFlow, el modelo se guarda con la extensión `.h5`.

## <font style="color:rgb(50, 120, 229);"> 6. Descargar el modelo </font>

Descarga el modelo y guárdalo en tu computadora. Esto puede tardar unos minutos.

## <font style="color:rgb(50, 120, 229);"> 7. Prueba el modelo </font>

El siguiente código carga un grupo de imágenes de prueba y las clasifica utilizando el modelo que acabas de entrenar.

In [None]:
uploaded = files.upload()

files = [file for file in uploaded.keys()]
print("Files uploaded:", files)

In [None]:
from keras.models import load_model

model = load_model('./best_model.keras') #Cargar el mejor modelo guardado

In [None]:
from PIL import Image
import numpy as np

plt.figure(figsize=(4, 4))

for file in files:
  image = Image.open(file)
  image = image.resize((224, 224)) #Redimensionar la imagen a las dimensiones de entrada del modelo
  image = np.array(image)
  image = np.expand_dims(image, axis=0) # Agregar una dimensión extra para que sea un lote de un solo elemento

  prediction = model.predict(image)
  class_index = np.argmax(prediction)
  class_name = train_dataset.class_names[class_index]

  plt.imshow(image[0])
  plt.title(f'Prediction: {class_name}')
  plt.axis('off')
  plt.show()