#PROYECTO FINAL
#MINERIA DE DATOS
#CLASIFICADOR DE IMAGENES
##Tony Chamorro Aguilar


#Introduccion.
Los modelos de clasificacion de imagenes tienen millones de parametros. Entrenarlos desde cero requiere una gran cantidad de datos de entrenamiento etiquetados y mucha potencia informática.

 El aprendizaje por transferencia es una técnica que ataja gran parte de esto al tomar una parte de un modelo que ya ha sido perturbado en una tarea relacionada y reutilizarlo en un nuevo modelo.

¿Cómo procesar imágenes con machine learning para reconocimiento y clasificación de objetos? La identificación de objetos en imágenes tiene múltiples aplicaciones: desde algo tan prosaico como identificar gatos o perros en fotografías, hasta la detección de tumores en pruebas diagnósticas o clasificar las piezas de una línea de producción según su calidad. 

# Objetivo del Proyecto.
Lo que se busca es entrenar un modelo con una serie de datos en imagenes.Algunas tareas de clasificación que son difíciles para los humanos resultan fáciles para redes neuronales. Usando un simple procedimiento de ajuste fino, una red neuronal puede ayudar.

#Datos a usar.
Inicialmente se va a trabajar con unos datos extraidos de una pagina https://tfhub.dev/google/imagenet/mobilenet_v2_100_224/feature_vector/4


#Algoritmos a utilizar.
Aprendizaje por transferencia demuestra cómo crear un modelo de Keras para clasificar cinco especies de flores mediante el uso de un modelo guardado TF2 previamente perturbado de TensorFlow Hub para la extracción de características de imagenes.

Keras es una API de aprendizaje profundo escrita en Python, que se ejecuta sobre la plataforma de aprendizaje automático TensorFlow . Fue desarrollado con un enfoque en permitir la experimentación rápida y proporcionar una experiencia de desarrollador agradable.

El propósito de Keras es brindar una ventaja injusta a cualquier desarrollador que busque enviar aplicaciones basadas en ML.

Keras es:

*   Simple , pero no simplista. Keras reduce la carga cognitiva del
desarrollador para que pueda concentrarse en las partes del problema que realmente importan. Keras se centra en la facilidad de uso, la velocidad de depuración, la elegancia y la concisión del código, la capacidad de mantenimiento y la capacidad de implementación (a través de TFServing, TFLite, TF.js).

*   Flexible : Keras adopta el principio de revelación progresiva de la 
complejidad : los flujos de trabajo simples deben ser rápidos y fáciles, mientras que los flujos de trabajo arbitrariamente avanzados deben ser posibles a través de un camino claro que se basa en lo que ya ha aprendido.


*   Potente : Keras proporciona un rendimiento y una escalabilidad sólidos en la industria: lo utilizan organizaciones y empresas, incluidas la NASA, YouTube y Waymo. Así es: sus recomendaciones de YouTube cuentan con la tecnología de Keras, al igual que el vehículo sin conductor más avanzado del mundo.


#Desarrolla el modelo Keras desde cero

Importa bibliotecas y define constantes.

Primero, importa las bibliotecas de Python necesarias para el entrenamiento:

In [None]:
import itertools
import os

import matplotlib.pylab as plt
import numpy as np

import tensorflow as tf
import tensorflow_hub as hub

print("TF version:", tf.__version__)
print("Hub version:", hub.__version__)
print("GPU is", "available" if tf.config.list_physical_devices('GPU') else "NOT AVAILABLE")

Carga la direccion con el directorio de trabajo.

In [None]:
#@title

model_name = "efficientnetv2-xl-21k" # @param ['efficientnetv2-s', 'efficientnetv2-m', 'efficientnetv2-l', 'efficientnetv2-s-21k', 'efficientnetv2-m-21k', 'efficientnetv2-l-21k', 'efficientnetv2-xl-21k', 'efficientnetv2-b0-21k', 'efficientnetv2-b1-21k', 'efficientnetv2-b2-21k', 'efficientnetv2-b3-21k', 'efficientnetv2-s-21k-ft1k', 'efficientnetv2-m-21k-ft1k', 'efficientnetv2-l-21k-ft1k', 'efficientnetv2-xl-21k-ft1k', 'efficientnetv2-b0-21k-ft1k', 'efficientnetv2-b1-21k-ft1k', 'efficientnetv2-b2-21k-ft1k', 'efficientnetv2-b3-21k-ft1k', 'efficientnetv2-b0', 'efficientnetv2-b1', 'efficientnetv2-b2', 'efficientnetv2-b3', 'efficientnet_b0', 'efficientnet_b1', 'efficientnet_b2', 'efficientnet_b3', 'efficientnet_b4', 'efficientnet_b5', 'efficientnet_b6', 'efficientnet_b7', 'bit_s-r50x1', 'inception_v3', 'inception_resnet_v2', 'resnet_v1_50', 'resnet_v1_101', 'resnet_v1_152', 'resnet_v2_50', 'resnet_v2_101', 'resnet_v2_152', 'nasnet_large', 'nasnet_mobile', 'pnasnet_large', 'mobilenet_v2_100_224', 'mobilenet_v2_130_224', 'mobilenet_v2_140_224', 'mobilenet_v3_small_100_224', 'mobilenet_v3_small_075_224', 'mobilenet_v3_large_100_224', 'mobilenet_v3_large_075_224']

model_handle_map = {
  "efficientnetv2-s": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet1k_s/feature_vector/2",
  "efficientnetv2-m": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet1k_m/feature_vector/2",
  "efficientnetv2-l": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet1k_l/feature_vector/2",
  "efficientnetv2-s-21k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_s/feature_vector/2",
  "efficientnetv2-m-21k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_m/feature_vector/2",
  "efficientnetv2-l-21k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_l/feature_vector/2",
  "efficientnetv2-xl-21k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_xl/feature_vector/2",
  "efficientnetv2-b0-21k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_b0/feature_vector/2",
  "efficientnetv2-b1-21k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_b1/feature_vector/2",
  "efficientnetv2-b2-21k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_b2/feature_vector/2",
  "efficientnetv2-b3-21k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_b3/feature_vector/2",
  "efficientnetv2-s-21k-ft1k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_ft1k_s/feature_vector/2",
  "efficientnetv2-m-21k-ft1k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_ft1k_m/feature_vector/2",
  "efficientnetv2-l-21k-ft1k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_ft1k_l/feature_vector/2",
  "efficientnetv2-xl-21k-ft1k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_ft1k_xl/feature_vector/2",
  "efficientnetv2-b0-21k-ft1k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_ft1k_b0/feature_vector/2",
  "efficientnetv2-b1-21k-ft1k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_ft1k_b1/feature_vector/2",
  "efficientnetv2-b2-21k-ft1k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_ft1k_b2/feature_vector/2",
  "efficientnetv2-b3-21k-ft1k": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet21k_ft1k_b3/feature_vector/2",
  "efficientnetv2-b0": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet1k_b0/feature_vector/2",
  "efficientnetv2-b1": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet1k_b1/feature_vector/2",
  "efficientnetv2-b2": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet1k_b2/feature_vector/2",
  "efficientnetv2-b3": "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet1k_b3/feature_vector/2",
  "efficientnet_b0": "https://tfhub.dev/tensorflow/efficientnet/b0/feature-vector/1",
  "efficientnet_b1": "https://tfhub.dev/tensorflow/efficientnet/b1/feature-vector/1",
  "efficientnet_b2": "https://tfhub.dev/tensorflow/efficientnet/b2/feature-vector/1",
  "efficientnet_b3": "https://tfhub.dev/tensorflow/efficientnet/b3/feature-vector/1",
  "efficientnet_b4": "https://tfhub.dev/tensorflow/efficientnet/b4/feature-vector/1",
  "efficientnet_b5": "https://tfhub.dev/tensorflow/efficientnet/b5/feature-vector/1",
  "efficientnet_b6": "https://tfhub.dev/tensorflow/efficientnet/b6/feature-vector/1",
  "efficientnet_b7": "https://tfhub.dev/tensorflow/efficientnet/b7/feature-vector/1",
  "bit_s-r50x1": "https://tfhub.dev/google/bit/s-r50x1/1",
  "inception_v3": "https://tfhub.dev/google/imagenet/inception_v3/feature-vector/4",
  "inception_resnet_v2": "https://tfhub.dev/google/imagenet/inception_resnet_v2/feature-vector/4",
  "resnet_v1_50": "https://tfhub.dev/google/imagenet/resnet_v1_50/feature-vector/4",
  "resnet_v1_101": "https://tfhub.dev/google/imagenet/resnet_v1_101/feature-vector/4",
  "resnet_v1_152": "https://tfhub.dev/google/imagenet/resnet_v1_152/feature-vector/4",
  "resnet_v2_50": "https://tfhub.dev/google/imagenet/resnet_v2_50/feature-vector/4",
  "resnet_v2_101": "https://tfhub.dev/google/imagenet/resnet_v2_101/feature-vector/4",
  "resnet_v2_152": "https://tfhub.dev/google/imagenet/resnet_v2_152/feature-vector/4",
  "nasnet_large": "https://tfhub.dev/google/imagenet/nasnet_large/feature_vector/4",
  "nasnet_mobile": "https://tfhub.dev/google/imagenet/nasnet_mobile/feature_vector/4",
  "pnasnet_large": "https://tfhub.dev/google/imagenet/pnasnet_large/feature_vector/4",
  "mobilenet_v2_100_224": "https://tfhub.dev/google/imagenet/mobilenet_v2_100_224/feature_vector/4",
  "mobilenet_v2_130_224": "https://tfhub.dev/google/imagenet/mobilenet_v2_130_224/feature_vector/4",
  "mobilenet_v2_140_224": "https://tfhub.dev/google/imagenet/mobilenet_v2_140_224/feature_vector/4",
  "mobilenet_v3_small_100_224": "https://tfhub.dev/google/imagenet/mobilenet_v3_small_100_224/feature_vector/5",
  "mobilenet_v3_small_075_224": "https://tfhub.dev/google/imagenet/mobilenet_v3_small_075_224/feature_vector/5",
  "mobilenet_v3_large_100_224": "https://tfhub.dev/google/imagenet/mobilenet_v3_large_100_224/feature_vector/5",
  "mobilenet_v3_large_075_224": "https://tfhub.dev/google/imagenet/mobilenet_v3_large_075_224/feature_vector/5",
}

model_image_size_map = {
  "efficientnetv2-s": 384,
  "efficientnetv2-m": 480,
  "efficientnetv2-l": 480,
  "efficientnetv2-b0": 224,
  "efficientnetv2-b1": 240,
  "efficientnetv2-b2": 260,
  "efficientnetv2-b3": 300,
  "efficientnetv2-s-21k": 384,
  "efficientnetv2-m-21k": 480,
  "efficientnetv2-l-21k": 480,
  "efficientnetv2-xl-21k": 512,
  "efficientnetv2-b0-21k": 224,
  "efficientnetv2-b1-21k": 240,
  "efficientnetv2-b2-21k": 260,
  "efficientnetv2-b3-21k": 300,
  "efficientnetv2-s-21k-ft1k": 384,
  "efficientnetv2-m-21k-ft1k": 480,
  "efficientnetv2-l-21k-ft1k": 480,
  "efficientnetv2-xl-21k-ft1k": 512,
  "efficientnetv2-b0-21k-ft1k": 224,
  "efficientnetv2-b1-21k-ft1k": 240,
  "efficientnetv2-b2-21k-ft1k": 260,
  "efficientnetv2-b3-21k-ft1k": 300, 
  "efficientnet_b0": 224,
  "efficientnet_b1": 240,
  "efficientnet_b2": 260,
  "efficientnet_b3": 300,
  "efficientnet_b4": 380,
  "efficientnet_b5": 456,
  "efficientnet_b6": 528,
  "efficientnet_b7": 600,
  "inception_v3": 299,
  "inception_resnet_v2": 299,
  "nasnet_large": 331,
  "pnasnet_large": 331,
}

model_handle = model_handle_map.get(model_name)
pixels = model_image_size_map.get(model_name, 224)

print(f"Selected model: {model_name} : {model_handle}")

IMAGE_SIZE = (pixels, pixels)
print(f"Input size {IMAGE_SIZE}")

BATCH_SIZE = 16#@param {type:"integer"}

##Configurar el conjunto de datos de Flowers
Las entradas se redimensionan adecuadamente para el módulo seleccionado. El aumento del conjunto de datos (es decir, distorsiones aleatorias de una imagen cada vez que se lee) mejora el entrenamiento, especialmente. al realizar un ajuste fino.

In [None]:
data_dir = tf.keras.utils.get_file(
    'flower_photos',
    'https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz',
    untar=True)

In [None]:
def build_dataset(subset):
  return tf.keras.preprocessing.image_dataset_from_directory(
      data_dir,
      validation_split=.20,
      subset=subset,
      label_mode="categorical",
      # Seed needs to provided when using validation_split and shuffle = True.
      # A fixed seed is used so that the validation set is stable across runs.
      seed=123,
      image_size=IMAGE_SIZE,
      batch_size=1)

train_ds = build_dataset("training")
class_names = tuple(train_ds.class_names)
train_size = train_ds.cardinality().numpy()
train_ds = train_ds.unbatch().batch(BATCH_SIZE)
train_ds = train_ds.repeat()

normalization_layer = tf.keras.layers.Rescaling(1. / 255)
preprocessing_model = tf.keras.Sequential([normalization_layer])
do_data_augmentation = True #@param {type:"boolean"}
if do_data_augmentation:
  preprocessing_model.add(
      tf.keras.layers.RandomRotation(40))
  preprocessing_model.add(
      tf.keras.layers.RandomTranslation(0, 0.2))
  preprocessing_model.add(
      tf.keras.layers.RandomTranslation(0.2, 0))
  # Like the old tf.keras.preprocessing.image.ImageDataGenerator(),
  # image sizes are fixed when reading, and then a random zoom is applied.
  # If all training inputs are larger than image_size, one could also use
  # RandomCrop with a batch size of 1 and rebatch later.
  preprocessing_model.add(
      tf.keras.layers.RandomZoom(0.2, 0.2))
  preprocessing_model.add(
      tf.keras.layers.RandomFlip(mode="horizontal"))
train_ds = train_ds.map(lambda images, labels:
                        (preprocessing_model(images), labels))

val_ds = build_dataset("validation")
valid_size = val_ds.cardinality().numpy()
val_ds = val_ds.unbatch().batch(BATCH_SIZE)
val_ds = val_ds.map(lambda images, labels:
                    (normalization_layer(images), labels))

# Definiendo el modelo
Todo lo que necesita es poner un clasificador lineal en la parte superior de la feature_extractor_layercon el módulo de concentradores.

Para la velocidad, comenzamos con un no entrenable feature_extractor_layer, pero también se puede permitir el ajuste fino para una mayor precisión.

In [None]:
do_fine_tuning = False #@param {type:"boolean"}

In [None]:
print("Building model with", model_handle)
model = tf.keras.Sequential([
    # Explicitly define the input shape so the model can be properly
    # loaded by the TFLiteConverter
    tf.keras.layers.InputLayer(input_shape=IMAGE_SIZE + (3,)),
    hub.KerasLayer(model_handle, trainable=do_fine_tuning),
    tf.keras.layers.Dropout(rate=0.2),
    tf.keras.layers.Dense(len(class_names),
                          kernel_regularizer=tf.keras.regularizers.l2(0.0001))
])
model.build((None,)+IMAGE_SIZE+(3,))
model.summary()

## Entrenando el modelo.

A continuación, crea estos conjuntos de datos de entrenamiento y evaluación. Usa los hiperparámetros para establecer cómo el conjunto de datos de entrenamiento le proporcionará ejemplos al modelo durante el entrenamiento. 

Establece el conjunto de datos de validación a fin de brindar todos sus ejemplos en un solo lote, para un solo paso de validación al final de cada ciclo de entrenamiento.

Crea conjuntos de datos de entrenamiento y validación.

Crea una función de entrada para convertir características y etiquetas  para entrenamiento o evaluación:


In [None]:
model.compile(
  optimizer=tf.keras.optimizers.SGD(learning_rate=0.005, momentum=0.9), 
  loss=tf.keras.losses.CategoricalCrossentropy(from_logits=True, label_smoothing=0.1),
  metrics=['accuracy'])

El progreso del entrenamiento puede verse de la siguiente manera:

In [None]:
steps_per_epoch = train_size // BATCH_SIZE
validation_steps = valid_size // BATCH_SIZE
hist = model.fit(
    train_ds,
    epochs=5, steps_per_epoch=steps_per_epoch,
    validation_data=val_ds,
    validation_steps=validation_steps).history

In [None]:
plt.figure()
plt.ylabel("Loss (training and validation)")
plt.xlabel("Training Steps")
plt.ylim([0,2])
plt.plot(hist["loss"])
plt.plot(hist["val_loss"])

plt.figure()
plt.ylabel("Accuracy (training and validation)")
plt.xlabel("Training Steps")
plt.ylim([0,1])
plt.plot(hist["accuracy"])
plt.plot(hist["val_accuracy"])

Pruebe el modelo en una imagen de los datos de validacion:

In [None]:
x, y = next(iter(val_ds))
image = x[0, :, :, :]
true_index = np.argmax(y[0])
plt.imshow(image)
plt.axis('off')
plt.show()

# Expand the validation image to (1, 224, 224, 3) before predicting the label
prediction_scores = model.predict(np.expand_dims(image, axis=0))
predicted_index = np.argmax(prediction_scores)
print("True label: " + class_names[true_index])
print("Predicted label: " + class_names[predicted_index])

#Ejemplo extra
#Clasificación de imágenes de frutas de CNN desde cero

In [None]:
# Install opendatasets for download kaggle dataset into colab notebook
!pip install opendatasets

In [None]:
# Import necessary tools
import numpy as np
import pandas as pd
import tensorflow as tf
import opendatasets as od
import matplotlib.pyplot as plt
import os
import seaborn as sns
import pathlib

In [None]:
# Download data
od.download("https://www.kaggle.com/datasets/moltean/fruits")

Saltando, encontró archivos descargados en "./frutas" (use force=True para forzar la descarga)

In [None]:
# Connect Google Colab GPU and checking it
print("GPU is connected..." if tf.config.list_physical_devices("GPU") else "Please check your runtime and run it again")

#Preparando imagenes



In [None]:
# train and test filepath
train_path = "/content/fruits/fruits-360_dataset/fruits-360/Training/"
test_path = "/content/fruits/fruits-360_dataset/fruits-360/Test/"

In [None]:
# We make fruits more legible so that we can examine them better
labels = []
filenames = []

for i in os.listdir(train_path):
  for image_filename in os.listdir(train_path + i):
    labels.append(i)
    filenames.append(train_path + i + "/" + image_filename) # Image of the fruit

In [None]:
# First 100 of labels
list(labels[:100])

In [None]:
filenames[10:20]

In [None]:
# Create fruits DataFrame
fruit_data = pd.DataFrame(
    labels, columns=["Classes"]
)
fruit_data["Filenames"] = filenames

In [None]:
fruit_data

In [None]:
plt.figure(figsize=(10,7))
sns.histplot(data=fruit_data, x=fruit_data["Classes"].value_counts(), kde=True)
plt.show()

In [None]:
# Create graph of fruit images with 
import plotly.express as px
fig = px.histogram(fruit_data, x="Classes")
fig.show()

In [None]:
len(np.unique(labels))

In [None]:
# Display image with keras.utils
from tensorflow.keras.utils import load_img
img = load_img(filenames[1])
plt.imshow(img)
plt.title(labels[1])
plt.axis("off")
plt.show()

In [None]:
# Display image with IPython 
from IPython.display import Image
Image(filenames[3000])

#Convertir etiquetas de datos en tipo booleano



Ya que tenemos la ruta de archivo de las imágenes de nuestro conjunto de datos de tren en una lista, y vamos a convertir nuestras etiquetas en tipo booleano

In [None]:
# We have already hase images labels in a list, now find unique values and save them into variable

unique_fruits = np.unique(labels)
unique_fruits

In [None]:
# Let's turn a single label into boolean type
print(labels[1])
labels[1] == unique_fruits

# As you can see label[1] value returned true in unique_fruits where it located

In [None]:
# Turn all labels into boolean dtype 
boolean_labels = [label == unique_fruits for label in labels]

# Compare length of labels and boolean_labels
print(f"Labels: {len(labels)}")
print(f"Boolean labels: {len(boolean_labels)}")

#Crear nuestro propio conjunto de datos de validación

In [None]:
X = filenames
y = boolean_labels

In [None]:
len(X)


In [None]:
# Split data into train and validation sets
from sklearn.model_selection import train_test_split

X_train, X_valid,  y_train, y_valid = train_test_split(X, y, test_size=0.2, random_state=42)
len(X_train), len(y_train)

In [None]:
len(X_valid), len(y_valid)

Imágenes de precesión
Convertir imágenes en tensores

Cree una función con los siguientes pasos:

Tomar la ruta del archivo de imagen como entrada
Use Tensorflow para leer un archivo y guardarlo en una imagen variable
Convierte nuestras imágenes en Tensores
Normalizar nuestra imagen (Convertir valores de color de 1-255 a 0-1)
Cambiar el tamaño de las imágenes para que sean una forma de (224,224)
Volver a la imagen modificada


In [None]:
# Setup image size
IMG_SIZE = 224
# Create a function for preprocessing images
def process_image(file_path, image_size=IMG_SIZE):
  """
  Take image filepath and turn it into Tensors 
  """
  # Read image file and save into variable
  image = tf.io.read_file(file_path)
  # Turn images into Tensors with 3 color channels
  image = tf.image.decode_jpeg(image, channels=3)
  # Normalize color channel values
  image = tf.image.convert_image_dtype(image, tf.float32)
  # Resize images
  image = tf.image.resize(image, size=(IMG_SIZE,IMG_SIZE))
  # Return images
  return image


Convierta los datos en lotes

¿Por qué usamos lotes en el aprendizaje profundo?

Otra razón por la que debería considerar usar lote es que cuando entrena su modelo de aprendizaje profundo sin dividirlo en lotes, entonces su algoritmo de aprendizaje profundo (puede ser una red neuronal) tiene que almacenar valores de error para todas esas 100000 imágenes en la memoria y esto causará una gran disminución en la velocidad de entrenamiento

In [None]:
# Create a function for preprocess images and return to tuple of (image, label)

def get_image_label(filepath, label):
  """
  Get image filepath and preprocess and returns a tuple of image, label
  """
  image = process_image(filepath)
  return image, label

In [None]:
# Sometimes we classify more images during process. More media data can not run very well on device.
# So that we need create data batches
# Data batches contain images which we defined image size

# Setup batch size
BATCH_SIZE = 32

# Create a function for turn our images into batches
def create_data_batches(X, y=None,
                        batch_size=BATCH_SIZE,
                        valid_data=False,
                        test_data = False):
  """
  This function creates batches of data out of images(X), and (y) pairs.
  Shuffle the data if it will be training dataset, however doesn't shuffle validation dataset
  Also accepts test data as input but no labels
  """
  if test_data:
    data = tf.data.Dataset.from_tensor_slices((tf.constant(X)))
    data_batch = data.map(process_image).batch(BATCH_SIZE)
    return data_batch
  
  elif valid_data:
    data = tf.data.Dataset.from_tensor_slices((
        tf.constant(X),
        tf.constant(y)
    ))
    data_batch = data.map(get_image_label).batch(BATCH_SIZE)
    return data_batch
  
  else:
    data = tf.data.Dataset.from_tensor_slices((
        tf.constant(X),
        tf.constant(y),
    ))
    data = data.shuffle(buffer_size = len(X))
    data = data.map(get_image_label)
    data_batch = data.batch(BATCH_SIZE)
  return data_batch

In [None]:
# Create train and validartion data batches
train_data = create_data_batches(X_train, y_train)
valid_data = create_data_batches(X_valid, y_valid, valid_data=True)

In [None]:
len(train_data)

In [None]:
len(valid_data)

#Visualizacion data

In [None]:
# Create a function for viewing images in a data batches

def show_images(images, labels):
  """
  Display 30 images and with their labels from data baches
  """

  # Setup figure
  plt.figure(figsize=(10,10))
  # Loop through 30 images
  for i in range(30):
    # Create subplots(5rows, 6columns)
    ax = plt.subplot(5,6, i+1)
    # Display images
    plt.imshow(images[i])
    # Add image label as a title
    plt.title(unique_fruits[labels[i].argmax()])
    plt.axis("off")

In [None]:
train_images, train_labels = next(train_data.as_numpy_iterator())
len(train_images), len(train_labels)

In [None]:
show_images(train_images, train_labels)


#Preparar entradas y salidas.

In [None]:
# Setup input shape to the model
INPUT_SHAPE = [None, IMG_SIZE, IMG_SIZE, 3] # // None is batch size

# Setup output shape for model
OUTPUT_SHAPE = len(unique_fruits)

# Get pre trained model url(Tensorflow Hub)
MODEL_URL = "https://tfhub.dev/google/imagenet/mobilenet_v2_100_224/classification/5"

#Modelado


Vamos a crear una función con los siguientes pasos:

Toma la forma de entrada, la forma de salida y la URL del modelo, que hemos definido

Define las capas en un modelo de Keras de forma secuencial

Compile el modelo (dice que debe ser evaluado y mejorado)

Construya el modelo (le dice al moodel la forma de entrada que obtendrá)


1.   Devolver el modelo





In [None]:
import tensorflow_hub as hub
def create_model(input_shape=INPUT_SHAPE, output_shape=OUTPUT_SHAPE, model_url = MODEL_URL):
  print("Now, building model for you project: ")
  model = tf.keras.Sequential([
      hub.KerasLayer(MODEL_URL), # // Layers input
      tf.keras.layers.Dense(units=OUTPUT_SHAPE, activation="softmax"), # //Layer for output
  ])

  # Compile the model
  model.compile(
      loss = tf.keras.losses.CategoricalCrossentropy(),
      optimizer = tf.keras.optimizers.Adam(),
      metrics = ["accuracy"]
  )

  # Build model
  model.build(INPUT_SHAPE)
  print("Model has been built successfully!")
  # Return the model
  return model

# Create a function for viewing images in a data batches

def show_images(images, labels):
  """
  Display 30 images and with their labels from data baches
  """

  # Setup figure
  plt.figure(figsize=(10,10))
  # Loop through 30 images
  for i in range(30):
    # Create subplots(5rows, 6columns)
    ax = plt.subplot(5,6, i+1)
    # Display images
    plt.imshow(images[i])
    # Add image label as a title
    plt.title(unique_fruits[labels[i].argmax()])
    plt.axis("off")

In [None]:
Create a function for viewing images in a data batches
def show_images(images, labels): """ Display 30 images and with their labels from data baches """

Setup figure
plt.figure(figsize=(10,10))

Loop through 30 images
for i in range(30):

# Create subplots(5rows, 6columns)
ax = plt.subplot(5,6, i+1)
# Display images
plt.imshow(images[i])
# Add image label as a title
plt.title(unique_fruits[labels[i].argmax()])
plt.axis("off")

#CONCLUSIONES
Keras es un marco altamente flexible adecuado para iterar sobre ideas de investigación de vanguardia. 

Sigue el principio de divulgación progresiva de la complejidad : facilita el inicio, pero permite manejar casos de uso arbitrariamente avanzados, que solo requieren un aprendizaje incremental en cada paso.

De la misma manera que pudo entrenar y evaluar una red neuronal simple arriba en unas pocas líneas, puede usar Keras para desarrollar rápidamente nuevos procedimientos de entrenamiento o arquitecturas de modelos exóticos. 