# PROYECTO DE MATERIA 
## TRATAMIENTO DE DATOS

Jaime Andrés Subía

### Paso 1: ###
Importamos las librerias necesarias

In [1]:
from keras.preprocessing.image import ImageDataGenerator 
from keras.models import Sequential 
from keras.layers import Conv2D, MaxPooling2D 
from keras.layers import Activation, Dropout, Flatten, Dense 
from keras import backend as K 

### Paso 2: ###
Seteamos el tamano de las imagenes a ser tratadas (224*224).

In [2]:
img_width, img_height = 224, 224

### Paso 3: ###
Inicializamos las variables para paths locales donde se encuentran los DataSets a ser procesados.

In [3]:
dir_train_carnes = 'C:/Users/JANDRES/Documents/CarneDataset/train'
dir_test_carnes = 'C:/Users/JANDRES/Documents/CarneDataset/test'

### Paso 4:
Insertamos la cantidad de imagenes a procesar, tanto de entrenamiento como de test y las variables para setear la cantidad de veces que el modelo sera entrenado (epochs).

In [4]:
num_train_img = 1633
num_test_img = 810
epochs = 30
batch_size = 20

### Paso 5: 
Verificamos el formato de datos, el modelo verificará primero y luego la forma de entrada se alimentará en consecuencia.

In [5]:
if K.image_data_format() == 'channels_first': 
    input_shape = (3, img_width, img_height) 
else: 
    input_shape = (img_width, img_height, 3) 

### Paso 6: 
Utilizamos las siguientes funciones:
##### Conv2D #####
Capa para convolucionar la imagen en múltiples imágenes 
##### Activation #####
Es la función de activación. 
##### MaxPooling2D #####
Se usa para agrupar al máximo el valor de la matriz de tamaño dada y lo mismo se usa para las siguientes 2 capas. 
##### Flatten #####
Se usa para aplanar las dimensiones de la imagen obtenida después de convolucionarla.
##### Dense ###### 
Se usa para hacer de este un modelo completamente conectado y es la capa oculta. 
##### Dropout #####
Se utiliza para evitar el sobreajuste en el conjunto de datos. 
##### Dense ###### 
Finalmente reutilizamos DENSE para la capa de salida que contiene solo una neurona que decide a qué categoría pertenece la imagen.

In [6]:
model = Sequential() 
model.add(Conv2D(32, (2, 2), input_shape=input_shape)) 
model.add(Activation('relu')) 
model.add(MaxPooling2D(pool_size = (2, 2)))

In [7]:
model.add(Conv2D(32, (2, 2))) 
model.add(Activation('relu')) 
model.add(MaxPooling2D(pool_size = (2, 2))) 

In [8]:
model.add(Conv2D(64, (2, 2))) 
model.add(Activation('relu')) 
model.add(MaxPooling2D(pool_size = (2, 2))) 

In [9]:
model.add(Flatten()) 
model.add(Dense(64)) 
model.add(Activation('relu')) 
model.add(Dropout(0.5)) 
model.add(Dense(1)) 
model.add(Activation('sigmoid')) 

### Paso 7: 
Utilizamos la función de compilación que implica el uso de pérdida, optimizadores y métricas. La función de pérdida utilizada es binary_crossentropy, el optimizador utilizado es rmsprop .

In [10]:
model.compile(loss='binary_crossentropy', 
              optimizer='rmsprop', 
              metrics=['accuracy']) 

### Paso 8:
Implementamos el generado de datos ImageDataGenerator con las siguientes funciones:
###### ImageDataGenerator 
Cambia la escala de la imagen, aplica corte en algún rango, hace zoom en la imagen y realiza un volteo horizontal con la imagen. Este ImageDataGenerator incluye todas las orientaciones posibles de la imagen. 
##### train_datagen.flow_from_directory 
Función que se usa para preparar datos del directorio train_dataset Target_size especifica el tamaño objetivo de la imagen. 
##### test_datagen.flow_from_directory 
Se usa para preparar datos de prueba para el modelo y todo es similar al anterior. 
##### fit_generator 
Se utiliza para ajustar los datos en el modelo creado anteriormente, otros factores utilizados son steps_per_epochs que nos informan sobre la cantidad de veces que se ejecutará el modelo para los datos de entrenamiento. 
##### epochs
Nos informa la cantidad de veces que el modelo será entrenado en pase hacia adelante y hacia atrás. 
##### Validation_data 
Se utiliza para alimentar los datos de validación/prueba en el modelo. 
##### validation_steps 
Indica el número de muestras de validación/prueba.


In [11]:
train_datagen = ImageDataGenerator( 
    rescale = 1./ 255, 
    shear_range = 0.2, 
    zoom_range = 0.2, 
    horizontal_flip = True) 

test_datagen = ImageDataGenerator(rescale = 1. / 255) 
  
train_generator = train_datagen.flow_from_directory( 
    dir_train_carnes, 
    target_size = (img_width, img_height), 
    batch_size = batch_size, 
    class_mode = 'binary') 

validation_generator = test_datagen.flow_from_directory( 
    dir_test_carnes, 
    target_size = (img_width, img_height), 
    batch_size = batch_size, 
    class_mode = 'binary') 
  
model.fit( 
    train_generator, 
    steps_per_epoch = num_train_img // batch_size, 
    epochs = epochs, 
    validation_data = validation_generator, 
    validation_steps = num_test_img // batch_size) 

Found 1633 images belonging to 8 classes.
Found 810 images belonging to 8 classes.
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x2a6ab64a2e0>

### Nota 
Se valida en la ejecución del modelo las imagenes procesadas y las 8 clases existentes por cada tipo de ellas. El procesamiento tardó al rededor de 5 minutos en la ejecución del entrenamiento del modelo.

### Paso 9:
Guardamos el modelo.

In [12]:
model.save('modelo_entrenamiento.h5')

### Paso 10:
Importamos librerias necesarias para cargar el modelo.

In [13]:
from keras.models import load_model
from tensorflow.keras.preprocessing.image import load_img
from tensorflow.keras.preprocessing.image import img_to_array
from keras.applications.vgg16 import preprocess_input
from keras.applications.vgg16 import decode_predictions
from keras.applications.vgg16 import VGG16
import numpy as np
from keras.models import load_model

### Paso 11:
Cargamos el modelo.

In [14]:
model = load_model('modelo_entrenamiento.h5')

### Paso 12:
Cargamos la imagen a ser procesada tomada desde la carpeta de TEST.

In [15]:
image = load_img('C:/Users/JANDRES/Documents/CarneDataset/test/CLASS_05/07-CAPTURE_20220614_074648_771.png', target_size=(224, 224)) 
img = np.array(image) 
img = img / 255.0
img = img.reshape(1,224,224,3) 
label = model.predict(img) 
print("Clase a la que petenece (CLASS_01, CLASS_02, CLASS_03, CLASS_04, CLASS_05, CLASS_06, CLASS_07, CLASS_07, CLASS_08): ", label[0][0])

Clase a la que petenece (CLASS_01, CLASS_02, CLASS_03, CLASS_04, CLASS_05, CLASS_06, CLASS_07, CLASS_08):  5


### Conclusión:
Podemos verificar que la clase cargada es la número 5 después del entrenamiento al modelo.