# **Experimentación de la Redes Siamesas con la base datos "Georgia Tech"**

### Importando librerias

In [11]:
import sys
import numpy as np
import pandas as pd
from matplotlib.pyplot import imread
import pickle
import os
import matplotlib.pyplot as plt
%matplotlib inline

import cv2
import time
from PIL import Image

import tensorflow as tf
from keras.models import Sequential
from keras.optimizers import Adam
from keras.layers import Conv2D, ZeroPadding2D, Activation, Input, concatenate
from keras.models import Model

from keras.layers.normalization import BatchNormalization
from keras.layers.pooling import MaxPooling2D
from keras.layers.merge import Concatenate
from keras.layers.core import Lambda, Flatten, Dense
from keras.initializers import glorot_uniform

from keras.engine.topology import Layer
from keras.regularizers import l2
from keras import backend as K

from sklearn.utils import shuffle

import numpy.random as rng
from tqdm.notebook import tqdm

In [12]:
from keras.preprocessing.image import ImageDataGenerator
from keras.callbacks import TensorBoard, ModelCheckpoint,EarlyStopping,ReduceLROnPlateau
from sklearn.model_selection import train_test_split

## 1. Implementacion del modelo

### 1.1 Funciones para inicializar parametros

Segun el [artículo](http://www.cs.utoronto.ca/~gkoch/files/msc-thesis.pdf) sugiere las siguientes inicializaciones para las capas CNN:
 - Pesos con una media de 0.0 y una desviación estándar de 0.01
 - Bias con una media de 0.5 y una desviación estándar de 0.01

In [13]:
def initialize_weights(shape, dtype=None):
    return np.random.normal(loc = 0.0, scale = 1e-2, size = shape)

In [14]:
def initialize_bias(shape, dtype=None):
    return np.random.normal(loc = 0.5, scale = 1e-2, size = shape)

### 1.2 Modelo Red Siamesa

Arquitectura a bajo nivel de la red siames

![siamese network_architecture](assets/siamese_network_architecture.png)

In [15]:
def get_siamese_model(input_shape):
    # Se define la dimensión de los tensores para las dos entradas de imágenes
    left_input = Input(input_shape)
    right_input = Input(input_shape)
    
    # Red Neuronal Convolucional
    model = Sequential()
    model.add(Conv2D(64, (10,10), activation='relu', input_shape=input_shape,
                   kernel_initializer=initialize_weights, kernel_regularizer=l2(2e-4)))
    model.add(MaxPooling2D())
    model.add(Conv2D(128, (7,7), activation='relu',
                     kernel_initializer=initialize_weights,
                     bias_initializer=initialize_bias, kernel_regularizer=l2(2e-4)))
    model.add(MaxPooling2D())
    model.add(Conv2D(128, (4,4), activation='relu', kernel_initializer=initialize_weights,
                     bias_initializer=initialize_bias, kernel_regularizer=l2(2e-4)))
    model.add(MaxPooling2D())
    model.add(Conv2D(256, (4,4), activation='relu', kernel_initializer=initialize_weights,
                     bias_initializer=initialize_bias, kernel_regularizer=l2(2e-4)))
    model.add(Flatten())
    model.add(Dense(4096, activation='sigmoid',
                   kernel_regularizer=l2(1e-3),
                   kernel_initializer=initialize_weights,bias_initializer=initialize_bias))
    
    # Generar los vectores caracteristicos para las dos imágenes
    encoded_l = model(left_input)
    encoded_r = model(right_input)
    
    # Agregar la capa personalizada para calcular la diferencia absoluta entre los vectores caracteristicos de las dos imágenes
    L1_layer = Lambda(lambda tensors:K.abs(tensors[0] - tensors[1]))
    L1_distance = L1_layer([encoded_l, encoded_r])
    
    # Agregar la capa densa el cuál generará el puntaje de similitud
    # Por medio de la función de activación sigmoid nos indicará con 0 si las dos imágenes son diferentes y 1 si son similares
    prediction = Dense(1,activation='sigmoid',bias_initializer=initialize_bias)(L1_distance)
    
    # Conectar las entradas con la salida
    siamese_net = Model(inputs=[left_input,right_input],outputs=prediction)
    
    # Retornar el modelo
    return siamese_net

#### 1.2.1. Resumen del modelo

In [16]:
model = get_siamese_model((105, 105, 3))
model.summary()

Model: "model_1"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_1 (InputLayer)            (None, 105, 105, 3)  0                                            
__________________________________________________________________________________________________
input_2 (InputLayer)            (None, 105, 105, 3)  0                                            
__________________________________________________________________________________________________
sequential_1 (Sequential)       (None, 4096)         38960448    input_1[0][0]                    
                                                                 input_2[0][0]                    
__________________________________________________________________________________________________
lambda_1 (Lambda)               (None, 4096)         0           sequential_1[1][0]         

#### 1.2.2. Compilación del modelo

In [122]:
optimizer = Adam(lr = 0.00006)
model.compile(loss="binary_crossentropy",optimizer=optimizer)

## 2. Importar data 

Se escogio el dataset de Georgia Tech debido a que brinda una gran cantidad de imagenes a colores y porque la posicion de los rostros varian considerablemente, lo que haria al modelo mas robusto. Este dataset contiene 750 imagenes en formato .jpg, pertenecientes a 50 personas. Se decidio agrupar las imagenes en 50 carpetas con 15 imagenes cada una. Ademas,se cambiaron las etiquetas dentro de cada carpeta a un numero entre 1 a 15. 

A partir de esta distribucion, se realizo un pequeño programa para escoger de manera aleatoria parejas iguales(imagenes dentro de la misma carpeta) y parejas sin similitud(imagenes en diferentes carpetas). Se escogieron 10000 parejas iguales y 10000 parejas sin similitud para mantener una correcta distribucion. Esta informacion se guardo como direciones de la imagen dentro de un DataFrame. Si las parejas sin similares el campo "Igualdad" es 1 y si son diferentes es 0. 

In [28]:
Data=pd.read_csv("Imagenes_siamesas.csv")

In [29]:
Data.head()

Unnamed: 0,Imagen1,Imagen2,Igualdad
0,s1/5.jpg,s1/6.jpg,1.0
1,s1/7.jpg,s1/2.jpg,1.0
2,s1/9.jpg,s1/10.jpg,1.0
3,s1/3.jpg,s1/5.jpg,1.0
4,s1/3.jpg,s1/10.jpg,1.0


In [30]:
Data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20000 entries, 0 to 19999
Data columns (total 3 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   Imagen1   20000 non-null  object 
 1   Imagen2   20000 non-null  object 
 2   Igualdad  20000 non-null  float64
dtypes: float64(1), object(2)
memory usage: 468.9+ KB


### 2.1 Transformando a entero la variable de igualdad

In [31]:
Data["Igualdad"]=Data["Igualdad"].astype(int)

### 2.2 Separando en train y validation set

Lo ideal es tener un train y test set que tengan una distribucion similar, por lo que se realizara una separacion estratificada con respecto a la columna "Igualdad"

In [32]:
df_train,df_val=train_test_split(Data,test_size=0.15,stratify=Data["Igualdad"])

In [33]:
df_val=df_val.reset_index(drop=True)

## 3. Funciones de entrenamiento

In [129]:
images_path="data_georgia/cropped_faces/"

### 3.1 Creando ImageDataGenerators para el entrenamiento

Utilizando la funcion de ImageDataGenerator, creare dos nuevos generadores de imagenes que brinden dos imagenes de entrada al modelo segun la informacion brindada en el Dataframe que pasa a la funcion. 

Para los datos de entrada se realiza un poco de data augmentation al agregarle un angulo de rotacion de 5° y haciendo un maximo zoom de 10%. Esto no aplica para las imagenes de validacion.

Información importante:
- batch_size: 32
- tamaño de la imagen: 160x160x3
- rotation_range=5
- zoom_range=0.1

In [128]:
train_generator=ImageDataGenerator(rescale=1./255,
                                   rotation_range=5,
                                   zoom_range=0.1)
test_generator=ImageDataGenerator(rescale=1./255)
val_generator=ImageDataGenerator(rescale=1./255)


In [130]:
def gen_train_flow_for_two_inputs(X1, X2, y):
    genX1 =train_generator.flow_from_dataframe(dataframe=df_train,
                                                 directory=images_path,
                                                 x_col=X1,
                                                 y_col=y,
                                                  target_size=(105,105),
                                                  batch_size=32,
                                                  class_mode="raw",
                                                  seed=42)
    genX2 = train_generator.flow_from_dataframe(dataframe=df_train,
                                                 directory=images_path,
                                                 x_col=X2,
                                                 y_col=y,
                                                  target_size=(105,105),
                                                  batch_size=32,
                                                  class_mode="raw",
                                                  seed=42)
    while True:
        X1i = genX1.next()
        X2i = genX2.next()
        yield [X1i[0], X2i[0]], X1i[1]


In [131]:
def gen_val_flow_for_two_inputs(X1, X2, y):
    genX1 =val_generator.flow_from_dataframe(dataframe=df_val,
                                                 directory=images_path,
                                                 x_col=X1,
                                                 y_col=y,
                                                  target_size=(105,105),
                                                  batch_size=32,
                                                  class_mode="raw",
                                                  seed=42)
    genX2 = val_generator.flow_from_dataframe(dataframe=df_val,
                                                 directory=images_path,
                                                 x_col=X2,
                                                 y_col=y,
                                                  target_size=(105,105),
                                                  batch_size=32,
                                                  class_mode="raw",
                                                  seed=42)
    while True:
        X1i = genX1.next()
        X2i = genX2.next()
        yield [X1i[0], X2i[0]], X1i[1]

In [132]:
gen_train_flow = gen_train_flow_for_two_inputs("Imagen1", "Imagen2", "Igualdad")

In [133]:
gen_val_flow = gen_val_flow_for_two_inputs("Imagen1", "Imagen2", "Igualdad")

## 4. Entrenamiento Modelo
Para descargar el modelo entrenado ingresar a este enlace: [RS_georgia_db.h5](https://drive.google.com/file/d/1leTDVAZKUgVgrrnplric7jT10q8hKU_5/view?usp=sharing)

In [None]:
mc = ModelCheckpoint('RS_georgia_db.h5', monitor='val_loss', mode='min', save_best_only=True)
red_lr_plat = ReduceLROnPlateau(monitor='val_loss', factor=0.8, patience=7, verbose=1, mode='auto', cooldown=5, min_lr=0.0001)
callbacks = [mc, red_lr_plat]
history = model.fit_generator(gen_train_flow,
                            steps_per_epoch = 532,
                            validation_data = gen_val_flow,
                            validation_steps = 94,
                            epochs = 2,
                            callbacks= callbacks)

In [135]:
# model.save_weights('RS_georgia_db.h5') Guarda los pesos del ultimo epoch no recomendado si ya guardamos con model Checkpoint

### 4.1 Adquirir los mejores parametros del modelo entrenado

Se han guardado los mejores parametros con respecto al val_loss

In [None]:
model.lead_weights('RS_georgia_db.h5')# Cargar los mejores pesos

## 5. Generar predicción

Para este proyecto el test set serian las imagenes que vienen de la camara. Sin embargo, para probar la funcion se aplicara al validation set.

### 5.1 Creando generador de imagenes para el test set

In [209]:
def gen_test_flow_for_two_inputs(X1, X2, y,df,dire):
    genX1 =test_generator.flow_from_dataframe(dataframe=df,
                                                 directory=dire,
                                                 x_col=X1,
                                                 y_col=y,
                                                  target_size=(105,105),
                                                  batch_size=1,
                                                  class_mode="raw",
                                                  shuffle=False)
    genX2 = test_generator.flow_from_dataframe(dataframe=df,
                                                 directory=dire,
                                                 x_col=X2,
                                                 y_col=y,
                                                  target_size=(105,105),
                                                  batch_size=1,
                                                  class_mode="raw",
                                                  shuffle=False)
    while True:
                X1i = genX1.next()
                X2i = genX2.next()
                yield [X1i[0], X2i[0]]

In [210]:
def get_prediction(df,direccion_prediccion):
    predictions=model.predict_generator(gen_test_flow_for_two_inputs("Imagen1", "Imagen2", "Imagen2",
                                                                            df,direccion_prediccion), steps = 1)
    return predictions

### 5.2 Generando las predicciones por cada row del DataFrame

In [None]:
lista_predicciones=[]

for i in range(len(df_val)):

    df_minitest=pd.DataFrame({"Imagen1":[df_val.loc[i,'Imagen1']],"Imagen2":[df_val.loc[i,'Imagen2']]})
    tensor = get_prediction(df_minitest,images_path)
    tensor=tensor.ravel()[0]

    lista_predicciones.append(tensor)

In [212]:
print(lista_predicciones[:5])

[0.57107264, 0.8720072, 0.96067595, 0.6933987, 0.12850149]
