In [None]:
# Python ≥3.5 is required
import sys
assert sys.version_info >= (3, 5)

# Scikit-Learn ≥0.20 is required
import sklearn
assert sklearn.__version__ >= "0.20"

try:
    # %tensorflow_version only exists in Colab.
    %tensorflow_version 2.x
except Exception:
    pass

# TensorFlow ≥2.0 is required
import tensorflow as tf
assert tf.__version__ >= "2.0"

# Common imports
import numpy as np
import os

# to make this notebook's output stable across runs
np.random.seed(42)

# To plot pretty figures
%matplotlib inline
import matplotlib as mpl
import matplotlib.pyplot as plt
mpl.rc('axes', labelsize=14)
mpl.rc('xtick', labelsize=12)
mpl.rc('ytick', labelsize=12)

# Where to save the figures
PROJECT_ROOT_DIR = "."
CHAPTER_ID = "ann"
IMAGES_PATH = os.path.join(PROJECT_ROOT_DIR, "images", CHAPTER_ID)
os.makedirs(IMAGES_PATH, exist_ok=True)

def save_fig(fig_id, tight_layout=True, fig_extension="png", resolution=300):
    path = os.path.join(IMAGES_PATH, fig_id + "." + fig_extension)
    print("Saving figure", fig_id)
    if tight_layout:
        plt.tight_layout()
    plt.savefig(path, format=fig_extension, dpi=resolution)

# Ignore useless warnings (see SciPy issue #5998)
import warnings
warnings.filterwarnings(action="ignore", message="^internal gelsd")

In [None]:
from tensorflow import keras
from tensorflow.keras.preprocessing import image_dataset_from_directory


In [None]:
# Vai ser usado o mesmo dataset da última aula: classificação de imagens de caes e gatos
import os 

_URL = 'https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip'

path_to_zip = tf.keras.utils.get_file('cats_and_dogs.zip', origin=_URL, extract=True, cache_dir=os.curdir)
PATH = os.path.join(os.path.dirname(path_to_zip), 'cats_and_dogs_filtered')

In [None]:
# Conferir o número total de imagens

import pathlib 

data_dir = pathlib.Path(PATH)

image_count = len(list(data_dir.glob('*/*/*.jpg')))
print(image_count)

In [None]:
# Criação e pré-processamento dos datasets (neste caso, vamos usar apenas datasets de treino e de validaçã)
IMG_SIZE = (160, 160)

train_dir = os.path.join(PATH, 'train')
validation_dir = os.path.join(PATH, 'validation')

train_ds = image_dataset_from_directory(train_dir, shuffle=True, seed=11, image_size=IMG_SIZE)
val_ds = image_dataset_from_directory(validation_dir, shuffle=True, seed=11, image_size=IMG_SIZE)

class_names = train_ds.class_names

train_ds = train_ds.cache().prefetch(1)
val_ds = val_ds.cache().prefetch(1)

normalization_layer = keras.layers.experimental.preprocessing.Rescaling(1./255)

train_ds = train_ds.map(lambda x, y: (normalization_layer(x), y))
val_ds = val_ds.map(lambda x, y: (normalization_layer(x), y))


In [None]:
#Visualizar algumas imagens

plt.figure(figsize=(10, 10))
for images, labels in train_ds.take(1):
    for i in range(20):
        ax = plt.subplot(4, 5, i + 1)
        plt.imshow(images[i].numpy().astype("float32")) #pode ser transformado num array numpy 
        plt.title(class_names[labels[i]])
        plt.axis("off")


In [None]:
# Obter 2 imagens para análise mais detalhada 
# No código só estão a ser visualizados os efeitos na primeira imagem. Alterar para ver o que acontece com a outra

for images, labels in train_ds.take(1):
    im1 = images[0].numpy().astype("float32")
    label1 = labels[0]
    im2 = images[1].numpy().astype("float32")
    label2 = labels[1]
    
    
plt.figure(figsize=(10, 10))

ax = plt.subplot(1, 2, 1)
plt.imshow(im1)
plt.title(class_names[label1])
plt.axis("off")
ax = plt.subplot(1, 2, 2)
plt.imshow(im2)
plt.title(class_names[label2])
plt.axis("off")

In [None]:
# Ajustar a dimensão do Tensor
im1 = tf.expand_dims(im1, axis=0)

im1.shape

In [None]:
# Criar filtros verticais e horizontais 
# A última dimensão define o número de canais de output - neste caso é apenas 1 feature map por cada filtro

# Podem alterar os filtros para verificar se existem diferenças nos feature maps que são produzidos

filter1 = np.zeros(shape=(7,7,3,1), dtype = np.float32)

filter2 = np.zeros(shape=(7,7,3,1), dtype = np.float32)

filter1[: , 3 , : ,] = 2
filter1[: , 1 , : ,] = -1
filter1[: , 5 , : ,] = -1


filter2[3 , : , :,] = 2
filter2[1 , : , :,] = -1
filter2[5 , : , :,] = -1



In [None]:
filter1.shape

In [None]:
# Visualizar o filtro1 através das suas 3 camadas

a = filter1.squeeze()

R = a[:,:,0]
G = a[:,:,1]
B = a[:,:,2]

plt.figure(figsize=(10, 10))

ax = plt.subplot(1, 3, 1)
plt.imshow(R)
plt.title("R")
plt.axis("off")
ax = plt.subplot(1, 3, 2)
plt.imshow(G)
plt.title("G")
plt.axis("off")
ax = plt.subplot(1, 3, 3)
plt.imshow(B)
plt.title("B")
plt.axis("off")


In [None]:
# Completar o código para visualizar o filtro2

In [None]:
# Aplicar CNN a cada uma das imagens
# Neste caso está a ser usado o método diretamente da biblioteca TensorFlow - Não estamos a usar a API Keras
# https://www.tensorflow.org/api_docs/python/tf/nn
# https://www.tensorflow.org/api_docs/python/tf/nn/conv2d
# Ainda não está a ser aplicada a função de ativação

output1 = tf.nn.conv2d(im1, filter1, strides=1, padding="SAME")
output2 = tf.nn.conv2d(im1, filter2, strides=1, padding="SAME")

In [None]:
# Qual é a dimensão do output? Porquê?

output1.shape

In [None]:
#Visualizar o feature map obtido por cada um dos filtros
#https://www.tensorflow.org/api_docs/python/tf/squeeze

fm1 = tf.squeeze(output1)
fm2 = tf.squeeze(output2)

plt.figure(figsize=(50, 50))

ax = plt.subplot(1, 2, 1)
plt.imshow(fm1, cmap="binary")
plt.title("Vertical", fontsize=30)
plt.axis("off")
ax = plt.subplot(1, 2, 2)
plt.imshow(fm2, cmap="binary")
plt.title("Horizontal", fontsize=30)
plt.axis("off")

# Analisar os padrões que se salientam nas imagens obtidas

In [None]:
# Aplicar função de ativação RELU
# https://www.tensorflow.org/api_docs/python/tf/nn/relu

final1 = tf.nn.relu(output1)
final2 = tf.nn.relu(output2)



In [None]:
# Confirmar a dimensão do output.

final1.shape


In [None]:
#Visualizar o feature map obtido após a aplicação da função de ativação
#https://www.tensorflow.org/api_docs/python/tf/squeeze

fmF1 = tf.squeeze(final1)
fmF2 = tf.squeeze(final2)

plt.figure(figsize=(50, 50))

ax = plt.subplot(1, 2, 1)
plt.imshow(fmF1, cmap="binary")
plt.title("Vertical", fontsize=30)
plt.axis("off")
ax = plt.subplot(1, 2, 2)
plt.imshow(fmF2, cmap="binary")
plt.title("Horizontal", fontsize=30)
plt.axis("off")

In [None]:
# Exercício: Qual a dimensão dos mapas de outputs em cada uma destas 4 situações?
# Dimensões de input: Imagem (160, 160, 3), Filtro (7, 7, 3)

outputE0 = tf.nn.conv2d(im1, filter1, strides=1, padding="SAME")

outputE1 = tf.nn.conv2d(im1, filter1, strides=2, padding="SAME")

outputE2 = tf.nn.conv2d(im1, filter1, strides=1, padding="VALID")

outputE3 = tf.nn.conv2d(im1, filter1, strides=2, padding="VALID")


In [None]:
# Verificar os resultados aqui


In [None]:
# Aplicação de uma camada MaxPool

pool1 = tf.nn.max_pool(final1, 2, strides=2, padding="SAME")
pool2 = tf.nn.max_pool(final2, 2, strides=2, padding="SAME")

In [None]:
#Confirmar o Downsampling da imagem

pool1.shape

In [None]:
plt.figure(figsize=(20, 20))

p1 = tf.squeeze(pool1)
p2 = tf.squeeze(pool2)

ax = plt.subplot(1, 2, 1)
plt.imshow(p1, cmap="binary")
plt.title("Vertical", fontsize=30)
plt.axis("off")
ax = plt.subplot(1, 2, 2)
plt.imshow(p2, cmap="binary")
plt.title("Horizontal", fontsize=30)
plt.axis("off")

In [None]:
# Criação de uma CNN Simples
# Vai ser criado um modelo sequencial em que as camadas se sucedem umas às outras
# https://www.tensorflow.org/api_docs/python/tf/keras/Model
# https://www.tensorflow.org/guide/keras/sequential_model
# https://keras.io/api/layers/

keras.backend.clear_session()
tf.random.set_seed(42)
np.random.seed(42)

model = keras.Sequential([
    keras.layers.Conv2D(32, 3, activation='relu', padding='same', input_shape=[160, 160, 3]),
    keras.layers.MaxPooling2D(),
    keras.layers.Conv2D(32, 3, activation='relu',padding='same'),
    keras.layers.Conv2D(64, 3, activation='relu',padding='same'),
    keras.layers.MaxPooling2D(),
    keras.layers.Flatten(),
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(1, activation="sigmoid")    
])

In [None]:
# Exercício: Descrever as características desta CNN

# Quais são as camadas de extração de features?

# Quais são as camadas de classificação?


In [None]:
# Mostrar detalhes e sumario
# Explicar o número de parâmetros de cada camada

model.summary()

In [None]:
#Obter detalhes da terceira camada CNN (4ª camada da rede)

my_layer = model.layers[3]
my_layer.name

In [None]:
weights, biases = my_layer.get_weights()
print("Weights Shape: ", weights.shape)
print("Biases Shape: ", biases.shape)

# Explicar os valores obtidos

In [None]:
# Compilar o modelo 
# A função de loss está ajustada ao formato da saída

model.compile(loss="binary_crossentropy",
              optimizer="adam",
              metrics=["accuracy"])

In [None]:
history = model.fit(
  train_ds,
  validation_data=val_ds,
  epochs=10
)

In [None]:
# Visualização da evolução da accurary e da loss

import pandas as pd 
history_frame = pd.DataFrame(history.history)
history_frame.loc[:, ['loss', 'val_loss']].plot()
history_frame.loc[:, ['accuracy', 'val_accuracy']].plot()

In [None]:
# Analisar resultados 



In [None]:
# Melhorar o desempenho através da alteração da arquitetura da CNN
# Experimente igualmente adicionar mecanismos de combate ao overfitting, como Dropout e/ou Batch Normalization

keras.backend.clear_session()
tf.random.set_seed(42)
np.random.seed(42)

# CRIAR NOVO MODELO chamado model2



In [None]:
model2.summary()

In [None]:
# Compilar e treinar
model2.compile(loss="binary_crossentropy",
              optimizer="adam",
              metrics=["accuracy"])


history = model2.fit(
  train_ds,
  validation_data=val_ds,
  epochs=10
)


In [None]:
# Analisar resultados

import pandas as pd 
history_frame = pd.DataFrame(history.history)
history_frame.loc[:, ['loss', 'val_loss']].plot()
history_frame.loc[:, ['accuracy', 'val_accuracy']].plot()

In [None]:
# Aplicar a casos de teste

imA = 'ex1.JPG'
imB = 'ex2.JPG'

a = tf.keras.preprocessing.image.load_img(imA, target_size=IMG_SIZE)
b = tf.keras.preprocessing.image.load_img(imB, target_size=IMG_SIZE)

input1 = keras.preprocessing.image.img_to_array(a)
input2 = keras.preprocessing.image.img_to_array(b)
input1 = input1.astype('float32') / 255
input2 = input2.astype('float32') / 255

teste = np.array([input1, input2])
teste.shape


In [None]:
predictions = model2.predict(teste)
predictions = predictions.squeeze()
predictions = np.where(predictions > 0.5, 1,0)
print(predictions)

In [None]:
# Mostrar o resultado

plt.figure(figsize=(10,10))
for i in range(2):
    ax = plt.subplot(2,2,i + 1)
    plt.imshow(teste[i]) 
    plt.title(class_names[predictions[i]])
    plt.axis("off")