### Projeto da DIO - Transfer Learning
#### Resumo: Será utilizado uma rede neural já existente para classificar uma amostra de imagens.
#### Essa rede já foi treinada com uma base de dados grande com boa precisão/performance.

In [7]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
# NOTE: Importando bibliotecas principais
import os
import random
import numpy as np
import keras
import matplotlib.pyplot as plt
from matplotlib.pyplot import imshow
from keras.preprocessing import image
from keras.applications.imagenet_utils import preprocess_input
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten, Activation
from keras.layers import Conv2D, MaxPooling2D
from keras.models import Model

import warnings
warnings.filterwarnings("ignore")

In [9]:
# Descompactando o arquivo zip dentro do diretório do colab
!unzip -q "/content/drive/MyDrive/Colab Notebooks/kagglecatsanddogs_5340.zip"
# Para mais informações sore o "!unzip", digitar "!unzip --help"

In [3]:
# Função criada para transformar uma imagem em um vetor
# (criada por outro colaboratório)
def get_image(path):
    img = image.load_img(path, target_size=(224, 224))
    x = image.img_to_array(img)
    x = np.expand_dims(x, axis=0)
    x = preprocess_input(x)
    return img, x

In [10]:
# Analisando cada pasta do dataset e transformando cada imagem num vetor
# Depois organizando esses dados num dicionário
path_imagens_cat_dog = "/content/PetImages"
categorias = os.listdir(path_imagens_cat_dog)
lista_imagens_vetores = []
# É necessário limitar o número de imagens analisadas pois a RAM do colab é limitada.
# Portanto, não é possível utilizar as 12.500 imagens de cada categoria livremente aqui.
limitador = 1000
for c, categoria in enumerate(categorias):
  arquivos_categoria = os.listdir(f"/content/PetImages/{categoria}")
  cont = 0
  for imagens in arquivos_categoria:
    path_mutav = f"/content/PetImages/{categoria}/{imagens}"
    if ('.jpg' in str(imagens)) or ('.png' in str(imagens)) or ('.jpeg' in str(imagens)):
      try:
        img, x = get_image(path_mutav)
        # Adicionando dicionário dentro de uma lista
        lista_imagens_vetores.append({'x':np.array(x[0]), 'y':c})
      except:
        continue
      cont = cont + 1
      if cont == limitador:
        break

In [11]:
# Misturando os dados de cada lista
random.shuffle(lista_imagens_vetores)
# Definindo pesos para os dados de treinamento
train_split, val_split = 0.7, 0.15
# Número de classes do problema estudado
número_classes = len(categorias)

In [12]:
# Separando, dentro da base toda, os dados de treino a partir do id de localização (posição de ordem na lista)
idx_val = int(train_split * len(lista_imagens_vetores))

# Separando, dentro da base toda, os dados de testes a partir do id de localização (posição de ordem na lista)
idx_test = int((train_split + val_split) * len(lista_imagens_vetores))

# Separando os conjuntos de dados com base nas localizações estabelecidas
train = lista_imagens_vetores[:idx_val]
val = lista_imagens_vetores[idx_val:idx_test]
test = lista_imagens_vetores[idx_test:]
# Separando entre dados de entrada e rótulos de cada entrada
x_train, y_train = np.array([t["x"] for t in train]), [t["y"] for t in train]
x_val, y_val = np.array([t["x"] for t in val]), [t["y"] for t in val]
x_test, y_test = np.array([t["x"] for t in test]), [t["y"] for t in test]

## Apenas para facilitar o entendimento:
##### 0 -> equivale à cachorro
##### 1 -> equivale à gato

In [13]:
# Normalizando dados (convertendo o tipo de dado para float32)
x_train = x_train.astype('float32') / 255.
x_val = x_val.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.

# Convertendo cada rótulo para one-hot (usado para distinguir cada classe, transformada cada uma em um vetor composto por 0 e 1)
y_train = keras.utils.to_categorical(y_train, número_classes)
y_val = keras.utils.to_categorical(y_val, número_classes)
y_test = keras.utils.to_categorical(y_test, número_classes)

In [14]:
# Resumo dos dados (não foi traduzido para agilizar o processo)
print("finished loading %d images from %d categories"%(len(lista_imagens_vetores), número_classes))
print("train / validation / test split: %d, %d, %d"%(len(x_train), len(x_val), len(x_test)))
print("training data shape: ", x_train.shape)
print("training labels shape: ", y_train.shape)

finished loading 2000 images from 2 categories
train / validation / test split: 1400, 300, 300
training data shape:  (1400, 224, 224, 3)
training labels shape:  (1400, 2)


In [15]:
# Construindo a rede neural (existem etapas daqui que preciso estudar melhor)
model = Sequential()
print("Dimensões de entrada",x_train.shape[1:])

model.add(Conv2D(32, (3, 3), input_shape=x_train.shape[1:]))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Dropout(0.25))

model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Dropout(0.25))

model.add(Flatten())
model.add(Dense(256))
model.add(Activation('relu'))

model.add(Dropout(0.5))

model.add(Dense(número_classes))
model.add(Activation('softmax'))

model.summary()

Dimensões de entrada (224, 224, 3)


In [18]:
# Utilizando a entropia cruzada categórica e adadelta
# Epoch utilizado igual a 1, pois demora bastante com valores superiores
model.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

history = model.fit(x_train, y_train,
                    batch_size=128,
                    epochs=1,
                    validation_data=(x_val, y_val))


[1m11/11[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m121s[0m 11s/step - accuracy: 0.5013 - loss: 0.7225 - val_accuracy: 0.5033 - val_loss: 0.6929


In [22]:
loss, accuracy = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', loss)
print('Test accuracy:', accuracy)

Test loss: 0.6917386651039124
Test accuracy: 0.5266666412353516


## Utilizando rede neural existente

In [23]:
vgg = keras.applications.VGG16(weights='imagenet', include_top=True)
vgg.summary()

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/vgg16/vgg16_weights_tf_dim_ordering_tf_kernels.h5
[1m553467096/553467096[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 0us/step


In [24]:
# Parte copiada e colada para facilitar
# make a reference to VGG's input layer
inp = vgg.input

# make a new softmax layer with num_classes neurons
new_classification_layer = Dense(número_classes, activation='softmax')

# connect our new layer to the second to last layer in VGG, and make a reference to it
out = new_classification_layer(vgg.layers[-2].output)

# create a new network between inp and out
model_new = Model(inp, out)

In [25]:
# Parte copiada e colada para facilitar
# make all layers untrainable by freezing weights (except for last layer)
for l, layer in enumerate(model_new.layers[:-1]):
    layer.trainable = False

# ensure the last layer is trainable/not frozen
for l, layer in enumerate(model_new.layers[-1:]):
    layer.trainable = True

model_new.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

model_new.summary()

In [27]:
history2 = model_new.fit(x_train, y_train,
                         batch_size=128,
                         epochs=1,
                         validation_data=(x_val, y_val))


[1m11/11[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1127s[0m 104s/step - accuracy: 0.5065 - loss: 0.8283 - val_accuracy: 0.5167 - val_loss: 0.6540


In [28]:
loss2, accuracy2 = model_new.evaluate(x_test, y_test, verbose=0)

print('Test loss:', loss2)
print('Test accuracy:', accuracy2)

Test loss: 0.6371323466300964
Test accuracy: 0.5366666913032532


In [29]:
# Comparando os dois modelos:
print('1° modelo')
print('Test loss:', loss)
print('Test accuracy:', accuracy)
print('')
print('2° modelo')
print('Test loss 2:', loss2)
print('Test accuracy 2:', accuracy2)


1° modelo
Test loss: 0.6917386651039124
Test accuracy: 0.5266666412353516

2° modelo
Test loss 2: 0.6371323466300964
Test accuracy 2: 0.5366666913032532
