# Problema de Classificação com Imagens: Gato ou Cachorro

Meu primeiro problema de classificação com Imagens, utilizando Redes Neurais com a biblioteca tensorflow, aqui utilizarei um modelo já treinado chamado MobileNetV2, mas primeiramente temos que fazer umas mudanças nesse modelo, pois ele classifica mais de 1000 imagens, e o nosso problema terá somente 2 classes, bora então.

#### importando as bibliotecas necessárias

In [1]:
from tqdm import tqdm_notebook
import os
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from zipfile import ZipFile
from tensorflow.keras.preprocessing.image import ImageDataGenerator

%matplotlib inline

#### Extraindo os arquivos do zip

In [None]:
# with ZipFile('cats_and_dogs_filtered.zip') as zp:
#     zp.extractall()

#### Configurando os caminhos

In [2]:
# caminho principal
main_path = './cats_and_dogs_filtered'


# caminho de treino e validação
train_dir = os.path.join(main_path, 'train')
val_dir = os.path.join(main_path, 'validation')

# caminho dos animais de treino e validação

train_cats = os.path.join(train_dir, 'cats')
val_cats = os.path.join(val_dir, 'cats')

train_dogs = os.path.join(train_dir, 'dogs')
val_dogs = os.path.join(val_dir, 'dogs')

# Configurando o modelo

#### Carregando o modelo pré-treinado (MobileNetV2)

como estamos pegando um modelo treinado, ele já carrega com as saidas definidas, o modelo mobileNetV2 tem 1000 classes definidas e como nosso modelo terá somente 2, passamos o include_top=False, para que nao seja carregado as saidas

In [3]:
# definindo o tamanho da imagem com 3 canais de cores
img_shape = (128, 128, 3)



base_model = tf.keras.applications.MobileNetV2(input_shape=img_shape, include_top=False, weights='imagenet')

In [4]:
# resumo do modelo

base_model.summary()

Model: "mobilenetv2_1.00_128"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_1 (InputLayer)            [(None, 128, 128, 3) 0                                            
__________________________________________________________________________________________________
Conv1_pad (ZeroPadding2D)       (None, 129, 129, 3)  0           input_1[0][0]                    
__________________________________________________________________________________________________
Conv1 (Conv2D)                  (None, 64, 64, 32)   864         Conv1_pad[0][0]                  
__________________________________________________________________________________________________
bn_Conv1 (BatchNormalization)   (None, 64, 64, 32)   128         Conv1[0][0]                      
_______________________________________________________________________________

### Congelando modelo base

In [5]:
# passando o objeco modelo.trainable = False, diz ao algoritmo que não queremos que os pesos sejam atualizados, nós congelamos o modelo base.

base_model.trainable = False

### Configurando o Cabeçalho personalizado da rede neural

In [6]:
# ao multiplicar o shape, o resultado será 20.480 pesos para a próxima camada
# a nossa proxima camada será a saida que queremos, gato ou cachorro. e com esse número grande
# pode gerar demora no processamento dos resultados
# utilizamos o globalAveragePooling para melhorar o desempenho
  
global_average_layer = tf.keras.layers.GlobalAveragePooling2D()(base_model.output)

In [7]:
# como podemos ver no shape, os dados foram redimensionalizado
global_average_layer

<tf.Tensor 'global_average_pooling2d/Mean:0' shape=(None, 1280) dtype=float32>

In [8]:
# criando a camada de saída
# teremos apenas um neurônio, pois temos apensa 2 classes, 0 ou 1
# passamos a função de ativação sigmoid, pois ela trata problemas de classificação com 2 classes
# passamos no final o global_average_layer, para ligar a camada densa de saida com a camada criada acima
prediction_layer = tf.keras.layers.Dense(units=1, activation="sigmoid")(global_average_layer)

### Definindo o modelo

In [9]:
#  na classe Model iremos passar 2 parâmetros, o input e o output do modelo

model = tf.keras.models.Model(inputs=base_model.input, outputs=prediction_layer)

In [10]:
# podemos ver no final, nossas 2 ultimas camadas foram adicionadas ao modelo

model.summary()

Model: "functional_1"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_1 (InputLayer)            [(None, 128, 128, 3) 0                                            
__________________________________________________________________________________________________
Conv1_pad (ZeroPadding2D)       (None, 129, 129, 3)  0           input_1[0][0]                    
__________________________________________________________________________________________________
Conv1 (Conv2D)                  (None, 64, 64, 32)   864         Conv1_pad[0][0]                  
__________________________________________________________________________________________________
bn_Conv1 (BatchNormalization)   (None, 64, 64, 32)   128         Conv1[0][0]                      
_______________________________________________________________________________________

### Compilando o modelo

In [11]:
# passando o otimizador RMSprop com o learning_rate de 0.0001
# como temos um problema de classificação com 2 classes, passamos a loss_function com binary_crossentropy
# e passamos a metrica de acuracia, que é o ideal para problemas de classificação

model.compile(optimizer=tf.keras.optimizers.RMSprop(lr=0.0001),
             loss='binary_crossentropy', metrics=["accuracy"])

### Criando geradores de dados (Data Generator)


o ImageDataGenerator é uma classe para o pré-processamento das imagens, com ela podemos, fazer todo o processamento desde redimensionamento até rotação das imagens

In [12]:
# no nosso caso iremos somente reescalar as imagens

data_gen_train = ImageDataGenerator(rescale=1/255.)
data_gen_valid = ImageDataGenerator(rescale=1/255.)

In [13]:
# criando o gerador que irá pegar as imagens do disco e fazer o nosso pré-processamento
# nos pegamos o objeto que criamos acima e pasamos a função flow_from_directory
# onde passamos o diretorio da pasta criado no começo
# passamos o batch_size que é quantas imagens o modelo irá treinar, de 128 em 128 imagens.
# passamos o class_mode='binary', pois temos somente duas classes

train_generator = data_gen_train.flow_from_directory(train_dir, target_size=(128,128), batch_size=128, class_mode='binary')
valid_generator = data_gen_valid.flow_from_directory(val_dir, target_size=(128,128), batch_size=128, class_mode='binary')

Found 2000 images belonging to 2 classes.
Found 1000 images belonging to 2 classes.


### Treinando o modelo

In [18]:
model.fit(train_generator, epochs=5, validation_data=valid_generator)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x1fd53bbe7c0>

### Avaliação do modelo de transferência de aprendizagem

In [19]:
valid_loss, valid_accuracy = model.evaluate(valid_generator)



In [20]:
# printando a perda
print('Função de Perda: ', valid_loss)

Função de Perda:  0.2200048714876175


In [21]:
# printando a acuracia
print('Acurácia: ', valid_accuracy)

Acurácia:  0.9399999976158142


Tivemos uma função de perda relativamente pequena e uma acurácia muito boa, então é isso, espero que seja a primeira de muitas. até a próxima