In [None]:
# check whether GPU is provided
!nvcc --version
!nvidia-smi

In [None]:
# %cd ..
from google.colab import drive
drive.mount('/content/gdrive')

In [None]:
import kagglehub

# Download latest version
path = kagglehub.dataset_download("paultimothymooney/chest-xray-pneumonia")

print("Path to dataset files:", path)

In [None]:
!cp /content/gdrive/MyDrive/datasets/chest_xray.zip .

In [None]:
import os
import zipfile

local_zip = 'chest_xray.zip'
zip_ref = zipfile.ZipFile(local_zip, 'r')
zip_ref.extractall('data/')
zip_ref.close()

In [None]:
import os
import numpy as np
from keras.preprocessing.image import ImageDataGenerator

base_dir = 'data/'

train_dir = os.path.join(base_dir, 'train')
validation_dir = os.path.join(base_dir, 'test')
# test_dir = os.path.join(base_dir, 'test')

**Building our network**

In [None]:
from tensorflow.keras import layers
from tensorflow.keras import models

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu',
                        input_shape=(150, 150, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(2, activation='softmax'))

In [None]:
model.summary()

In [None]:
from tensorflow.keras import optimizers

# compile the model
model.compile(loss='sparse_categorical_crossentropy',
              optimizer=optimizers.RMSprop(learning_rate=1e-4),
              metrics=['acc'])

**Data preprocessing**

Devemos converter os dados em tensores de ponto flutuante. Devemos seguir as seguintes etapas:

Leia os arquivos de imagem.
Decodifique em pixels RGB
Converta-os em tensores de ponto flutuante.
Rescale de cada pixels de (0 a 255) para [0, 1]

O keras.preprocessing.image contém a classe ImageDataGenerator, que permite configurar geradores Python que podem transformar automaticamente arquivos de imagem em disco em lotes de tensores pré-processados.


In [None]:
from keras.preprocessing.image import ImageDataGenerator

# All images will be rescaled by 1./255
train_datagen = ImageDataGenerator(rescale=1./255)
validation_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
        # This is the target directory
        train_dir,
        # All images will be resized to 150x150
        target_size=(150, 150),
        batch_size=20,
        # Since we use binary_crossentropy loss, we need binary labels
        class_mode='sparse')

validation_generator = validation_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=12,
        class_mode='sparse')

Vamos dar uma olhada no formato dos arquivos gerados pelo python

Foram produzidos batches de imagens RGB de 150x150 (shape (20, 150, 150, 3)) e labels binárias (shape (20,))

20 é o número de amostras em cada batch (o tamanho do batch)

In [None]:
for data_batch, labels_batch in train_generator:
    print('data batch shape:', data_batch.shape)
    print('labels batch shape:', labels_batch.shape)
    break

**Treinando o modelo**

Vamos ajustar nosso modelo aos dados usando o gerador, usando o método **fit_generator**

train_generator: (primeiro argumento) produzirá batches indefinidamente.

Como os dados estão sendo gerados infinitamente, o gerador precisa saber por exemplo quantas amostras extrair do gerador antes de declarar uma época.

Assim, usamos o **steps_per_epoch** para que, depois de extrair "steps_per_epoch" batches do gerador, o model.fit irá para a próxima época. Neste caso, cada batch possui 20 amostras, portanto, serão necesssário 100 batches até atingirmos o objetivo de 2000 amostras.

**validation_data**: pode ser um gerador (como neste caso) e portanto, temos que fornecer o argumento **validation_steps** pois o gerador irá gerar dados infinitamente. O argumento validation_steps determina quantos batches serão extraídos do gerador Python de validação para a avaliação do modelo (50 pois nosso conjunto de validação possui 1000 amostras).


In [None]:
history = model.fit(
      train_generator,
      steps_per_epoch=50,
      epochs=10,
      validation_data=validation_generator,
      validation_steps=50)

In [None]:
model.save('chest_xray.h5')

Vamos plotar a loss e a acurácia do modelo sobre os dados de treinamento e validação durante o treinamento:


In [None]:
import matplotlib.pyplot as plt

acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']

epochs = range(len(acc))

plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='Validation acc')
plt.title('Training and validation accuracy')
plt.legend()

plt.figure()

plt.plot(epochs, loss, 'bo', label='Training loss')
plt.plot(epochs, val_loss, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.legend()

plt.show()

Observe que a acurácia dos dados de treinamento aumenta linearmente ao longo do tempo até atingir quase 100% (e validação não passa de 70%).

A validation loss atinge seu mínimo depois de apenas cinco épocas, e a train loss continua diminuindo linearmente até atingir quase 0.

Como temos apenas poucas amostras de treinamento (2000), o maior risco é de overfitting (poderíamos resolver o problema com dropout).

No entanto, usaremos uma técnica muito como para visão computacional que pode solucionar o problema de overfitting: **data augmentation**



Mas, antes de abordarmos o assunto de data augmentation, vamos aprender a realizar algumas poredições no nosso modelo treinado.

**Realizando Predições**

Obtendo uma imagem de exemplo usando no treinamento (veja que esta imagem já está pré-processada)

In [None]:
data_batch, labels_batch = validation_generator[0]
print('data batch shape:', data_batch.shape)
print(data_batch[5].shape)

x = data_batch[5]

Observe o shape da imagem (150, 150, 3), para a predição temos que converter para um tensor 4D

In [None]:
x = x.reshape(1, 150, 150, 3)

print (x.shape)

Realizando a inferência: a loss function binary_crossentropy retorna um valor de probabilidade entre 0 e 1 para a classificação binária (cat - 0 e dog - 1)

In [None]:
prob = model.predict(x)

# print(prob)

print(np.around(model.predict(x), 2))

preds = np.argmax(model.predict(x), axis=-1)

print(preds)

Código usado na produção

Abrindo uma imagem diretamente do diretório. Obsserve que agora a imagem não está pre-processada

In [None]:
from google.colab.patches import cv2_imshow
import numpy as np
import cv2

# path = os.path.join(base_dir, 'validation/dogs/dog.2027.jpg')
path = os.path.join(base_dir, 'test/PNEUMONIA/person109_bacteria_528.jpeg')

img = cv2.imread(path)
cv2_imshow(img)

In [None]:
print(img.shape)

Vamos carregar a imagem usando PIL (biblioteca para processamento de imagens em Python)

In [None]:
from tensorflow.keras.preprocessing.image import array_to_img, img_to_array, load_img
from PIL import Image

img = load_img(path, target_size=(150, 150))

Rescale de cada pixels de (0 a 255) para [0, 1]

In [None]:
from numpy import asarray

img = asarray(img)

print('Data Type: %s' % img.dtype)
print('Min: %.3f, Max: %.3f' % (img.min(), img.max()))

img = img.astype('float32')
img /= 255.0

print('Min: %.3f, Max: %.3f' % (img.min(), img.max()))

In [None]:
x = img_to_array(img)  # this is a Numpy array with shape (3, 150, 150)
x = x.reshape((1,) + x.shape)  # this is a Numpy array with shape (1, 3, 150, 150)

print(x.shape)

In [None]:
prob = model.predict(x)

preds = np.argmax(model.predict(x), axis=-1)

print(prob, preds)

print(np.around(model.predict(x), 2))

**Usando data augmentation**

O problema de overfitting foi causado por ter poucas amostras para aprender, ou seja, faz com que o modelo seja incapazes de generalizar para novos dados.

Data augmentation gera mais dados de treinamento a partir de amostras existentes de treinamento, por meio de várias transformações aleatórias que produzem novas imagens.

O objetivo é que, durante o treinamento, nosso modelo nunca veja exatamente a mesma imagem duas vezes. Isso ajuda o modelo a se expor a mais aspectos dos dados e a generalizar melhor.

Você pude utilizar operações de processamento de imagens comuns para produzir novas amostras de dados a partir das imagens de treinamento.

Acesse para exemplos:

https://github.com/albumentations-team/albumentations

https://github.com/codebox/image_augmentor


No Keras, isso pode ser feito configurando várias transformações aleatórias a serem executadas nas imagens lidas pela nossa instância do ImageDataGenerator.


In [None]:
datagen = ImageDataGenerator(
      # rotation_range=40,
      width_shift_range=0.2,
      height_shift_range=0.2,
      shear_range=0.2,
      zoom_range=0.2,
      horizontal_flip=True,
      fill_mode='nearest')

Estas são apenas algumas das opções disponíveis (para mais, consulte a documentação do Keras).

rotation_range é um valor em graus (0-180), um intervalo no qual gira aleatoriamente as imagens.

width_shift e height_shift são intervalos dentro dos quais rotaciona aleatoriamente imagens na vertical ou na horizontal.

shear_range é para aplicar aleatoriamente transformações de cisalhamento.

zoom_range é para ampliar aleatoriamente as imagens.

horizontal_flip é para virar aleatoriamente metade das imagens horizontalmente

fill_mode é a estratégia usada para preencher pixels recém-criados, que podem aparecer após uma rotação ou uma mudança de largura / altura.

In [None]:
# Directory with our training cat pictures
train_NORMAL_dir = os.path.join(train_dir, 'NORMAL')

# Directory with our training dog pictures
train_PNEUMONIA_dir = os.path.join(train_dir, 'PNEUMONIA')


# Directory with our validation cat pictures
validation_NORMAL_dir = os.path.join(validation_dir, 'NORMAL')

# Directory with our validation dog pictures
validation_PNEUMONIA_dir = os.path.join(validation_dir, 'PNEUMONIA')


In [None]:
from tensorflow.keras.preprocessing import image

fnames = [os.path.join(train_NORMAL_dir, fname) for fname in os.listdir(train_NORMAL_dir)]

# We pick one image to "augment"
img_path = fnames[3]

# Read the image and resize it
img = image.load_img(img_path, target_size=(150, 150))

# Convert it to a Numpy array with shape (150, 150, 3)
x = image.img_to_array(img)

# Reshape it to (1, 150, 150, 3)
x = x.reshape((1,) + x.shape)

# The .flow() command below generates batches of randomly transformed images.
# It will loop indefinitely, so we need to `break` the loop at some point!
i = 0
for batch in datagen.flow(x, batch_size=1):
    plt.figure(i)
    imgplot = plt.imshow(image.array_to_img(batch[0]))
    i += 1
    if i % 4 == 0:
        break

plt.show()

Se treinarmos uma nova rede usando data augmentation, a rede nunca verá duas vezes a mesma entrada. No entanto, isso pode não ser suficiente para se livrar completamente do problema de overfitting. Para isso, também adicionaremos uma camada Dropout ao modelo.

In [None]:
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu',
                        input_shape=(150, 150, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dropout(0.5))
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(4, activation='softmax'))

model.compile(loss='sparse_categorical_crossentropy',
              optimizer=optimizers.RMSprop(learning_rate=1e-4),
              metrics=['acc'])

Treinando o modelo usando data augmentation e dropout



In [None]:
train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,)

# Note that the validation data should not be augmented!
validation_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
        # This is the target directory
        train_dir,
        # All images will be resized to 150x150
        target_size=(150, 150),
        batch_size=20,
        # Since we use binary_crossentropy loss, we need binary labels
        class_mode='sparse')

validation_generator = validation_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=12,
        class_mode='sparse')

history = model.fit(
      train_generator,
      steps_per_epoch=50,
      epochs=10,
      validation_data=validation_generator,
      validation_steps=50)

In [None]:
model.save('chest_xray_2.h5')

In [None]:
acc = history.history['acc']
val_acc = history.history['val_acc']
loss = history.history['loss']
val_loss = history.history['val_loss']

epochs = range(len(acc))

plt.plot(epochs, acc, 'bo', label='Training acc')
plt.plot(epochs, val_acc, 'b', label='Validation acc')
plt.title('Training and validation accuracy')
plt.legend()

plt.figure()

plt.plot(epochs, loss, 'bo', label='Training loss')
plt.plot(epochs, val_loss, 'b', label='Validation loss')
plt.title('Training and validation loss')
plt.legend()

plt.show()

Observe que agora não estamos mais enfrentando o problema de overfitting.

As curvas de treinamento estão acompanhando de perto as curvas de validação.

Referência: François Chollet. Deep Learning with Python. November 2017