# Modelowanie na danych obrazowych
Przechodzimy do części zajmującej się przygotowaniem kilku modeli oraz wybraniem zeń najlepszego kandydata do naszych finalnych rozważań dotyczących związanych z naszymi bazami danych. Rozważanymi przez nas architekturami będą autorsko tworzone architektury w framework'u keras. Oczywiście nie jest to koniecznie finalna architektura w przypadku całego projektu i w przypadku znalezienia lepszego rozwiązania dla naszego rozwiązania, zastosujemy je.

Przygotowywanie bibliotek.

In [44]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
import PIL
from PIL import Image
import os
from pathlib import Path
import numpy as np
from sklearn.model_selection import train_test_split
import pandas as pd
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from sklearn.metrics import accuracy_score

## Dane oraz cel modelu
Za pomocą naszych wcześniej wytworzonych narzędzi przygotowaliśmy jeden zbiór danych złożonych z danych pochodzących z następujących zbiorów danych:
- covidx-cxr2
- qatacov19-dataset
- siim-acr-pneumothorax-segmentation
- Shenzhen 
- rsna-pneumonia-detection-challenge 
Dane zostały podzielone na zbiory testowy, treningowy oraz walidacyjny (walidacyjny nie został ujęty w części treningowej).  
Dane we wszystkich zbiorach zostały jednakowo przetworzone i ustandaryzowane wedle narzędzi zaopatrzonych w pracy domowej 4.  
Celem naszego utworzonego zadania będzie klasyfikacja wielo-klasowa polegająca na predykcji choroby na podstawie skanu roentgena klatki piersiowej.  
W naszej bazie zostały zawarte następujące klasy z następująco przypisanymi im encodingami:  
- 0 - zdrowy
- 1 - covid 
- 2 - tuberculosis 
- 3 - pneumonia
Naszym zadaniem będzie poprawnie sklasyfikować daną etykiete.  
W zbiorze danych nie zawarliśmy wszystkich używanych przez nas baz danych ze względu na zbyt duże różnice między nimi by móc jakkolwiek logicznie dokonać ich konkatenacji i uczenia (np. jeden zbiór z danymi był tomografią komputerową podczas gdy reszta danych była skanami roentgena więc ich łączenie nie miałoby sensu).  
 **Uwaga** Dane były zrównoważone, tudzież jest tyle samo danych z każdej klasy, zatem użycie miary accuracy w dalszych rozważaniach będzie adekwatne.

In [2]:
labels = pd.read_csv(r'C:\Users\aaf6\Desktop\WB-2\Data_full\etykiety.csv')
labels = labels['class']

In [3]:
#Wgranie i przygotowanie danych
data = []
names = []
PATH = r'C:\Users\aaf6\Desktop\WB-2\Data_full\dataformodel'
files = Path(PATH).glob('*')
for file in files:
    names.append(str(file).split('\\')[-1])
    image = Image.open(file)
    data.append(np.asarray(image))

In [4]:
X_train, X_test, y_train, y_test = train_test_split(data, labels, test_size=0.33, random_state=42)

Poniżej zamieszczono pobranie danych za pomocą wbudowanego modułu kerasowego, wymagało to przydzielenie instancji klas do osobnych folderów.

In [39]:
train = ImageDataGenerator()
train_dataset = train.flow_from_directory(r"C:\\Users\\aaf6\\Desktop\\WB-2\\Data_full_train\\")

Found 1344 images belonging to 4 classes.


In [40]:
test = ImageDataGenerator()
test_dataset = train.flow_from_directory(r"C:\\Users\\aaf6\\Desktop\\WB-2\\Data_full_test\\")

Found 400 images belonging to 4 classes.


### Tworzenie modeli
Poniżej dokonaliśmy utworzenia 5 testowych modeli za pomocą framework'u keras. Każdy zeń różni się nieznacznie jeżeli chodzi o złożoność oraz ilość warstw, jednakże każdy opiera się na podobnej architekturze naprzemiennych warstw konwolucyjnych oraz Pooling. W celu zabezpieczenia przed przeuczeniem zawarliśmy również warstwy *Dropout* w niektórych modelach.

Pierwszy model był naszym testowym, "domyślnym" o "sensownej" wielkości. Architektura zawarta została poniżej.  
W kerasie możliwym jest stworzenie modelu poprzez podawanie naprzemiennie warstw jakie chcemy ująć w naszsej architekturze.

In [31]:
model = keras.Sequential(
    [
        layers.Conv2D(16, (3,3), strides=2, activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(32, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Dropout(0.1),
        layers.Conv2D(64, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dense(128, activation="relu"),
        layers.Dropout(0.15),
        layers.Dense(4, activation="softmax")
    ]
)


Nasz drugi model został powiększony o dodatkowe dwa zestawy warstw konwolucyjnych oraz pooling. Ponieważ zdjęcia w naszej bazie są dość dużej rozdzielczości, użycie głębszej sieci może okazać się bardziej optymalne.

In [34]:
model_2 = keras.Sequential(
    [
        layers.Conv2D(16, (3,3), strides=2, activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Dropout(0.15),
        layers.Conv2D(32, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Dropout(0.1),
        layers.Conv2D(64, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(32, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dense(32, activation="relu"),
        layers.Dropout(0.15),
        layers.Dense(4, activation="softmax")
    ]
)


Niewielkie różnice względem pierwszego modelu, zmienione zostały wartości okna w poolingu.

In [36]:
model_3 = keras.Sequential(
    [
        layers.Conv2D(16, (3,3), strides=2, activation="relu"),
        layers.MaxPooling2D(pool_size=(4, 4)),
        layers.Dropout(0.15),
        layers.Conv2D(32, (4,4), activation="relu"),
        layers.MaxPooling2D(pool_size=(4, 4)),
        layers.Dropout(0.1),
        layers.Flatten(),
        layers.Dense(64, activation="relu"),
        layers.Dropout(0.15),
        layers.Dense(4, activation="softmax")
    ]
)

Poniższy cechuje się różnymi wartościami okien w warstwach konwolucyjnych oraz ilości neuronów w warstwie gęstej.

In [64]:
model_4 = keras.Sequential(
    [
        layers.Conv2D(16, (3,3), strides=2, activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(32, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(4, 4)),
        layers.Conv2D(64, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dense(512,activation = 'relu'),
        layers.Dense(4, activation="softmax")
    ]
)

I ostatnia nasza architektura, cechująca się ponownie większą głębokością, lecz o innej wielkości okna w warstwie poolingu (2x2) oraz większej głębokości niż "domyślna" architektura.

In [71]:
model_5 = keras.Sequential(
    [
        layers.Conv2D(16, (3,3), strides=2, activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(32, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(32, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(32, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, (3,3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dense(512,activation = 'relu'),
        layers.Dense(4, activation="softmax")
    ]
)

## Etap uczenia
Poniżej przechodzimy do etapu uczenia naszych modeli na treningowej bazie danych. Treningu dokonaliśmy dla każdego z modeli na podobnej konfiguracji (optimizer RMSPROP oraz funkcja starty categorical_crossentropy przy batch size wynoszącym 32).  W ogólności przez charakter funkcjonowania warstw konwolucyjnych, rozdzielczość i sama ilość zdjęć, czas uczenia jest dość długi, chociaż nie przekracza 1 godziny.

In [33]:
model.compile(optimizer="rmsprop",metrics=['accuracy'],loss='categorical_crossentropy')
model.fit(x=train_dataset, batch_size=32, epochs=50)

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


AttributeError: 'Sequential' object has no attribute 'precict'

Powyższy błąd wynikał z lietrówki, nie należy się nim przejmować, został naprawiony i nie wpływa na sieć, ani jej uczenie.

In [35]:
model_2.compile(optimizer="rmsprop",metrics=['accuracy'],loss='categorical_crossentropy')
model_2.fit(x=train_dataset, batch_size=32, epochs=20)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x1dd45e79c40>

In [37]:
model_3.compile(optimizer="rmsprop",metrics=['accuracy'],loss='categorical_crossentropy')
model_3.fit(x=train_dataset, batch_size=32, epochs=20)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x1dd45ed02e0>

In [65]:
model_4.compile(optimizer="rmsprop",metrics=['accuracy'],loss='categorical_crossentropy')
model_4.fit(x=train_dataset, batch_size=32, epochs=40)

Epoch 1/40
Epoch 2/40
Epoch 3/40
Epoch 4/40
Epoch 5/40
Epoch 6/40
Epoch 7/40
Epoch 8/40
Epoch 9/40
Epoch 10/40
Epoch 11/40
Epoch 12/40
Epoch 13/40
Epoch 14/40
Epoch 15/40
Epoch 16/40
Epoch 17/40
Epoch 18/40
Epoch 19/40
Epoch 20/40
Epoch 21/40
Epoch 22/40
Epoch 23/40
Epoch 24/40
Epoch 25/40
Epoch 26/40
Epoch 27/40
Epoch 28/40
Epoch 29/40
Epoch 30/40
Epoch 31/40
Epoch 32/40
Epoch 33/40
Epoch 34/40
Epoch 35/40
Epoch 36/40
Epoch 37/40
Epoch 38/40
Epoch 39/40
Epoch 40/40


<keras.callbacks.History at 0x1dd459b6910>

In [72]:
model_5.compile(optimizer="rmsprop",metrics=['accuracy'],loss='categorical_crossentropy')
model_5.fit(x=train_dataset, batch_size=32, epochs=40)

Epoch 1/40
Epoch 2/40
Epoch 3/40
Epoch 4/40
Epoch 5/40
Epoch 6/40
Epoch 7/40
Epoch 8/40
Epoch 9/40
Epoch 10/40
Epoch 11/40
Epoch 12/40
Epoch 13/40
Epoch 14/40
Epoch 15/40
Epoch 16/40
Epoch 17/40
Epoch 18/40
Epoch 19/40
Epoch 20/40
Epoch 21/40
Epoch 22/40
Epoch 23/40
Epoch 24/40
Epoch 25/40
Epoch 26/40
Epoch 27/40
Epoch 28/40
Epoch 29/40
Epoch 30/40
Epoch 31/40
Epoch 32/40
Epoch 33/40
Epoch 34/40
Epoch 35/40
Epoch 36/40
Epoch 37/40
Epoch 38/40
Epoch 39/40
Epoch 40/40


<keras.callbacks.History at 0x1dd459b6700>

Jak można było zauważyć, dla każdej z architektury osiągana wartość accuracy była niezwykle wysoka, wręcz przyrównywała się do jedynki. Podejrzanym faktorem jest potencjalne przeuczenie sieci bądź zbyt wielkie różnice w zdjęciach pomiędzy różnymi bazami danych, z których pochodziły dane. Zastosowanie zbioru walidacyjnego będzie konieczne przy zastosowaniu i konfiguracji naszego ostatecznego modelu.

## Dokonywanie predykcji oraz analizowanie poprawności modeli na danych testowych
Na koniec dokonamy sprawdzenia miary accuracy (dane były zrównoważone) na danych testowych (również zbiór zrównoważony) dla poszczególnych modeli.

In [79]:
#Funkcja pomocnicza do dokonywania predykcji
def prepare_labels_test(model):
    labels_pred = model.predict(test_dataset)
    labels_predicted = []
    for i in range(labels_pred.shape[0]):
        labels_predicted.append(list(labels_pred[i]).index(max(labels_pred[i])))
    return labels_predicted

In [80]:
#model 1
labels = prepare_labels_test(model)
accuracy_score(test_dataset.classes, labels)

0.21

In [85]:
#model 2
labels = prepare_labels_test(model_2)
accuracy_score(test_dataset.classes, labels)

0.2325

In [86]:
#model 3
labels = prepare_labels_test(model_3)
accuracy_score(test_dataset.classes, labels)

0.2475

In [87]:
#model 4
labels = prepare_labels_test(model_4)
accuracy_score(test_dataset.classes, labels)

0.27

In [88]:
#model 5
labels = prepare_labels_test(model_5)
accuracy_score(test_dataset.classes, labels)

0.25

## Wnioski
Poniżej zamieszczam streszczone wnioski oraz uwagi dla naszych modeli, które będziemy musieli wziąć pod uwagę przy wyborze naszego ostatecznego modelu (i jego modyfikacji).  
- Niestety ale modele wykazywały się dość niską miarą accuracy na danych testowych (blisko zgadywania) oraz bardzo dużymi na zbiorze treningowym, co jest dość nadzwyczajne gdyż dane pochodziły z jednej próbki co oznacza, iż powiniśmy jeszcze raz sprawdzić (i być może wyeksplorować dane testowe i treningowe) dane
- W zbiorze treningowym dysponowaliśmy 1344 zdjęciami, co może być niewystarczającą ilością i doszło do zwyczajnego przeuczenia się, będziemy musieli zwiększyć ilość danych .
- należy wziąć pod uwagę skorzystanie z głębszej sieci, która lepiej wyekstraktuje cechy naszych danych, gdyż istnieje podejrzenie zbyt płytkiej architektury
- przydałoby się dokonać przetasowania danych (shuffle) by zoptymalizować uczenie