# Laboratorium: Analiza obraz√≥w przy pomocy sieci konwolucyjnych

## ≈Åadowanie danych

Do za≈Çadowania danych skorzystamy z pakietu Tensorflow Datasets, kt√≥ry udostƒôpnia wiele zbior√≥w przydatnych do uczenia maszynowego. Aby utrzymaƒá wzglƒôdnie kr√≥tkie czasy uczenia, do ƒáwicze≈Ñ bƒôdziemy u≈ºywaƒá zbioru tf_flowers:

In [2]:
import tensorflow_datasets as tfds

[test_set_raw, valid_set_raw, train_set_raw], info = tfds.load(
    "tf_flowers",
    split=["train[:10%]", "train[10%:25%]", "train[25%:]"],
    as_supervised=True,
    with_info=True)


Kilka s≈Ç√≥w o argumentach metody load:
- split zapewnia odpowiedni podzia≈Ç zbioru (dlatego pierwszy element zwracanej krotki jest 3-elementowym s≈Çownikiem),
- as_supervised sprawia, ≈ºe zwracane obiekty tf.data.Dataset majƒÖ postaƒá krotek zawierajƒÖcych zar√≥wno cechy, jak i etykiety,
- with_info dodaje drugi element zwracanej krotki.


In [3]:
info

tfds.core.DatasetInfo(
    name='tf_flowers',
    full_name='tf_flowers/3.0.1',
    description="""
    A large set of images of flowers
    """,
    homepage='https://www.tensorflow.org/tutorials/load_data/images',
    data_path='~\\tensorflow_datasets\\tf_flowers\\3.0.1',
    file_format=tfrecord,
    download_size=218.21 MiB,
    dataset_size=221.83 MiB,
    features=FeaturesDict({
        'image': Image(shape=(None, None, 3), dtype=tf.uint8),
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    }),
    supervised_keys=('image', 'label'),
    disable_shuffling=False,
    splits={
        'train': <SplitInfo num_examples=3670, num_shards=2>,
    },
    citation="""@ONLINE {tfflowers,
    author = "The TensorFlow Team",
    title = "Flowers",
    month = "jan",
    year = "2019",
    url = "http://download.tensorflow.org/example_images/flower_photos.tgz" }""",
)

Mo≈ºemy ≈Çatwo wyekstrahowaƒá istotne parametry zbioru:

In [4]:
class_names = info.features["label"].names
n_classes = info.features["label"].num_classes
dataset_size = info.splits["train"].num_examples

Wy≈õwietlmy kilka przyk≈Çadowych obraz√≥w:

In [5]:
import matplotlib.pyplot as plt

plt.figure(figsize=(12, 8))
index = 0
sample_images = train_set_raw.take(9)
for image, label in sample_images:
    index += 1
    plt.subplot(3, 3, index)
    plt.imshow(image)
    plt.title("Class: {}".format(class_names[label]))
    plt.axis("off")
plt.show(block=False)

## Budujemy prostƒÖ sieƒá CNN

W tym ƒáwiczeniu zbudujemy sieƒá o nieskompikowanej strukturze.

###  Przygotowanie danych

Sieƒá bƒôdzie przetwarza≈Ça obrazy o rozmiarze 224 √ó 224 pikseli, a wiƒôc pierwszym krokiem bƒôdzie
przetworzenie. Obiekty Dataset pozwalajƒÖ na wykorzystanie metody map, kt√≥ra przy uczeniu
nadzorowanym bƒôdzie otrzymywa≈Ça dwa argumenty (cechy, etykieta) i powinna zwracaƒá je w postaci
krotki po przetworzeniu.

Najprostsza funkcja bƒôdzie po prostu skalowa≈Ça obraz do po≈ºƒÖdanego rozmiaru:

In [6]:
import tensorflow as tf


def preprocess(image, label):
    resized_image = tf.image.resize(image, [224, 224])
    return resized_image, label


Aplikujemy jƒÖ do pobranych zbior√≥w:

In [7]:
batch_size = 12
train_set = train_set_raw.map(preprocess).shuffle(dataset_size).batch(batch_size).prefetch(1)
valid_set = valid_set_raw.map(preprocess).batch(batch_size).prefetch(1)
test_set = test_set_raw.map(preprocess).batch(batch_size).prefetch(1)

Wykorzystujemy tu dodatkowe metody Dataset API tak aby dostarczanie danych nie sta≈Ço siƒô wƒÖskim gard≈Çem procesu uczenia:
- shuffle losowo ustawia kolejno≈õƒá pr√≥bek w zbiorze uczƒÖcym,
- batch ≈ÇƒÖczy pr√≥bki we wsady o podanej d≈Çugo≈õci (idealnie, powinna to byƒá wielko≈õƒá miniwsadu podczas uczenia),
- prefetch zapewnia takie zarzƒÖdzanie buforem, aby zawsze przygotowane by≈Ço ùëõ pr√≥bek gotowych do pobrania (w tym przypadku chcemy, aby podczas przetwarzania miniwsadu przez algorytm uczenia zawsze czeka≈Ç jeden przygotowany kolejny miniwsad).


Wy≈õwietlmy pr√≥bkƒô danych po przetworzeniu:

In [8]:
# plt.figure(figsize=(8, 8))
# sample_batch = train_set.take(1)
# for X_batch, y_batch in sample_batch:
#     for index in range(12):
#         plt.subplot(3, 4, index + 1)
#         plt.imshow(X_batch[index] / 255.0)
#         plt.title("Class: {}".format(class_names[y_batch[index]]))
#         plt.axis("off")
# plt.show()

### Budowa sieci

Zaprojektuj prostƒÖ sieƒá konwolucyjnƒÖ, kt√≥ra pozwoli na uzyskanie przyzwoitej dok≈Çadno≈õci klasy- fikacji przetwarzanego zbioru.

Pamiƒôtaj o istotnych zasadach:
1. W przypadku naszych danych, poniewa≈º sk≈Çadowe RGB pikseli majƒÖ warto≈õci z zakresu 0‚Äì255, musimy pamiƒôtaƒá o normalizacji danych; mo≈ºna u≈ºyƒá do tego warstwy skalujƒÖcej warto≈õci.
2. Czƒô≈õƒá wykrywajƒÖca elementy obrazu sk≈Çada siƒô z warstw konwolucyjnych, najczƒô≈õciej przepla- tanych warstwami zbierajƒÖcymi:
- g≈Ç√≥wnymi parametrami warstw konwolucyjnych sƒÖ liczba filtr√≥w i rozmiar filtra; za- zwyczaj zaczynamy od wzglƒôdnie niskiej liczby filtr√≥w (np. 32) o wiƒôkszym rozmiarze (np. 7 √ó 7), aby wykryƒá elementarne komponenty obrazu, a na kolejnych warstwach ≈ÇƒÖczymy je w bardziej z≈Ço≈ºone struktury ‚Äì kombinacji jest wiƒôcej, a wiƒôc mamy coraz wiƒôcej filtr√≥w, ale mogƒÖ byƒá mniejszego rozmiaru (np. 3 √ó 3),
- zwyczajowo na jednƒÖ warstwƒô konwolucyjnƒÖ przypada≈Ça jedna warstwa zbierajƒÖca (zm- niejszajƒÖca rozmiar ‚Äûobrazu‚Äù), ale czƒôsto stosujemy te≈º kilka (np. 2) warstw kon- wolucyjnych bezpo≈õrednio na sobie.
3. Po czƒô≈õci konwolucyjnej typowo nastƒôpuje czƒô≈õƒá gƒôsta, z≈Ço≈ºona z warstw gƒôstych i opcjonalnie regularyzacyjnych (dropout?):
- czƒô≈õƒá gƒôsta musi byƒá poprzedzona warstwƒÖ sp≈ÇaszczajƒÖcƒÖ dane, gdy≈º spodziewa siƒô 1- wymiarowej struktury,
- ostatnia warstwa musi byƒá dostosowana do charakterystyki zbioru danych.

In [15]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Rescaling(scale=1. / 127.5, offset=-1, input_shape=[224, 224, 3]),
  tf.keras.layers.Conv2D(32, 7, activation='relu'),
  tf.keras.layers.MaxPooling2D(pool_size=(2,2)),
  tf.keras.layers.Conv2D(64, 5, activation='relu'),
  tf.keras.layers.MaxPooling2D(pool_size=(2,2)),
  tf.keras.layers.Conv2D(96, 3, activation='relu'),
  tf.keras.layers.MaxPooling2D(pool_size=(2,2)),
  tf.keras.layers.Flatten(),
  tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(units=64, activation='relu'),
tf.keras.layers.Dropout(0.5),


  tf.keras.layers.Dense(5, activation="softmax")

])


In [16]:
model.compile(loss=["sparse_categorical_crossentropy"], metrics=["accuracy"], optimizer="Adam")
model.fit(train_set, validation_data=valid_set, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x231dc72ca30>

Zapisz wynik ewaluacji dla zbioru uczƒÖcego, walidacyjnego i testowego w postaci krotki
(acc_train, acc_valid, acc_test) do pikla simple_cnn_acc.pkl.

In [17]:
import pickle

acc = (model.evaluate(train_set)[1], model.evaluate(valid_set)[1], model.evaluate(test_set)[1])

with open('simple_cnn_acc.pkl', 'wb') as file:
    pickle.dump(acc, file)
acc



(0.9026162624359131, 0.5462794899940491, 0.6103542447090149)

## Uczenie transferowe

Tym razem wykorzystamy gotowƒÖ, du≈ºo bardziej z≈Ço≈ºonƒÖ sieƒá. Dziƒôki temu, ≈ºe sieƒá bƒôdzie zainicjalizowana wagami, mo≈ºemy znaczƒÖco skr√≥ciƒá czas uczenia.
Jako bazowƒÖ wykorzystamy wzglƒôdnie nowoczesnƒÖ sieƒá Xception. Jest ona dostƒôpna w pakiecie
tf.keras.applications.xception.
Wykorzystamy wcze≈õniej ju≈º za≈Çadowane surowe zbiory danych (..._set_raw).

### Przygotowanie danych

Gotowe modele czƒôsto dostarczajƒÖ w≈Çasnych funkcji przygotowujƒÖcych wej≈õcie w spos√≥b zapewniajƒÖcy optymalne przetwarzanie. Musimy wiƒôc zmieniƒá nieco funkcjƒô przygotowujƒÖcƒÖ dane, dodajƒÖc
wywo≈Çanie odpowiedniej metody

In [18]:
def preprocess(image, label):
    resized_image = tf.image.resize(image, [224, 224])
    final_image = tf.keras.applications.xception.preprocess_input(resized_image)
    return final_image, label

Zobaczmy jak tym razem wyglƒÖdajƒÖ wstƒôpnie przetworzone dane; zwr√≥ƒá uwagƒô, ≈ºe poniewa≈º teraz
warto≈õci nale≈ºƒÖ ju≈º do zakresu (‚àí1, 1), musimy je odpowiednio przeskalowaƒá (ale w sieci nie
bƒôdziemy potrzebowali warstwy skalujƒÖcej):

In [None]:
plt.figure(figsize=(8, 8))
sample_batch = train_set.take(1)
for X_batch, y_batch in sample_batch:
    for index in range(12):
        plt.subplot(3, 4, index + 1)
        plt.imshow(X_batch[index] / 2 + 0.5)
        plt.title("Class: {}".format(class_names[y_batch[index]]))
        plt.axis("off")
plt.show()

### Budowa sieci

Utw√≥rz model bazowy przy pomocy odpowiedniej metody:

In [19]:
base_model = tf.keras.applications.xception.Xception(
    weights="imagenet",
    include_top=False)


Wyja≈õnienie:
- argument weights zapewnia inicjalizacjƒô wag sieci wynikami uczenia zbiorem ImageNet,
- argument include_top sprawi, ≈ºe sieƒá nie bƒôdzie posiada≈Ça g√≥rnych warstw (kt√≥re musimy
sami dodaƒá, gdy≈º sƒÖ specyficzne dla danego problemu).

Mo≈ºesz wy≈õwietliƒá strukturƒô za≈Çadowanej sieci:

In [20]:
for index, layer in enumerate(base_model.layers):
    print(index, layer.name)


0 input_2
1 block1_conv1
2 block1_conv1_bn
3 block1_conv1_act
4 block1_conv2
5 block1_conv2_bn
6 block1_conv2_act
7 block2_sepconv1
8 block2_sepconv1_bn
9 block2_sepconv2_act
10 block2_sepconv2
11 block2_sepconv2_bn
12 conv2d_10
13 block2_pool
14 batch_normalization_4
15 add_12
16 block3_sepconv1_act
17 block3_sepconv1
18 block3_sepconv1_bn
19 block3_sepconv2_act
20 block3_sepconv2
21 block3_sepconv2_bn
22 conv2d_11
23 block3_pool
24 batch_normalization_5
25 add_13
26 block4_sepconv1_act
27 block4_sepconv1
28 block4_sepconv1_bn
29 block4_sepconv2_act
30 block4_sepconv2
31 block4_sepconv2_bn
32 conv2d_12
33 block4_pool
34 batch_normalization_6
35 add_14
36 block5_sepconv1_act
37 block5_sepconv1
38 block5_sepconv1_bn
39 block5_sepconv2_act
40 block5_sepconv2
41 block5_sepconv2_bn
42 block5_sepconv3_act
43 block5_sepconv3
44 block5_sepconv3_bn
45 add_15
46 block6_sepconv1_act
47 block6_sepconv1
48 block6_sepconv1_bn
49 block6_sepconv2_act
50 block6_sepconv2
51 block6_sepconv2_bn
52 block6

KorzystajƒÖc z API funkcyjnego Keras dodaj warstwy:
- u≈õredniajƒÖcƒÖ warto≈õci wszystkich ‚Äûpikseli‚Äù,
- wyj≈õciowƒÖ, gƒôstƒÖ, odpowiedniƒÖ dla problemu.


In [22]:
avg = tf.keras.layers.GlobalAveragePooling2D()(base_model.output)
output = tf.keras.layers.Dense(n_classes, activation="softmax")(avg)
model = tf.keras.models.Model(inputs=base_model.input, outputs=output)

Przeprowad≈∫ uczenie w dw√≥ch krokach:
1. Kilka (np. 5) iteracji, podczas kt√≥rych warstwy sieci bazowej bƒôdƒÖ zablokowane; ten krok
jest konieczny aby zapobiec ‚Äûzepsuciu‚Äù wag dostarczonych wraz z sieciƒÖ bazowƒÖ ze wzglƒôdu
na spodziewane du≈ºe b≈Çƒôdy wynikajƒÖce z braku przyuczenia ‚Äûnowych‚Äù warstw:

In [23]:
for layer in base_model.layers:
    layer.trainable = False
model.compile(loss="sparse_categorical_crossentropy", optimizer="Adam", metrics=["accuracy"])
history = model.fit(train_set, validation_data=valid_set,epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


In [None]:
for layer in base_model.layers:
    layer.trainable = True
model.fit(train_set, validation_data=valid_set,epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10

Zapisz wynik ewaluacji dla zbioru uczƒÖcego, walidacyjnego i testowego w postaci krotki
(acc_train, acc_valid, acc_test) do pikla xception_acc.pkl.

In [None]:
acc = (model.evaluate(train_set)[1], model.evaluate(valid_set)[1], model.evaluate(test_set)[1])

with open('xception_acc.pkl', 'wb') as file:
    pickle.dump(acc, file)
acc