<a href="https://colab.research.google.com/github/KacperLudwiczak/DL-Machine-Learning-Projects-Study/blob/main/Convolutional_neural_network.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Convolutional Neural Network

### Importing the libraries

In [None]:
import tensorflow as tf
from keras.preprocessing.image import ImageDataGenerator

In [None]:
tf.__version__

'2.11.0'

## Part 1 - Data Preprocessing

### Preprocessing the Training set

In [None]:
train_datagen = ImageDataGenerator(rescale = 1./255,
                                   shear_range = 0.2,
                                   zoom_range = 0.2,
                                   horizontal_flip = True)
training_set = train_datagen.flow_from_directory('dataset/training_set',
                                                 target_size = (64, 64),
                                                 batch_size = 32,
                                                 class_mode = 'binary')

# Ten kod służy do tworzenia obiektu ImageDataGenerator i przepływu danych z katalogu.
# ImageDataGenerator jest używany do wykonywania augmentacji danych na obrazach. W tym przykładzie użyte są następujące parametry:
# rescale = 1./255: przeskalowuje wartości pikseli obrazów tak, aby mieściły się w zakresie od 0 do 1.
# shear_range = 0.2: stosuje losowe przekształcenia cieniowania obrazów.
# zoom_range = 0.2: stosuje losowe przekształcenia zoomowania obrazów.
# horizontal_flip = True: losowo odbija obrazy w poziomie.
# Metoda flow_from_directory służy do ładowania obrazów z katalogu i generowania partii z augmentowanymi danymi. W tym przykładzie użyte są następujące parametry:
# 'dataset/training_set': ścieżka do katalogu zawierającego obrazy zbioru treningowego.
# target_size = (64, 64): rozmiar, do którego będą zmieniane obrazy.
# batch_size = 32: rozmiar partii danych, które będą generowane.
# class_mode = 'binary': rodzaj etykiet, które zostaną wygenerowane. W tym przypadku etykiety będą binarne (0 lub 1), ponieważ to jest problem klasyfikacji binarnej.

### Preprocessing the Test set

In [None]:
test_datagen = ImageDataGenerator(rescale = 1./255)
test_set = test_datagen.flow_from_directory('dataset/test_set',
                                            target_size = (64, 64),
                                            batch_size = 32,
                                            class_mode = 'binary')

# Ten kod służy do tworzenia obiektu ImageDataGenerator i przepływu danych z katalogu testowego.
# ImageDataGenerator jest używany do przeskalowania pikseli obrazów testowych. W tym przykładzie użyty jest tylko jeden parametr:
# rescale = 1./255: przeskalowuje wartości pikseli obrazów testowych tak, aby mieściły się w zakresie od 0 do 1.
# Metoda flow_from_directory służy do ładowania obrazów z katalogu testowego i generowania partii danych. W tym przykładzie użyte są następujące parametry:
# 'dataset/test_set': ścieżka do katalogu zawierającego obrazy zbioru testowego.
# target_size = (64, 64): rozmiar, do którego będą zmieniane obrazy.
# batch_size = 32: rozmiar partii danych, które będą generowane.
# class_mode = 'binary': rodzaj etykiet, które zostaną wygenerowane. W tym przypadku etykiety będą binarne (0 lub 1), ponieważ to jest problem klasyfikacji binarnej.

## Part 2 - Building the CNN

### Initialising the CNN

In [None]:
cnn = tf.keras.models.Sequential()

# Ten kod służy do tworzenia sekwencyjnego modelu sieci neuronowej przy użyciu biblioteki Keras z pakietu Tensorflow.
# Model ten pozwala na definiowanie warstw sieci neuronowej w kolejności sekwencyjnej.
# Aby dodać kolejne warstwy do modelu, należy użyć metody .add().
# Przykładowo, aby dodać warstwę konwolucyjną, można użyć kodu cnn.add(tf.keras.layers.Conv2D(filters=32, kernel_size=3, activation='relu', input_shape=[64, 64, 3])).
# W kolejnych liniach kodu definiowane są kolejne warstwy sieci neuronowej, aż do osiągnięcia końcowej warstwy wyjściowej.

### Step 1 - Convolution

In [None]:
cnn.add(tf.keras.layers.Conv2D(filters=32, kernel_size=3, activation='relu', input_shape=[64, 64, 3]))

# Ten kod dodaje warstwę konwolucyjną do sekwencyjnego modelu sieci neuronowej.
# tf.keras.layers.Conv2D to warstwa konwolucyjna dwuwymiarowa, która przetwarza wejściowe obrazy.
# W tym przypadku, filters=32 oznacza liczbę filtrów konwolucyjnych, kernel_size=3 określa rozmiar jądra konwolucyjnego, a activation='relu' definiuje funkcję aktywacji, która będzie stosowana do wyników konwolucji.
# Parametr input_shape określa wymiary wejściowe dla obrazów, które będą przetwarzane przez tę warstwę. W tym przypadku obrazy będą miały wymiary 64x64 pikseli z 3 kanałami (RGB).

### Step 2 - Pooling

In [None]:
cnn.add(tf.keras.layers.MaxPool2D(pool_size=2, strides=2))

# Ten kod dodaje warstwę poolingową do sekwencyjnego modelu sieci neuronowej.
# tf.keras.layers.MaxPool2D to warstwa poolingowa typu maksymalnego, która zmniejsza wymiary wejściowe przez zastosowanie operacji max-pooling na wynikach warstwy poprzedniej.
# W tym przypadku, pool_size=2 określa rozmiar obszaru poolingowego, a strides=2 określa, o ile przesuwane są okna poolingowe podczas wykonywania operacji.
# Dzięki zastosowaniu warstwy poolingowej, sieć neuronowa staje się mniej wrażliwa na przesunięcia i skalowanie wejściowych obrazów, co może przyspieszyć proces uczenia oraz poprawić skuteczność klasyfikacji.

### Adding a second convolutional layer

In [None]:
cnn.add(tf.keras.layers.Conv2D(filters=32, kernel_size=3, activation='relu'))
cnn.add(tf.keras.layers.MaxPool2D(pool_size=2, strides=2))

# Ten kod dodaje kolejne dwie warstwy do sekwencyjnego modelu sieci neuronowej.
# Warstwa konwolucyjna tf.keras.layers.Conv2D i warstwa poolingowa typu maksymalnego tf.keras.layers.MaxPool2D są dodawane po sobie w celu wykrycia kolejnych cech na obrazie i zmniejszenia wymiarów wejściowych.
# W tym przypadku, parametry filters, kernel_size i activation warstwy konwolucyjnej są takie same jak w poprzedniej warstwie.
# Warstwa poolingowa ma również takie same parametry jak w poprzedniej warstwie, czyli pool_size=2 i strides=2.
# Dodanie kolejnych warstw pozwala na budowanie coraz bardziej skomplikowanych i zaawansowanych modeli sieci neuronowej, które mogą lepiej wykrywać cechy i klasyfikować obrazy.

### Step 3 - Flattening

In [None]:
cnn.add(tf.keras.layers.Flatten())

# Ten kod dodaje warstwę Flatten do sekwencyjnego modelu sieci neuronowej.
# Warstwa Flatten służy do spłaszczania tensorów wielowymiarowych do jednowymiarowych, co jest wymagane przed dodaniem warstwy typu Dense (w pełni połączonej) do sieci neuronowej.
# W przypadku sieci konwolucyjnych, dane wejściowe mają zwykle trzy wymiary: wysokość, szerokość i liczba kanałów. Dzięki zastosowaniu warstw konwolucyjnych i poolingowych, szerokość i wysokość obrazów ulegają zmniejszeniu, natomiast liczba kanałów pozostaje niezmieniona.
# Warstwa Flatten spłaszcza te trzy wymiary do jednego wymiaru, co pozwala na przekształcenie danych wejściowych do formy, która może być przetwarzana przez warstwy typu Dense.

### Step 4 - Full Connection

In [None]:
cnn.add(tf.keras.layers.Dense(units=128, activation='relu'))

# Ten kod dodaje w pełni połączoną warstwę typu Dense do sekwencyjnego modelu sieci neuronowej.
# Warstwa Dense zawiera neurony, które są w pełni połączone z neuronami z warstwy poprzedniej. Każdy neuron w warstwie Dense otrzymuje wektor wejściowy o takiej samej długości i wykonuje na nim operację liniową, po której stosowana jest funkcja aktywacji.
# W tym przypadku, parametr units=128 określa liczbę neuronów w warstwie Dense, a activation='relu' określa funkcję aktywacji jako ReLU.
# Warstwa Dense pozwala na budowanie modeli sieci neuronowych, które mogą uczyć się skomplikowanych zależności między cechami wejściowymi a etykietami wyjściowymi, co jest szczególnie przydatne w zadaniach klasyfikacji obrazów.

### Step 5 - Output Layer

In [None]:
cnn.add(tf.keras.layers.Dense(units=1, activation='sigmoid'))

# Ten kod dodaje ostatnią warstwę typu Dense do sekwencyjnego modelu sieci neuronowej.
# W przypadku zadania klasyfikacji binarnej, ta ostatnia warstwa Dense zawiera tylko jeden neuron, który zwraca wartości z przedziału 0 do 1. Funkcja aktywacji jest ustawiona na sigmoid, co oznacza, że wartość wyjściowa będzie interpretowana jako prawdopodobieństwo przynależności do jednej z dwóch klas.
# W przypadku zadania klasyfikacji wieloklasowej, ostatnia warstwa Dense zwykle zawiera tyle neuronów, ile jest klas w zbiorze danych, a funkcja aktywacji jest ustawiona na softmax. W ten sposób, wartości wyjściowe są interpretowane jako rozkład prawdopodobieństwa dla każdej klasy.

## Part 3 - Training the CNN

### Compiling the CNN

In [None]:
cnn.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

# Ten kod kompiluje sekwencyjny model sieci neuronowej z wykorzystaniem optymalizatora Adam, funkcji straty binary_crossentropy i metryki accuracy.
# Optymalizator Adam jest popularnym algorytmem optymalizacji gradientowej stosowanym w uczeniu maszynowym. Jego zadaniem jest minimalizacja funkcji kosztu poprzez zmianę wag sieci neuronowej w kierunku odwrotnym do gradientu funkcji kosztu.
# Funkcja straty binary_crossentropy jest stosowana w zadaniach klasyfikacji binarnej, a jej wartość mierzy odległość między przewidywaniami sieci neuronowej a rzeczywistymi etykietami binarnymi. Im mniejsza wartość funkcji straty, tym lepsze przewidywania sieci neuronowej.
# Metryka accuracy jest używana do oceny jakości modelu podczas uczenia. Jest to stosunek liczby poprawnych predykcji do liczby wszystkich predykcji.

### Training the CNN on the Training set and evaluating it on the Test set

In [None]:
cnn.fit(x = training_set, validation_data = test_set, epochs = 25)

# Ten kod trenuje sekwencyjny model sieci neuronowej z wykorzystaniem danych treningowych training_set i danych walidacyjnych test_set przez 25 epok.
# Funkcja fit() stosowana jest do trenowania modeli sieci neuronowej. W tym przypadku, parametr x określa zbiór danych treningowych, a parametr validation_data określa zbiór danych walidacyjnych. W każdej epoce, model jest trenowany na danych treningowych i oceniany na danych walidacyjnych.
# Parametr epochs określa liczbę epok, czyli liczbę razy, które model jest trenowany na całym zbiorze danych treningowych. W każdej epoce, model jest aktualizowany z wykorzystaniem algorytmu optymalizacji gradientowej, który minimalizuje funkcję kosztu.
# Podczas uczenia, sieć neuronowa będzie dostosowywać swoje wagi i bias na podstawie informacji z danych wejściowych, tak aby minimalizować funkcję kosztu i uzyskać jak najlepsze przewidywania dla nowych danych.

## Part 4 - Making a single prediction

In [None]:
import numpy as np
from keras.preprocessing import image
test_image = image.load_img('dataset/single_prediction/cat_or_dog_1.jpg', target_size = (64, 64))
test_image = image.img_to_array(test_image)
test_image = np.expand_dims(test_image, axis = 0)
result = cnn.predict(test_image)
training_set.class_indices
if result[0][0] == 1:
  prediction = 'dog'
else:
  prediction = 'cat'

# Ten kod służy do dokonania predykcji na podstawie jednego zdjęcia.
# Zaczynamy od importu potrzebnych bibliotek. Następnie, wczytujemy zdjęcie testowe cat_or_dog_1.jpg za pomocą funkcji image.load_img(), a następnie zmniejszamy jego rozmiar do (64, 64) pikseli i przekształcamy go w tablicę Numpy za pomocą funkcji image.img_to_array().
# Następnie, dodajemy dodatkowy wymiar do tablicy za pomocą funkcji np.expand_dims(), ponieważ nasza sieć neuronowa wymaga danych wejściowych o wymiarach [batch_size, width, height, channels]. W tym przypadku batch_size wynosi 1.
# Następnie przeprowadzamy predykcję na tablicy testowej za pomocą funkcji cnn.predict(). Wynik predykcji zapisujemy w zmiennej result.
# Ostatnim krokiem jest sprawdzenie etykiet klas za pomocą atrybutu class_indices obiektu training_set, który określa, która klasa odpowiada wartości numerycznej 0 i 1. W zależności od wartości predykcji result[0][0], która będzie wynosić 1 dla psa i 0 dla kota, przypisujemy etykietę klasową dog lub cat do zmiennej prediction.

In [None]:
print(prediction)