## Splotowe sieci neuronowe (ang. "Convolutional Neural Networks", CNN)

- Twórcy: Yann LeCun, Bernhard Boser, John S. Denker, Donnie Henderson, Richard E. Howard, Wayne Hubbard, Lawrence D. Jackel
- Pierwsza publikacja: "Backpropagation Applied to Handwritten Zip Code Recognition", Neural Computation (1989),
DOI: 10.1162/neco.1989.1.4.541

- Splotowe sieci neuronowe (CNN) to rodzaj sztucznej sieci neuronowej, szczególnie efektywny w przetwarzaniu obrazów i danych z regularną strukturą przestrzenną.
- Podstawowym elementem CNN są warstwy splotowe, które stosują filtry (jądra splotowe) do wyodrębniania cech z danych wejściowych.
- Ważną techniką, stosowaną w CNN jest tzw. **Pooling**, czyli technika zmniejszania rozmiaru danych poprzez agregację wartości z sąsiednich obszarów. Najpopularniejszy typ to *max pooling*.
- Opróćz warstw splotowych, w sieciach CNN występują **warstwy w pełni połączone** ("fully connected leyers"), które łączą wszystkie neurony z poprzedniej warstwy z każdym neuronem w bieżącej warstwie, służąc do klasyfikacji.
- CNN są uczone są za pomocą propagacji wstecznej ("backpropagation") błędu, aby zminimalizować funkcję straty.
- Popularne architektury CNN to:
 - LeNet,
 - AlexNet,
 - VGGNet,
 - ResNet,
 - Inception.
CNN są stosowane w dziedzinach takich, jak rozpoznawanie obrazów, detekcja obiektów, segmentacja obrazu.

Szczególne techniki i metody, stosowane w CNN to mi.in.:
 - Metoda **"transfer learning"** pozwala na wykorzystanie wcześniej wytrenowanych modeli CNN do nowych zadań, co przyspiesza proces uczenia.
 - **"Data augmentation"** to technika sztucznego zwiększania zbioru danych treningowych poprzez transformacje obrazów, np. obroty, skalowanie.
 - **Regularyzacja** pomaga zapobiegać przeuczeniu modelu poprzez dodawanie kary do funkcji straty.
 - **"Batch normalization"** normalizuje dane wejściowe do każdej warstwy, co przyspiesza uczenie i poprawia wyniki.
 - **"Dropout"** to technika losowego wyłączania neuronów podczas treningu, co zapobiega przeuczeniu.

In [1]:
# Przykład

import tensorflow as tf

# Załadowanie zbioru danych MNIST
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()

# Wstępne przetwarzanie danych
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0
y_train = tf.keras.utils.to_categorical(y_train, num_classes=10)
y_test = tf.keras.utils.to_categorical(y_test, num_classes=10)

# Definicja modelu
model = tf.keras.models.Sequential([
  tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
  tf.keras.layers.MaxPooling2D((2, 2)),
  tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
  tf.keras.layers.MaxPooling2D((2, 2)),
  tf.keras.layers.Flatten(),
  tf.keras.layers.Dense(10, activation='softmax')
])

# Kompilacja modelu
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Trenowanie modelu
model.fit(x_train.reshape(-1, 28, 28, 1), y_train, epochs=5)

# Ewaluacja modelu
loss, accuracy = model.evaluate(x_test.reshape(-1, 28, 28, 1), y_test)
print('Dokładność:', accuracy)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 0us/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m51s[0m 26ms/step - accuracy: 0.8955 - loss: 0.3490
Epoch 2/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m49s[0m 26ms/step - accuracy: 0.9825 - loss: 0.0557
Epoch 3/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m80s[0m 25ms/step - accuracy: 0.9893 - loss: 0.0362
Epoch 4/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m84s[0m 26ms/step - accuracy: 0.9909 - loss: 0.0281
Epoch 5/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m80s[0m 25ms/step - accuracy: 0.9930 - loss: 0.0218
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 7ms/step - accuracy: 0.9844 - loss: 0.0458
Dokładność: 0.9876999855041504
