<a href="https://colab.research.google.com/github/Gricay-vasily/project_9_DCGAN/blob/main/Learning_NN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Навчання Deep Convolutional Generative Adversarial Network (DCGAN) на завантажених даних Cifar

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import os
import random
import tensorflow as tf
from tensorflow.keras import layers
from tensorflow.keras.optimizers import Adam

In [None]:
tf.__version__

In [None]:
gpus = tf.config.list_physical_devices("GPU")

In [None]:
if gpus:
    for gpu in gpus:
         print("Found a GPU with the name:", gpu)
else:
    print("Failed to detect a GPU.")

## Завантаження і підготовка Дата-сетів

### Зчитування мета-даних

Посилання на дані

In [None]:
URL_DIR = "https://www.cs.toronto.edu/~kriz/"
cifar=10

if cifar == 10:
    FILE_NAME_CIFAR = "cifar-10-python.tar.gz"
if cifar ==100:
    FILE_NAME_CIFAR = "cifar-100-python.tar.gz"

Завантажимо дані

In [None]:
def load_and_unzip_cifar(url:str, file_name:str):
  '''Завантаження і розпакування файлу-архіву, якщо ще цього не зроблено'''
  from pathlib import Path
  # Завантаження даних
  full_url_to_load = url + file_name
  print(full_url_to_load)
  if Path(file_name).exists() and Path(file_name).is_file():
    print(f"Файл {file_name} вже є. Немає потреби його завантажувати!")
  else:
    print(f"Заватажуємо файл {file_name} ")
    !wget $full_url_to_load
  # Розпакування даних
  # Створення робочої папки через stem i split - відсікання суфіксів
  work_dir = Path(str((Path() / Path(file_name).stem)).split(".")[0])
  # print(work_dir)
  if work_dir.exists() and work_dir.is_dir():
    print(f"Директорія {work_dir} вже існує, перезаписуємо файли")
    # Перезаписуємо, бо є файли, які не дають видалити папку
    !tar -xzvf $file_name
  else:
    print(f"Розпакуємо файл {file_name}")
    !tar -xzvf $file_name

load_and_unzip_cifar(URL_DIR, FILE_NAME_CIFAR)

In [None]:
def unpickle(file):
  '''Десеріалізація даних з pickle-файлу'''
  import pickle
  with open(file, 'rb') as fo:
      dict = pickle.load(fo, encoding='bytes')
  return dict

In [None]:
if cifar == 10:
  metadata_path = './cifar-10-batches-py/batches.meta' # шлях до даних"
  metadata = unpickle(metadata_path)
  superclass_dict = dict(list(enumerate(metadata[b'label_names'])))
if cifar ==100:
  metadata_path = './cifar-100-python/meta' # шлях до даних
  metadata = unpickle(metadata_path)
  superclass_dict = dict(list(enumerate(metadata[b'coarse_label_names'])))

### Завантаження тренувальної та тестувальної вибірок (використовуючи суперкласи):

In [None]:
if cifar == 100:
  data_pre_path = './cifar-100-python/' # шлях до даних
  # шляхи до файлів
  data_train_path = data_pre_path + 'train'
  data_test_path = data_pre_path + 'test'
  # Зчитуємо словники
  data_train_dict = unpickle(data_train_path)
  data_test_dict = unpickle(data_test_path)
  # Отримуємо дані (вибираємо coarse_labels щоб отримати всі 100 класів)
  data_train = data_train_dict[b'data']
  label_train = np.array(data_train_dict[b'coarse_labels'])
  data_test = data_test_dict[b'data']
  label_test = np.array(data_test_dict[b'coarse_labels'])

### Завантаження тренувальної та тестувальної вибірок для Cifar-10:

In [None]:
if cifar == 10:
  data_pre_path = './cifar-10-batches-py/' # шлях до даних
  data_train = None
  label_train = []
  data_test = None
  label_test = []
  # Тренувальні вибірки
  for _ in range(1,6):
    data_train_dict = unpickle(data_pre_path + f"data_batch_{_}")
    if _ == 1:
      data_train = data_train_dict[b'data']
    else:
      data_train = np.vstack((data_train, data_train_dict[b'data']))
    label_train += data_train_dict[b'labels']
  #  Тестувальні вибірки
  data_test_dict = unpickle(data_pre_path + "test_batch")
  data_test = data_test_dict[b'data']
  label_test = data_test_dict[b'labels']

Поверхнево дослідимо дані

In [None]:
type(data_train.shape), type(data_test.shape)

In [None]:
data_train.shape, data_test.shape

In [None]:
np.info(data_train)

In [None]:
data_train.reshape(len(data_train), 3, 32, 32).shape, data_test.reshape(len(data_test), 3, 32, 32).shape

### Зміна розмірності зображень - виконувати лише раз у колабі!!!

In [None]:
# Транспонується саме (0,2,3,1) - щоб отримати:
# 0 - Позицію картинки
# 2 - Значення висоти в пікселях
# 3 - Значення ширини в пікселях
# 1 - значення кольорів у RGB
# Якщо набрати (0,3,2,1) - картинка перевертається на 90град - висота і ширина міняються місцями

data_train = data_train.reshape(len(data_train), 3, 32, 32).transpose(0,2,3,1)
data_test = data_test.reshape(len(data_test), 3, 32, 32).transpose(0,2,3,1)

In [None]:
np.info(data_train)

In [None]:
_ = random.randint(0,len(data_train))
print(f"For picture #{_} - {label_train[_]} ({superclass_dict[label_train[_]]}):")
fig = plt.figure(figsize=(1,1))
fig.add_subplot(1,1,1)
plt.imshow(data_train[_])
plt.axis("off")
plt.show()

Трохи більше картинок з тренувальної та тестувальної вибірок...

In [None]:
def show_pictures_n_m(data,n,m:int):
    fig = plt.figure(figsize=(max(n,m),max(n,m)))
    for _ in range (n*m):
        fig.add_subplot(n,m,_+1)
        plt.imshow(data[_])
        plt.axis("off")
    plt.show()

show_pictures_n_m(data_train,5,5)
show_pictures_n_m(data_test,3,3)

### Подальша підготовка даних для тренувань мережі

In [None]:
data_train.shape[0]

In [None]:
BUFFER_SIZE = data_train.shape[0]
BATCH_SIZE = 256
# як альтернатива
# BATCH_SIZE = int(BUFFER_SIZE / 100)

In [None]:
def prepare_images(data_set, buffer_size, batch_size):
  prepared_images = data_set.astype("float32")
  prepared_images = (prepared_images - 127.5) / 127.5
  # prepared_images = prepared_images[:1000]
  # prepared_images = tf.data.Dataset.from_tensor_slices(prepared_images)
  # Перемішаємо дані випадковим чином
  # prepared_images = prepared_images.shuffle(buffer_size=buffer_size).batch(batch_size=batch_size)
  return prepared_images

In [None]:
train_images = prepare_images(data_train, BUFFER_SIZE, BATCH_SIZE)

In [None]:
train_images.shape

In [None]:
len(train_images)

In [None]:
BUFFER_SIZE = train_images.shape[0]
BATCH_SIZE = int(BUFFER_SIZE / 100)

# Створення та тренування генератора і дискримінатора

Генератор - використовує шари `tf.keras.layers.Conv2DTranspose` (для підвищення дискретності),щоб створювати зображення з вихідного випадкового шуму (random noise). Починається шаром `Dense`, який приймає це початкове значення, а потім кілька разів підвищує дискретизацію, поки не досягне бажаного розміру зображення.

Дискримінатор - Це класифікатор зображень на основі CNN.

Він класифікує (визначає) якою є згенерована картинка - справжньою чи фейковою. Модель тренується показувати позитивне значення для справжньої картинки і негативне для фейкової.

In [None]:
def real_or_fake(decision):
  if decision>=0:
    return "Real"
  else:
    return "Fake"

## Змінні

In [None]:
# Швидкість навчання
LEARNING_RATE = 2e-4
# Вхідна розмірність
INPUT_DIM = 100

## Функції створення генератора та дискримінатора

In [None]:
def build_generator(nodes=4, input_dim=100, alpha = 0.2):
  """Створення генератора"""
  model = tf.keras.Sequential()
  # Основа для зображення 4 * 4 * 256
  n_f_nodes = 256 * nodes * nodes
  model.add(layers.Dense(n_f_nodes, input_dim = input_dim))
  model.add(layers.BatchNormalization())
  model.add(layers.LeakyReLU())
  model.add(layers.Reshape((nodes, nodes, 256)))
  # Підвищення дискретизації до 8x8
  model.add(layers.Conv2DTranspose(128, (nodes, nodes), strides=(2, 2), padding='same'))
  model.add(layers.BatchNormalization())
  model.add(layers.LeakyReLU())
  # Підвищення дискретизації до 16x16
  model.add(layers.Conv2DTranspose(128, (nodes, nodes), strides=(2, 2), padding='same'))
  model.add(layers.BatchNormalization())
  model.add(layers.LeakyReLU())
  # Підвищення дискретизації до 32x32
  model.add(layers.Conv2DTranspose(128, (nodes, nodes), strides=(2, 2), padding='same'))
  model.add(layers.BatchNormalization())
  model.add(layers.LeakyReLU())
  # Вихідний шар
  model.add(layers.Conv2D(3, (3, 3), activation='tanh', padding='same'))

  print("Створено Генератор")
  return model

In [None]:
def build_discriminator(input_shape = (32,32,3), alpha = 0.2):
  """Створення дискримінатора"""
  model = tf.keras.Sequential()
  # Перший шар
  model.add(layers.Conv2D(64, (3, 3), strides=(2, 2), padding='same', input_shape=input_shape))
  model.add(layers.LeakyReLU(alpha=alpha))
  # model.add(layers.Dropout(0.3))
  # 3меншення дискретизації
  model.add(layers.Conv2D(128, (3, 3), strides=(2, 2), padding='same'))
  model.add(layers.LeakyReLU(alpha=0.2))
  # model.add(layers.Dropout(0.3))
  # 3меншення дискретизації
  model.add(layers.Conv2D(128, (3, 3), strides=(2, 2), padding='same'))
  model.add(layers.LeakyReLU(alpha=0.2))
  # model.add(layers.Dropout(0.3))
  # 3меншення дискретизації
  model.add(layers.Conv2D(256, (3, 3), strides=(2, 2), padding='same'))
  model.add(layers.LeakyReLU(alpha=alpha))
  model.add(layers.Dropout(0.3))
  # Класифікатор
  model.add(layers.Flatten())
  model.add(layers.Dense(1, activation='sigmoid'))

  print("Створено Дискримінатор")
  return model

In [None]:
def build_gen_disc_model(gen_model, disc_model):
  '''
  Комбінована модель генератора і дискримінатора,
  для оновлення генератора
  '''
  # зробимо ваги для дискримінатора нетренованими
  disc_model.trainable = False
  # З'єднаємо дві моделі
  model = tf.keras.Sequential()
  # Додамо генератор
  model.add(gen_model)
  # Додамо дискримінатор
  model.add(disc_model)

  print("Створено Генератор-Дискримінатор")
  return model

In [None]:
def compile_model(model, opt, loss, metrics):
  '''Компіляція створеної моделі'''
  model.compile(loss = loss, optimizer = opt, metrics = metrics)
  print("Модель скомпільовано")

## Функції роботи генератора

In [None]:
def generate_real_images(dataset, n_images):
  '''Генерація реальних зображень'''
  # Виберемо випадкове зображення
  idx = np.random.randint(0, dataset.shape[0], n_images)
  # print(f"Func = g_r_i, idx = {idx}")
  # print(f"Func = g_r_i, idx.shape = {idx.shape}")
  # Отримаємо вибрані зображення
  X = dataset[idx]
  # print(f"Func = g_r_i, X = {X}")
  # print(f"Func = g_r_i, X.shape = {X.shape}")
  # Згенеруємо 'справжні' мітки класу - одинична матриця
  y = np.ones((n_images, 1))
  # print(f"Func = g_r_i, y = {y}")
  # print(f"Func = g_r_i, y.shape = {y.shape}")
  return X, y

In [None]:
def generate_points(input_dim, n_images):
  '''
  Генерація точок в прихованому вхідному шарі просторі
  як вхідні дані для генератора
  '''
  # Генерація точок
  x_input = np.random.randn(input_dim * n_images)
  # print(f"Func = g_p, x_input.shape = {x_input.shape}")
  # Зміна форми до форми пакету виходів мережі
  x_input = x_input.reshape(n_images, input_dim)
  # print(f"Func = g_p, x_input.reshape = {x_input.shape}")
  return x_input

In [None]:
def generate_fake_images(gen_model, input_dim, n_images):
  '''Генерація фейкових зображень'''
  # Генеруємо точки для вхідного шару
  x_input = generate_points(input_dim, n_images)
  # print(f"Func = g_f_i, x_input.shape = {x_input.shape}")
  # Генерація (передбачення) генератором
  X = gen_model.predict(x_input, verbose = 0)
  # print(f"Func = g_f_i, X_input.shape = {X.shape}")
  # Створення 'фейкового зображення' - матриця нулів
  y = np.zeros((n_images, 1))
  # print(f"Func = g_f_i, y.shape = {y.shape})")
  return X, y


## Функції обробки результатів роботи моделей

In [None]:
def show_save_plot(examples, epoch, to_save, n=5):
  '''
  Створення, вивіт та за необхідності збереження зображень
  '''
  # Масштабування виводу зображення (від [-1,1] до [0,1])
  examples = (examples + 1) / 2.0
  # Малювання зображень
  for i in range(n * n):
      plt.subplot(n, n, 1 + i)
      # Приберемо виведення осей
      plt.axis('off')
      # Вивід зображення
      plt.imshow(examples[i])
  # Збереження зображення за необхідності
  if to_save:
    filename = 'gen_img_e%03d.png' % (epoch+1)
    plt.savefig(filename)
  plt.show()

In [None]:
def summary_performance(epoch, gen_model, disc_model, dataset, input_dim, n_images=100, to_save = False):
  '''
  Ф-я оцінки дискримінатором, побудова зображень
  '''
  # Генерація реальних зображень
  # print("Func =s_p_i, Генерація реальних зображень")
  X_real, y_real = generate_real_images(dataset, n_images)
  # Оцінка дискримінатором згенерованих реальних зображень
  # print("Func =s_p_i, Оцінка дискримінатором згенерованих реальних зображень")
  _, accuracy_real = disc_model.evaluate(X_real, y_real, verbose=0)
  # Генерація фейкових зображень
  # print("Func =s_p_i, Генерація фейкових зображень")
  x_fake, y_fake = generate_fake_images(gen_model, input_dim, n_images)
  # Оцінка дискримінатором згенерованих фейкових зображень
  # print("Func =s_p_i, Оцінка дискримінатором згенерованих фейкових зображень")
  _, accuracy_fake = disc_model.evaluate(x_fake, y_fake, verbose=0)
  # Загальний вивід інформації роботи дискримінатора
  # print("Func =s_p_i, Загальний вивід інформації роботи дискримінатора")
  print(f"Точність для реального зображення: {accuracy_real*100 : .0f}\n\
Точність для фейкового зображення {accuracy_fake * 100:.0f}")
  show_save_plot(x_fake, epoch, to_save = False)

## Функція тренування генератора і дискримінатора

In [None]:
def train(gen_model, disc_model, gen_disc_model, dataset, input_dim, n_epochs, batch_size):
  '''Функція тренування генератора і дискримінатора'''
  from IPython import display
  import time as tm
  start = tm.time()
  # Кількість пакетів на епоху
  batch_per_epoch = int(dataset.shape[0] / batch_size)
  half_batch = int(batch_size / 2)
  # Ручний перелік епох
  for i in range(n_epochs):
    ep_start = tm.time()
    print(f"Епоха {i+1} з {n_epochs}")
    # Перелік пакетів у тренувальній вибірці
    for j in range(batch_per_epoch):
      print(f"Ep={i}, J={j+1} з {batch_per_epoch}")
      # Випадкова генерація 'реальних' зображень
      # print("Випадкова генерація 'реальних' зображень")
      X_real, y_real = generate_real_images(dataset, half_batch)
      # Оновлення вагів дискримінатора для 'реальних' зображень
      # print("Оновлення вагів дискримінатора для 'реальних' зображень")
      d_loss1, _ = disc_model.train_on_batch(X_real, y_real)
      # Генерація 'фейкових' зображень
      # print("Генерація 'фейкових' зображень")
      X_fake, y_fake = generate_fake_images(gen_model, input_dim, half_batch)
      # Оновлення вагів дискримінатора для 'фейкових' зображень
      # print("Оновлення вагів дискримінатора для 'фейкових' зображень")
      d_loss2, _ = disc_model.train_on_batch(X_fake, y_fake)
      # Підготовка точок у вхідному шарі як вхідних для генератора
      # print("Підготовка точок у вхідному шарі як вхідних для генератора")
      X_gen_disc = generate_points(input_dim, batch_size)
      # Створення інвертованих міток для фейкових зображень
      # print("Створення інвертованих міток для фейкових зображень")
      y_gen_disc = np.ones((batch_size, 1))
      # Оновлення генератора через значення помилок дискримінатора
      # print("Оновлення генератора через значення помилок дискримінатора")
      gen_disc_loss = gen_disc_model.train_on_batch(X_gen_disc, y_gen_disc)
      # Загальна втрата для цього пакету
      if j+1 % 100 == 0:
          print('>%d, %d/%d, d1=%.3f, d2=%.3f g=%.3f' % (i + 1, j + 1, batch_per_epoch, d_loss1, d_loss2, gen_disc_loss))
    # Проміжна оцінка продуктивності моделі
    if (i+1) % 1 == 0:
      summary_performance(i, gen_model, disc_model, dataset, input_dim, to_save=False)
    print(f"Час навчання епохи {i+1} - {(tm.time()-ep_start):.2f} сек")
  print(f"Загальний час навчання на {n_epochs} епохах - {(tm.time()-start):.2f} сек")

## Створення і налаштування генератора

In [None]:
LOSS = "binary_crossentropy"
OPT = Adam(learning_rate=LEARNING_RATE)
METRICS = []

generator = build_generator(nodes=4, input_dim=100, alpha = 0.2)
compile_model(generator, OPT, LOSS, METRICS)

generator.summary()

## Створення і налаштування дискримінатора

In [None]:
LOSS = "binary_crossentropy"
OPT = Adam(learning_rate=LEARNING_RATE)
METRICS = ["accuracy"]

discriminator = build_discriminator(input_shape = (32,32,3), alpha = 0.2)
compile_model(discriminator, OPT, LOSS, METRICS)

discriminator.summary()

## Створення і налаштування загальної моделі генератор-дискримінатор

In [None]:
LOSS = "binary_crossentropy"
OPT = Adam(learning_rate=LEARNING_RATE)
METRICS = []

gen_disc = build_gen_disc_model(generator, discriminator)
compile_model(gen_disc, OPT, LOSS, METRICS)

gen_disc.summary()

In [None]:
# Генерування зображення та його класифікація дискримінатором без навчання
noise = tf.random.normal([1, INPUT_DIM])
generated_image = generator(noise, training = False)
decision = discriminator(generated_image).numpy()[0][0]
print(f"generated_image.shape = {generated_image.shape}") #TensorShape([1, 32, 32, 3])
print(f"Точність decision = {decision}")
verdict = real_or_fake(decision)
print(f"Зображення - {verdict}")
plt.imshow(generated_image[generated_image.shape[0]-1, :,: ,0])
plt.show()

## Тренування моделей

Задаємо тренувальні параметри

In [None]:
EPOCHS = 20

In [None]:
train_images.shape

In [None]:
type(train_images)

In [None]:
train(gen_model = generator,
      disc_model = discriminator,
      gen_disc_model = gen_disc,
      dataset = train_images,
      input_dim = INPUT_DIM,
      n_epochs = EPOCHS,
      batch_size = BATCH_SIZE)

In [None]:
generator.save("generator.h5")

In [None]:
discriminator.save("discriminator.h5")