# **Конфигурация**

Здесь осуществялется **указание переменных проекта**, **подключение всех импортов**.

## Импорты

Здесь осуществляется импорт всех используемых в проекте библиотек. **Все импорты следует указывать здесь**.

In [None]:
import os, glob, random, shutil, ntpath, cv2, pandas as pd, tensorflow as tf
from pathlib import Path
from PIL import Image
from google.colab import drive
import tensorflow_datasets as tfds
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Activation, Flatten
from tensorflow.keras.layers import Conv2D, MaxPooling2D
from tensorflow.keras.callbacks import TensorBoard

## Подключение данных

Здесь осуществляется подключение данных. Данными выступают фотографии. Фотографии берутся из Google Disk. Исходя из своих потребностей **вы можете сами определить для себя, откуда вы будете извлекать фотографии для формирования датасетов**. Это означает, что вам не обязательно выполнять данный блок, но придется переопределить его для своих нужд и возможностей, например, осуществляя локальную подгрузку файлов.

In [None]:
# подключение вашего гугл диска
drive.mount('/content/drive')

## Функции

Здесь определяются функции, которые могут быть использованы во всех последующих блоках многократно.

In [None]:
# функция для подгрузки всех файлов
def get_files_from(path, exp):

  images = []

  for f in glob.glob("drive/MyDrive/csu/ML/" + path + "/" + "*." + exp):

    images.append(f)

  return images

# копирование файлов в указанную директорию
def copy_files_from(path, files):

  for f in files:

    shutil.copyfile(f, "drive/MyDrive/csu/ML/" + path + "/" + ntpath.basename(f))

# удаление всех файлов в директории
def remove_files_from(path):

  for f in glob.glob("drive/MyDrive/csu/ML/" + path + "/**/*", recursive = True):

    try:
      
      os.remove(f)
    
    except OSError as e:

      print(e)

## Переменные

Здесь определяются переменные проекта, которые будут использоваться во всех последующих блоках.

In [None]:
# кол-во эпох
epochs = 100
# ширина изображений
img_width = 224
# высота изображений
img_height = 224
# кол-во изображений
img_count = 640
# размеры изображения
img_size = (img_width, img_height, 3)
# размер пакета
batch_size = 32
# кол-во классов
num_classes = 2
# названия классов
class_names = ["Olds", "Youngs"]
# цвет
color_mode = "rgb"
# шаг валидации
validation_steps = 30
# основная директория
dir_main = Path("drive/MyDrive/csu/ML")
# пути к фотографиям старцев
class1 = get_files_from("Olds", "jpg")
# пути к фотографиям юнцов
class2 = get_files_from("Youngs", "jpg")
# массив всех изображений
images = class1 + class2

# **Обработка данных**

Здесь осуществляется обработка данных, перед формированием наборов данных. Их можно искажать, подгонять под правильные размеры.

## Изменение размеров изображений

Здесь осуществялется изменение размеров всех фотографий.

In [None]:
for f in images:
  
  Image.open(f).resize((img_width, img_height)).save(f)

# **Формирование данных**

Здесь осуществялется формирование наборов данных.

## Очистка предыдущих наборов данных

Здесь осуществялется очистка всех фотографий из папок преназначенных для формирования наборов данных.

In [None]:
# удаление тренировочной папки
remove_files_from("Train/Olds")
remove_files_from("Train/Youngs")
# удаление валидационной папки
remove_files_from("Validate/Olds")
remove_files_from("Validate/Youngs")
# удаление тестовой папки
remove_files_from("Test/Olds")
remove_files_from("Test/Youngs")

## Заполнение папок наборов данных

Здесь формируются папки будущих наборов данных.

In [None]:
# заполнение тренировочной папки
copy_files_from("Train/Olds", class1[:(int)(len(class1)*0.7)])
copy_files_from("Train/Youngs", class2[:(int)(len(class2)*0.7)])

In [None]:
# заполнение валидационной папки
copy_files_from("Validate/Olds", class1[(int)(len(class1)*0.7):(int)(len(class1)*0.85)])
copy_files_from("Validate/Youngs", class2[(int)(len(class2)*0.7):(int)(len(class2)*0.85)])

In [None]:
# заполнение тестовой папки
copy_files_from("Test/Olds", class1[(int)(len(class1)*0.85):])
copy_files_from("Test/Youngs", class2[(int)(len(class2)*0.85):])

## Создание наборов данных

Здесь осуществляется формирование наборов данных, как объектов tf. Для формирования используется подгрузка данных из папок. **Формировать такие наборы следует в отдельных блоках**.

In [None]:
# создание тренировочного датасета
train_ds = tf.keras.utils.image_dataset_from_directory(
  "drive/MyDrive/csu/ML/Train/",
  seed=123,
  shuffle=True,
  subset="validation",
  color_mode=color_mode,
  class_names = class_names,
  batch_size=batch_size,
  image_size=img_size[:2],
  validation_split=0.2)

In [None]:
# создание валидационного датасета
validate_ds = tf.keras.utils.image_dataset_from_directory(
  "drive/MyDrive/csu/ML/Validate/",
  seed=123,
  shuffle=True,
  subset="validation",
  color_mode=color_mode,
  class_names = class_names,
  batch_size=batch_size,
  image_size=img_size[:2],
  validation_split=0.2)

## Создание таблиц

Здесь осущетсвялется формирование таблиц на основе наборов данных.

In [None]:
# тренировочный датафрейм
set_training = [(file.as_posix(), file.parent.name) for file in dir_main.joinpath("Train").glob("**/*.*")]
train_df = pd.DataFrame(data=set_training, columns=['file', 'label'])
train_df['label_i'] = train_df['label'].astype('category').cat.codes
train_df.head()

In [None]:
# валидационный датафрейм
set_validate = [(file.as_posix(), file.parent.name) for file in dir_main.joinpath('Validate').glob('**/*.*')]
val_df = pd.DataFrame(data=set_validate, columns=['file', 'label'])
val_df['label_i'] = val_df['label'].astype('category').cat.codes
val_df.head()

# **Формирование Модели**

Здесь осуществляется формирование модели.

## Создание модели данных

In [None]:
# создание модели на основе наборов данных
model = Sequential([
  tf.keras.layers.Flatten(input_shape=img_size),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10)
])

## Компиляция

In [None]:
model.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy'])

# **Обучение Модели**

In [None]:
history = model.fit(
    train_ds,
    epochs=epochs,
    validation_data=validate_ds,
    validation_steps=validation_steps)