In [None]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
import keras_tuner as kt # Импортируем KerasTuner
import numpy as np
import matplotlib.pyplot as plt

# 0. Проверка и установка KerasTuner, если необходимо
# !pip install keras-tuner -q # Раскомментируйте, если KerasTuner не установлен

print(f"TensorFlow version: {tf.__version__}")
print(f"KerasTuner version: {kt.__version__}")

# 1. Загрузка и подготовка данных (Fashion MNIST)
(x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data()

# Нормализация изображений
x_train = x_train.astype("float32") / 255.0
x_test = x_test.astype("float32") / 255.0

# Добавление канала (т.к. CNN ожидает 4D тензор: [batch, height, width, channels])
x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)

print(f"x_train shape: {x_train.shape}")
print(f"y_train shape: {y_train.shape}")
print(f"x_test shape: {x_test.shape}")
print(f"y_test shape: {y_test.shape}")

num_classes = 10
input_shape = x_train.shape[1:] # (28, 28, 1)

# 2. Создание функции для построения модели (hypermodel)
def build_model(hp):
    model = keras.Sequential()
    model.add(layers.Input(shape=input_shape))

    # Тюнинг количества фильтров в первом сверточном слое
    hp_filters1 = hp.Int('filters_1', min_value=32, max_value=128, step=32)
    model.add(layers.Conv2D(filters=hp_filters1, kernel_size=(3, 3), activation="relu"))
    model.add(layers.MaxPooling2D(pool_size=(2, 2)))

    # Тюнинг количества фильтров во втором сверточном слое
    # hp_filters2 = hp.Int('filters_2', min_value=32, max_value=64, step=16) # Можно добавить больше слоев
    # model.add(layers.Conv2D(filters=hp_filters2, kernel_size=(3, 3), activation="relu"))
    # model.add(layers.MaxPooling2D(pool_size=(2, 2)))

    model.add(layers.Flatten())

    # Тюнинг количества нейронов в полносвязном слое
    hp_units = hp.Int('units', min_value=32, max_value=512, step=32)
    model.add(layers.Dense(units=hp_units, activation="relu"))

    # Тюнинг коэффициента Dropout
    hp_dropout_rate = hp.Float('dropout_rate', min_value=0.0, max_value=0.5, step=0.1)
    model.add(layers.Dropout(rate=hp_dropout_rate))

    model.add(layers.Dense(num_classes, activation="softmax"))

    # Тюнинг скорости обучения
    hp_learning_rate = hp.Choice('learning_rate', values=[1e-2, 1e-3, 1e-4])

    model.compile(
        optimizer=keras.optimizers.Adam(learning_rate=hp_learning_rate),
        loss="sparse_categorical_crossentropy", # Используем sparse, т.к. y_train - это индексы классов
        metrics=["accuracy"],
    )
    return model

# 3. Настройка и запуск KerasTuner
# Мы будем использовать RandomSearch. Другие опции: Hyperband, BayesianOptimization
tuner = kt.RandomSearch(
    build_model,
    objective='val_accuracy', # Метрика для оптимизации
    max_trials=10,  # Количество комбинаций гиперпараметров для проверки (увеличьте для реальных задач)
    executions_per_trial=1, # Сколько раз обучать каждую модель (для стабильности, увеличьте для реальных задач)
    directory='keras_tuner_dir', # Директория для сохранения результатов
    project_name='fashion_mnist_tuning'
)

# Выводим информацию о пространстве поиска
tuner.search_space_summary()

# Определяем колбэк для ранней остановки, чтобы не тратить время на плохие конфигурации
stop_early = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=5)

# Запускаем поиск лучших гиперпараметров
# Используем validation_split для создания валидационной выборки из обучающей
print("\nStarting hyperparameter search...")
tuner.search(
    x_train, y_train,
    epochs=10, # Количество эпох для каждой *пробной* модели (увеличьте для реальных задач)
    validation_split=0.2,
    callbacks=[stop_early],
    verbose=1 # Можно поставить 0 или 2 для меньшего вывода
)

# Выводим лучшие найденные гиперпараметры
print("\n--- Best Hyperparameters ---")
best_hps = tuner.get_best_hyperparameters(num_trials=1)[0]

print(f"""
The hyperparameter search is complete.
Optimal number of filters in the first conv layer: {best_hps.get('filters_1')}
Optimal number of units in the first dense layer: {best_hps.get('units')}
Optimal dropout rate: {best_hps.get('dropout_rate'):.2f}
Optimal learning rate for the optimizer: {best_hps.get('learning_rate')}
""")

# Можно также получить лучшую модель напрямую
best_model_from_tuner = tuner.get_best_models(num_models=1)[0]
print("\nSummary of the best model from tuner:")
best_model_from_tuner.summary()


# 4. Обучение лучшей модели
# Теперь построим модель с лучшими гиперпараметрами и обучим ее на большем количестве эпох
print("\n--- Training the best model ---")
model = tuner.hypermodel.build(best_hps) # Строим модель с лучшими hp

# Можно использовать весь x_train для обучения, если уверены, или оставить validation_split
# Для финального обучения можно объединить train и validation данные, если вы уверены
# в гиперпараметрах, и обучать на (x_train + x_val), а тестировать на x_test.
# Здесь для простоты оставим validation_split.

history = model.fit(
    x_train, y_train,
    epochs=30, # Обучаем дольше
    validation_split=0.2,
    callbacks=[stop_early] # Также используем раннюю остановку
)

# 5. Оценка модели на тестовых данных
print("\n--- Evaluating the best model on test data ---")
loss, accuracy = model.evaluate(x_test, y_test, verbose=0)
print(f"Test Loss: {loss:.4f}")
print(f"Test Accuracy: {accuracy:.4f}")

# 6. Визуализация истории обучения (опционально)
def plot_history(history_obj):
    plt.figure(figsize=(12, 4))

    plt.subplot(1, 2, 1)
    plt.plot(history_obj.history['accuracy'], label='Train Accuracy')
    plt.plot(history_obj.history['val_accuracy'], label='Validation Accuracy')
    plt.title('Model Accuracy')
    plt.xlabel('Epoch')
    plt.ylabel('Accuracy')
    plt.legend()

    plt.subplot(1, 2, 2)
    plt.plot(history_obj.history['loss'], label='Train Loss')
    plt.plot(history_obj.history['val_loss'], label='Validation Loss')
    plt.title('Model Loss')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend()

    plt.tight_layout()
    plt.show()

plot_history(history)

# Сохранение лучшей модели (опционально)
# model.save("best_fashion_mnist_model.h5")
# print("\nBest model saved as best_fashion_mnist_model.h5")

# Посмотреть результаты поиска KerasTuner можно командой (в терминале):
# tensorboard --logdir keras_tuner_dir/fashion_mnist_tuning


ModuleNotFoundError: No module named 'keras_tuner'

In [None]:
!pip install keras-tuner -q

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/129.1 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━━━━[0m [32m92.2/129.1 kB[0m [31m2.5 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m129.1/129.1 kB[0m [31m2.4 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
import keras_tuner as kt # Импортируем KerasTuner
import numpy as np
import matplotlib.pyplot as plt

In [None]:
# 0. Проверка и установка KerasTuner, если необходимо
print(f"TensorFlow version: {tf.__version__}")
print(f"KerasTuner version: {kt.__version__}")

TensorFlow version: 2.18.0
KerasTuner version: 1.4.7


In [None]:
# 1. Загрузка и подготовка данных (Fashion MNIST)
(x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data()

# Нормализация изображений
x_train = x_train.astype("float32") / 255.0
x_test = x_test.astype("float32") / 255.0

# Добавление канала (т.к. CNN ожидает 4D тензор: [batch, height, width, channels])
x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)

print(f"x_train shape: {x_train.shape}")
print(f"y_train shape: {y_train.shape}")
print(f"x_test shape: {x_test.shape}")
print(f"y_test shape: {y_test.shape}")

num_classes = 10
input_shape = x_train.shape[1:] # (28, 28, 1)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
[1m29515/29515[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
[1m26421880/26421880[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
[1m5148/5148[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
[1m4422102/4422102[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
x_train shape: (60000, 28, 28, 1)
y_train shape: (60000,)
x_test shape: (10000, 28, 28, 1)
y_test shape: (10000,)


In [None]:
# 2. Создание функции для построения модели (hypermodel)
def build_model(hp):
    model = keras.Sequential()
    model.add(layers.Input(shape=input_shape))

    # Тюнинг количества фильтров в первом сверточном слое
    hp_filters1 = hp.Int('filters_1', min_value=32, max_value=128, step=32)
    model.add(layers.Conv2D(filters=hp_filters1, kernel_size=(3, 3), activation="relu"))
    model.add(layers.MaxPooling2D(pool_size=(2, 2)))

    # Тюнинг количества фильтров во втором сверточном слое
    # hp_filters2 = hp.Int('filters_2', min_value=32, max_value=64, step=16) # Можно добавить больше слоев
    # model.add(layers.Conv2D(filters=hp_filters2, kernel_size=(3, 3), activation="relu"))
    # model.add(layers.MaxPooling2D(pool_size=(2, 2)))

    model.add(layers.Flatten())

    # Тюнинг количества нейронов в полносвязном слое
    hp_units = hp.Int('units', min_value=32, max_value=512, step=32)
    model.add(layers.Dense(units=hp_units, activation="relu"))

    # Тюнинг коэффициента Dropout
    hp_dropout_rate = hp.Float('dropout_rate', min_value=0.0, max_value=0.5, step=0.1)
    model.add(layers.Dropout(rate=hp_dropout_rate))

    model.add(layers.Dense(num_classes, activation="softmax"))

    # Тюнинг скорости обучения
    hp_learning_rate = hp.Choice('learning_rate', values=[1e-2, 1e-3, 1e-4])

    model.compile(
        optimizer=keras.optimizers.Adam(learning_rate=hp_learning_rate),
        loss="sparse_categorical_crossentropy", # Используем sparse, т.к. y_train - это индексы классов
        metrics=["accuracy"],
    )
    return model


In [None]:
# 3. Настройка и запуск KerasTuner
# Мы будем использовать RandomSearch. Другие опции: Hyperband, BayesianOptimization
tuner = kt.RandomSearch(
    build_model,
    objective='val_accuracy', # Метрика для оптимизации
    max_trials=10,  # Количество комбинаций гиперпараметров для проверки (увеличьте для реальных задач)
    executions_per_trial=1, # Сколько раз обучать каждую модель (для стабильности, увеличьте для реальных задач)
    directory='keras_tuner_dir', # Директория для сохранения результатов
    project_name='fashion_mnist_tuning'
)

In [None]:
# Выводим информацию о пространстве поиска
tuner.search_space_summary()

# Определяем колбэк для ранней остановки, чтобы не тратить время на плохие конфигурации
stop_early = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=5)

# Запускаем поиск лучших гиперпараметров
# Используем validation_split для создания валидационной выборки из обучающей
print("\nStarting hyperparameter search...")
tuner.search(
    x_train, y_train,
    epochs=10, # Количество эпох для каждой *пробной* модели (увеличьте для реальных задач)
    validation_split=0.2,
    callbacks=[stop_early],
    verbose=1 # Можно поставить 0 или 2 для меньшего вывода
)


Trial 10 Complete [00h 32m 47s]
val_accuracy: 0.9169999957084656

Best val_accuracy So Far: 0.922166645526886
Total elapsed time: 03h 04m 00s


In [None]:
# Выводим лучшие найденные гиперпараметры
print("\n--- Best Hyperparameters ---")
best_hps = tuner.get_best_hyperparameters(num_trials=1)[0]

print(f"""
The hyperparameter search is complete.
Optimal number of filters in the first conv layer: {best_hps.get('filters_1')}
Optimal number of units in the first dense layer: {best_hps.get('units')}
Optimal dropout rate: {best_hps.get('dropout_rate'):.2f}
Optimal learning rate for the optimizer: {best_hps.get('learning_rate')}
""")

# Можно также получить лучшую модель напрямую
best_model_from_tuner = tuner.get_best_models(num_models=1)[0]
print("\nSummary of the best model from tuner:")
best_model_from_tuner.summary()


In [None]:
# 4. Обучение лучшей модели
# Теперь построим модель с лучшими гиперпараметрами и обучим ее на большем количестве эпох
print("\n--- Training the best model ---")
model = tuner.hypermodel.build(best_hps) # Строим модель с лучшими hp

# Можно использовать весь x_train для обучения, если уверены, или оставить validation_split
# Для финального обучения можно объединить train и validation данные, если вы уверены
# в гиперпараметрах, и обучать на (x_train + x_val), а тестировать на x_test.
# Здесь для простоты оставим validation_split.

history = model.fit(
    x_train, y_train,
    epochs=30, # Обучаем дольше
    validation_split=0.2,
    callbacks=[stop_early] # Также используем раннюю остановку
)


In [None]:
# 5. Оценка модели на тестовых данных
print("\n--- Evaluating the best model on test data ---")
loss, accuracy = model.evaluate(x_test, y_test, verbose=0)
print(f"Test Loss: {loss:.4f}")
print(f"Test Accuracy: {accuracy:.4f}")

# 6. Визуализация истории обучения (опционально)
def plot_history(history_obj):
    plt.figure(figsize=(12, 4))

    plt.subplot(1, 2, 1)
    plt.plot(history_obj.history['accuracy'], label='Train Accuracy')
    plt.plot(history_obj.history['val_accuracy'], label='Validation Accuracy')
    plt.title('Model Accuracy')
    plt.xlabel('Epoch')
    plt.ylabel('Accuracy')
    plt.legend()

    plt.subplot(1, 2, 2)
    plt.plot(history_obj.history['loss'], label='Train Loss')
    plt.plot(history_obj.history['val_loss'], label='Validation Loss')
    plt.title('Model Loss')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend()

    plt.tight_layout()
    plt.show()

plot_history(history)