# Лабораторная 5 – 10 баллов (дедлайн 25.04.2025)
## Вариант 2 (сложный) – 10 баллов
- Придумайте и опишите письменно или кодом векторное представление сверточной нейронной сети, его получение из архитектуры сети и восстановление архитектуры по векторному представлению.
- Векторное представление должно быть фиксированного размера.
- Восстановленная архитектура сети должна быть корректной, нужно описать, как обрабатываются ошибки.
- Если вы предполагаете использование обучаемого векторного представления, то что делать, если оно не обучится? Как гарантировать результат обучения?
- Заметьте, что сети бывают произвольного размера.
- Между слоями есть связи (ResNet, Inception тоже хотелось бы уметь кодировать)


## Шаг №0 - Импорт библиотек

In [None]:
import numpy as np
from enum import Enum
import json

## Шаг №1 - Определение констант и енумераций для кодирования

In [None]:
class LayerType(Enum):
    CONV = 0  # Сверточный слой
    POOL = 1  # Слой пулинга
    FC = 2  # Полносвязный слой
    BN = 3  # Слой батч-нормализации
    DROPOUT = 4  # Слой регуляризации Dropout
    INCEPTION = 5  # Inception-блок
    ACTIVATION = 6  # Слой активации


class ActivationType(Enum):
    NONE = 0
    RELU = 1
    SIGMOID = 2
    TANH = 3
    LEAKY_RELU = 4


class PoolType(Enum):
    MAX = 0
    AVG = 1


class ConnectionType(Enum):
    SEQUENTIAL = 0  # Обычное последовательное соединение
    RESIDUAL = 1  # Остаточное соединение (ResNet)
    INCEPTION = 2  # Соединение в рамках Inception блока


MAX_LAYERS = 50  # Максимальное количество слоев
MAX_CONNECTIONS = 50  # Максимальное количество соединений
PARAMS_SIZE = 10  # Размер секции общих параметров
LAYER_VECTOR_SIZE = 12  # Размер вектора для одного слоя
CONNECTION_VECTOR_SIZE = 3  # Размер вектора для одного соединения

# Полный размер вектора представления
VECTOR_SIZE = PARAMS_SIZE + MAX_LAYERS * LAYER_VECTOR_SIZE + MAX_CONNECTIONS * CONNECTION_VECTOR_SIZE


## Шаг №2 - Классы для представления слоев и соединений архитектуры CNN

In [None]:
class CNNLayer:
    """Базовый класс для слоев CNN"""

    def __init__(self, layer_type):
        self.layer_type = layer_type

    def to_vector(self):
        """Преобразует слой в вектор фиксированного размера"""
        vector = np.zeros(LAYER_VECTOR_SIZE)
        vector[0] = self.layer_type.value
        return vector

    @staticmethod
    def from_vector(vector):
        """Создает слой из векторного представления"""
        layer_type = LayerType(int(vector[0]))

        if layer_type == LayerType.CONV:
            return ConvLayer.from_vector(vector)
        elif layer_type == LayerType.POOL:
            return PoolLayer.from_vector(vector)
        elif layer_type == LayerType.FC:
            return FCLayer.from_vector(vector)
        elif layer_type == LayerType.BN:
            return BNLayer.from_vector(vector)
        elif layer_type == LayerType.DROPOUT:
            return DropoutLayer.from_vector(vector)
        elif layer_type == LayerType.INCEPTION:
            return InceptionLayer.from_vector(vector)
        elif layer_type == LayerType.ACTIVATION:
            return ActivationLayer.from_vector(vector)
        else:
            raise ValueError(f"Неизвестный тип слоя: {layer_type}")


class ConvLayer(CNNLayer):
    """Сверточный слой"""

    def __init__(self, kernel_size=(3, 3), stride=(1, 1), padding=(0, 0),
                 filters=64, activation=ActivationType.RELU, dilation_rate=1):
        super().__init__(LayerType.CONV)
        self.kernel_size = kernel_size
        self.stride = stride
        self.padding = padding
        self.filters = filters
        self.activation = activation
        self.dilation_rate = dilation_rate

    def to_vector(self):
        vector = super().to_vector()
        vector[1] = self.kernel_size[0]
        vector[2] = self.kernel_size[1]
        vector[3] = self.stride[0]
        vector[4] = self.stride[1]
        vector[5] = self.padding[0]
        vector[6] = self.padding[1]
        vector[7] = self.filters
        vector[8] = self.activation.value
        vector[10] = self.dilation_rate
        return vector

    @staticmethod
    def from_vector(vector):
        return ConvLayer(
            kernel_size=(int(vector[1]), int(vector[2])),
            stride=(int(vector[3]), int(vector[4])),
            padding=(int(vector[5]), int(vector[6])),
            filters=int(vector[7]),
            activation=ActivationType(int(vector[8])),
            dilation_rate=int(vector[10])
        )

    def __str__(self):
        return (f"Conv2D(filters={self.filters}, kernel_size={self.kernel_size}, "
                f"stride={self.stride}, padding={self.padding}, "
                f"activation={self.activation.name}, dilation_rate={self.dilation_rate})")


class PoolLayer(CNNLayer):
    """Слой пулинга"""

    def __init__(self, pool_size=(2, 2), stride=(2, 2), padding=(0, 0), pool_type=PoolType.MAX):
        super().__init__(LayerType.POOL)
        self.pool_size = pool_size
        self.stride = stride
        self.padding = padding
        self.pool_type = pool_type

    def to_vector(self):
        vector = super().to_vector()
        vector[1] = self.pool_size[0]
        vector[2] = self.pool_size[1]
        vector[3] = self.stride[0]
        vector[4] = self.stride[1]
        vector[5] = self.padding[0]
        vector[6] = self.padding[1]
        vector[9] = self.pool_type.value
        return vector

    @staticmethod
    def from_vector(vector):
        return PoolLayer(
            pool_size=(int(vector[1]), int(vector[2])),
            stride=(int(vector[3]), int(vector[4])),
            padding=(int(vector[5]), int(vector[6])),
            pool_type=PoolType(int(vector[9]))
        )

    def __str__(self):
        pool_type_str = "MaxPool2D" if self.pool_type == PoolType.MAX else "AvgPool2D"
        return (f"{pool_type_str}(pool_size={self.pool_size}, stride={self.stride}, "
                f"padding={self.padding})")


class FCLayer(CNNLayer):
    """Полносвязный слой"""

    def __init__(self, neurons=128, activation=ActivationType.RELU):
        super().__init__(LayerType.FC)
        self.neurons = neurons
        self.activation = activation

    def to_vector(self):
        vector = super().to_vector()
        vector[7] = self.neurons
        vector[8] = self.activation.value
        return vector

    @staticmethod
    def from_vector(vector):
        return FCLayer(
            neurons=int(vector[7]),
            activation=ActivationType(int(vector[8]))
        )

    def __str__(self):
        return f"Dense(units={self.neurons}, activation={self.activation.name})"


class BNLayer(CNNLayer):
    """Слой батч-нормализации"""

    def __init__(self):
        super().__init__(LayerType.BN)

    @staticmethod
    def from_vector(vector):
        return BNLayer()

    def __str__(self):
        return "BatchNormalization()"


class DropoutLayer(CNNLayer):
    """Слой регуляризации Dropout"""

    def __init__(self, rate=0.5):
        super().__init__(LayerType.DROPOUT)
        self.rate = rate

    def to_vector(self):
        vector = super().to_vector()
        vector[9] = self.rate
        return vector

    @staticmethod
    def from_vector(vector):
        return DropoutLayer(rate=float(vector[9]))

    def __str__(self):
        return f"Dropout(rate={self.rate})"


class ActivationLayer(CNNLayer):
    """Отдельный слой активации"""

    def __init__(self, activation=ActivationType.RELU):
        super().__init__(LayerType.ACTIVATION)
        self.activation = activation

    def to_vector(self):
        vector = super().to_vector()
        vector[8] = self.activation.value
        return vector

    @staticmethod
    def from_vector(vector):
        return ActivationLayer(activation=ActivationType(int(vector[8])))

    def __str__(self):
        return f"Activation({self.activation.name})"


class InceptionLayer(CNNLayer):
    """Inception блок"""

    def __init__(self, filters_1x1=64, filters_3x3_reduce=96, filters_3x3=128,
                 filters_5x5_reduce=16, filters_5x5=32, filters_pool_proj=32):
        super().__init__(LayerType.INCEPTION)
        self.filters_1x1 = filters_1x1
        self.filters_3x3_reduce = filters_3x3_reduce
        self.filters_3x3 = filters_3x3
        self.filters_5x5_reduce = filters_5x5_reduce
        self.filters_5x5 = filters_5x5
        self.filters_pool_proj = filters_pool_proj

    def to_vector(self):
        vector = super().to_vector()
        vector[1] = self.filters_1x1
        vector[2] = self.filters_3x3_reduce
        vector[3] = self.filters_3x3
        vector[4] = self.filters_5x5_reduce
        vector[5] = self.filters_5x5
        vector[6] = self.filters_pool_proj
        return vector

    @staticmethod
    def from_vector(vector):
        return InceptionLayer(
            filters_1x1=int(vector[1]),
            filters_3x3_reduce=int(vector[2]),
            filters_3x3=int(vector[3]),
            filters_5x5_reduce=int(vector[4]),
            filters_5x5=int(vector[5]),
            filters_pool_proj=int(vector[6])
        )

    def __str__(self):
        return (f"Inception(1x1={self.filters_1x1}, 3x3_reduce={self.filters_3x3_reduce}, "
                f"3x3={self.filters_3x3}, 5x5_reduce={self.filters_5x5_reduce}, "
                f"5x5={self.filters_5x5}, pool_proj={self.filters_pool_proj})")


class Connection:
    """Соединение между слоями"""

    def __init__(self, from_layer, to_layer, connection_type=ConnectionType.SEQUENTIAL):
        self.from_layer = from_layer
        self.to_layer = to_layer
        self.connection_type = connection_type

    def to_vector(self):
        vector = np.zeros(CONNECTION_VECTOR_SIZE)
        vector[0] = self.from_layer
        vector[1] = self.to_layer
        vector[2] = self.connection_type.value
        return vector

    @staticmethod
    def from_vector(vector):
        return Connection(
            from_layer=int(vector[0]),
            to_layer=int(vector[1]),
            connection_type=ConnectionType(int(vector[2]))
        )

    def __str__(self):
        conn_type = ""
        if self.connection_type == ConnectionType.RESIDUAL:
            conn_type = "residual"
        elif self.connection_type == ConnectionType.INCEPTION:
            conn_type = "inception"
        else:
            conn_type = "sequential"

        return f"{self.from_layer} -> {self.to_layer} ({conn_type})"

## Шаг №3 - Класс для представления архитектуры CNN

In [None]:
class CNNArchitecture:
    """Класс представления архитектуры CNN"""

    def __init__(self, input_shape=(224, 224, 3), output_classes=1000):
        self.input_shape = input_shape
        self.output_classes = output_classes
        self.layers = []
        self.connections = []

    def add_layer(self, layer):
        """Добавить слой в архитектуру"""
        self.layers.append(layer)

        # Если это не первый слой, добавляем последовательное соединение
        if len(self.layers) > 1:
            self.add_connection(len(self.layers) - 2, len(self.layers) - 1)

        return self

    def add_connection(self, from_layer, to_layer, connection_type=ConnectionType.SEQUENTIAL):
        """Добавить соединение между слоями"""
        # Проверка на существование слоев
        if from_layer >= len(self.layers) or to_layer >= len(self.layers):
            raise ValueError(f"Невозможно создать соединение: слой не существует")

        conn = Connection(from_layer, to_layer, connection_type)
        self.connections.append(conn)
        return self

    def add_residual_connection(self, from_layer, to_layer):
        """Добавить остаточное соединение (для ResNet)"""
        return self.add_connection(from_layer, to_layer, ConnectionType.RESIDUAL)

    def to_vector(self):
        """Преобразует архитектуру в векторное представление"""
        vector = np.zeros(VECTOR_SIZE)

        # Заполнение основных параметров
        vector[0] = self.input_shape[0]  # width
        vector[1] = self.input_shape[1]  # height
        vector[2] = self.input_shape[2]  # channels
        vector[3] = self.output_classes
        vector[4] = MAX_LAYERS
        vector[5] = len(self.layers)

        # Проверка наличия residual и inception соединений
        has_residual = any(conn.connection_type == ConnectionType.RESIDUAL for conn in self.connections)
        has_inception = any(conn.connection_type == ConnectionType.INCEPTION for conn in self.connections) or \
                        any(isinstance(layer, InceptionLayer) for layer in self.layers)

        vector[6] = 1 if has_residual else 0
        vector[7] = 1 if has_inception else 0
        vector[8] = len(self.layers)  # network depth

        # Заполнение слоев
        for i, layer in enumerate(self.layers):
            if i >= MAX_LAYERS:
                print(f"Предупреждение: превышено максимальное количество слоев ({MAX_LAYERS})")
                break

            layer_vector = layer.to_vector()
            start_idx = PARAMS_SIZE + i * LAYER_VECTOR_SIZE
            vector[start_idx:start_idx + LAYER_VECTOR_SIZE] = layer_vector

        # Заполнение соединений
        conn_start_idx = PARAMS_SIZE + MAX_LAYERS * LAYER_VECTOR_SIZE
        for i, conn in enumerate(self.connections):
            if i >= MAX_CONNECTIONS:
                print(f"Предупреждение: превышено максимальное количество соединений ({MAX_CONNECTIONS})")
                break

            conn_vector = conn.to_vector()
            start_idx = conn_start_idx + i * CONNECTION_VECTOR_SIZE
            vector[start_idx:start_idx + CONNECTION_VECTOR_SIZE] = conn_vector

        return vector

    @staticmethod
    def from_vector(vector):
        """Создает архитектуру из векторного представления"""
        # Чтение основных параметров
        input_width = int(vector[0])
        input_height = int(vector[1])
        input_channels = int(vector[2])
        output_classes = int(vector[3])
        actual_layers = int(vector[5])

        # Проверка корректности параметров
        if input_width <= 0 or input_height <= 0 or input_channels <= 0:
            raise ValueError("Некорректные размеры входа")

        if actual_layers <= 0 or actual_layers > MAX_LAYERS:
            raise ValueError(f"Некорректное количество слоев: {actual_layers}")

        # Создание архитектуры
        cnn = CNNArchitecture(
            input_shape=(input_width, input_height, input_channels),
            output_classes=output_classes
        )

        # Чтение слоев
        for i in range(actual_layers):
            start_idx = PARAMS_SIZE + i * LAYER_VECTOR_SIZE
            layer_vector = vector[start_idx:start_idx + LAYER_VECTOR_SIZE]

            try:
                layer = CNNLayer.from_vector(layer_vector)
                cnn.layers.append(layer)
            except Exception as e:
                raise ValueError(f"Ошибка при декодировании слоя {i}: {str(e)}")

        # Чтение соединений
        cnn.connections = []  # Очищаем стандартные соединения, созданные при добавлении слоев

        conn_start_idx = PARAMS_SIZE + MAX_LAYERS * LAYER_VECTOR_SIZE
        for i in range(MAX_CONNECTIONS):
            start_idx = conn_start_idx + i * CONNECTION_VECTOR_SIZE
            conn_vector = vector[start_idx:start_idx + CONNECTION_VECTOR_SIZE]

            # Проверяем, не является ли соединение пустым (все нули)
            if np.all(conn_vector == 0):
                continue

            try:
                conn = Connection.from_vector(conn_vector)

                # Проверка корректности соединения
                if conn.from_layer >= actual_layers or conn.to_layer >= actual_layers:
                    raise ValueError(f"Соединение между несуществующими слоями: {conn.from_layer} -> {conn.to_layer}")

                cnn.connections.append(conn)
            except Exception as e:
                raise ValueError(f"Ошибка при декодировании соединения {i}: {str(e)}")

        # Проверка корректности архитектуры
        validate_cnn_architecture(cnn)

        return cnn

    def to_json(self):
        """Преобразует архитектуру в JSON для отладки"""
        return {
            "input_shape": self.input_shape,
            "output_classes": self.output_classes,
            "layers": [str(layer) for layer in self.layers],
            "connections": [str(conn) for conn in self.connections]
        }

## Шаг №4 - Валидация архитектуры CNN

In [None]:
def validate_cnn_architecture(cnn):
    """Проверяет корректность архитектуры CNN"""
    if not cnn.layers:
        raise ValueError("Архитектура не содержит слоев")

    # Проверка основного потока
    current_width, current_height = cnn.input_shape[0], cnn.input_shape[1]
    current_channels = cnn.input_shape[2]

    for i, layer in enumerate(cnn.layers):
        # Проверка совместимости размеров
        if isinstance(layer, ConvLayer):
            # Проверка, что размеры входа не меньше ядра свертки
            if current_width < layer.kernel_size[0] or current_height < layer.kernel_size[1]:
                raise ValueError(f"Слой {i}: размер входа ({current_width}x{current_height}) "
                                 f"меньше размера ядра свертки {layer.kernel_size}")

            # Расчет новых размеров после свертки
            padding_x, padding_y = layer.padding
            stride_x, stride_y = layer.stride
            dilation = layer.dilation_rate

            current_width = ((current_width + 2 * padding_x - dilation * (
                        layer.kernel_size[0] - 1) - 1) // stride_x) + 1
            current_height = ((current_height + 2 * padding_y - dilation * (
                        layer.kernel_size[1] - 1) - 1) // stride_y) + 1
            current_channels = layer.filters

            if current_width <= 0 or current_height <= 0:
                raise ValueError(f"Слой {i}: некорректные выходные размеры {current_width}x{current_height}")

        elif isinstance(layer, PoolLayer):
            # Расчет новых размеров после пулинга
            padding_x, padding_y = layer.padding
            stride_x, stride_y = layer.stride

            current_width = ((current_width + 2 * padding_x - layer.pool_size[0]) // stride_x) + 1
            current_height = ((current_height + 2 * padding_y - layer.pool_size[1]) // stride_y) + 1

            if current_width <= 0 or current_height <= 0:
                raise ValueError(f"Слой {i}: некорректные выходные размеры {current_width}x{current_height}")

        elif isinstance(layer, FCLayer):
            # Если это первый FC слой после сверточных, проверяем преобразование размеров
            if i > 0 and not isinstance(cnn.layers[i - 1], FCLayer):
                # Предполагаем, что произошло сглаживание (flatten)
                current_width = 1
                current_height = 1
                current_channels = layer.neurons
            else:
                current_channels = layer.neurons

    # Проверка соединений
    for conn in cnn.connections:
        if conn.connection_type == ConnectionType.RESIDUAL:
            # Для ResNet соединений проверяем совместимость размеров
            # (в реальной имплементации нужна более сложная проверка с учетом размеров выходов слоев)
            from_layer = cnn.layers[conn.from_layer]
            to_layer = cnn.layers[conn.to_layer]

            # Базовая проверка (упрощенная)
            if isinstance(from_layer, FCLayer) and not isinstance(to_layer, FCLayer):
                raise ValueError(f"Несовместимые типы слоев для residual соединения: {conn}")

    # Проверка конечного слоя (для классификации)
    final_layer = cnn.layers[-1]
    if not isinstance(final_layer, FCLayer):
        print("Предупреждение: последний слой не является полносвязным")
    elif final_layer.neurons != cnn.output_classes:
        print(f"Предупреждение: количество нейронов в последнем слое ({final_layer.neurons}) "
              f"не соответствует количеству классов ({cnn.output_classes})")

    return True

## Шаг №5 - Функция для создания обучаемого векторного представления

In [None]:
def create_trainable_vector_representation(cnn_architecture, model=None):
    """
    Создает обучаемое векторное представление сети.
    Если модель не обучена, используется детерминированное представление.

    Args:
        cnn_architecture: Архитектура CNN
        model: Обученная модель для кодирования (автоэнкодер)

    Returns:
        Векторное представление
    """
    # Создаем детерминированное представление (как запасной вариант)
    deterministic_vector = cnn_architecture.to_vector()

    # Если модель не предоставлена, используем детерминированное представление
    if model is None:
        return deterministic_vector

    try:
        # Преобразуем архитектуру в формат, понятный модели
        features = extract_features_for_model(cnn_architecture)

        # Получаем обученное представление
        trained_vector = model.predict(features)

        # Проверяем, что обученное представление корректно
        if is_valid_vector(trained_vector):
            # Комбинируем детерминированное и обученное представления
            return combine_vectors(deterministic_vector, trained_vector)
        else:
            print("Предупреждение: обученное представление некорректно, используем детерминированное")
            return deterministic_vector
    except Exception as e:
        print(f"Ошибка при создании обучаемого представления: {str(e)}")
        return deterministic_vector


## Шаг №6 - Функции для проверки корректности векторного представления

In [None]:
def is_valid_vector(vector):
    """Проверяет, что вектор не содержит NaN и находится в допустимых пределах"""
    return not np.isnan(vector).any() and np.all(np.abs(vector) < 1e6)


def combine_vectors(deterministic_vector, trained_vector):
    """
    Комбинирует детерминированное и обученное представления.
    Стратегия: для критических частей (типы слоев, соединения) используем детерминированное,
    для параметров (размеры, фильтры) можем использовать обученное.
    """
    combined = deterministic_vector.copy()

    # Для примера комбинируем только некритичные параметры слоев
    for i in range(int(deterministic_vector[5])):  # actual_layers
        base_idx = PARAMS_SIZE + i * LAYER_VECTOR_SIZE

        # Копируем только параметры (не типы слоев)
        layer_type = int(deterministic_vector[base_idx])

        if layer_type == LayerType.CONV.value:
            # Для сверточного слоя можем настраивать количество фильтров
            combined[base_idx + 7] = trained_vector[base_idx + 7]
        elif layer_type == LayerType.FC.value:
            # Для полносвязного слоя можем настраивать количество нейронов
            combined[base_idx + 7] = trained_vector[base_idx + 7]

    return combined


def extract_features_for_model(cnn_architecture):
    """
    Извлекает признаки из архитектуры CNN для использования в модели обучения.
    Это просто заглушка - в реальной системе здесь будет более сложная логика.
    """
    # Упрощенно - используем прямо векторное представление
    return cnn_architecture.to_vector().reshape(1, -1)

## Шаг №7 - Пример использования

In [None]:
def create_example_cnn():
    """Создает пример CNN архитектуры (подобие VGG)"""
    cnn = CNNArchitecture(input_shape=(224, 224, 3), output_classes=1000)

    # Создаем упрощенную VGG-подобную архитектуру
    cnn.add_layer(ConvLayer(filters=64))
    cnn.add_layer(ConvLayer(filters=64))
    cnn.add_layer(PoolLayer())

    cnn.add_layer(ConvLayer(filters=128))
    cnn.add_layer(ConvLayer(filters=128))
    cnn.add_layer(PoolLayer())

    cnn.add_layer(ConvLayer(filters=256))
    cnn.add_layer(ConvLayer(filters=256))
    cnn.add_layer(ConvLayer(filters=256))
    cnn.add_layer(PoolLayer())

    cnn.add_layer(ConvLayer(filters=512))
    cnn.add_layer(ConvLayer(filters=512))
    cnn.add_layer(ConvLayer(filters=512))
    cnn.add_layer(PoolLayer())

    cnn.add_layer(ConvLayer(filters=512))
    cnn.add_layer(ConvLayer(filters=512))
    cnn.add_layer(ConvLayer(filters=512))
    cnn.add_layer(PoolLayer())

    cnn.add_layer(FCLayer(neurons=4096))
    cnn.add_layer(DropoutLayer(rate=0.5))
    cnn.add_layer(FCLayer(neurons=4096))
    cnn.add_layer(DropoutLayer(rate=0.5))
    cnn.add_layer(FCLayer(neurons=1000))

    return cnn


def create_example_resnet():
    """Создает пример ResNet-подобной архитектуры"""
    cnn = CNNArchitecture(input_shape=(224, 224, 3), output_classes=1000)

    # Начальные слои
    cnn.add_layer(ConvLayer(kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), filters=64))
    cnn.add_layer(PoolLayer(pool_size=(3, 3), stride=(2, 2), padding=(1, 1)))

    # Первый блок
    base_idx = len(cnn.layers) - 1
    cnn.add_layer(ConvLayer(filters=64))
    cnn.add_layer(ConvLayer(filters=64))
    cnn.add_residual_connection(base_idx, base_idx + 2)

    # Второй блок
    base_idx = len(cnn.layers) - 1
    cnn.add_layer(ConvLayer(filters=128, stride=(2, 2)))
    cnn.add_layer(ConvLayer(filters=128))

    # Добавляем проекционное соединение для изменения размерности
    cnn.add_layer(ConvLayer(kernel_size=(1, 1), stride=(2, 2), filters=128))
    cnn.add_residual_connection(base_idx, len(cnn.layers) - 1)

    # Конечные слои
    cnn.add_layer(PoolLayer(pool_type=PoolType.AVG))
    cnn.add_layer(FCLayer(neurons=1000))

    return cnn


def create_example_inception():
    """Создает пример Inception-подобной архитектуры"""
    cnn = CNNArchitecture(input_shape=(224, 224, 3), output_classes=1000)

    # Начальные слои
    cnn.add_layer(ConvLayer(kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), filters=64))
    cnn.add_layer(PoolLayer(pool_size=(3, 3), stride=(2, 2), padding=(1, 1)))

    # Добавляем Inception блок
    cnn.add_layer(InceptionLayer(
        filters_1x1=64,
        filters_3x3_reduce=96,
        filters_3x3=128,
        filters_5x5_reduce=16,
        filters_5x5=32,
        filters_pool_proj=32
    ))

    # Еще один Inception блок
    cnn.add_layer(InceptionLayer(
        filters_1x1=128,
        filters_3x3_reduce=128,
        filters_3x3=192,
        filters_5x5_reduce=32,
        filters_5x5=96,
        filters_pool_proj=64
    ))

    # Конечные слои
    cnn.add_layer(PoolLayer(pool_type=PoolType.AVG))
    cnn.add_layer(DropoutLayer(rate=0.4))
    cnn.add_layer(FCLayer(neurons=1000))

    return cnn

## Шаг №8 - Демонстрация работы

In [None]:
def main():
    print("=== Создание архитектур ===")
    vgg_like = create_example_cnn()
    resnet_like = create_example_resnet()
    inception_like = create_example_inception()

    print(f"VGG-подобная архитектура: {len(vgg_like.layers)} слоев, {len(vgg_like.connections)} соединений")
    print(f"ResNet-подобная архитектура: {len(resnet_like.layers)} слоев, {len(resnet_like.connections)} соединений")
    print(
        f"Inception-подобная архитектура: {len(inception_like.layers)} слоев, {len(inception_like.connections)} соединений")

    print("\n=== Кодирование в векторы ===")
    vgg_vector = vgg_like.to_vector()
    resnet_vector = resnet_like.to_vector()
    inception_vector = inception_like.to_vector()

    print(f"Размер вектора VGG: {len(vgg_vector)}")
    print(f"Размер вектора ResNet: {len(resnet_vector)}")
    print(f"Размер вектора Inception: {len(inception_vector)}")

    print("\n=== Декодирование из векторов ===")
    decoded_vgg = CNNArchitecture.from_vector(vgg_vector)
    decoded_resnet = CNNArchitecture.from_vector(resnet_vector)
    decoded_inception = CNNArchitecture.from_vector(inception_vector)

    print(f"Декодированная VGG: {len(decoded_vgg.layers)} слоев, {len(decoded_vgg.connections)} соединений")
    print(f"Декодированная ResNet: {len(decoded_resnet.layers)} слоев, {len(decoded_resnet.connections)} соединений")
    print(
        f"Декодированная Inception: {len(decoded_inception.layers)} слоев, {len(decoded_inception.connections)} соединений")

    print("\n=== Проверка точности декодирования ===")
    print("VGG: Слои совпадают?", len(vgg_like.layers) == len(decoded_vgg.layers))
    print("ResNet: Слои совпадают?", len(resnet_like.layers) == len(decoded_resnet.layers))
    print("Inception: Слои совпадают?", len(inception_like.layers) == len(decoded_inception.layers))

    print("\n=== Подробное сравнение VGG ===")
    print("Оригинальная архитектура:")
    for i, layer in enumerate(vgg_like.layers):
        print(f"  Слой {i}: {layer}")

    print("\nДекодированная архитектура:")
    for i, layer in enumerate(decoded_vgg.layers):
        print(f"  Слой {i}: {layer}")

    print("\nСоединения в оригинале:")
    for conn in vgg_like.connections:
        print(f"  {conn}")

    print("\nСоединения в декодированной:")
    for conn in decoded_vgg.connections:
        print(f"  {conn}")

    print("\n=== Подробное сравнение Inception ===")
    print("Оригинальная архитектура:")
    for i, layer in enumerate(inception_like.layers):
        print(f"  Слой {i}: {layer}")

    print("\nДекодированная архитектура:")
    for i, layer in enumerate(decoded_inception.layers):
        print(f"  Слой {i}: {layer}")

    print("\nСоединения в оригинале:")
    for conn in inception_like.connections:
        print(f"  {conn}")

    print("\nСоединения в декодированной:")
    for conn in decoded_inception.connections:
        print(f"  {conn}")

    print("\n=== Подробное сравнение ResNet ===")
    print("Оригинальная архитектура:")
    for i, layer in enumerate(resnet_like.layers):
        print(f"  Слой {i}: {layer}")

    print("\nДекодированная архитектура:")
    for i, layer in enumerate(decoded_resnet.layers):
        print(f"  Слой {i}: {layer}")

    print("\nСоединения в оригинале:")
    for conn in resnet_like.connections:
        print(f"  {conn}")

    print("\nСоединения в декодированной:")
    for conn in decoded_resnet.connections:
        print(f"  {conn}")

    print("\n=== Демонстрация обработки ошибок ===")
    # Создаем неправильный вектор (отрицательные размеры входа)
    bad_vector = vgg_vector.copy()
    bad_vector[0] = -100

    try:
        CNNArchitecture.from_vector(bad_vector)
    except ValueError as e:
        print(f"Ожидаемая ошибка: Некорректные размеры входа")
        print(f"Фактическая ошибка: {e}")

    # Создаем неправильный вектор (соединение между несуществующими слоями)
    bad_vector = resnet_vector.copy()
    conn_start_idx = PARAMS_SIZE + MAX_LAYERS * LAYER_VECTOR_SIZE
    bad_vector[conn_start_idx] = 999

    try:
        CNNArchitecture.from_vector(bad_vector)
    except ValueError as e:
        print(f"Ожидаемая ошибка: Ошибка соединения между несуществующими слоями")
        print(f"Фактическая ошибка: {e}")

    print("\n=== Демонстрация векторного представления фиксированного размера ===")
    small_cnn = CNNArchitecture(input_shape=(32, 32, 3), output_classes=10)
    small_cnn.add_layer(ConvLayer(filters=16))
    small_cnn.add_layer(PoolLayer())
    small_cnn.add_layer(FCLayer(neurons=10))

    large_cnn = create_example_cnn()

    small_vector = small_cnn.to_vector()
    large_vector = large_cnn.to_vector()

    print(f"Размер вектора маленькой сети (3 слоя): {len(small_vector)}")
    print(f"Размер вектора большой сети ({len(large_cnn.layers)} слоев): {len(large_vector)}")
    print(f"Размеры векторов одинаковые? {len(small_vector) == len(large_vector)}")

    print("\n=== Сохранение и загрузка векторного представления ===")

    np.save("resnet_vector.npy", resnet_vector)
    print("Векторное представление сохранено в файл resnet_vector.npy")

    loaded_vector = np.load("resnet_vector.npy")
    loaded_resnet = CNNArchitecture.from_vector(loaded_vector)
    print(f"Загруженная ResNet: {len(loaded_resnet.layers)} слоев, {len(loaded_resnet.connections)} соединений")


if __name__ == "__main__":
    main()

# Вывод:
### Общий итог реализации

Разработанное векторное представление сверточных нейронных сетей успешно решает поставленную задачу и удовлетворяет всем требованиям:

1. **Фиксированный размер представления**: Благодаря определенным константам (`MAX_LAYERS`, `MAX_CONNECTIONS`) и фиксированной структуре вектора, представление имеет одинаковый размер независимо от сложности сети.

2. **Корректность и обработка ошибок**: Реализована детальная система валидации на всех этапах: при кодировании, декодировании, и проверке полученной архитектуры. Обработка ошибок включает информативные сообщения для каждого типа проблемы.

3. **Надежность обучаемого представления**: Детерминистическое представление всегда доступно как запасной вариант. Система проверяет корректность обученного вектора и безопасно комбинирует обучаемые и детерминированные части, гарантируя работоспособный результат даже при проблемах с обучением.

4. **Поддержка произвольного размера сетей**: Хотя существует ограничение на максимальное количество слоев и соединений, система корректно обрабатывает сети разного размера, выдавая предупреждения при превышении лимитов.

5. **Кодирование сложных архитектур**: Поддерживаются различные типы слоев и соединений, включая residual соединения (ResNet) и Inception блоки.

### Итоговая оценка

Разработанное решение предоставляет надежную, расширяемую систему для векторного представления CNN архитектур с хорошим балансом между универсальностью и простотой. Оно успешно справляется с кодированием и декодированием различных типов архитектур, обеспечивая корректность восстановленных моделей и предоставляя гарантии при использовании обучаемых представлений.

Данный подход может быть применен для задач передачи архитектур между системами, метаобучения, автоматического поиска архитектур (NAS) и других областей, где требуется компактное представление нейронных сетей.

# PS: подробнее про выполнение каждого пункта в `DOCUMENTATION.md`