<a href="https://colab.research.google.com/github/MaxKuzmenko/age-determinant/blob/master/Article.%20DIY%20Transformer.%20%20Aplication.%20MaxKuz13.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Трансформер с нуля до реализации. Приложение.

## Подготовка:

In [None]:
import numpy as np
import random
from typing import Union, Optional

In [None]:
# !pip install cupy-cuda12x

## Код для практики:

Следующий код помощет понять смысл масштабирования эксперементальным путем. С помощью множества экспериментов мы собираем статистику стандартных отклонений произведения случайных матриц разных размеров. Для каждого размера, усредняем их стандартные отклонения и среднее значением по модулю, так как нас интересует сама его величина.


In [None]:
#@title Функция сбора статистики:
def statistic_matrix(
        sizes: list, experiments: int,
        round_num: int = 9,
        scale: int = 1, scaling: bool = False
) -> None:
    sizes.extend(sizes)
    sizes_pair = sorted(sizes)
    statistics_std = ([], [], [], [])
    statistics_avg = ([], [], [], [])
    for _ in range(experiments):
        # Генерация матриц:
        matrices = []
        matrix = None
        for i in sizes_pair:
            matrix = np.random.normal(size=(i, i), scale=scale)
            matrices.append(matrix)

        # Центрирование матриц:
        matrices = [matrix - matrix.mean() for matrix in matrices]

        # Сбор статистики:
        pairs = zip(matrices[:-1:2], matrices[1::2])
        for i, (matrix_1, matrix_2) in enumerate(pairs):
            # m1 = round(matrix_1.mean(), round_num)
            # m2 = round(matrix_2.mean(), round_num)
            result = matrix_1 @ matrix_2
            result /= np.sqrt(len(result)) if scaling else 1

            avg = round(abs(result.mean()), round_num)
            std = round(result.std(), round_num)
            statistics_avg[i].append(avg)
            statistics_std[i].append(std)

    # Вывод:
    for i, (avg, std) in enumerate(zip(statistics_avg, statistics_std)):
        avg = round(np.mean(avg), round_num)
        std = round(np.mean(std), round_num)
        print(f"Матрицы размера {sizes[i]},   СКО = {std},   Среднее = {avg}")


In [None]:
#@title Влияние масштаба на среднее и стандартное отклонение матриц:
experiments = 1000         # Количество экспериментов
sizes = [3, 16, 64, 512]  # Размеры матриц
round_num = 5             # Округление
scale = 1                 # Стандартное отклонение
scaling = False           # Масштабирование

statistic_matrix(sizes, experiments, round_num, scale, scaling)

Матрицы размера 3,   СКО = 1.37415,   Среднее = 0.34911
Матрицы размера 16,   СКО = 3.96705,   Среднее = 0.19906
Матрицы размера 64,   СКО = 7.9948,   Среднее = 0.10101
Матрицы размера 512,   СКО = 22.62789,   Среднее = 0.03494


In [None]:
#@title Масштабирование матриц:
experiments = 1000         # Количество экспериментов
sizes = [3, 16, 64, 512]  # Размеры матриц
round_num = 5             # Округление
scale = 1                 # Стандартное отклонение
scaling = True            # Масштабирование

statistic_matrix(sizes, experiments, round_num, scale, scaling)

Матрицы размера 3,   СКО = 0.77202,   Среднее = 0.18582
Матрицы размера 16,   СКО = 0.99305,   Среднее = 0.04576
Матрицы размера 64,   СКО = 0.99852,   Среднее = 0.01214
Матрицы размера 512,   СКО = 0.99998,   Среднее = 0.00157
