In [1]:
import numpy as np
import matplotlib.pyplot as plt

from tqdm import tqdm

from src.utils import \
    build_knn_graph, \
    generate_a, \
    generate_h

from src.characteristics import \
    calculate_triangles, \
    calculate_chromatic_number

from src.distributions import \
    lognormal_distribution, \
    exp_distribution

## 1. Исследовать, как ведет себя числовая характеристика $\tau$ в зависимости от параметров распределений $\theta$ и $\nu$, зафиксировав размер выборки и параметр процедуры построения графа.


### 1.1. Исследуем характеристику $\tau^{KNN}$.

Зафиксируем размер выборки $n = 50$ и количество соседей $k = 5$. Число итераций для метода Монте-Карло равно 1000.

#### 1.1.1. Распределение LogNormal с $\mu$ = 0 и параметром $\theta$.

In [10]:
thetas = [0.0001, 0.0005, 0.001, 0.005, 0.01, 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.75, 0.9]
n_samples = 50
k_neighbours = 5
n_iter = 1000

In [None]:
theta_n_triangles = []

for i, theta in enumerate(tqdm(thetas)):
    n_triangles = []
    for _ in range(n_iter):
        vertices = np.random.lognormal(0, theta, n_samples)
        knn_graph = build_knn_graph(vertices, k_neighbours)
        n_triangles.append(calculate_triangles(knn_graph))
    
    theta_n_triangles.append(sum(n_triangles) / n_iter)
    
plt.plot(thetas, theta_n_triangles, color="green")
plt.title("Зависимость $\\tau^{KNN}$ от $\\theta$")
plt.xlabel("Значения $\\theta$")
plt.ylabel("Среднее значение характеристики")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/1.png).

При небольших $\theta$ среднее значение характеристики $\tau^{KNN}$ $\approx 190$ и растет при $\theta \longrightarrow 1$.

In [12]:
thetas = [1, 2, 5, 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 250, 500]
n_samples = 50
k_neighbours = 5
n_iter = 1000

In [None]:
theta_n_triangles = []

for i, theta in enumerate(tqdm(thetas)):
    n_triangles = []
    for _ in range(n_iter):
        vertices = np.random.lognormal(0, theta, n_samples)
        knn_graph = build_knn_graph(vertices, k_neighbours)
        n_triangles.append(calculate_triangles(knn_graph))
    
    theta_n_triangles.append(sum(n_triangles) / n_iter)
    
plt.plot(thetas, theta_n_triangles, color="green")
plt.title("Зависимость $\\tau^{KNN}$ от $\\theta$")
plt.xlabel("Значения $\\theta$")
plt.ylabel("Среднее значение характеристики")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/2.png).

#### 1.1.2. Распределение Exp с параметром $\nu$.

In [14]:
nus = [0.0001, 0.0005, 0.001, 0.005, 0.01, 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.75, 0.9]
n_samples = 50
k_neighbours = 5
n_iter = 1000

In [None]:
nu_n_triangles = []

for i, nu in enumerate(tqdm(nus)):
    n_triangles = []
    for _ in range(n_iter):
        vertices = np.random.exponential(nu, n_samples)
        knn_graph = build_knn_graph(vertices, k_neighbours)
        n_triangles.append(calculate_triangles(knn_graph))
    
    nu_n_triangles.append(sum(n_triangles) / n_iter)
    
plt.plot(nus, nu_n_triangles, color="red")
plt.title("Зависимость $\\tau^{KNN}$ от $\\nu$")
plt.xlabel("Значения $\\nu$")
plt.ylabel("Среднее значение характеристики")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/3.png).

In [16]:
nus = [1, 2, 5, 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 250, 500]
n_samples = 50
k_neighbours = 5
n_iter = 1000

In [None]:
nu_n_triangles = []

for i, nu in enumerate(tqdm(nus)):
    n_triangles = []
    for _ in range(n_iter):
        vertices = np.random.exponential(nu, n_samples)
        knn_graph = build_knn_graph(vertices, k_neighbours)
        n_triangles.append(calculate_triangles(knn_graph))
    
    nu_n_triangles.append(sum(n_triangles) / n_iter)
    
plt.plot(nus, nu_n_triangles, color="red")
plt.title("Зависимость $\\tau^{KNN}$ от $\\nu$")
plt.xlabel("Значения $\\nu$")
plt.ylabel("Среднее значение характеристики")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/4.png).

В случае экспоненциального распределения усредненная характеристика $\tau^{KNN}$ принимает значения в некоторой окрестности 190 независимо от значения $\nu$.

### 1.2. Исследуем характеристику $\tau^{dist}$.

Зафиксируем размер выборки $n = 50$ и расстояние $dist = 5$.

#### 1.2.1. Распределение LogNormal с $\mu$ = 0 и параметром $\theta$.

In [29]:
thetas = [0.0001, 0.0005, 0.001, 0.005, 0.01, 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.75, 0.9]
n_samples = 50
dist = 5
n_iter = 1000

In [None]:
theta_chromatic_number = []

for i, theta in enumerate(tqdm(thetas)):
    chromatic_number = []
    for _ in range(n_iter):
        vertices = np.random.lognormal(0, theta, n_samples)
        chromatic_number.append(calculate_chromatic_number(vertices, dist))
    
    theta_chromatic_number.append(sum(chromatic_number) / n_iter)
    
plt.plot(thetas, theta_chromatic_number, color="green")
plt.title("Зависимость $\\tau^{dist}$ от $\\theta$")
plt.xlabel("Значения $\\theta$")
plt.ylabel("Среднее значение характеристики")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/5.png).

In [43]:
thetas = [1, 2, 5, 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 250, 500, 750, 1000]
n_samples = 50
dist = 5
n_iter = 1000

In [None]:
theta_chromatic_number = []

for i, theta in enumerate(tqdm(thetas)):
    chromatic_number = []
    for _ in range(n_iter):
        vertices = np.random.lognormal(0, theta, n_samples)
        chromatic_number.append(calculate_chromatic_number(vertices, dist))
    
    theta_chromatic_number.append(sum(chromatic_number) / n_iter)
    
plt.plot(thetas, theta_chromatic_number, color="green")
plt.title("Зависимость $\\tau^{dist}$ от $\\theta$")
plt.xlabel("Значения $\\theta$")
plt.ylabel("Среднее значение характеристики")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/6.png).

С увеличением $\theta$ среднее значение характеристики $\tau^{dist}$ уменьшается, и при $\theta \approx 100$ принимает значение 25. Затем на больших $\theta$ среднее значение немного увеличивается и колеблется около 27.

#### 1.2.2. Распределение Exp с переменной $\nu$.

In [35]:
nus = [0.0001, 0.0005, 0.001, 0.005, 0.01, 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.75, 0.9]
n_samples = 50
dist = 5
n_iter = 1000

In [None]:
nu_chromatic_number = []

for i, nu in enumerate(tqdm(nus)):
    chromatic_number = []
    for _ in range(n_iter):
        vertices = np.random.exponential(nu, n_samples)
        chromatic_number.append(calculate_chromatic_number(vertices, dist))
    
    nu_chromatic_number.append(sum(chromatic_number) / n_iter)
    
plt.plot(nus, nu_chromatic_number, color="red")
plt.title("Зависимость $\\tau^{dist}$ от $\\nu$")
plt.xlabel("Значения $\\nu$")
plt.ylabel("Среднее значение характеристики")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/7.png).

In [41]:
nus = [1, 2, 5, 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 250, 500, 750, 1000]
n_samples = 50
dist = 5
n_iter = 1000

In [None]:
nu_chromatic_number = []

for i, nu in enumerate(tqdm(nus)):
    chromatic_number = []
    for _ in range(n_iter):
        vertices = np.random.exponential(nu, n_samples)
        chromatic_number.append(calculate_chromatic_number(vertices, dist))
    
    nu_chromatic_number.append(sum(chromatic_number) / n_iter)
    
plt.plot(nus, nu_chromatic_number, color="red")
plt.title("Зависимость $\\tau^{dist}$ от $\\nu$")
plt.xlabel("Значения $\\nu$")
plt.ylabel("Среднее значение характеристики")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/8.png).

При больших $\nu$ среднее значение $\tau^{dist}$ стремится к 1. 

Заметим, что для экспоненциального распределения видно более резкое уменьшение значения характеристики по сравнению с lognormal распределением.

## 2. Исследовать, как ведет себя числовая характеристика $\tau$ в зависимости от параметров процедуры построения графа и размера выборки при фиксированных значениях $\theta_0 = 1$ и $\nu_0 = \frac{1}{\sqrt{e^2 - e}}$.


### 2.1. Исследуем характеристику $\tau^{KNN}$.

#### 2.1.1. Распределение LogNormal с $\mu = 0$ и $\theta_0 = 1$.

In [2]:
n_samples = [1, 2, 5, 10, 15, 20, 25, 50, 75, 100, 150, 250, 500]
k_neighbours = [1, 2, 3, 5, 10, 15, 20, 25, 50]
n_iter = 1000

In [None]:
figure, axis = plt.subplots(
    nrows=len(n_samples),
    ncols=len(k_neighbours),
    figsize=(10 * len(n_samples),
             10 * len(k_neighbours))
)

for i, n in enumerate(tqdm(n_samples)):
    for j, k in enumerate(tqdm(k_neighbours)):
        n_triangles = []
        for _ in range(n_iter):
            vertices = np.random.lognormal(0, 1, n)
            knn_graph = build_knn_graph(vertices, k)
            n_triangles.append(calculate_triangles(knn_graph))
        
        axis[i][j].plot(n_triangles, color="green")
        axis[i][j].set_title(f"n_samples = {n}, k_neighbours = {k}, avg $\\tau^{{KNN}}$ = {sum(n_triangles) / n_iter}")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/9.png).

#### 2.1.2. Распределение Exp c $\nu = \frac{1}{\sqrt{e^2 - e}}$.

In [None]:
n_samples = [1, 2, 5, 10, 15, 20, 25, 50, 75, 100, 150, 250, 500]
k_neighbours = [1, 2, 3, 5, 10, 15, 20, 25, 50]
n_iter = 1000

In [None]:
figure, axis = plt.subplots(
    nrows=len(n_samples),
    ncols=len(k_neighbours),
    figsize=(10 * len(n_samples),
             10 * len(k_neighbours))
)

for i, n in enumerate(tqdm(n_samples)):
    for j, k in enumerate(tqdm(k_neighbours)):
        n_triangles = []
        for _ in range(n_iter):
            vertices = np.random.exponential(1 / np.sqrt(np.e * np.e - np.e), n)
            knn_graph = build_knn_graph(vertices, k)
            n_triangles.append(calculate_triangles(knn_graph))
        
        axis[i][j].plot(n_triangles, color="red")
        axis[i][j].set_title(f"n_samples = {n}, k_neighbours = {k}, avg $\\tau^{{KNN}}$ = {sum(n_triangles) / n_iter}")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/10.png).

In [None]:
n_samples = [1, 2, 5, 10, 15, 20, 25, 50, 75, 100, 150, 250, 500]
k_neighbours = [1, 2, 3, 5, 10, 15, 20, 25, 50]
n_iter = 1000

In [None]:
figure, axis = plt.subplots(
    nrows=len(k_neighbours),
    ncols=1,
    figsize=(10, 10 * len(k_neighbours))
)

for i, k in enumerate(tqdm(k_neighbours)):
    n_triangles_lognormal = []
    n_triangles_exp = []
    for j, n in enumerate(tqdm(n_samples)):
        avg_n_triangles_1 = []
        avg_n_triangles_2 = []
        for _ in range(n_iter):
            vertices = np.random.lognormal(0, 1, n)
            knn_graph = build_knn_graph(vertices, k)
            avg_n_triangles_1.append(calculate_triangles(knn_graph))

            vertices = np.random.exponential(1 / np.sqrt(np.e * np.e - np.e), n)
            knn_graph = build_knn_graph(vertices, k)
            avg_n_triangles_2.append(calculate_triangles(knn_graph))
        
        n_triangles_lognormal.append(sum(avg_n_triangles_1) / n_iter)
        n_triangles_exp.append(sum(avg_n_triangles_2) / n_iter)
        
    axis[i].plot(n_samples, n_triangles_lognormal, color="green", label="lognormal")
    axis[i].plot(n_samples, n_triangles_exp, color="red", label="exponential")
    axis[i].set_title(f"k_neighbours = {k}")
    axis[i].set_xlabel("Размер выборки")
    axis[i].set_ylabel("Среднее значение числа треугольников в KNN-графе")
    axis[i].legend(["LogNormal(0, 1)", "Exp($\\frac{1}{\\sqrt{e^2 - e}}$)"])

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/11.png).

Пара замечаний тут:
- $\tau^{KNN}$ для Exp распределения растет медленнее, чем для LogNormal распределения.
- Стоит посмотреть на значения характеристики при бОльших размерах выборки (еще не смотрела).

Возможно, еще добавлю замечания тут.

### 2.2. Исследуем характеристику $\tau^{dist}$.

#### 2.2.1. Распределение LogNormal с $\mu$ = 0 и $\theta = 1$.

In [None]:
n_samples = [1, 2, 5, 10, 15, 20, 25, 50, 100, 150, 200, 500]
dist = [0.0001, 0.001, 0.01, 0.1, 1, 2, 3, 5, 10, 25, 50, 100]
n_iter = 1000

In [None]:
figure, axis = plt.subplots(
    nrows=len(n_samples),
    ncols=len(dist),
    figsize=(10 * len(n_samples),
             10 * len(dist))
)

for i, n in enumerate(tqdm(n_samples)):
    for j, k in enumerate(tqdm(dist)):
        chromatic_number = []
        for _ in range(n_iter):
            vertices = np.random.lognormal(0, 1, n)
            chromatic_number.append(calculate_chromatic_number(vertices, k))
        
        axis[i][j].plot(chromatic_number, color="green")
        axis[i][j].set_title(f"n_samples = {n}, dist = {k}, avg $\\tau^{{dist}}$ = {sum(chromatic_number) / n_iter}")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/12.png).

#### 2.2.2. Распределение Exp c $\nu = \frac{1}{\sqrt{e^2 - e}}$.

In [30]:
n_samples = [1, 2, 5, 10, 15, 20, 25, 50, 100, 150, 200, 500]
dist = [0.0001, 0.001, 0.01, 0.1, 1, 2, 3, 5, 10, 25, 50, 100]
n_iter = 1000

In [None]:
figure, axis = plt.subplots(
    nrows=len(n_samples),
    ncols=len(dist),
    figsize=(10 * len(n_samples),
             10 * len(dist))
)

for i, n in enumerate(tqdm(n_samples)):
    for j, k in enumerate(tqdm(dist)):
        chromatic_number = []
        for _ in range(n_iter):
            vertices = np.random.exponential(1 / np.sqrt(np.e * np.e - np.e), n)
            chromatic_number.append(calculate_chromatic_number(vertices, k))
        
        axis[i][j].plot(chromatic_number, color="red")
        axis[i][j].set_title(f"n_samples = {n}, dist = {k}, avg $\\tau^{{dist}}$ = {sum(chromatic_number) / n_iter}")

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/13.png).

Пара замечаний тут:
- $\tau^{dist}$ для Exp распределения растет быстрее, чем для LogNormal распределения.
- $dist \ge 50$ можно не рассматривать, т.к. для обоих распределений характеристика показывает одинаковое значение (хроматическое число равно числу вершин).
- есть подозрение, что если $\tau^{dist} \ne n$, где $n$ -- число вершин в графе при $dist \in [5, 50]$, то очень вероятно, что этот граф был построен на реализациях случайной величины lognormal распределения (опа, идея для критерия).
- пока что $\tau^{dist}$ рассматривать и изучать приятнее/проще, чем $\tau^{KNN}$.

Для более видимого различия между характеристикой для разных распределений я построю график роста среднего значения характеристики при различном размере выборки $n$ и фиксированном пороге расстояния $dist$.

In [None]:
n_samples = [1, 2, 5, 10, 15, 20, 25, 50, 100, 150, 200, 500]
dist = [0.0001, 0.001, 0.01, 0.1, 1, 2, 3, 5]
n_iter = 1000

In [None]:
figure, axis = plt.subplots(
    nrows=len(dist),
    ncols=1,
    figsize=(10, 10 * len(dist))
)

for i, k in enumerate(tqdm(dist)):
    chromatic_number_lognormal = []
    chromatic_number_exp = []
    for j, n in enumerate(tqdm(n_samples)):
        avg_chromatic_number_1 = []
        avg_chromatic_number_2 = []
        for _ in range(n_iter):
            vertices = np.random.lognormal(0, 1, n)
            avg_chromatic_number_1.append(calculate_chromatic_number(vertices, k))

            vertices = np.random.exponential(1 / np.sqrt(np.e * np.e - np.e), n)
            avg_chromatic_number_2.append(calculate_chromatic_number(vertices, k))
        
        chromatic_number_lognormal.append(sum(avg_chromatic_number_1) / n_iter)
        chromatic_number_exp.append(sum(avg_chromatic_number_2) / n_iter)
        
    axis[i].plot(n_samples, chromatic_number_lognormal, color="green", label="lognormal")
    axis[i].plot(n_samples, chromatic_number_exp, color="red", label="exponential")
    axis[i].set_title(f"dist = {k}")
    axis[i].set_xlabel("Размер выборки")
    axis[i].set_ylabel("Среднее значение хроматического числа в дистанционном графе")
    axis[i].legend(["LogNormal(0, 1)", "Exp($\\frac{1}{\\sqrt{e^2 - e}}$)"])

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/14.png).

## 3. Построить множество A в предположении $\theta = \theta_0$ и $\nu = \nu_0$ при максимальной допустимой вероятности ошибки первого рода $\alpha = 0.05$. Оценить мощность полученного критерия.


### 3.1. Характеристика $\tau^{KNN}$.

Сначала посмотрим на распределения характеристики.

In [9]:
n_samples = [1, 2, 5, 10, 15, 20, 25, 50, 75]
k_neighbours = [1, 2, 3, 5, 10, 15]
n_iter = 1000

In [None]:
figure, axis = plt.subplots(
    nrows=len(k_neighbours),
    ncols=len(n_samples),
    figsize=(10 * len(n_samples), 10 * len(k_neighbours))
)

for i, k in enumerate(tqdm(k_neighbours)):
    n_triangles_lognormal = []
    n_triangles_exp = []
    for j, n in enumerate(tqdm(n_samples)):
        avg_n_triangles_1 = []
        avg_n_triangles_2 = []
        for _ in range(n_iter):
            vertices = np.random.lognormal(0, 1, n)
            knn_graph = build_knn_graph(vertices, k)
            avg_n_triangles_1.append(calculate_triangles(knn_graph))

            vertices = np.random.exponential(1 / np.sqrt(np.e * np.e - np.e), n)
            knn_graph = build_knn_graph(vertices, k)
            avg_n_triangles_2.append(calculate_triangles(knn_graph))
        
        axis[i][j].scatter(avg_n_triangles_1, [i for i in range(n_iter)], color="green", label="lognormal")
        axis[i][j].scatter(avg_n_triangles_2, [i for i in range(n_iter)], color="red", label="exponential")

        axis[i][j].set_title(f"n_samples = {n}, k_neighbours = {k}")
        axis[i][j].set_xlabel("Значение хроматического числа в KNN-графе")
        axis[i][j].set_ylabel("Число итераций")
        axis[i][j].legend(["LogNormal(0, 1)", "Exp($\\frac{1}{\\sqrt{e^2 - e}}$)", "threshold"])

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/15.png).

Видно, что распределения смешаны между собой, и невозможно определить какую-либо границу между ними. Выходит, что работать с KNN-графом довольно трудно. Посмотрим на дистанционный граф.

### 3.2. Характеристика $\tau^{dist}$.

In [6]:
n_samples = [1, 2, 5, 10, 15, 20, 25, 50, 100, 150, 200, 500]
dist = [0.0001, 0.001, 0.01, 0.1, 1, 2, 3, 5]
n_iter = 1000

Сначала посмотрим на распределения характеристики.

In [None]:
figure, axis = plt.subplots(
    nrows=len(dist),
    ncols=len(n_samples),
    figsize=(10 * len(n_samples), 10 * len(dist))
)

for i, k in enumerate(tqdm(dist)):
    chromatic_number_lognormal = []
    chromatic_number_exp = []
    for j, n in enumerate(tqdm(n_samples)):
        avg_chromatic_number_1 = []
        avg_chromatic_number_2 = []
        for _ in range(n_iter):
            vertices = np.random.lognormal(0, 1, n)
            avg_chromatic_number_1.append(calculate_chromatic_number(vertices, k))

            vertices = np.random.exponential(1 / np.sqrt(np.e * np.e - np.e), n)
            avg_chromatic_number_2.append(calculate_chromatic_number(vertices, k))
        
        axis[i][j].scatter(avg_chromatic_number_1, [i for i in range(n_iter)], color="green", label="lognormal")
        axis[i][j].scatter(avg_chromatic_number_2, [i for i in range(n_iter)], color="red", label="exponential")

        axis[i][j].set_title(f"n_samples = {n}, dist = {k}")
        axis[i][j].set_xlabel("Значение хроматического числа в дистанционном графе")
        axis[i][j].set_ylabel("Число итераций")
        axis[i][j].legend(["LogNormal(0, 1)", "Exp($\\frac{1}{\\sqrt{e^2 - e}}$)"])

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/16.png).

А вот тут четко видна граница между двумя распределениями, особенно при бОльших размерах выборки. Построим множество $A$ (синие пунктирные линии на графике).

In [None]:
n_samples = [1, 2, 5, 10, 15, 20, 25, 50, 100, 150, 200, 500]
dist = [0.0001, 0.001, 0.01, 0.1, 1, 2, 3, 5]
n_iter = 1000

In [None]:
figure, axis = plt.subplots(
    nrows=len(dist),
    ncols=len(n_samples),
    figsize=(10 * len(n_samples), 10 * len(dist))
)

for i, k in enumerate(tqdm(dist)):
    chromatic_number_lognormal = []
    chromatic_number_exp = []
    for j, n in enumerate(tqdm(n_samples)):
        h0 = generate_h(
            distr=lognormal_distribution,
            param=1,
            n_samples=n_iter,
            sample_size=n
        )

        h1 = generate_h(
            distr=exp_distribution,
            param=1 / np.sqrt(np.e * np.e - np.e),
            n_samples=n_iter,
            sample_size=n
        )
        
        threshold_set, power, error = generate_a(
            h0_samples=h0,
            h1_samples=h1,
            calculation=calculate_chromatic_number,
            graph_type="dist",
            graph_param=k,
            alpha=0.05
        )

        t_h0 = [calculate_chromatic_number(sample, k) for sample in h0]
        t_h1 = [calculate_chromatic_number(sample, k) for sample in h1]
        
        axis[i][j].scatter(t_h0, [i for i in range(n_iter)], color="green", label="lognormal")
        axis[i][j].scatter(t_h1, [i for i in range(n_iter)], color="red", label="exponential")

        for threshold_value in threshold_set:
            axis[i][j].axvline(x=threshold_value, color='blue', linestyle='--', linewidth=2, label="threshold")

        axis[i][j].set_title(f"n_samples = {n}, dist = {k}, мощность: {power:.3f}, ошибка: {error:.3f}")
        axis[i][j].set_xlabel("Значение хроматического числа в дистанционном графе")
        axis[i][j].set_ylabel("Число итераций")
        axis[i][j].legend(["LogNormal(0, 1)", "Exp($\\frac{1}{\\sqrt{e^2 - e}}$)"])

plt.show();

[Визуализация](https://github.com/misshimichka/dm-random-graphs/blob/report/report/17.png).

Видно, что при увеличении $dist$ и размера выборки граница между двумя распределениями становится более явной. И даже есть примеры, когда мощность максимальна и равна 1.
Однако при небольших размерах выборки и маленьких $dist$ распределения довольно трудно различимы. Ошибка в таких случаях больше заданного $\alpha = 0.05$.

Вывод: если дана выборка достаточного размера, то при выборе правильного $dist$ ($\approx 2, 3, 5$) можно построить дистанционный граф так, что по хроматическому числу этого графа будет возможно определить исходное распределение.