# Тесты эстиматоров взаимной информации

## Преамбула

In [None]:
import numpy as np
import pandas as pd
import scipy.stats as sps

In [None]:
%matplotlib inline
import matplotlib
import matplotlib.pyplot as plt

import seaborn as sns

In [None]:
font = {'family' : 'DejaVu Sans',
        'size'   : 18}

matplotlib.rc('font', **font)

In [None]:
import os
import json
import csv

from datetime import datetime

In [None]:
path = os.path.abspath(os.getcwd()) + "/../data/"

In [None]:
experiments_path = path + "mutual_information/synthetic/"

#### Импортирование модуля

In [None]:
import sys
sys.path.insert(0, './py')

In [None]:
import mutinfo.estimators.mutual_information as mi_estimators
from mutinfo.utils.dependent_norm import multivariate_normal_from_MI

In [None]:
global_n_jobs = 64

#### Стандартные тесты с произвольным преобразованием

In [None]:
def perform_normal_test(mi, n_samples, X_dimension, Y_dimension, X_map=None, Y_map=None, verbose=0):
    # Генерация.
    random_variable = multivariate_normal_from_MI(X_dimension, Y_dimension, mi)
    X_Y = random_variable.rvs(n_samples)
    X = X_Y[:, 0:X_dimension]
    Y = X_Y[:, X_dimension:X_dimension + Y_dimension]
        
    # Применение преобразования.
    if not X_map is None:
        X = X_map(X)
           
    if not Y_map is None:
        Y = Y_map(Y)

    # Оценка взаимной информации.
    mi_estimator = mi_estimators.MutualInfoEstimator(n_jobs=global_n_jobs)
    mi_estimator.fit(X, Y, verbose=verbose)
    
    return mi_estimator.predict(X, Y, verbose=verbose), mi_estimator.X_Y_entropy_estimator_.best_estimator_.get_params()['bandwidth']

## Зависимость оценки от истинного значения (непрерывный случай)

In [None]:
def perform_normal_tests_MI(MI, n_samples, X_dimension, Y_dimension, X_map=None, Y_map=None, verbose=0):
    """
    Вычислить оценки взаимной информации для разных истинных значений
    (преобразованное нормальное распределение).
    """
    n_exps = len(MI)
    
    # Оценки взаимной информации.
    estimated_MI = []
    Bandwidth = []

    # Проведение тестов.
    for n_exp in range(n_exps):
        print("\nn_exp = %d/%d\n------------\n" % (n_exp + 1, n_exps))
        mi, bandwidth = perform_normal_test(MI[n_exp], n_samples, X_dimension, Y_dimension,
                                            X_map, Y_map, verbose)
        estimated_MI.append(mi)
        Bandwidth.append(bandwidth)
        
    return np.asarray(estimated_MI), np.asarray(Bandwidth)

In [None]:
def plot_estimated_MI(MI, estimated_MI, title, Bandwidth=None, bandwidth_scale=10.0):
    estimated_MI_mean = estimated_MI[:,0]
    estimated_MI_std  = estimated_MI[:,1]
    
    fig_normal, ax_normal = plt.subplots()

    fig_normal.set_figheight(11)
    fig_normal.set_figwidth(16)

    # Сетка.
    ax_normal.grid(color='#000000', alpha=0.15, linestyle='-', linewidth=1, which='major')
    ax_normal.grid(color='#000000', alpha=0.1, linestyle='-', linewidth=0.5, which='minor')

    ax_normal.set_title(title)
    ax_normal.set_xlabel("$I(X,Y)$")
    ax_normal.set_ylabel("$\\hat I(X,Y)$")
    
    ax_normal.minorticks_on()
    
    #ax_normal.set_yscale('log')
    #ax_normal.set_xscale('log')

    ax_normal.plot(MI, MI, label="$I(X,Y)$", color='red')
    ax_normal.plot(MI, estimated_MI_mean, label="$\\hat I(X,Y)$")        
    ax_normal.fill_between(MI, estimated_MI_mean + estimated_MI_std, estimated_MI_mean - estimated_MI_std, alpha=0.2)
    
    if not Bandwidth is None:
        ax_normal.plot(MI, Bandwidth * bandwidth_scale, label="bandwidth")

    ax_normal.legend(loc='upper left')

    ax_normal.set_xlim((0.0, None))
    ax_normal.set_ylim((0.0, None))

    plt.show();

In [None]:
def save_estimated_MI(MI, estimated_MI, name):
    """
    Сохранение полученных данных в файл.
    """
    
    file_path = experiments_path + name + '/'
    file_name = str(n_samples) + '_' + str(X_dimension) + '_' + str(Y_dimension) + "__" + datetime.now().strftime("%d-%b-%Y_%H:%M:%S") + '.csv'
    os.makedirs(file_path, exist_ok=True)
    np.savetxt(file_path + file_name, np.column_stack([MI, np.asarray(estimated_MI)]), delimiter=' ')

### Глобальные параметры тестов

In [None]:
# Исследуемые значения взаимной информации.
#MI = [0.0, 0.1, 0.2, 0.3, 0.5, 0.7, 1.0, 1.5, 2.0, 3.0, 5.0, 6.0, 8.0, 10.0]
#MI = [0.0, 0.5, 1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 8.0, 10.0]
MI = np.linspace(0.0, 10.0, 41)
#MI = [0.0, 2.0, 5.0]
n_exps = len(MI)

# Число экземпляров и размерности векторов X и Y.
n_samples = 100
X_dimension = 2
Y_dimension = 2

### Нормальный случайный вектор

In [None]:
# Оценки взаимной информации.
estimated_MI, Bandwidth = perform_normal_tests_MI(MI, n_samples, X_dimension, Y_dimension, verbose=10)

In [None]:
plot_estimated_MI(MI, estimated_MI, "Нормальные векторы", Bandwidth)

In [None]:
save_estimated_MI(MI, estimated_MI, 'normal')

### Равномерные распределения

Применим к компонентам нормального случайного вектора их функцию распределения.

In [None]:
from mutinfo.utils.synthetic import normal_to_uniform

In [None]:
from mutinfo.utils.matrices import get_scaling_matrix

In [None]:
def _uniform_pp():
    _X_Y = multivariate_normal_from_MI(1, 1, mutual_information=10.0).rvs(10000)
    _X = _X_Y[:, 0:1]
    _Y = _X_Y[:, 1:2]
    _X = normal_to_uniform(_X)
    _Y = normal_to_uniform(_Y)
    _X_Y = np.concatenate([_X, _Y], axis=1)
    #M = get_scaling_matrix(np.cov(_X_Y, rowvar=False))
    #_X_Y = _X_Y @ M
    print(np.cov(_X_Y, rowvar=False))

    pp = sns.pairplot(pd.DataFrame(_X_Y), height = 2.0, aspect=1.6,
                      plot_kws=dict(edgecolor="k", linewidth=0.0, alpha=0.05, size=0.01, s=0.01),
                      diag_kind="kde", diag_kws=dict(shade=True))

    fig = pp.fig
    fig.subplots_adjust(top=0.93, wspace=0.3)
    t = fig.suptitle("Попарные графики", fontsize=14)
    
_uniform_pp()

In [None]:
# Оценки взаимной информации.
estimated_MI, Bandwidth = perform_normal_tests_MI(MI, n_samples, X_dimension, Y_dimension,
                                                  X_map=normal_to_uniform, Y_map=normal_to_uniform, verbose=10)

In [None]:
plot_estimated_MI(MI, estimated_MI, "Равномерное распределение", Bandwidth)

In [None]:
save_estimated_MI(MI, estimated_MI, 'uniform')

### Тангенс гиперболический

Применим преобразование
$$
y_i = \alpha \tanh\left(\frac{x_i}{\alpha}\right)
$$

In [None]:
def tanh_mapping(X, alpha=1.0):
    """
    Преобразование нормального вектора согласно формуле выше.
    """
    
    assert len(X.shape) == 2
    
    new_X = alpha * np.tanh(X / alpha)
            
    return new_X

In [None]:
# Оценки взаимной информации.
estimated_MI, Bandwidth = perform_normal_tests_MI(MI, n_samples, X_dimension, Y_dimension, X_map=tanh_mapping,
                                                  Y_map=tanh_mapping, verbose=10)

In [None]:
plot_estimated_MI(MI, estimated_MI, "Тангенс гиперболический", Bandwidth)

In [None]:
save_estimated_MI(MI, estimated_MI, 'tanh')

### Кольца

Получим равномерные распределения согласно второму пункту. Далее применим следующее преобразование:

$$
\begin{cases}
x' = [R \cdot x + r \cdot (1 - x)] \cdot \cos(2 \pi y) \\
y' = [R \cdot x + r \cdot (1 - x)] \cdot \sin(2 \pi y) \\
\end{cases}
$$

Здесь требуется размерность $ 2 $ у обоих векторов.

In [None]:
r = 1.0
R = 2.0

def ring_mapping(X):
    """
    Нормальный вектор в кольцо.
    """
    
    assert len(X.shape) == 2
    assert X.shape[1] == 2
    
    X = normal_to_uniform(X)
    new_X = np.zeros_like(X)
    for index in range(X.shape[0]):
        rho = R * X[index][0] + r * (1.0 - X[index][0])
        phi = 2.0 * np.pi * X[index][1]
        
        new_X[index][0] = rho * np.cos(phi)
        new_X[index][1] = rho * np.sin(phi)
    
    return new_X

In [None]:
def _rings_pp():
    _X_Y = multivariate_normal_from_MI(2, 2, mutual_information=10.0).rvs(10000)
    _X = _X_Y[:, 0:2]
    _Y = _X_Y[:, 2:4]
    _X = ring_mapping(_X)
    _Y = ring_mapping(_Y)
    _X_Y = np.concatenate([_X, _Y], axis=1)

    pp = sns.pairplot(pd.DataFrame(_X_Y), height = 2.0, aspect=1.6,
                      plot_kws=dict(edgecolor="k", linewidth=0.0, alpha=0.05, size=0.01, s=0.01),
                      diag_kind="kde", diag_kws=dict(shade=True))

    fig = pp.fig
    fig.subplots_adjust(top=0.93, wspace=0.3)
    t = fig.suptitle("Попарные графики", fontsize=14)
    
_rings_pp()

In [None]:
# Оценки взаимной информации.
estimated_MI, Bandwidth = perform_normal_tests_MI(MI, n_samples, 2, 2,
                                                  X_map=ring_mapping, Y_map=ring_mapping, verbose=10)

In [None]:
plot_estimated_MI(MI, estimated_MI, "Кольца", Bandwidth)

## Зависимость оценки от истинного значения (дискретный случай)

In [None]:
def perform_uniform_discrete_test(n_labels, n_samples, X_dimension, X_map=None, verbose=0):
    # Генерация.  
    X_random_variable = sps.uniform(scale=1.0)
    X = np.zeros(shape=(n_samples, X_dimension))
    for dim in range(X_dimension):
        X[:,dim] = X_random_variable.rvs(size=n_samples)
    
    # Пусть метка генерируется исключительно по первой координате.
    Y = (np.floor(X[:,0] * n_labels)).astype(int)
        
    # Применение преобразования.
    if not X_map is None:
        X = X_map(X)
        #X_Y = np.concatenate([X, Y], axis=1)

    # Оценка энтропии.
    mi_estimator = mi_estimators.MutualInfoEstimator(Y_is_discrete=True, n_jobs=global_n_jobs)
    mi_estimator.fit(X, Y, verbose = verbose)
    
    return mi_estimator.predict(X, Y, verbose=verbose)

In [None]:
def perform_uniform_discrete_test_MI(N_labels, n_samples, X_dimension, X_map=None, verbose=0):
    """
    Вычислить оценки взаимной информации для разных истинных значений
    (равномерное распределение).
    """
    n_exps = len(N_labels)
    MI = np.array([np.log(N_labels[index]) for index in range(n_exps)])
    
    # Оценки взаимной информации.
    estimated_MI = []

    # Проведение тестов.
    for n_exp in range(n_exps):
        print("\nn_exp = %d/%d\n------------\n" % (n_exp + 1, n_exps))
        estimated_MI.append(perform_uniform_discrete_test(N_labels[n_exp], n_samples, X_dimension, X_map, verbose))
        
    return np.asarray(MI), np.asarray(estimated_MI)

### Глобальные параметры тестов

In [None]:
# Исследуемые значения числа меток.
N_labels = [1, 2, 4]#, 8, 16, 32, 64]
n_exps = len(N_labels)

# Число экземпляров и размерности векторов X и Y.
X_dimension = 2

In [None]:
MI, estimated_MI = perform_uniform_discrete_test_MI(N_labels, n_samples, X_dimension, verbose=10)

In [None]:
plot_estimated_MI(MI, estimated_MI, "Равномерное распределение с дискретной меткой")

In [None]:
save_estimated_MI(MI, estimated_MI, 'uniform_discrete')

## Зависимость оценки от размерности (непрерывный случай)

In [None]:
def perform_normal_tests_dim(mi, n_samples, dimensions, X_map=None, Y_map=None, verbose=0):
    """
    Вычислить оценки взаимной информации для разных истинных значений.
    """
    n_exps = len(dimensions)
    
    # Оценки взаимной информации.
    estimated_MI = []
    Bandwidth = []

    # Проведение тестов.
    for n_exp in range(n_exps):
        print("\nn_exp = %d/%d\n------------\n" % (n_exp + 1, n_exps))
        mi, bandwidth = perform_normal_test(mi, n_samples, dimensions[n_exp], dimensions[n_exp],
                                            X_map, Y_map, verbose)
        estimated_MI.append(mi)
        Bandwidth.append(bandwidth)
        
    return estimated_MI

In [None]:
def plot_estimated_dim(dimensions, mi, estimated_MI, title):
    estimated_MI_mean = np.array([estimated_MI[index][0] for index in range(len(estimated_MI))])
    estimated_MI_std  = np.array([estimated_MI[index][1] for index in range(len(estimated_MI))])
    
    fig_normal, ax_normal = plt.subplots()

    fig_normal.set_figheight(11)
    fig_normal.set_figwidth(16)

    # Сетка.
    ax_normal.grid(color='#000000', alpha=0.15, linestyle='-', linewidth=1, which='major')
    ax_normal.grid(color='#000000', alpha=0.1, linestyle='-', linewidth=0.5, which='minor')

    ax_normal.set_title(title)
    ax_normal.set_xlabel("Размерность $ X $ и $ Y $")
    ax_normal.set_ylabel("$\\hat I(X,Y)$")
    
    ax_normal.minorticks_on()
    
    #ax_normal.set_yscale('log')
    #ax_normal.set_xscale('log')

    ax_normal.plot(dimensions, np.ones_like(dimensions) * mi, label="$I(X,Y)$", color='red')
    ax_normal.plot(dimensions, estimated_MI_mean, label="$\\hat I(X,Y)$")
    ax_normal.fill_between(dimensions, estimated_MI_mean + estimated_MI_std, estimated_MI_mean - estimated_MI_std, alpha=0.2)

    ax_normal.legend(loc='upper left')

    ax_normal.set_xlim((0.0, None))
    ax_normal.set_ylim((0.0, None))

    plt.show();

### Глобальные параметры тестов

In [None]:
#dimensions = [1, 2, 3, 4, 5, 6, 8, 10, 12, 14, 16, 20, 25, 30, 40]
dimensions = [1, 2, 4, 6, 8, 12, 16, 20, 30, 40]
mi = 2.0

### Нормальный случайный вектор

In [None]:
# Оценки взаимной информации.
#estimated_MI = perform_normal_tests_dim(mi, n_samples, dimensions, verbose=10)

In [None]:
#plot_estimated_dim(dimensions, mi, estimated_MI, "Нормальные векторы")