In [99]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import typing as tp
import scipy.stats as sps

In [100]:
def estimator(sample):
    '''
    Делает необходимые преобразования с выборкой (выполняет подсчет статистики).
    Используется в функции bootstrap для вычисления оценок.
    
    :param sample: массив с числами
    :return: оценка, посчитанная по выборке
    '''
    
    return np.mean(sample, axis = 1)


def bootstrap(sample: np.ndarray, 
              B: int = int(1e2))->np.ndarray:
    '''
    Реализует процедуру бутстрепа.
    
    :param sample: исходная выборка, по которой будут вычисляться бутстрепные оценки
    :param B: число бутстрепных оценок
    :return: возвращает массив длины B c бутстрепными оценками
    '''

    n = len(sample)  # длина выборки
    resample = np.random.choice(sample, size = (B, n))
    return estimator(resample)

In [101]:
def boostrap_normal_confidence_interval(bootstrap_estimations: np.ndarray,
                                        sample: np.ndarray,
                                        estimator_function: tp.Callable = np.mean,
                                        alpha: float = 0.95):
    estimation_value = estimator_function(sample)
    bootstrap_variance = np.mean(np.power(bootstrap_estimations, 2)) - np.power(np.mean(bootstrap_estimations), 2)
    z = np.abs(sps.norm.ppf((1 - alpha) / 2))   
    print(z)       
    return estimation_value - z * np.sqrt(bootstrap_variance), estimation_value + z * np.sqrt(bootstrap_variance)
    

    
def boostrap_central_confidence_interval(bootstrap_estimations: np.ndarray,
                                         sample: np.ndarray,
                                         estimator_function: tp.Callable = np.mean, 
                                         alpha: float = 0.95) -> tuple:
    doubled_estimation = 2 * estimator_function(sample)
    qLeft = np.quantile(bootstrap_estimations, q = (1 + alpha) / 2)
    qRight = np.quantile(bootstrap_estimations, q = (1 - alpha) / 2)
    return doubled_estimation - qLeft, doubled_estimation - qRight
    
def boostrap_quantile_confidence_interval(bootstrap_estimations, alpha=0.95):
    qLeft = np.quantile(bootstrap_estimations, q = (1 + alpha) / 2)
    qRight = np.quantile(bootstrap_estimations, q = (1 - alpha) / 2)
    return (qLeft, qRight)

In [102]:
sample = np.array([5, 1, 3, 6, 4])


In [103]:
boostrap_central_confidence_interval(bootstrap(sample), sample, np.mean)

(2.5999999999999996, 5.199999999999999)

In [104]:
boostrap_normal_confidence_interval(bootstrap(sample), sample, np.mean)

1.959963984540054


(2.280508294279058, 5.319491705720941)

In [105]:
boostrap_quantile_confidence_interval(bootstrap(sample))

(5.0, 2.2)