In [105]:
from scipy.stats import uniform
import numpy as np
from math import sqrt
from math import log
from scipy.stats import norm
from sklearn.utils import resample

In [137]:
# Функция для вычисления бутстраповского доверительного интервала (Параметрический)
def bootstrap_param_confidence_interval(data, n_bootstrap_samples = 100000, ci=95):
    bootstrap_means = []
    N = len(data)
    for _ in range(n_bootstrap_samples):
        # Генерация бутстраповской выборки
        sample = resample(data, replace = True)
        random_log = [log(i) for i in sample]
        bootstrap_means.append(N / sum(random_log) + 1)
    
    # Вычисление границ доверительного интервала
    lower_bound = np.percentile(bootstrap_means, 2.5)
    upper_bound = np.percentile(bootstrap_means, 97.5)
    lenght = upper_bound - lower_bound
    
    return lower_bound, upper_bound, lenght

In [146]:
# Функция для вычисления бутстраповского доверительного интервала (Непараметрический)
def bootstrap_confidence_interval(data, n_bootstrap_samples = 1000, ci=95):
    bootstrap_means = []
    N = len(data) 
    random_log = [log(i) for i in data]
    first_est = N / sum(random_log) + 1
    for _ in range(n_bootstrap_samples):
        # Генерация бутстраповской выборки
        sample = resample(data, replace = True)
        random_log = [log(i) for i in sample]
        bootstrap_means.append(N / sum(random_log) + 1 - first_est)
    
    # Вычисление границ доверительного интервала
    lower_diff = np.percentile(bootstrap_means, 2.5)
    upper_diff = np.percentile(bootstrap_means, 97.5)
    
    lower_bound = first_est - upper_diff
    upper_bound = first_est - lower_diff
    lenght = upper_bound - lower_bound
    
    return lower_bound, upper_bound, lenght

In [147]:
def AsymptoticIntervalMedian(teta_estimation, N):
    first_q = -1.959963985
    second_q = 1.959963985
    left = 2 ** (1 / (teta_estimation - 1)) - 2 ** (1 / (teta_estimation - 1)) * log(2) / ((teta_estimation - 1) * sqrt(N)) * second_q
    right =  2 ** (1 / (teta_estimation - 1)) - 2 ** (1 / (teta_estimation - 1)) * log(2) / ((teta_estimation - 1) * sqrt(N)) * first_q
    lenght = right - left
    print(" Левая граница: ", left, '\n', "Правая граница: ", right, '\n', "Длина интервала = ", lenght)

In [148]:
def AsymptoticIntervalTeta(teta_estimation, N):
    first_q = -1.959963985
    second_q = 1.959963985
    left = teta_estimation - (teta_estimation - 1) / sqrt(N) * second_q
    right = teta_estimation - (teta_estimation - 1) / sqrt(N) * first_q
    lenght = right - left
    print(" Левая граница: ", left, '\n', "Правая граница: ", right, '\n', "Длина интервала = ", lenght)

In [172]:
# Генерация выборки
tetta = 5

n = 100
sample = np.random.uniform(0, 1, n) 

sample = sample ** (1 / (1 - tetta))
print(sample)

[1.25546006 1.56065996 5.47892472 1.7321146  1.14439844 1.03925747
 1.57577429 1.94931475 1.33504888 1.05914272 1.15136792 1.08483364
 1.01507484 1.3084536  1.34936054 1.00902218 1.26419448 1.15098861
 1.02894169 1.20891931 1.01817666 1.77064854 1.23294415 1.5075197
 1.10347395 1.64283081 1.07115957 1.22675315 1.00394536 1.18221071
 1.0985501  2.3638964  1.05754469 1.33555413 2.1443631  1.11737813
 1.30015867 1.31158958 1.15552992 1.10735642 1.00231823 1.01212801
 1.0049133  1.0436374  1.17632707 1.28848253 1.0120006  1.06530833
 1.27406857 1.01892605 1.03994558 1.909218   1.12400869 1.38526334
 1.04122645 1.17359335 1.41820265 1.01633014 1.76959695 1.26469274
 1.00878653 1.1908912  1.32416885 1.43252104 1.49838706 1.07866203
 1.38900323 1.15776413 2.21559367 1.06087073 3.09114677 1.2379997
 1.59492588 1.35911118 1.01655724 1.04665621 2.23390477 1.03580374
 1.66052216 1.07079747 1.06641779 1.15015209 1.12568434 1.01818235
 1.11631695 1.26281843 1.01769352 1.0920615  1.15640934 2.98193


In [173]:
# Получение информации о асимптотическом интервале для медианы
random_log = [log(i) for i in sample]
teta_estimation = n / sum(random_log) + 1

AsymptoticIntervalMedian(teta_estimation, n)

 Левая граница:  1.1559516775452066 
 Правая граница:  1.2410106066938562 
 Длина интервала =  0.08505892914864965


In [174]:
# Получение информации о асимптотическом интервале для параметра
random_log = [log(i) for i in sample]
teta_estimation = n / sum(random_log) + 1

AsymptoticIntervalTeta(teta_estimation, n)

 Левая граница:  4.078029912475426 
 Правая граница:  5.578726616308421 
 Длина интервала =  1.500696703832995


In [175]:
# Вызов параметрического bootstrap для параметра teta

left, right, lenght = bootstrap_param_confidence_interval(sample)
print(f"{95}% доверительный интервал для n = 100000: [{left}, {right}], длина = {lenght}")

95% доверительный интервал для n = 100000: [4.118497206497303, 5.817240631704393], длина = 1.6987434252070894


In [181]:
# Вызов Непараметрического bootstrap для параметра teta

left, right, lenght = bootstrap_confidence_interval(sample)
print(f"{95}% доверительный интервал для n = 1000: [{left}, {right}], длина = {lenght}")

95% доверительный интервал для n = 1000: [3.8123879922951227, 5.552921724730927], длина = 1.7405337324358046


In [182]:
print(f"В нашем случае мы получили хороший доверительный интервал для медианы. Лучшим доверительным интервалом для параметра teta оказался асимптотический доверительный интервал. В случае же bootstrap-овских доверительных интервалов получили, что параметрический оказался чуть уже, чем непараметрический")

В нашем случае мы получили хороший доверительный интервал для медианы. Лучшим доверительным интервалом для параметра teta оказался асимптотический доверительный интервал. В случае же bootstrap-овских доверительных интервалов получили, что параметрический оказался чуть уже, чем непараметрический
