In [219]:
from scipy.stats import uniform
import numpy as np
from math import sqrt
from scipy.stats import norm
from sklearn.utils import resample

In [220]:
def ExactInterval(x_max, beta, N):
    left = x_max / (((1 + beta) / 2) ** (1./N) + 1)
    right = x_max / (((1 - beta) / 2) ** (1./N) + 1)
    lenght = right - left
    print(" Левая граница: ", left, '\n', "Правая граница: ", right, '\n', "Длина интервала = ", lenght)

In [221]:
def AsymptoticInterval(first_moment, second_moment, N, teta_estimation):
    first_q = -1.959963985
    second_q = 1.959963985
    left = teta_estimation - (3./2) * sqrt(second_moment - first_moment ** 2) * second_q / sqrt(N)
    right = teta_estimation - (3./2) * sqrt(second_moment - first_moment ** 2) * first_q / sqrt(N)
    lenght = right - left
    print(" Левая граница: ", left, '\n', "Правая граница: ", right, '\n', "Длина интервала = ", lenght)

In [222]:
# Функция для вычисления бутстраповского доверительного интервала
def bootstrap_confidence_interval(data, n_bootstrap_samples = 100000, ci=95):
    bootstrap_means = []
    N = len(data)
    for _ in range(n_bootstrap_samples):
        # Генерация бутстраповской выборки
        sample = resample(data, replace = True)
        # Вычисление среднего значения выборки
        bootstrap_means.append((N + 1) / (2 * N + 1) * (max(sample)))
    
    # Вычисление границ доверительного интервала
    lower_bound = np.percentile(bootstrap_means, 2.5)
    upper_bound = np.percentile(bootstrap_means, 97.5)
    lenght = upper_bound - lower_bound
    
    return lower_bound, upper_bound, lenght

In [223]:
# Задаём параметры
N = 100
teta = 1
beta = 0.95

# Получаем выборку и максимум
random_array = np.random.uniform(teta, 2*teta, N) 
x_max = max(random_array)

print(random_array, x_max)

[1.7154336  1.18644776 1.94134588 1.90027399 1.28993563 1.85851109
 1.69025374 1.63570297 1.65931432 1.12515604 1.31403929 1.54855727
 1.5840994  1.39123612 1.3350927  1.29431368 1.82217006 1.75378136
 1.70108355 1.40763195 1.05458341 1.84978909 1.47177767 1.6279113
 1.44382933 1.31713739 1.9225019  1.46709963 1.08817828 1.89037581
 1.5546982  1.90336295 1.53779061 1.55077327 1.92817257 1.53988957
 1.29339965 1.00887224 1.42769802 1.10850201 1.17447165 1.59016642
 1.91995511 1.39011107 1.63381946 1.26231696 1.9955988  1.05160414
 1.58777172 1.59533667 1.32640334 1.72411555 1.43545615 1.74210405
 1.76734729 1.6688563  1.09417142 1.10600019 1.81300624 1.28318453
 1.86979942 1.3007724  1.77317883 1.77509219 1.55560502 1.81289478
 1.95067354 1.83763567 1.95963593 1.44647317 1.21897237 1.19432634
 1.84889186 1.21382536 1.48157948 1.72411886 1.09084881 1.80685739
 1.10441291 1.58080609 1.74847539 1.13097109 1.01056733 1.58317232
 1.63016421 1.00119003 1.70908457 1.30880755 1.42488625 1.19101

In [224]:
# Получаем информацию о точном доверительном интервале
ExactInterval(x_max, beta, N)

 Левая граница:  0.9979257126394118 
 Правая граница:  1.016201124059606 
 Длина интервала =  0.018275411420194287


In [225]:
# Получаем информацию о асимптотическом доверительном интервале
random_sqr = [i ** 2 for i in random_array]
first_moment = sum(random_array) / len(random_array)
second_moment = sum(random_sqr) / len(random_sqr)
teta_estimation = 2./3 * first_moment

AsymptoticInterval(first_moment, second_moment, N, teta_estimation)

 Левая граница:  0.9345852815008161 
 Правая граница:  1.098770196169969 
 Длина интервала =  0.16418491466915286


In [226]:
# Бутстраповский доверительный интервал
left, right, lenght = bootstrap_confidence_interval(random_array)
print(f"{95}% доверительный интервал для n = 100000: [{lower}, {upper}], длина = {lenght}")

95% доверительный интервал для n = 100000: [0.987528096444299, 1.0652557720605818], длина = 0.027261419539770237


In [227]:
# Сравнение интервалов
print(f"В нашем случае точный доверительный интервал оказался уже всего => он даёт наилучшую оценку. Бутстраповский доверительный интервал тоже дал неплохую оценку. Асимптотический интервал же вышел хуже всех. Скорее всего из-за n = 100, т.е из-за слишком маленькой выборки")

В нашем случае бутстраповский доверительный интервал оказался уже всего => он даёт наилучшую оценку. Точный доверительный интервал тоже дал неплохую оценку. Асимптотический интервал же вышел хуже всех. Скорее всего из-за n = 100, т.е из-за слишком маленькой выборки
