# $ \text{Т.6} $

$$ \text{Случайная величина имеет распределение Парето:} $$

$$ p(x, \theta) = \begin{cases}
  \frac{\theta - 1}{x^{\theta}}, & x \geq 1, \\
  0, &  x < 1
\end{cases}
,
$$

$$ \text{где } \theta > 1 $$



In [1]:
from rich.console import Console
from rich.table import Table
from rich.panel import Panel
from rich.text import Text

import numpy as np

console = Console()
table = Table()

## $ \text{d) Сгенерировать выборку объёма } n = 100 \\ \text{ для некоторого значения параметра } \theta \text{.} \\ \text{ Вычислите указанные выше (по задаче)} \\ \text{ доверительные интервалы для } \beta = 0.95 \text{.}$

In [2]:
def p(x: float, theta: float) -> float:
    """Закон распределения."""
    return (theta - 1) / (x ** theta) if x >= 1 else 0

def F(x: float, theta: float) -> float:
    """Функция распределения."""
    return (1 - x ** (1 - theta)) if x >= 1 else 0

def InverseF(y: float, theta: float) -> float:
    """Обратная к функции распределения."""
    return (1 - y) ** (1 / (1 - theta))

# Размер выборки
N = 100

# Доверительная информация
beta = 0.95

# Некоторое значение параметра тета
theta = 1000

confidence_intervals: dict[str, int] = {}

In [3]:
rng = np.random.default_rng()
random_numbers = rng.random(size=N)

# Выборка
sample = np.array([InverseF(y, theta) for y in random_numbers])

# mean(ln(x))
ln_mean = np.mean([np.log(x) for x in sample])

In [4]:
table.add_column(header="Выборка", justify="center")

for i in range(len(sample) // 4):
    s = sample[i]
    s_1 = sample[i+1]
    s_2 = sample[i+2]
    s_3 = sample[i+3]

    table.add_row(f"{s:.7f} │ {s_1:.7f} │ {s_2:.7f} │ {s_3:.7f}")

console.print(table)

$$ \text{Асимптотический доверительный интервал (О.М.П.) для медианы:} $$

$$ P\left(\sqrt[\tilde\theta - 1]{2} - \frac{1,96 \cdot \ln2 \cdot \sqrt[\tilde\theta - 1]{2}}{\sqrt{n} (\tilde\theta - 1)} < x_{0,5} < \sqrt[\tilde\theta - 1]{2} + \frac{1,96 \cdot \ln2 \cdot \sqrt[\tilde\theta - 1]{2}}{\sqrt{n} (\tilde\theta - 1)}\right) = \beta $$

$$ P\left(2 ^ {\overline{\ln x}} - \frac{1,96 \cdot \ln2 \cdot 2^{\overline{\ln x}} \cdot \overline{\ln x}}{\sqrt{n}} < x_{0,5} < 2^{\overline{\ln x}} + \frac{1,96 \cdot \ln2 \cdot 2^{\overline{\ln x}} \cdot \overline{\ln x}}{\sqrt{n}}\right)=\beta $$

In [5]:
lower_bound = 2 ** ln_mean - (1.96 * np.log(2) * 2 ** ln_mean * ln_mean) / np.sqrt(N)
upper_bound = 2 ** ln_mean + (1.96 * np.log(2) * 2 ** ln_mean * ln_mean) / np.sqrt(N)

console.print(Panel(Text(f"{lower_bound} < x₀₅ < {upper_bound}"
                         f"\n\tl = {upper_bound - lower_bound}"
                         f"\n\tmedian: {np.median(sample)}",
                         style="bold"),
                    title="Асимптотический доверительный интервал (О.М.П.) для медианы"),
                    justify="left")

$$ \text{Асимптотический доверительный интервал (О.М.П.):} $$

$$ P\left(1 - \frac{1.96 - \sqrt{n}}{\sqrt{n} \cdot \overline{\ln(x)}} < \theta < 1 + \frac{1.96 + \sqrt{n}}{\sqrt{n} \cdot \overline{\ln(x)}}\right)=\beta $$

In [6]:
lower_bound = 1 - (1.96 - np.sqrt(N)) / (ln_mean * np.sqrt(N))
upper_bound = 1 + (1.96 + np.sqrt(N)) / (ln_mean * np.sqrt(N))

console.print(Panel(Text(f"{lower_bound} < θ < {upper_bound}\n\tl = {upper_bound - lower_bound}",
                         style="bold"),
                    title="Асимптотический доверительный интервал (О.М.П.)"),
                    justify="left")

confidence_intervals["Асимптотический доверительный интервал (О.М.П.)"] = upper_bound - lower_bound

## $ \text{g) Численно постройте bootstrap'овский} \\ \text{ доверительный интервал двумя способами:} \\ \text{ используя параметрический bootstrap} \\ \text{ и непараметрический bootstrap.}$

#### $$ \text{Непараметрический bootstrap} $$

In [None]:
# Количество повторений bootstrap
bootstrap_iterations = 1000

# Полученная О.М.П.
theta_OMP = 1 + 1 / ln_mean.astype(float)

In [None]:
bootstrap_delta: list[float] = []

for _ in range(bootstrap_iterations):
    bootstrap_delta.append(1 + 1 /\
                            np.mean([np.log(x) for x in np.random.choice(sample, size=N)
                                     ]).astype(float) \
                           - theta_OMP)

In [None]:
lower_bound = theta_OMP - sorted(bootstrap_delta)[int((1 + beta) * bootstrap_iterations / 2)]
upper_bound = theta_OMP - sorted(bootstrap_delta)[int((1 - beta) * bootstrap_iterations / 2)]

console.print(Panel(Text(f"{lower_bound} < θ < {upper_bound}"
                         f"\n\tl = {upper_bound - lower_bound}",
                         style="bold"),
                    title="Непараметрический bootstrap'овский доверительный интервал"),
                    justify="left")

confidence_intervals["Непараметрический bootstrap'овский доверительный интервал"] =\
    upper_bound - lower_bound

#### $$ \text{Параметрический bootstrap} $$

In [None]:
# Количество повторений bootstrap
bootstrap_iterations = 50_000

In [None]:
bootstrap_delta: list[float] = []

for _ in range(bootstrap_iterations):
    random_sample  =  []

    for _ in range(N):
        y = np.random.random()
        random_sample.append(InverseF(y, theta_OMP))

    bootstrap_delta.append(1 + 1 / np.mean([np.log(x) for x in random_sample]) - theta_OMP)

In [None]:
lower_bound = theta_OMP - sorted(bootstrap_delta)[int((1 + beta) * bootstrap_iterations / 2)]
upper_bound = theta_OMP - sorted(bootstrap_delta)[int((1 - beta) * bootstrap_iterations / 2)]

console.print(Panel(Text(f"{lower_bound} < θ < {upper_bound}"
                         f"\n\tl = {upper_bound - lower_bound}",
                         style="bold"),
                    title="Параметрический bootstrap'овский доверительный интервал"),
                    justify="left")

confidence_intervals["Параметрический bootstrap'овский доверительный интервал"] =\
    upper_bound - lower_bound

## $ \text{g)  Сравнить все интервалы.} $

In [13]:
confidence_intervals = sorted(confidence_intervals.items(), key=lambda item: item[1])

output: list[str] = ["Доверительные интервалы (в порядке улучшения):\n\n"]

for interval_name, interval_value in confidence_intervals:
    output.append(f"[bold]{interval_name}[/bold] ([cyan]l = {interval_value:.2f}[/cyan])\n")

console.print(*output)