# Задача

В водоеме обитает некоторая биологическая популяция, состоящая из смеси особей двух возрастов. Длина особи - случайная величина, распределенная по нормальному закону $N(a_{i}, \sigma_{i} )$, где i=1,2 - индекс, относящийся к возрасту. С целью определения доли q особей 1-го возраста проведен отлов n особей и измерена их длина. По результатам $х_{1}$,…,$х_{n}$  построить оценку $\hat{q}$ для q  и приближенный доверительный интервал с уровнем доверия Рд . 

##### Решение (без вывода):
$$I = (q_{1}, q_{2})  $$

$$q_{1,2} =  \frac{(\hat{q} + \frac{t_{p}^2}{2n}) \pm t_{p}\sqrt{\frac{1}{n}\big[\hat{q}(1 - \hat{q} + \frac{\sigma^2}{(a1-a2)^2}\big] + \alpha_{n}} }{1 + \frac{t_{p}^2}{n}}   $$

$$\alpha_{n} \equiv \frac{f_{p}^2}{n^2}(\frac{1}{4} + \frac{\sigma^2}{(a_{1} - a_{2})^2})  $$

$t_{p}$ - квантиль порядка $\frac{1 + Pд}{2}$ для $N(0,1)$

# Найдем доверительный инретвал, используя бутстрап:

In [1]:
pip install arch

Collecting arch
  Downloading arch-6.2.0-cp39-cp39-win_amd64.whl (923 kB)
Installing collected packages: arch
Successfully installed arch-6.2.0
Note: you may need to restart the kernel to use updated packages.


In [5]:
import numpy as np
import pandas as pd
import seaborn as sns
from arch.bootstrap import IIDBootstrap, IndependentSamplesBootstrap
import scipy.stats as sts
import random

In [13]:
n = 40
a1 = 6
a2 = 9
Pd = 0.95
#q = 0.5
sigma=1

#Сгенирируем выборку
x = np.hstack((sts.norm(loc=a1, scale=1).rvs(size=int(n*q)), sts.norm(loc=a2, scale=1).rvs(size=int(n*q))))
random.shuffle(x)
x

array([6.64133597, 3.86815246, 9.20115883, 6.92027673, 7.40932941,
       8.91665051, 9.24173198, 5.62585098, 9.73621497, 7.3041373 ,
       5.71459474, 9.09689354, 7.7487192 , 7.1088715 , 3.82493008,
       9.23092266, 8.24739101, 9.38227656, 4.87828331, 4.72462342,
       7.01787393, 7.3093546 , 9.03650733, 7.31611086, 8.46712852,
       9.01350623, 8.85344913, 6.32146885, 5.69723839, 5.99773697,
       9.179211  , 5.2933073 , 7.9084396 , 6.05286825, 8.4566869 ,
       9.0695115 , 4.9219151 , 5.5334535 , 6.10992009, 9.9875473 ])

In [14]:
#Оценка, построенная методом моментов
def q_hat(x):
    return (x.mean() - a2)/ (a1 - a2) 
q_hat(x)

0.5636201625392321

In [15]:
boot = IIDBootstrap(x, seed=1)
boot.conf_int(q_hat, method='basic', reps=10000, size=0.95)

array([[0.38520988],
       [0.73877199]])

# Посмотрим доверительный интервал, используя матстат

In [26]:
tp = sts.norm(loc=7.5, scale=1).ppf((1+Pd)/2)
alpha_n = fp*fp/(n*n)*(0.25 + sigma*sigma/((a1-a2)*(a1-a2)))
q2 = (q_hat(x) + tp*tp/(2*n) + tp*np.sqrt(1/n*(q_hat(x)*(1-q_hat(x))+sigma*sigma/((a1-a2)*(a1-a2)))))/(1 + tp*tp/n)
q1 = (q_hat(x) + tp*tp/(2*n) - tp*np.sqrt(1/n*(q_hat(x)*(1-q_hat(x))+sigma*sigma/((a1-a2)*(a1-a2)))))/(1 + tp*tp/n)

In [27]:
print('q1 = ', q1)
print('q2 = ', q2)
print(f'I = ({round(q1, 4)}, {round(q2, 4)})')

q1 =  0.2435609496527738
q2 =  0.7957438375755947
I = (0.2436, 0.7957)
