In [1]:
import numpy as np
import math
import scipy.stats as sps
import matplotlib.pyplot as plt
%matplotlib inline

In [17]:
data_input = open("data9.2.txt")
# считаем построчно,без знака переноса в конце строки
X= np.array(list(map(float, data_input.readlines()))) 
data_input.close()

In [46]:
n = len(X)

### Сводим задачу к линейной модели
$Y_{0} = X_{0} = \beta_{1} + \varepsilon_{i}$

$Y_{i} = X_{i} - X_{i-1} = \beta_{2} + \varepsilon_{i}$

=>
$Y = l + \varepsilon \backsim N(0,\sigma^2)$ 

Получаем $Z = \begin{pmatrix}
1 & 0\\
0 & 1 \\         
\vdots & \vdots\\
0 & 1
\end{pmatrix}$


$\hat{\theta} =(Z^{T}Z)^{-1}Z^{T}Y= \begin{pmatrix}
Y_{0}\\
\frac{\sum_{i=1}^n Y_{i}}{n} 
\end{pmatrix}$ - оценка для $\theta = \begin{pmatrix}
\beta_{1}\\
\beta_{2}
\end{pmatrix}$ 


In [47]:
Y = [X[k] - X[k-1] for k in range(n)]
Y[0] = X[0]
Y = np.matrix(Y)

Z = [[0,1] for i in range(n)]
Z[0] = [1,0]
Z = np.matrix(Z)

### Находим оценки $\beta_{1}$ и $\beta_{2}$

In [48]:
def estimation(Z,X):
    return (Z.T * Z).I * Z.T * X.T

In [49]:
theta = estimation(Z,Y)
print theta

[[ 380.69511   ]
 [  11.05387643]]


### Несмещенная оценка для $\sigma^2$

$\hat{\sigma^2} = \frac{1}{n-1}|Y-Z\hat{\theta}|^2$

In [52]:
sigma = ((Y.T - Z*theta).T * (Y.T - Z*theta))/(n-1)
print sigma

[[ 0.09158536]]


### Оценка дисперсии отсчета времени

Так как $ \varepsilon_{i} = \varepsilon_{i}^t \beta_2$ и $\varepsilon_{i} \backsim N(0,\sigma^2)$ =>

$\hat{\sigma_{t}^2} = \frac{\hat{\sigma^2}}{\beta_2^2}$




In [54]:
sigma_t = sigma/(np.array(theta)[1]**2)
print(sigma_t)

[[ 0.00074954]]


Можно сделать вывод, что линейная модель применима в данном случае для получения достаточно точных оценок, так как $\hat{\sigma^2_{t}} << 1$ и $\hat{\sigma^2} << Y_{i}$