In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as sts
%matplotlib inline

# Выкладки

## Сведение задачи к линейной модели

$X_{i} = \beta_{1} + i\beta_{2} + \epsilon_{0} + \epsilon_{1} + ... + \epsilon_{i}$, $i\in \{0, 1, ... , n\}$

$Y_{i} = X_{i} - X_{i - 1} = \beta_{2} + \epsilon_{i}$, $i\in \{1, ... , n\}$

$Y_{0} = \beta_{1} + \epsilon_{0}$

$Z_{(n + 1)\times2} = \begin{pmatrix}
1 & 0\\
0 & 1\\         
\vdots & \vdots\\
0 & 1\end{pmatrix}$

$(Z^{T}Z) = \begin{pmatrix}
1 & 0\\
0 & n\end{pmatrix}$

$(Z^{T}Z)^{-1} = \begin{pmatrix}
1 & 0\\
0 & \frac{1}{n}\end{pmatrix}$

$Z\hat{\theta} = \frac{1}{n}
\begin{pmatrix}
n & 0 & \cdots & 0 \\
0 & 1 & \cdots & 1 \\         
\vdots & \vdots & \ddots & \vdots \\
0 & 1 & \cdots & 1
\end{pmatrix} Y
$

$||Y - Z\hat{\theta}||^{2} = || (E - \frac{1}{n}
\begin{pmatrix}
n & 0 & \cdots & 0 \\
0 & 1 & \cdots & 1 \\         
\vdots & \vdots & \ddots & \vdots \\
0 & 1 & \cdots & 1
\end{pmatrix}
) Y||^{2}$

### ОНК для $\beta_{1}\text{ и }\beta_{2}$

$\hat{\theta} = (Z^{T}Z)^{-1}Z^{T}Y = 
\begin{pmatrix}   1 & 0 & \cdots & 0\\ 
                  0 & \frac{1}{n}  & \cdots & \frac{1}{n} 
\end{pmatrix} Y = 
\frac{1}{n} 
\begin{pmatrix} n & 0 & \cdots & 0\\ 
                0 & 1 & \cdots & 1 
\end{pmatrix} Y =
\begin{pmatrix} \hat{\beta_{1}}\\ 
                \hat{\beta_{2}} 
\end{pmatrix}
$

### Несмещенная оценка для $\sigma^{2}$

$\sigma^{2} = \frac{||Y - Z\hat{\theta}||^2}{(n + 1) - k} = \frac{1}{n - 1}||Y - Z\hat{\theta}||^2$

### Оценка дисперсии отсчета времени

$\epsilon_{i} = \epsilon_{i}^{t}\beta_{2} \Rightarrow \sigma_{t}^{2} = \frac{\sigma^{2} }{\beta_{2}}$

# Вычисления

## Считывание данных

In [2]:
file_obj = open('Regression.csv', 'r')

# исходная выборка
X = np.array([])

for line in file_obj:
    line = line[:-1]
    X = np.append(X, float(line))
file_obj.close()

In [3]:
print X.size

1000


In [4]:
Y = np.zeros_like(X)
Y[0] = X[0]

for i in xrange(1, X.size):
    Y[i] = X[i] - X[i-1]

In [5]:
print Y.size

1000


## ОНК для $\beta_{1}\text{ и }\beta_{2}$

$\hat{\theta} = (Z^{T}Z)^{-1}Z^{T}Y = 
\begin{pmatrix}   1 & 0 & \cdots & 0\\ 
                  0 & \frac{1}{n}  & \cdots & \frac{1}{n} 
\end{pmatrix} Y = 
\frac{1}{n} 
\begin{pmatrix} n & 0 & \cdots & 0\\ 
                0 & 1 & \cdots & 1 
\end{pmatrix} Y =
\begin{pmatrix} \hat{\beta_{1}}\\ 
                \hat{\beta_{2}} 
\end{pmatrix}
$

In [6]:
beta_1 = Y[0]
beta_2 = np.mean(Y[1:])

In [7]:
print 'ОНК для beta_1 и beta_2:', '\nbeta_1 = ', beta_1, '\nbeta_2 = ', beta_2

ОНК для beta_1 и beta_2: 
beta_1 =  83.7221 
beta_2 =  9.97799349349


## Несмещенная оценка для $\sigma^{2}$

$\sigma^{2} = \frac{||Y - Z\hat{\theta}||^2}{(n + 1) - k} = \frac{1}{n - 1}||Y - Z\hat{\theta}||^2$

In [8]:
Z = np.zeros(Y.size * 2).reshape(Y.size, 2)
Z[0][0] = 1
for i in xrange(1, Z.size/2):
    Z[i][1] = 1

In [9]:
print Z

[[ 1.  0.]
 [ 0.  1.]
 [ 0.  1.]
 ..., 
 [ 0.  1.]
 [ 0.  1.]
 [ 0.  1.]]


In [10]:
theta = np.linalg.inv( (np.transpose(Z).dot(Z)) ).dot(np.transpose(Z)).dot(Y)

In [11]:
print theta

[ 83.7221       9.97799349]


In [12]:
Y_Z_Theta = Y - Z.dot(theta)

In [13]:
sigma_2 = float(Y_Z_Theta.dot(np.transpose(Y_Z_Theta)))/(Y.size - 2)

In [14]:
print 'Несмещенная оценка сигма в квадрате равна ', sigma_2

Несмещенная оценка сигма в квадрате равна  2.70470552438


## Оценка дисперсии отсчета времени

In [16]:
print 'Оценка дисперсии отсчета времени ', float(sigma_2)/(beta_2 * beta_2)

 Оценка дисперсии отсчета времени  0.027166491595


## Вывод