Задача 7.4


$\mathbb{E}(N_t|N_s) = \mathbb{E}(N_t - N_s + N_s|N_s) = \mathbb{E}(N_t - N_s|N_s) + \mathbb{E}(N_s|N_s)$. Поскольку $N_t - N_s$ и $N_s$ независимы, то
$\mathbb{E}(N_t - N_s|N_s) = \mathbb{E}(N_t - N_s) = \lambda(t - s)$. Кроме того,
$\mathbb{E}(N_s|N_s) = N_s$.
Итого получаем, что
$\mathbb{E}(N_t|N_s) = N_s + \lambda(t - s)$.

В качестве априорного распределения возьмем сопряженное к экспоненциальному -- то есть гамма распределение. При этом, если параметры априорного равны $(\alpha, \beta)$, то параметры апостериорного будут равны $(\alpha + n, \beta + \sum{x_i})$. А байесовская оценка -- $\frac{\alpha + n}{\beta + \sum{x_i}}$.

Поскольку мы не обладаем никакими дополнительными знаниями о $\lambda$, то выбрать параметры априорного распределения довольно трудно. В данной задаче выберем такие параметры, чтобы матожидание априорного распределения было по порядку величины близко к истинному значению -- (2, 5).

In [23]:
from __future__ import print_function
import numpy as np

def bayes_estimator(alpha, beta, sample):
    alpha1 = float(alpha) + len(sample)
    beta1 = float(beta) + np.sum(sample)
    return alpha1 / beta1

def read_data():
    input = open('input.txt')
    next(input)  # skipping lambda; assuming it's not known
    return [float(m) for m in input]

def calc_predictions(moments):
    result = []
    for s in range(0, 61):
        happened = [m for m in moments if m <= s]
        deltas = [happened[i] - happened[i - 1] for i in range(1, len(happened))]
        lambda_ = bayes_estimator(2, 5, deltas)
        N_s = len(happened)
        E_N_t_N_s = N_s + lambda_ * (60 - s)
        result.append((s, E_N_t_N_s))
    return result

moments = read_data()
result = calc_predictions(moments) + [(m, 'break') for m in moments]
for x, y in sorted(result):
    print(x, y, sep='\t')


0	24.0
1	23.6
2	23.2
3	22.8
4	22.4
5	22.0
5.944	break
6	22.6
6.579	break
7	30.2165039929
7.256	break
8	35.9531051965
9	35.319391635
10	34.6856780735
10.317	break
11	30.1389096341
12	29.6054624987
13	29.0720153633
14	28.5385682279
15	28.0051210925
16	27.4716739571
16.07	break
17	22.0567235224
18	21.6600555335
18.481	break
19	22.365398871
20	21.9662428009
21	21.5670867309
22	21.1679306609
23	20.7687745909
23.748	break
24	19.6293632696
24.059	break
25	21.6275146009
26	21.2381570409
26.777	break
27	21.7743583788
28	21.3872566098
29	21.0001548407
29.129	break
30	21.7083555082
31	21.3180769913
32	20.9277984744
32.997	break
33	21.1082581974
34	20.7338782641
35	20.3594983309
36	19.9851183977
37	19.6107384644
37.457	break
37.668	break
38	21.3868859601
39	21.005663871
40	20.6244417819
41	20.2432196928
42	19.8619976037
42.756	break
43	20.098727638
44	19.7399789534
44.087	break
45	20.5628954871
46	20.192035788
47	19.8211760888
48	19.4503163897
49	19.0794566905
50	18.7085969914
51	18.3377372923
52	