## HMM 예제 

문이 하나 존재하고, 문의 상태를 $X$, 센서의 관측을 $Z$라 하면 

$$X = \left \{  \text{open , closed}\right \} \qquad Z = \left \{  \text{sensor{\_}open , sensor{\_}closed}\right \}
$$

문은 외력이 작용하지 않는다고 하고, 센서의 성능은 다음과 같다고 하자.

$$
\begin{aligned}
&p(\text{sensor{\_}open} | \text{open}) = 0.7,  \;\; p(\text{sensor{\_}open} | \text{closed}) = 0.2 \\
&p(\text{sensor{\_}closed} | \text{open}) =0.3 \;\ \;
p(\text{sensor{\_}closed} | \text{closed}) = 0.8
\end{aligned}

초기 상태를 모르므로 $P(\text{open}), \; p(\text{closed}) = 0.5$

우리가 알고싶은것은 센서를 통해 문이 열려있다고 한번 관측했을때, 문이 열려있을 확률을 구해보자

In [1]:
import numpy as np

In [2]:
p_SO_O = 0.7
p_SC_O = 0.3
p_SO_C = 0.2
p_SC_C = 0.8

# initial prob
p_O = 0.5
p_C = 0.5

### Bayes Rule

$$
p(x_j|z) = \frac{p(z|x_i)p(x_j)}{\sum_{i=1}^n p(z|x_i)p(x_i)} = \eta\ \cdot p(z|x_j)p(x_j)
$$

우리가 구할것 $\to$ $p(O|SO)$

In [3]:
p_O_SO = p_SO_O * p_O
p_C_SO = p_SO_C * p_C

eta = 1 / (p_O_SO + p_C_SO)

p_O_SO = eta * p_O_SO
p_C_SO = eta * p_C_SO

print("p(open|sensor_open) = " + str(p_O_SO))
print("p(closed|sensor_open) = " + str(p_C_SO))

p(open|sensor_open) = 0.7777777777777778
p(closed|sensor_open) = 0.22222222222222224


그렇다면 이제 센서의 관측이 2번 문이 열려있다고 하는 경우를 보자

$$
p(\text{open} | \text{sensor{\_}open , sensor{\_}open})
$$

그리고 센서의 성능이 약간 향상되어 성능이 올라갔다고 가정한다

In [4]:
p_SO_O = 0.75
p_SC_O = 0.25
p_SO_C = 0.1
p_SC_C =0.9

p_O = 1/3
p_C = 2/3

In [5]:
p_O_SO = p_SO_O * p_O
p_C_SO = p_SO_C * p_C

eta = 1 / (p_O_SO + p_C_SO)

p_O_SO = eta * p_O_SO
p_C_SO = eta * p_C_SO

print("p(open|sensor_open) = " + str(p_O_SO))
print("p(closed|sensor_open) = " + str(p_C_SO))

p(open|sensor_open) = 0.7894736842105263
p(closed|sensor_open) = 0.21052631578947367


In [6]:
p_O_SO_SO = p_SO_O * p_O_SO
p_C_SO_SO = p_SO_C * p_C_SO

eta2 = 1 / (p_O_SO_SO + p_C_SO_SO)

p_O_SO_SO = eta2 * p_O_SO_SO
p_C_SO_SO = eta2 * p_C_SO_SO

print("p(open|sensor_open, sensor_open) = " + str(p_O_SO_SO))
print("p(closed|sensor_open, sensor_open) = " + str(p_C_SO_SO))

p(open|sensor_open, sensor_open) = 0.9656652360515022
p(closed|sensor_open, sensor_open) = 0.03433476394849786


## Bayes Estimation

$$
\begin{aligned}
p(x_0) = &\;\text{Typically assumped uniform distribution} \\
p(x_1|z_1) = &\;\eta_1 \ \cdot p(z_1|x_1)\sum_{x_0}p(x_1|x_0)p(x_0)\\
p(x_2|,z_2,z_1) = &\;\eta_2 \ \cdot p(z_2|x_2)\sum_{x_1}p(x_2|x_1)p(x_1|z_1)\\
\vdots  = & \;\vdots\\
p(x_t|,z_t,z_{t-1},\cdots,z_1) = &\;\eta_t \ \cdot p(z_t|x_t)\sum_{x_{t-1}}p(x_t|x_{t-1})p(x_{t-1}|z_{t-1},z_{t-2},\cdots,z_1)\\

\end{aligned}
$$

위의 식에서 control u를 식에 포함시키고,

$$
\begin{aligned}
p(x_t|z_t,\cdots,z_1,u_t,\cdots,u_1) &= \eta_t \cdot p(z_t|x_t,u_t)\sum_{x_{t-1}}p(x_t|x_{t-1},u_t)p(x_{t-1}|z_{t-1},\cdots,z_1,u_{t-1},\cdots,u_1)\\
& = \eta_t \cdot p(z_t|x_t)\sum_{x_{t-1}}p(x_t|x_{t-1},u_t)p(x_{t-1}|z_{t-1},\cdots,z_1,u_{t-1},\cdots,u_1)
\end{aligned}
$$

$bel$을 써서 식을 정리하면 다음과 같다.

$$
\begin{aligned}
\overline{bel}(x_t) & = \sum_{x_{t-1}}p(x_t|x_{t-1},u_t)p(x_{t-1}|z_1,\cdots,z{t-1},u1,\cdots,u_{t-1})\\
& = \sum_{x_{t-1}}p(x_t|x_{t-1},u_t)bel(x_{t-1})
\end{aligned}
$$

그리고 두 식은 다음처럼 하나의 recursive한 형태로 정리된다.

$$
bel(x_t) = \eta_t \cdot p(z_t|x_t) \cdot \sum_{x_{t-1}}p(x_t|x_{t-1},u_t)bel(x_{t-1})
$$