# Описание всех возможных ходов

### Состояния и их интерпретация

- $s0$–$s3$ — «выжил» (продолжает просмотр),  
- $s0B$–$s3B$ — «купил и ушёл»,  
- $s0D$–$s3D$ — «ушёл без покупки (None ушёл)».

---

#### Базовые состояния (ход, которым попали в текущую ячейку)

- $s0$: ход предыдущий $L \to$ вниз в $L$ (левая карточка $\to$ нижняя левая ячейка).
- $s1$: ход предыдущий $R \to$ влево и вниз в $L$ (правая карточка $\to$ нижняя левая ячейка).
- $s2$: ход предыдущий $R \to$ вниз в $R$ (правая карточка $\to$ нижняя правая ячейка).
- $s3$: ход предыдущий $L \to$ вправо и вниз в $R$ (левая карточка $\to$ нижняя правая ячейка).

---

#### Состояния «купил/ушёл» (фиксируемся в клетке)

- $s0B, s0D$: ход предыдущий $L$, приходим в левую ячейку и **остаёмся в этой клетке** $L$ — купил и ушёл / ушёл.
- $s1B, s1D$: ход предыдущий $R \to$ влево, остаёмся в клетке $L$ — купил и ушёл / ушёл.
- $s2B, s2D$: ход предыдущий $R$, остаёмся в этой клетке $R$ — купил и ушёл / ушёл.
- $s3B, s3D$: ход предыдущий $L \to$ вправо, остаёмся в клетке $R$ — купил и ушёл / ушёл.

---

### Допустимые переходы между «живыми» состояниями

$$
s0 \to \{\,s0,\; s3,\; s0B,\; s0D,\; s3B,\; s3D\,\},
$$

$$
s1 \to \{\,s0,\; s3,\; s0B,\; s0D,\; s3B,\; s3D\,\},
$$

$$
s2 \to \{\,s1,\; s2,\; s1B,\; s1D,\; s2B,\; s2D\,\},
$$

$$
s3 \to \{\,s1,\; s2,\; s1B,\; s1D,\; s2B,\; s2D\,\}.
$$

---

### Пустое состояние

$\text{None}$ — пустое состояние: пользователь ушёл (с покупкой или без).


# Матрица переходов

Обозначения:

- $r_L = \text{rel\_matrix}_{0,0}$ — релевантность левой верхней карточки;
- $r_R = \text{rel\_matrix}_{0,1}$ — релевантность правой верхней карточки;
- $p_b = p_{\text{break}}$;
- $c_{00} = \text{colors}[0,0],\; c_{01} = \text{colors}[0,1],\; c_{10} = \text{colors}[1,0],\; c_{11} = \text{colors}[1,1]$.

Пусть $P_{\text{look}}(c\to c') = p\_{\text{look}}[c, c']$.

### Вероятности движения по цветам

$$
p_{\text{right}}
= \frac{P_{\text{look}}(c_{00}\to c_{01})}
       {P_{\text{look}}(c_{00}\to c_{01}) + P_{\text{look}}(c_{00}\to c_{10})},
$$

$$
p_{\text{ld}}
= \frac{P_{\text{look}}(c_{00}\to c_{10})}
       {P_{\text{look}}(c_{00}\to c_{01}) + P_{\text{look}}(c_{00}\to c_{10})}.
$$

$$
p_{\text{left}}
= \frac{P_{\text{look}}(c_{01}\to c_{00})}
       {P_{\text{look}}(c_{01}\to c_{00}) + P_{\text{look}}(c_{01}\to c_{11})},
$$

$$
p_{\text{rd}}
= \frac{P_{\text{look}}(c_{01}\to c_{11})}
       {P_{\text{look}}(c_{01}\to c_{00}) + P_{\text{look}}(c_{01}\to c_{11})}.
$$

Обозначим элементы матрицы переходов как
$$
T_{i,j} = P(S_j \mid S_i).
$$

Порядок состояний:
$$
(S_0, S_1, S_2, S_3,
 S_0^B, S_1^B, S_2^B, S_3^B,
 S_0^D, S_1^D, S_2^D, S_3^D,
 \text{None}).
$$

---

### Переходы из $S_0$ (строка 0)

$$
T_{S_0, S_0}
= (1 - r_L)(1 - p_b)\, p_{\text{ld}},
$$

$$
T_{S_0, S_3}
= (1 - r_L)(1 - p_b)\, p_{\text{right}}\,
  (1 - r_R)(1 - p_b),
$$

$$
T_{S_0, S_0^B}
= r_L,
$$

$$
T_{S_0, S_3^B}
= (1 - r_L)(1 - p_b)\, p_{\text{right}}\, r_R,
$$

$$
T_{S_0, S_0^D}
= (1 - r_L)\, p_b,
$$

$$
T_{S_0, S_3^D}
= (1 - r_L)(1 - p_b)\, p_{\text{right}}\,
  (1 - r_R)\, p_b.
$$

Остальные $T_{S_0, \cdot} = 0$.

---

### Переходы из $S_1$ (строка 1)

(по коду — те же коэффициенты, что и для $S_0$):

$$
T_{S_1, S_0}
= (1 - r_L)(1 - p_b)\, p_{\text{ld}},
$$

$$
T_{S_1, S_3}
= (1 - r_L)(1 - p_b)\, p_{\text{right}}\,
  (1 - r_R)(1 - p_b),
$$

$$
T_{S_1, S_0^B}
= r_L,
$$

$$
T_{S_1, S_3^B}
= (1 - r_L)(1 - p_b)\, p_{\text{right}}\, r_R,
$$

$$
T_{S_1, S_0^D}
= (1 - r_L)\, p_b,
$$

$$
T_{S_1, S_3^D}
= (1 - r_L)(1 - p_b)\, p_{\text{right}}\,
  (1 - r_R)\, p_b.
$$

Остальные $T_{S_1, \cdot} = 0$.

---

### Переходы из $S_2$ (строка 2)

$$
T_{S_2, S_1}
= (1 - r_R)(1 - p_b)\, p_{\text{left}}\,
  (1 - r_L)(1 - p_b),
$$

$$
T_{S_2, S_2}
= (1 - r_R)(1 - p_b)\, p_{\text{rd}},
$$

$$
T_{S_2, S_1^B}
= (1 - r_R)(1 - p_b)\, p_{\text{left}}\, r_L,
$$

$$
T_{S_2, S_2^B}
= r_R,
$$

$$
T_{S_2, S_1^D}
= (1 - r_R)(1 - p_b)\, p_{\text{left}}\,
  (1 - r_L)\, p_b,
$$

$$
T_{S_2, S_2^D}
= (1 - r_R)\, p_b.
$$

Остальные $T_{S_2, \cdot} = 0$.

---

### Переходы из $S_3$ (строка 3)

$$
T_{S_3, S_1}
= (1 - r_R)(1 - p_b)\, p_{\text{left}}\,
  (1 - r_L)(1 - p_b),
$$

$$
T_{S_3, S_2}
= (1 - r_R)(1 - p_b)\, p_{\text{rd}},
$$

$$
T_{S_3, S_1^B}
= (1 - r_R)(1 - p_b)\, p_{\text{left}}\, r_L,
$$

$$
T_{S_3, S_2^B}
= r_R,
$$

$$
T_{S_3, S_1^D}
= (1 - r_R)(1 - p_b)\, p_{\text{left}}\,
  (1 - r_L)\, p_b,
$$

$$
T_{S_3, S_2^D}
= (1 - r_R)\, p_b.
$$

Остальные $T_{S_3, \cdot} = 0$.

---

### Абсорбирующее состояние None

По коду для всех $i \in \{S_0^B, S_1^B, S_2^B, S_3^B,
S_0^D, S_1^D, S_2^D, S_3^D, \text{None}\}$:

$$
T_{i, \text{None}} = 1,
\qquad
T_{i, j} = 0 \;\; \text{для всех } j \neq \text{None}.
$$


# Наблюдаемые состояния $(X_k$)

Наблюдаемое состояние кодируем по событиям на правой (R) и левой (L) карточках.

Обозначения:

- $(N$) — ничего (нет клика и покупки),
- $(C$) — клик,
- $(B$) — покупка.

Тогда алфавит наблюдений $\{X_0,\dots,X_7\}$ задаётся так:

$$
\begin{array}{c|cc}
 & R & L \\ \hline
X_0 & N & N \\
X_1 & C & N \\
X_2 & N & C \\
X_3 & C & C \\
X_4 & C,B & N \\
X_5 & N & C,B \\
X_6 & C,B & C \\
X_7 & C & C,B
\end{array}
$$

Для генерации удобно использовать двоичный код $(\text{click}, \text{buy})$
для каждой стороны:

$$
\begin{array}{c|cc}
 & R & L \\ \hline
X_0 & (0,0) & (0,0) \\
X_1 & (1,0) & (0,0) \\
X_2 & (0,0) & (1,0) \\
X_3 & (1,0) & (1,0) \\
X_4 & (1,1) & (0,0) \\
X_5 & (0,0) & (1,1) \\
X_6 & (1,1) & (1,0) \\
X_7 & (1,0) & (1,1)
\end{array}
$$


# Матрица эмиссий $(E$) для состояний $(S_i$)

Функция `get_emission_matrix` возвращает матрицу
$$
E \in \mathbb{R}^{13 \times 8}, \qquad
E_{i,k} = P(X_k \mid S_i).
$$

Пусть
- $\text{matrix\_click} = [\,p_{c,L},\; p_{c,R}\,]$,
- $p_{c,L}$ — вероятность клика по левой карточке,
- $p_{c,R}$ — вероятность клика по правой карточке.

Порядок скрытых состояний (строки матрицы):

$$
\begin{aligned}
S_0, S_1, S_2, S_3,\;
S_0^D, S_1^D, S_2^D, S_3^D,\;
S_0^B, S_1^B, S_2^B, S_3^B,\;
\text{None}.
\end{aligned}
$$

Порядок наблюдений (столбцы матрицы):

$$
X_0, X_1, X_2, X_3, X_4, X_5, X_6, X_7.
$$

---

#### Строка $S_0$

$$
\begin{aligned}
P(X_0 \mid S_0) &= 1 - p_{c,L},\\
P(X_1 \mid S_0) &= p_{c,L},
\end{aligned}
$$
остальные $ P(X_k \mid S_0) = 0 $.

---

#### Строка $S_1$

$$
\begin{aligned}
P(X_0 \mid S_1) &= (1 - p_{c,L})(1 - p_{c,R}), \\
P(X_1 \mid S_1) &= (1 - p_{c,L})\, p_{c,R}, \\
P(X_2 \mid S_1) &= p_{c,L}\, (1 - p_{c,R}), \\
P(X_3 \mid S_1) &= p_{c,L}\, p_{c,R},
\end{aligned}
$$
остальные $ P(X_k \mid S_1) = 0 $.

---

#### Строка $S_2$

$$
\begin{aligned}
P(X_0 \mid S_2) &= 1 - p_{c,R},\\
P(X_2 \mid S_2) &= p_{c,R},
\end{aligned}
$$
остальные $P(X_k \mid S_2) = 0$.

---

#### Строка $S_3$

$$
\begin{aligned}
P(X_0 \mid S_3) &= (1 - p_{c,R})(1 - p_{c,L}), \\
P(X_1 \mid S_3) &= p_{c,R}(1 - p_{c,L}), \\
P(X_2 \mid S_3) &= (1 - p_{c,R})\, p_{c,L}, \\
P(X_3 \mid S_3) &= p_{c,R}\, p_{c,L},
\end{aligned}
$$
остальные $P(X_k \mid S_3) = 0$.

---

#### Строки состояний ухода без покупки \((S_i^D)\)

- Для $S_0^D$:

$$
P(X_0 \mid S_0^D) = 1,
$$
остальные $P(X_k \mid S_0^D) = 0$.

- Для $S_1^D$:

$$
\begin{aligned}
P(X_0 \mid S_1^D) &= 1 - p_{c,L}, \\
P(X_2 \mid S_1^D) &= p_{c,L},
\end{aligned}
$$
остальные $P(X_k \mid S_1^D) = 0$.

- Для $S_2^D$:

$$
P(X_0 \mid S_2^D) = 1,
$$
остальные $P(X_k \mid S_2^D) = 0$.

- Для $S_3^D$:

$$
\begin{aligned}
P(X_0 \mid S_3^D) &= 1 - p_{c,R},\\
P(X_1 \mid S_3^D) &= p_{c,R},
\end{aligned}
$$
остальные $P(X_k \mid S_3^D) = 0$.

---

#### Строки состояний покупки $(S_i^B)$.

- Для $S_0^B$:

$$
P(X_4 \mid S_0^B) = 1,
$$
остальные $P(X_k \mid S_0^B) = 0$.

- Для $S_1^B$:

$$
\begin{aligned}
P(X_4 \mid S_1^B) &= 1 - p_{c,L}, \\
P(X_6 \mid S_1^B) &= p_{c,L},
\end{aligned}
$$
остальные $P(X_k \mid S_1^B) = 0$.

- Для $S_2^B$:

$$
P(X_5 \mid S_2^B) = 1,
$$
остальные $P(X_k \mid S_2^B) = 0$.

- Для $S_3^B$:

$$
\begin{aligned}
P(X_5 \mid S_3^B) &= 1 - p_{c,R}, \\
P(X_7 \mid S_3^B) &= p_{c,R},
\end{aligned}
$$
остальные $P(X_k \mid S_3^B) = 0$.

---

#### Строка состояния $\text{None}$

$$
P(X_0 \mid \text{None}) = 1,
$$
остальные $P(X_k \mid \text{None}) = 0$.

Таким образом, каждая строка матрицы эмиссий определяется **только** вероятностями клика
$p_{c,L}$ и $p_{c,R}$, и не зависит от $p_{\text{break}}$.
