**Autor:** [Matej Uhrin](mailto:5283652@upjs.sk)

**Podporné materiály k bakalárskej práci *Simulácie vybraných stochastických procesov v interaktívnom prostredí***

***

<br>

**<font size=10 color=brown> Markovove reťazce</font>**

<br>

<a id=table_of_contents></a>
##  Obsah
* [Algoritmus simulácie diskrétneho Markovovho reťazca](#algo)
* [Problém vysokoškoláka športovca](#sportstudy)

<font size=3>Pre návrat na obsah stlačte klávesu Home.</font>
---

In [4]:
# nacitanie balikov
import numpy as np
import matplotlib.pyplot as plt

***
<a id=algo><a>
## Algoritmus simulácie diskrétneho Markovovho reťazca
<blockquote>Pri tejto simulácii sa obmedzíme na konečný počet stavov v reťazci. Algoritmus je opäť priamočiary a vychádza z konštrukcie matice pravdepodobnosti prechodu. Uvažujme teda diskrétny Markovov reťazec $\{X_n, n\in\mathbb{N}_0\},\  \mathcal{S}=\{1,2,\dots,r\}$, ktorý je popísaný $r\times r$ maticou pravdepodobnosti prechodu $\mathbf{P}$ a počiatočným rozdelením $\alpha$. Potom:

- Zvoľme $k$ - počet krokov, ktoré chceme odsimulovať.
- Generovaním z vektora $\alpha$ vygenerujme počiatočný stav $x_0$.
- Pre $i=1,2,\dots,k$ opakujme:
    - Generovaním z $(x_{i-1})$-tého riadku matice $\mathbf{P}$ vygenerujme stav $x_i$.

Výsledkom je množina  $\{x_n: n=0,1,2,\dots,k\}$, kde $x_n$ predstavuje stav reťazca po $n$-tom kroku.</blockquote>


Ukážme implementáciu tohto algoritmu v Python-e:

In [2]:
def markov_chain(k, prob_matrix, init_dist):
    """
    Vykona prvych k krokov realizacie zadaneho diskretneho Markovoveho retazca.

    :param k: Pocet krokov simulacie
    :param prob_matrix: Matica pravdepodobnosti prechodu
    :param init_dist: Pociatocne rozdelenie
    :return: Pole dlzky k+1 - realizacia Markovoveho retazca
    """
    rng = np.random.default_rng()

    idx_arr = np.arange(len(prob_matrix))
    
    # generovanie pociatocneho stavu
    init_state = rng.choice(idx_arr, p=init_dist)
    X = [init_state]
    
    # generovanie prvych k stavov
    for _ in range(k):
        prob_vector = prob_matrix[X[-1]]
        X_i = rng.choice(idx_arr, p=prob_vector)
        X.append(X_i)
        
    return np.array(X)

Ukážka simulácie diskrétneho Markovového reťazca - uvažujme reťazec so stavovým priestorom $\mathcal{S}=\{0,1,2,3\}$ a maticou pravdepodobnosti prechodu
$P=\begin{pmatrix}
0 & 0.5 & 0.5 & 0\\
0.2 & 0.5 & 0.1 & 0.2\\
0.4 & 0 & 0.3 & 0.3\\
0.1 & 0.1 & 0.3 & 0.5\\
\end{pmatrix}$ a počiatočným rozdelením $\alpha = \left(\,0.25\;0.25\;0.25\;0.25\,\right)$.

Vykonajme simuláciu prvých 10 krokov:

In [6]:
P = [[0, 0.5, 0.5, 0], [0.2, 0.5, 0.1, 0.2], [0.4, 0, 0.3, 0.3], [0.1, 0.1, 0.3, 0.5]]
init_dist = [0.25, 0.25, 0.25, 0.25]

X = markov_chain(k=10, prob_matrix=P, init_dist=init_dist)

# vypis
print("Realizacia Markovoveho retazca:")
for i, x in enumerate(X):
    print(f"x_{i} \t {x}")

Realizacia Markovoveho retazca:
x_0 	 2
x_1 	 0
x_2 	 2
x_3 	 0
x_4 	 2
x_5 	 3
x_6 	 3
x_7 	 2
x_8 	 0
x_9 	 1
x_10 	 1


***
<a id=sportstudy><a>
## Problém vysokoškoláka športovca
<blockquote>Peter je talentový športovec, ale zároveň študuje matematiku na vysokej škole. Každý deň sa chce primerane venovať štúdiu a tiež športovým tréningom. Každú hodinu sa rozhodne, ktorú z týchto aktivít bude najbližšiu hodinu vykonávať. Žiaľ, obe aktivity sú pre Petra rizikové. Pri športovaní sa Peter môže zraniť a z učenia si môže priviesť bolesť hlavy. Keď nastane niektorá z týchto nepríjemných situácií, potom musí Peter dostatočný čas oddychovať a nemôže vykonávať ani jednu zo spomínaných činností. Z predchádzajúcich skúseností Peter zistil, že jeho činnosti sa riadia podľa nasledovného diagramu:</blockquote>

<blockquote><img src="mc_sportstudy.png"/></blockquote>

Na začiatok vykonajme niekoľko možných realizácií tohto procesu:

Z obrázka vieme určiť maticu $\mathbf{P}=\begin{matrix}(\textit{Štúdium})\\(\textit{Šport})\\(\textit{Bolesť hlavy})\\(\textit{Zranenie})\end{matrix}\begin{pmatrix}
0.75 & 0.2 & 0.05 & 0 \\
0.4 & 0.5 & 0 & 0.1 \\
0 & 0 & 1 & 0 \\
0 & 0 & 0 & 1 \\
\end{pmatrix}$

In [8]:
P = [[0.75, 0.2, 0.05, 0], [0.4, 0.5, 0, 0.1], [0, 0, 1, 0], [0, 0, 0, 1]]
zaciatok_studium = [1, 0, 0, 0]
zaciatok_sport = [0, 1, 0, 0]
zaciatok_50_50 = [0.5, 0.5, 0, 0]
labels = ["Studium", "Sport", "Bolest hlavy", "Zranenie"]

In [14]:
for i in range(5):
    X = markov_chain(k=10, prob_matrix=P, init_dist=zaciatok_50_50)
    labeled_x = list(map(labels.__getitem__, X))
    print(f"{i}:\t {', '.join(labeled_x)}")

0:	 Studium, Studium, Studium, Sport, Studium, Studium, Studium, Studium, Sport, Sport, Sport
1:	 Studium, Studium, Sport, Sport, Sport, Studium, Bolest hlavy, Bolest hlavy, Bolest hlavy, Bolest hlavy, Bolest hlavy
2:	 Sport, Sport, Sport, Zranenie, Zranenie, Zranenie, Zranenie, Zranenie, Zranenie, Zranenie, Zranenie
3:	 Studium, Studium, Studium, Studium, Studium, Studium, Sport, Sport, Studium, Bolest hlavy, Bolest hlavy
4:	 Studium, Studium, Studium, Studium, Studium, Studium, Sport, Studium, Studium, Sport, Sport


Na záver overme teoretické závery jednotlivých podotázok:

<blockquote>S ktorou aktivitou by mal Peter začať, aby v priemere oddialil vznik nepríjemnej situácie?</blockquote>

Ukázali sme, že:

$E[\text{čas vzniknutia nepríjemnej situácie}|\text{Peter začína štúdiom}]=\mu(\text{Štúdium})=15.55$<br>

$E[\text{čas vzniknutia nepríjemnej situácie}|\text{Peter začína športom}]=\mu(\text{Šport})=14.44$

In [95]:
def chain_stopping_time(prob_matrix, init_dist):
    """
    Simulacia nasho retazca po prvy prechod do neprijemneho stavu.
    """
    rng = np.random.default_rng()

    idx_arr = np.arange(len(prob_matrix))
    state = rng.choice(idx_arr, p=init_dist)
    time = 0
    while state < 2:
        prob_vector = prob_matrix[state]
        state = rng.choice(idx_arr, p=prob_vector)
        time += 1
    return time

In [97]:
# volitelny parameter N - pocet realizacii
N = 100_000

# pocitadla meranych velicin
study_times, sport_times = [], []

# simulacia
for _ in range(N):
    study_times.append(chain_stopping_time(prob_matrix=P, init_dist=zaciatok_studium))
    sport_times.append(chain_stopping_time(prob_matrix=P, init_dist=zaciatok_sport))

# vypis empirickych hodnot
print(f"Priemerny cas vzniknutia neprijemnej situacie, ak zacina studiom:\t{np.mean(study_times):.3f}")
print(f"Priemerny cas vzniknutia neprijemnej situacie, ak zacina sportom:\t{np.mean(sport_times):.3f}")

Priemerny cas vzniknutia neprijemnej situacie, ak zacina studiom:	15.553
Priemerny cas vzniknutia neprijemnej situacie, ak zacina sportom:	14.444


<blockquote>Peter si vyhradil na aktivity 5 hodín. Aby zistil s ktorou aktivitou začne, hodil si mincou. Aká je pravdepodobnosť, že sa Peter po týchto 5 hodinách nezranil, ani ho nebolela hlava?</blockquote>

Skutočná pravdepodobnosť vypočítaná v práci: $0.701$

Nájdime empirickú hodnotu:

In [15]:
# volitelny parameter N - pocet realizacii
N = 100_000

# pocitadlo uspesnych realizacii
n_of_success = 0

# simulacia
for _ in range(N):
    X = markov_chain(k=5, prob_matrix=P, init_dist=zaciatok_50_50)
    if X[-1] < 2:
        n_of_success += 1

# vypis
print(f"Empiricka pravdepodobnost:\t{n_of_success / N:.4f}")

Empiricka pravdepodobnost:	0.7015
