# Nezávislé náhodné premenné

Hodnoty niekoľkých štatisticky nezávislých premenných môžeme pokladať za špeciálny prípad reprezentácie n-rozmernej náhodnej premennej vo vektorovom tvare. Pre ilustráciu určime pravdepodobnosť, kedy pri hode dvoch kociek padne rovnaká hodnota.

Náhodná premenná X môže mať hodnoty

\begin{equation}
X = \{ [1,1], [1,2] \dots [1,6], [2,1], [2,2], \dots [6,5], [6,6] \}
\end{equation}

Celkový počet hodnôt $m = 36$, hladáme pravdepodobnosť výskytu stavov $w = \{[1,1], \, \dots \, [6,6] \}$. Pretože obe kocky sú vzájomne od seba nezávislé, pravdepodobnosť hodu rovnakej hodnoty na oboch kockách súčasne je súčinom pravdepodobnosti hodu hodnoty na každej kocke  

\begin{equation}
P(w) = P([1,1]) + \dots + P([6,6]) = P(1) \, P(1) + \dots + P(6) \, P(6) =  6 \times \left( \frac{1} {6} \times \frac{1} {6} \right)= 0.1666
\end{equation}


In [19]:
# Priklad - Simulacia hodu dvoma kockami

%reset -f  
%matplotlib inline

import numpy as np
from numpy.random import randint
import matplotlib.pyplot as plt

m = 10000                    # pocet sucasnych hodov   
q = 0                        # pocetnost vyskytu sledovaneho javu
X = randint(1, 7, size=m)    # kocka c. 1, nahodna premenna X
Y = randint(1, 7, size=m)    # kocka c. 2, nahodna premenna Y
for i in range(m):
    if X[i] == Y[i]:
        q+=1

print('P(q) = ', float(q)/m)

P(q) =  0.1654


# Závislé náhodné premenné

Predpokladajme, že máme krabicu, v ktorej sa vyskytujú rezistory rôznych hodnôt a s rôznym výkonovým zaťažením. Celkový počet všetkých rezistorov v krabici je 1000 a ich početnosti pre hodnoty a zaťaženie sú v nasledujúcej tabuľke.


|             |     1 Ohm  |    10 Ohm |    100 Ohm |  1000 Ohm |<b>Spolu</b> |
|-------------|------------|-----------|------------|-----------|-------------|
| <b>1 W</b>  |         50 |      300  |         90 |        0  |  <b>440</b> |
| <b>2 W</b>  |         50 |       50  |          0 |      100  |  <b>200</b> |
| <b>5 W</b>  |          0 |      150  |         60 |      150  |  <b>360</b> |
| <b>Spolu</b>| <b>100</b> | <b>500</b>| <b>150</b> | <b>250</b>| <b>1000</b> |


Pravdepodobnosť, že z krabice vytiahneme rezistor s nejakou hodnotou odporu je

\begin{equation}
P(1 \, \Omega) = \frac{100} {1000} = 0.1
\end{equation}

\begin{equation}
P(10 \, \Omega) = \frac{500} {1000} = 0.5
\end{equation}

\begin{equation}
P(100 \, \Omega) = \frac{150} {1000} = 0.15
\end{equation}

\begin{equation}
P(1000 \, \Omega) = \frac{250} {1000} = 0.25
\end{equation}

Podobne pravdepodobnosť, že vytiahneme rezistor s nejakou hodnotou výkonového zaťaženie je

\begin{equation}
P(1 \, W) = \frac{440} {1000} = 0.44
\end{equation}

\begin{equation}
P(2 \, W) = \frac{200} {1000} = 0.2
\end{equation}

\begin{equation}
P(5 \, W) = \frac{360} {1000} = 0.36
\end{equation}

Skúmajme, s akou pravdepodobnosťou vyberieme z krabice rezistor s hodnotou 10 Ohm a zaťažením 5 W. Z tabuľky vyplýva, že takýchto rezistorov je v krabici 150, takže pravdepodobnosť je 

\begin{equation}
P(10 \,\Omega, 5 \, W) = \frac{150} {1000} = 0.15
\end{equation}

Je dôležité si uvedomiť, že hodnoty rezistorov a výkonového zaťaženie <b>nie sú štatisticky nezávislé</b>. Ak by boli štatisticky nezávislé, tak pravdepodobnosť výskytu rezistoru s hodnotou 10 Ohm a zaťažením 5 W by sme mohli vypočítať ako

\begin{equation}
P(10 \,\Omega, 5 \, W) = P(10 \,\Omega) \, P(5 \, W) = 0.5 \times 0.36 = 0.18 \neq 0.15
\end{equation}

Pre štatisticky závislé náhodné premenné je potrebné definovať koncept <b>podmienenej pravdepodobnosti</b> (<i>conditional probability</i>), ktorá definuje pravdepodobnosť javu $A$, ak už nastal jav $B$, označuje sa ako $P (A | B)$.

V našej krabici máme spolu 360 rezistorov, ktoré sú na zaťaženie 5W, z týchto má 150 hodnotu 10 Ohm. Podmienená pravdepodobnosť výberu hodnoty 10 Ohm je

\begin{equation}
P(10 \,\Omega \, | \, 5 \, W) = \frac {150} {360} = 0.417
\end{equation}

Ak chceme poznať pravdepodobnosť výberu takéhoto rezistora z celej krabice, musíme ešte hodnotu podmienej pravdepodobnosti vynásobiť pravdepodobnosťou výberu (nejakého) rezistoru so zaťažením 5W z krabice, toto označujeme ako <b>okrajovú pravdepodobnosť</b> (<i>marginal probability</i>)

\begin{equation}
P(10 \,\Omega \, | \, 5 \, W) \, P(5 \, W) = 0.417 \times 0.36 = 0.15 = P(10 \,\Omega, \, 5 \, W)
\end{equation}



# Podmienená pravdepodobnosť

Vyššie uvedené môžeme prepísať vo všeobecnom tvare

\begin{equation}
P(A, B) = P(A \, | \, B) \, P(B) = P(B \, | \, A) \, P(A)
\end{equation}

Ak udalosť $A$ nezávisí od udalosti $B$, podmienená pravdepodobnosť má tvar

\begin{equation}
P(A \, | \, B) = P(A)
\end{equation}

alebo v opačnom prípade

\begin{equation}
P(B \, | \, A) = P(B)
\end{equation}

Potom dosadením do vzťahu vyššie obdržime vzťah pre pravdepodobnosť výskytu stavu v prípade štatisticky nezávislých náhodných premenných (použitý na začiatku kapitoly) ako súčin okrajových pravdepodobností

\begin{equation}
P(A, B) = P(A) \, P(B)
\end{equation}


### Príklad

Vyššie uvedený koncept môžeme rozšíriť o pojmy z teórie množín. Ak máme náhodnú premennú, v ktorej sa môžu vyskytovať javy $A$ a $B$ s pravdepodobnosťami $P(A)$ a $P(B)$, pričom $P(B) \neq 0$, potom o podmienenej pravdepodobnosti hovoríme vtedy, ak hladáme pravdepodobnosť výskytu udalosti $A$, ak nastala udalosť $B$.


\begin{equation}
P(A | B) = \frac{P (A \cap B)} {P(B)} 
\end{equation}

Určime pravdepodobnosť, že ak na kocke padne párne číslo (udalosť $B$), tak toto číslo bude 4 (udalosť $A$). 

Pravdepodobnosť udalosti $B$ je

\begin{equation}
P(B) = \frac { \{ 2,4,6 \} } { \{ 1,2,3,4,5,6 \} } = \frac {1}{2}
\end{equation}

Pravdepodobnosť udalosti $A$ je

\begin{equation}
P(A) = \frac { \{ 4 \} } { \{ 1,2,3,4,5,6 \} } = \frac {1}{6}
\end{equation}

Prienik $P (A \cap B)$ má hodnotu 

\begin{equation}
P (A \cap B) = \frac { \{ 2, 4, 6 \} } { \{ 1,2,3,4,5,6 \} }  \cap  \frac { \{ 4 \} } { \{ 1,2,3,4,5,6 \} } = \frac { \{ 4 \} }{ \{ 1,2,3,4,5,6 \} } = \frac{1}{6}
\end{equation}

Potom 

\begin{equation}
P(A | B) = \frac{P (A \cap B)} {P(B)} = \frac {1/6} {1/2} = 1/3
\end{equation}

In [21]:
m = 10000                    # pocet hodov kocky  
A = 0                        # pocetnost udalosti A
B = 0                        # pocetnost udalosti B
X = randint(1, 7, size=m)    # nahodna premenna X
for i in range(m):
    if X[i] in [2,4,6]:
        B+=1
        if X[i]== 4:
            A+=1

print('P(A|B) = ', float(A)/B)

P(A|B) =  0.3290960451977401


### Literatúra

Dokumentácia k štatistickým funkciám Numpy

https://docs.scipy.org/doc/numpy-1.14.0/reference/routines.statistics.html