# Náhodná premenná

### Jednorozmerná náhodná premenná

Predpokladajme, že máme konečnú postupnosť $X$, ktorá obsahuje $m$ hodnôt náhodnej premennej, $X=\{X_1, X_2, \dots X_m\}$, Rozsah hodnôt náhodnej premennej $X$ je daný $n$ diskrétnymi hodnotami $x_i, \, i=1 \dots n$.

Pravdepodobnosť $p_i$  výskytu hodnoty $x_i$ v postupnosti $X$ je definovaná ako počet výskytov tejto hodnoty $q_i$ vzhľadom na celkový počet hodnôt v súbore $m$

\begin{equation}
p_i = P \,(x_i) = \frac{q_i}{m}  
\end{equation}



In [35]:
%reset -f  

from numpy.random import randint

m = 30                   # pocet hodnot X   
X = randint(6, size=m)   # vytvorenie pola X, int hodnoty z rozsahu 0...5 
xi = 3                   # zvolena hodnota nahodnej premennej
qi = sum(X==xi)          # vypocet pocetnosti vyskytu xi
P = qi / m               # vypocet pravdepodobnosti P

print('  X  = ', X)
print('  qi = ', qi)
print('P({0:1d}) =  {1:0.3f}'.format(xi,P))

  X  =  [5 5 3 4 1 4 1 3 4 4 3 1 2 1 0 0 0 4 1 4 0 2 4 5 3 5 4 2 4 0]
  qi =  4
P(3) =  0.133


Označenie $P(x_i)$  definuje pravdepodobnosť ako funkčnú závislosť od hodnoty $x_i$.V literatúre sa vyskytujú aj alternatívne označenie $P(X=x_i)$, $P[X=x_i]$.

Charakteristickou hodnotou náhodnej premennej je stredná hodnota $E[X]$ (v literatúre označovaná aj ako <i>mean</i>, <i>excepted value</i>) $E[X]$, štandardne označovaná aj ako $\mu$. Pre túto  môžeme písať 

\begin{equation}
\mu = E[X] = \frac{1}{m} \sum_{i=1}^n q_i x_i = \sum_{i=1}^n p_i x_i 
\end{equation}

kde postupnosť $ \lbrace p_1, \, p_2 \dots \rbrace $ definuje rozdelenie pravdepodobností pre hodnoty $ \lbrace x_1, \, x_2 \dots \rbrace $. 
Označenie $E[X]$ definuje operátor nad postupnosťou $X$, t.j. násobenie a následnú sumáciu prvkov postupnosti. 

V literatúre sa používajú pre označenie strednej hodnoty aj symboly $\mathbb{E}[X]$, $E(X)$, $E(x)$, $\overline{X}$, $\overline{x}$.

In [50]:
import numpy as np

x = range(6)             # hodnoty xi [0, 1, ... 5]
q = np.zeros(6)          # hodnoty qi [0, 0,     0]
p = np.zeros(6)          # hodnoty pi [0, 0,     0]

for xi in x:
    q[xi] = sum(X==xi)
    p[xi] = q[xi] / m
    print('xi = {0:1d}    qi ={1:2.0f}    pi = {2:1.3f}'.format(xi,q[xi], p[xi]))
    
print()
print('      Mean = ', sum(p*x))
print('Numpy mean = ', np.mean(X))    # standard numpy function

xi = 0    qi = 5    pi = 0.167
xi = 1    qi = 5    pi = 0.167
xi = 2    qi = 3    pi = 0.100
xi = 3    qi = 4    pi = 0.133
xi = 4    qi = 9    pi = 0.300
xi = 5    qi = 4    pi = 0.133

      Mean =  2.63333333333
Numpy mean =  2.63333333333


Je zrejmé, že pre súčet hodnôt rozdelenia pravdepodobností platí

\begin{equation}
\sum_{i=1}^n p_i = 1
\end{equation}

In [52]:
print(sum(p))

1.0


Vlastnosti odchýlok náhodnej premennej $X$ od strednej hodnoty $\mu$ popisuje rozptyl (<i>variance</i>) $Var[X]$, v technickej praxi označovaný aj ako $\sigma^2$, ktorý je definovaný vzťahom

\begin{equation}
\nonumber
\sigma^2 = Var[X] =  E[(X-E[X])^2] = E[(X-\mu)^2] 
\end{equation}

Pri diskrétnom rozdelení vzťah pre rozptyl má tvar (s uplatnením vlastností operátora $E[X]$ ) 

\begin{equation}
Var[X] =  E[(X-\mu)^2] = \frac{1}{m} \sum_{i=1}^n q_i (x_i - \mu)^2 = \sum_{i=1}^n p_i (x_i - \mu)^2
\end{equation} 