# Verovatnoća i statistika

U literaturi koja obrađuje verovatnoću susrećemo se sa pojmovima eksperimenta, prostora ishoda, događa i funkcije verovatnoće. Eksperimentom možemo smatrati proceduru koja se može ponavljati (u istim uslovima) i koja ima dobro definisane ishode. Skup svih ishoda nazivamo **prostorom ishoda**. Podskup prostora ishoda nazivamo **događaj**. Funkciju kojom svakom ishodu pridružujemo verovatnoću nazivamo **funkcijom verovatnoće**.  

Na primer, bacanje fer novčića možemo smatrati eksperimentom sa mogućim ishodima pismo (P) ili glava (G). Ako novčić bacamo tri puta, prostor ishoda je skup $\Omega = \{PPP, PPG, PGP, PGG, GPP, GPG, GGP, GGG\}$. Svaki ishod je jednako verovatan, sa verovatnoćom 1/8. Događaj bi mogao biti skup ishoda $E = \{GGP, GPG, PGG\}$ u kojima se glava pojavljuje tačno dva puta. Verovatnoća ovog događaja je 3/8. 

U opštem slučaju prostor ishoda može biti *diskretan* ili *kontinualan*. 

Formalno, za diskretan prostor ishoda $\Omega$, funkcija $P: \Omega \rightarrow R$ je **funkcija verovatnoće** ukoliko zadovoljava uslove: 
- $0 \le P(w) \le 1$ 
- $\sum_{w \in \Omega} P(w) = 1 $

Za događaje A, L i R koji pripadaju istom prostoru ishoda $\Omega$ i funkciju verovatnoće $P$ definisanu na njemu važe:
- princip komplementarnosti: $P(A^c)= 1-P(A)$
- princip uključivanja i isključivanja: $ P(L\cup R) = P(L) + P (R) - P (L \cap R)$

### Uslovna verovatnoća

Neka su $A$ i $B$ događaji koji pripadaju istom prostoru ishoda $\Omega$. Uslovna verovatnoća događaja $A$ pri uslovu $B$ se definiše kao $ P(A|B) = \frac{P(A\cap B)}{P(B)}$, uz ograničenje $P(B) \ne 0$.

Posmatrajmo bacanje novčića tri puta. Neka je $A$ događaj koji predstavlja dobitak tri glave $\{GGG\}$, a $B$ događaj koji predstavlja da je pri prvom bacanju dobijena glava $\{GGG, GGP, GPG, GPP\}$. Kako je $P(A)= \frac{1}{8}$, $P(B)=\frac{1}{2}$ i $A \cap B=A$, možemo izračunati da je $P(A|B) = \frac{1}{4}$. 

### Bajesova formula

Neka su $A$ i $B$ događaji koji pripadaju istom prostoru ishoda $\Omega$. Tada važi: $$P(A|B) = \frac{P(B|A) P(A)}{P(B)}$$ 

In [1]:
# P(B)*P(A|B) = P(A)*P(B|A) = P(A^B)

Ova formula nam praktično pomaže da izračunamo verovatnoće P(B|A) i P(A|B) ukoliko je jedna od njih poznata.

### Nezavnisnost događaja

Neka su $A$ i $B$ događaji koji pripadaju istom prostoru ishoda $\Omega$. Za njih kažemo da su nezavnisni ako važi $P(A\cap B) = P(A) P(B)$.

Posmatrajmo bacanje novčića dva puta. Neka je $A$ događaj koji označava da je pri prvom bacanju dobijena glava, a $B$ događaj koji označava da je pri drugom bacanju dobijena glava. Kako je presek događaja $A$ i $B$ događaj u kojem su glave dobijene oba puta i kako važi $P(A\cap B) = \frac{1}{4} = P(A) P(B)$, možemo zaključiti da su događaji $A$ i $B$ nezavisni. 

Posmatrajmo bacacanje novčića 3 puta. Neka je $A$ događaj koji označava da je prilikom prvog bacanja dobijena glava, a $B$ događaj koji označava da su ukupno pale dve glave. Kako događaj $A$ objedinjuje ishode $\{GPP, GPG, GGP, GGG\}$, a dogadjaj $B$ ishode $\{GGP, GPG, PGG\}$, to je $A\cap B$ skup ishoda $\{GPG, GGP\}$ i možemo zaključiti da ne važi $P(A\cap B) = P(A) P(B)$ i da događaji $A$ i $B$ nisu nezavisni.  

### Slučajna promenljiva (slučajna veličina)

Neka je $\Omega$ prostor ishoda. Diskretna slučajna promenljiva $X$ je funkcija $X: \Omega \rightarrow R$.

Posmatrajmo bacanje dveju kockica. Neka $i$ označava vrednost dobijenu na prvoj kockici, a $j$ vrednost dobijenu na drugoj kockici. Funkcija $$X(i, j) = 
\begin{cases}
    500, & \text{ako je } i+j=7\\
    -100, & \text{inace}
\end{cases}$$ je primer jedne slučajne promenljive. 

###  Matematičko očekivanje

Neka je $X$ diskretna slučajna veličina koja uzima vrednosti $x_1$, $x_2$, ..., $x_n$ redom sa verovatnoćama $p_1$, $p_2$, ..., $p_n$. Matematičko očekivanje $E(X)$ slučajne veličine $X$ se definiše kao $$E(X) = \sum_{i=1}^{n} p_i\cdot x_i = p_1x_1 + p_2x_2 + \ldots + p_nx_n$$. 

Posmatrajmo slučajnu veličinu $X$ koja predstavlja zbir vrednosti prilikom bacanja dveju kockica. Vrednosti koje ova slučajna veličina uzima i njima pripadajuće verovatnoće možemo zapisati tabelarno: 

| 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:----:|:----:|:----:|
|1/36 | 2/36 | 3/36 | 4/36 | 5/36 | 6/36 | 5/36 | 4/36 | 3/36 | 2/36 | 1/36 | 

Njeno matematičko očekivanje je $E(X) = 
2\cdot \frac{1}{36} + 
3\cdot \frac{2}{36} +
4\cdot \frac{3}{36} +
5\cdot \frac{4}{36} +
6\cdot \frac{5}{36} + 
7\cdot \frac{6}{36} +
8\cdot \frac{5}{36} +
9\cdot \frac{4}{36} +
10\cdot \frac{3}{36} +
11\cdot \frac{2}{36} +
12\cdot \frac{1}{36} = 7
$. 

Neka su $X$ i $Y$ dve slučajne veličine definisane na istom prostoru ishoda i $a$ i $b$ konstante. Tada važe osobine:
- $E(X+Y) = E(X) + E(Y)$
- $E(aX+b) = aE(x) + b$ 
- Ako je funkcija $h$ definisanu za vrednosti $x_1$, $x_2$, ..., $x_n$ koje uzima slučajna veličina $X$, tada je i $h(X)$ slučajna veličina sa matematičkim očekivanjem $E(h(X)) = \sum_{i=1}^{n} p_i\cdot h(x_i)$. 

Posmatrajmo isti problem bacanja dveju kockica. Neka je $X_1$ slučajna veličina koja predstavlja vrednost dobijenu na prvoj kockici, a $X_2$ slučajna veličina koja predstavlja vrednost dobijenu na drugoj kockici. Za slučajnu veličinu $X$ iz prethodnog primera važi $X = X_1 + X_2$ pa se traženo matematičko očekivanje može dobiti i malo jednostavnije $E(X) = E(X_1) + E(X_2)$. Kako je $E(X_1) = E(X_2) = 3.5$ (proveriti!), dobijamo $E(X)=7$.

### Varijansa i standardna devijacija diskretne slučajne promenljive

Varijansa je mera koja ukazuje na to koliko su vrednosti diskretne slučajne promenljive raspršene (engl. spread) oko srednje vrednosti tj. očekivanja.

Neka je X slučajna veličina sa očekivanjem $E(X)=\mu$, `varijansa slučajne veličine` $Var(X)$ se definiše kao $$Var(X)=E((X-\mu)^2)= \sum{p(x_i) (x_i-\mu)^2}$$.

`Standardna devijacija` $\sigma$ slučajne veličine X se definiše kao koren varijanse $\sqrt{Var(X)}$. Ona se izračunava u istim merama kao i slučajna veličina X.

Varijansa se često obeležava sa $\sigma^2$.

Svojstva varijanse:
- Ako su $X$ i $Y$ nezavisne slučajne veličine, tada je $Var(X+Y)=Var(X)+Var(Y)$.
- Za konstante $a$ i $b$ važi $Var(aX+b) = a^2Var(X)$.
- $Var(X) = E(X^2) - E(X)^2$

Pretpostavimo da treba izračunati srednju vrednost, varijansu i standardnu devijaciju slučajne veličine $X$ koja uzima vrednosti $1$, $3$ i $5$ redom sa verovatnoćama $1/4$, $1/4$ i $1/2$.

Kako je $E(X)= 1\cdot 0.25 + 3 \cdot 0.25 + 5 \cdot 0.5 = 3.5$, veličina $X-E(X)$ uzima vrednosti $-2.5$, $0.5$, i $1.5$, a veličina $(X-E(X))^2$ vrednosti $6.25$, $0.25$ i $2.25$. Stoga je varijansa $0.25 \cdot 6.25 + 0.25 \cdot 0.25+0.5\cdot 2.25 = 2.75$, a standardna devijacija $1.65$.

## Zadaci za vežbu

1) U kutiji se nalazi 5 crvenih i 2 zelene loptice. Dve loptice su izvučene jedna za drugom. Koja je verovatnoća da je druga loptica crvena?

Rešenje - prvi način: 

In [2]:
# {C, C, C, C, C, Z, Z}
# 
# _, _

In [3]:
# Z, Z, C, C, C, C, C
# Z, C, Z, C, C, C, C
# _, _, _, _, _, _, _
# (1,2), (1,3), (1,4), (1,5), (1,6), (1,7)
#        (2,3), (2,4), (2,5), (2,6), (2,7)
#               (3,4), (3,5), (3,6), (3,6)
#                      (4,5), (4,6), (4,7)
#                             (5,6), (5,7)
#                                    (6,7)
# 21 jednako verov ras
# 1-6/21

In [4]:
1 - 6/21

0.7142857142857143

Rešenje - drugi način:

In [5]:
import random

In [6]:
n_total = 100000
n_valid = 0

for _ in range(n_total):
    first = random.choice('ZZCCCCC')
    if first == 'Z':
        second = random.choice('ZCCCCC')
    else:
        second = random.choice('ZZCCCC')
    
    if second == 'C':
        n_valid += 1
        
print(n_valid/n_total)

0.71558


2) Zamislimo da bacamo dve kockice. Ukoliko je suma dobijenih vrednosti 2, dobijamo 1000 dinara, u suprotnom gubimo 100 dinara. Koliku dobit očekujemo u proseku?

In [7]:
# E = 1/36*1000 + 35/36*100

3) Neka je slučajna veličina $Y$ definisana za bacanje dveju kockica sa $Y(i, j)= max(i,j)$. Odrediti matematičko očekivanje i varijansu slučajne veličine $Y$.

4) Neka su $X$ i $Y$ dve nezavisne slučajne veličine za koje važi $Var(X) = 3$ i $Var(Y) = 5$. Izračunati $Var(3X+4)$ i $Var(X+3Y)$. 