# Binomisk fordeling 

La $X$ være en stokastisk variabel slik at $X \sim \text{binomisk}(n,p)$. Vi sier at $X$ er binomisk fordelt med parametere $n$ og $p$. Den stokastiske variabelen representerer antall suksesser i $n$ uavhengige og identiske forsøk der sannsynligheten for suksess er $p$ i hvert forsøk. 

I denne notatboken illustrerer vi hvordan du kan regne ut sannsynligheter for $X$, og plotte sannsynlighetsfordelingen til $X$, ved bruk av python-kode.

In [None]:
from scipy import stats # statistikk-modulen i scipy-pakken
import matplotlib.pyplot as plt # plotting

## Punktsannsynligheter

Vi lar $X$ være binomisk fordelt med parametere $n$ og $p$. For å regne ut sannsynligheten $P(X = x)$ bruker vi funksjonen `stats.binom.pmf(x,n,p)` fra stats-modulen i scipy-pakken, der "pmf" er en forkortelse for "probability mass function" (punksannsynlighet). 

Punktsannsynligheter for alle mulige verdier av $X$ kan illustreres i et sannsynlighetshistogram der høyden (og arealet) på en stolpe er punktsannsynligheten.

In [None]:
n = 10   # antall forsøk
p = 0.4  # sannsynligheten for suksess
x = 3    # det tallet vi vil regne på sannsynlighet for
stats.binom.pmf(x,n,p)  # P(X = x)

In [None]:
# stats.binom.pmf(3,10,0.4) # vi kan også skrive tallene rett inn i formelen

In [None]:
# vi bruker funksjonen range under - så vi kan sjekke den litt først
print(list(range(0,16))) 
print(max(range(0,16)))
print(len(range(0,16)))

In [None]:
# skrive ut alle punktsannsynligheter for x fra 0 til 15
stats.binom.pmf(range(0, 16), n,p) 

### Plotte et sannsynlighetshistogram

In [None]:
x_max = n + 5 # hvor langt ut på x-aksen skal vi plotte? Juster om nødvendig
plt.bar(range(0,x_max), stats.binom.pmf(range(0, x_max), n,p))
plt.grid(); plt.ylabel("P(X = x)"); plt.xlabel("x")

## Kumulative sannsynligheter

Vi lar $X$ være binomisk fordelt med parametere $n$ og $p$. For å regne ut den kumulative sannsynligheten $P(X \leq x)$ bruker vi funksjonen `stats.binom.cdf(x,n,p)` fra stats-modulen i scipy-pakken, der "cdf" er en forkortelse for "cumulative distribution function" (kumulativ fordelingsfunksjon).

Når vi har en måte for å regne ut kumulative sannsynligheter kan vi også regne ut andre sannsynligheter slik som $P(X < x)$ (streng ulikhet), $P(a < X \leq b)$, osv. 

Slike sannsynligheter kan forstås som arealet av flere stolper i et sannsynlighetshistogram.

In [None]:
n = 10   # antall forsøk
p = 0.4  # sannsynligheten for suksess
x = 3    # det tallet vi vil regne kumulativ sannsynlighet for
stats.binom.cdf(x,n,p)  # P(X ≤ x)

In [None]:
stats.binom.cdf(x-1,n,p) # P(X < x)

In [None]:
stats.binom.cdf(5,n,p) - stats.binom.cdf(3,n,p)  # P(3 < X ≤ 5)

### Plotte kumulative sannsynligheter

In [None]:
x_max = n + 5 # hvor langt ut på x-aksen skal vi plotte? Juster om nødvendig
plt.step(range(0,x_max), stats.binom.cdf(range(0, x_max), n,p))
plt.grid(); plt.ylabel("P(X ≤ x)"); plt.xlabel("x")

# Geometrisk fordeling

Som vi har sett denne uka, så er binomisk og geometrisk fordeling nært beslektet. 
Begge er tett knyttet til den binomiske forsøksrekka.

Funksjoner for å beregne punktsannsynlighet og kumulativ sannsynlighet for geometrisk fordeling følger samme system som for binomisk.

## Punktsannsynlighet 

Vi lar $Y$ være geometrisk fordelt med parameter $p$. For å regne ut sannsynligheten $P(Y = y)$ bruker vi funksjonen `stats.geom.pmf(y,p)` 

In [None]:
p=0.55
y=3
prob = stats.geom.pmf(y,p) 
print("Sannsynligheten for at Y=3 er %.3f"%(prob))

## Kumulative sannsynligheter

For å regne ut den kumulative sannsynligheten $P(Y \leq y)$ bruker vi funksjonen `stats.geom.cdf(y,p)`


In [None]:
p=0.55
y=3
prob = stats.geom.cdf(y,p) 
print("Sannsynligheten for at Y er mindre eller lik 3 er %.3f"%(prob))