# Forventningsverdi


**Forventningsveri** er et sentralt begrep i sannsynlighetsteori. Det er et mål på "langtidsgjennomsnittet" av en tilfeldig variabel (eller tilfeldig prosess).

Det er mange områder der forventningsverdi brukes, og det er vanskelig å gi en omfattende liste. Den brukes i en rekke beregninger av naturvitere, datavitere, statistikere, investorer, økonomer, finansinstitusjoner og profesjonelle gamblere, for bare å nevne noen.


Forventningsverdi er nært knyttet til begrepet *gjennomsnitt* vi har lært om i statistikk. Vi skal utforske begrepet nå. For dette la oss begynne med et eksempel.

## Innledning og først eksempel

La oss si at du jobber for et amerikansk selskap som betaler deg en fast lønn på $\$ 7500 $ hver måned. Når det gjelder daglige utgifter, bruker du nøyaktig $\$ 2500$ totalt hver måned, og du setter resten på din personlige bankkonto. Si også at du starter med nøyaktig $\$ 0$ på kontoen din 1. januar. Hvor mye penger forventer du å ha innen 1. januar året etter (dvs. 12 måneder senere)?

In [None]:
#La Python regne for deg...

La oss nå endre eksemplet litt. Dine månedlige kostnader og lønn er fortsatt de samme, men du mottar også variabel månedlig bonus. Disse bonusene avhenger av flere markedsfaktorer som er utenfor din kontroll. Mangelen på kontroll og usikkerhet betyr at det endelige beløpet du mottar ikke lenger er deterministisk, men er avhengig av tilfeldighet, dvs. vi må regne med begrep fra sannsynlighetsregning. 

For å forenkle saken, la oss antar at din månedlig bonus hver måned er ikke avhengig av måneder før og du har følgende sjanser for å få utbetalt:

- $\$ 1000$ med sannsynlighet $0.6$
- $\$ 500$ med sannsynlighet $0.3$, og
- $\$ 0$ med sannsynlighet $0.1$

La oss nå stille det samme spørsmålet igjen: 
*hvor mye forventer du å ha på kontoen din etter 12 måneders arbeid?*

Du vet at du helt sikkert får $\$ 60$ tusen fra den faste lønnen (etter å ha trukket fra de månedlige utgiftene dine). På toppen av det vil du legge til et usikkert beløp fra bonusene. Men hvor mye?

**Oppgave** Diskuter noen minutter i gruppene: Hva kan du si i situasjonen? Hva mener dere er sannsynlig at dere får som bonus (Gjerne beregn noen sannsynligheter)? Kan dere forvente en minimal bonus?

**Plass for dine notater**

In [None]:
#Du kan bruke cellen her hvis du må regne noe og vil at Python hjelper

Det vi kan spørre nå etter vi har sett på saken er: Fins det noen verdi vi kan forvente å få som bonus etter ett år på jobb?

## Forventningsverdi

I denne delen skal vi se den formelle definisjonen av forventningsverdi og hvordan man faktisk beregner den. Jeg skal også gi deg litt intuisjon om det ved å vise dets forhold til det gjennomsnittet.

La oss starte med eksemplet fra siste avsnitt og svare på de spørsmål fra slutten av forrige avsnitt. Først la oss beregne forventningsverdien uten for mye forklaring, og se på detaljene etterpå.

For å nedbryte oppgaven litt, la oss beregne først den forventede bonusen per måned. Det gjør man ved å multiplisere hver mulig verdi som fins som bonus med dens respektive sannsynlighet og legge til produktene.

Siden vi får $\$ 1000$ med sannsynlighet $0.6$, $\$ 500$ med sannsynlighet $0.3$, og $\$ 0$ med sannsynlighet $0.1$ får vi som **forvented bonus**:

$$\$ 1000 \cdot 0.6 + \$ 500 \cdot 0.3 + \$ 0 \cdot 0.1 = \$ 600 + \$ 150 = \$ 750$$

**Spørsmål** Den forvented bonus for en måned er $\$ 750$, hvordan beregner vi nå den forvented bonus for ett år?

In [None]:
#Plass for ditt svar, la Python regne for deg

# Definisjon av forventningsverdi

Før vi definerer forventningsverdi la oss minne om forskjellen mellom *deterministiske* og *tilfeldige variabler*.'

En **deterministisk variabel** er en variabel med bare én mulig fast verdi til enhver tid.

--- 
**Eksempel** 
Din nåværende alder en deterministisk variabel. For å finne verdien trenger vi bare trekke fra fødselsdatoen din fra gjeldende dato (og eventuelt konvertere fra dager til år). Uansett hvor mange ganger du utfører denne målingen, vil du alltid få det samme resultatet. Med andre ord er alderen din en fast verdi (til ethvert bestemt tidspunkt).

---


En **tilfeldig variabel** har derimot mer enn én mulig verdi. Når den måles, vil variabelen ta en av disse verdiene tilfeldig, hver med en viss sannsynlighet. 

---
**Eksempel**
For eksempel er siden som en mynt lander på en tilfeldig variabel med to mulige verdier: krone og mynt, hver med en sannsynlighet på $0,5$. 

---

Generellt ser vi nå på tilfeldige variabler $X$ som kan ha en endelig antall $N$ av mulige utfall. Vi skriver for disse verdier
$$v_1 , v_2, v_3 , \ldots , v_N, \text{ hvor } N \in \mathbb{N}$$
La oss skrive de sannsynligehetene for disse verdier som 
$$P(X = v_1), P(X= v_2), P(X=v_3), \ldots, P(X= v_N).$$
I andre ord, at den tilfeldige variabel $X$ tar verdien $v_1$ er $P(X= v_1)$. Husk at vi må ha 
$$P(X = v_1 ) + P(X=v_2) + \cdots + P(X = v_N) = 1.$$

Vi kan nå gi en (formell) definisjon av forventningsverdi til en tilfeldig variabel $X$. **Forventingsverdien** defineres som
$$\mathbb{E}(X) = v_1 \cdot  P(X=v_1) + v_2\cdot P(X=v_1) + \cdots + v_N \cdot P(X=v_N).$$
(Vi bruker symbolet $\mathbb{E}$ for forventingsverdi siden på engelsk heter forventningsverdi *expectation* eller *expected value*. Det er vanlig å bruke $\mathbb{E}$ eller $E$ som en forkortning av det.) 

**Oppgave 1** Se på formelen for forventningsverdien. Forklar
1. hvilke tall i eksemplet om forvented bonusbetaling fra den siste avsnitt tilsvarer $v_i$ og hvilke $P(X=v_i)$.
2. hvorfor den formelen vi har brukt for å beregne forvented månedlig bonus er en spesialfall av den allmen definisjon av forventningsverdien.

**Plass for dine svar og notater, dobbeltklikk her for å skrive noe**

### Litt matematisk notasjon: summetegn $\Sigma$

Det er ofte litt tungvint å skrive summene som vi skal se ofte nå i utregninger av forventningsverdier uten en bedre matematisk notasjon. For dette fins det så kallte *summetegn* som brukes den greske bokstaven stor Sigma for å skrive en summe mer kompakt. For eksempel kan vi skrive

$$x_1 + x_2 + \cdots x_N = \sum_{n=1}^N x_n$$

På venstre side av ligningen blir $N$ antall verdier som adderes. Verdiene er uttrykt som variabelen $x$ med et subskript. Subskriptet indikerer indeksen til elementet i sekvensen.

På høyre side har vi samme sum uttrykt med sumoperatoren. Den består av $4$ deler:
- $\Sigma$-symbolet, som indikerer en sumoperasjon
- $n = 1$, som indikerer at indeksen (som heter $n$) starter fra $1$
- $N$, som indikerer at indeksen går opp til og med $N$
- $x_n$, som er det faktiske addisjonsleddet

Indeksen økes med $1$ for hver iterasjon (for hvert ledd i summen). I stedet for $x_n$ kan du ha et vilkårlig komplekst uttrykk som består av termer (valgfritt) indeksert med $n$. For mer informasjon viser vi til en liten [Youtube video](https://youtu.be/mDy8L62745k).

---
**Eksempel (Forventningsverdi)**
Ved hjelp av summetegn kan vi utrykke forventningsverdien for en tilfeldig variabel $X$ med verdier $v_1,\ldots, v_N$ som 

$$\mathbb{E}(X) = \sum_{n=1}^N v_n P(X=v_n).$$

For å skrive det igjen eksplisit: Hvis $X$ tar tre verdier $v_1,v_2, v_3$ er $N=3$ og forventningsverdien av $X$ er gitt som $\mathbb{E}(X)= v_1P(X=v_1)+v_2P(X=v_2)+v_3P(X=v_3)$

---

# Eksempler og simulasjon

Vi skal overbevise oss om at den forventningsverdien faktisk er et tall som bør "forventes". La oss bekrefte dette med noen eksperimentelle simuleringer.

Først og framst ser vi igjen på bonus-lønn-eksemplet vi startet med. Husk at vi beregnet bonusens forventede verdi for $1$ måned til å være $\$ 750$. La oss se om det virkelig er tilfelle.

For dette skal vi lage først den tilfeldige variabel $Bonus=$bonusbetaling i en måned. 

**Oppgave** Se på kode under og forklar hva skjer. Kommenter koden linje for linje og forklar hva den gjør. Hvorfor kommer vilkår <code> if tilfeldig <=0.6</code> først? Kunne vi også har tatt sjansen for $0$ bonus først?

In [None]:
import random as rd #trenger random biblioteket siden B er tilfeldig

def Bonus (): #Definer en funksjon Bonus i Python. 
        #------------ Funksjonsdokumentatsjon ----------------------
        # Funksjon Bonus simulerer en tilfeldig variabel og beregner
        #bonus i en måned
        # Inndata:  Ingenting
        # Utdata:   Et tall
        #------------ Slutt av Funksjonsdokumentatsjon -------------
        tilfeldig=rd.random()
        if tilfeldig <=0.6:
            return 1000
        elif (tilfeldig > 0.6) and (tilfeldig <=0.9):
            return 500
        else:
            return 0    

In [None]:
#Her kan dere teste hva bonus gjør
Bonus()

Ved hjelp av <code>Bonus</code> kan vi generere noen tilfeldige verdier av bonusbetalingen. Disse bruker vi for å utregne den 

**løpende gjennomsnitt** over noen måneder, dvs. vi beregner for hver måned gjennomsnitt av alle bonusbetalinger vi har fått så lenge. I formler har vi for den løpende gjennomsnitt etter $k$-måneder 
$$\text{lgjennom} = \frac{1}{k}\sum_{n=1}^k \text{bonus i måned } n$$   
La oss programmere det i Python nå. Se op koden og prøv å svare på spørsmålene som står i kommentarene:

In [None]:
ant_mdr = 50                  #Skal simulere for 50 måneder
lgjennom = [Bonus()]          #Vi lager en liste lgjennom for den
                              #løpende gjennomsnitt og setter den 
                              #første verdi til Bonus(). Hvorfor?
for n in range(1,ant_mdr):    #Her trenger vi å begynne med 1. Hvorfor?
    #Forklar hvorfor den følgende formel beregner den riktige løpende
    #gjennomsnitt
    #Tip: Lag noen eksempler av formelen på papir og se på linje 10!
    ny_gjennomsnitt = (Bonus()+lgjennom[n-1]*(n-1))/n
    lgjennom.append(ny_gjennomsnitt)    #Legg til ny gjennomsnitt 
    
# print(lgjennom) #Ta vekk kommentarsymbol om du vil se på resultatet 

Vitsen med løpende gjennomsnitt er at vi kan sammenlikne det nå med den forventningsverdi vi har lagd. Den neste kodeblokk skriver ut resultatet i en graf.

In [None]:
# Importer nødvendige moduler for plotting
%matplotlib inline 
from numpy import *               
from matplotlib.pyplot import *   
newparams = {'axes.grid': True,
             'lines.markersize': 8, 'lines.linewidth': 2,
             'font.size': 16}
rcParams.update(newparams)
x = range(1,ant_mdr+1)      # Lager 'x-aksen' 
forvented = [750]*(ant_mdr) #Lager en liste med riktig antall
                            #av forventningsverdi (gjenta 750)
plot(x, forvented, 'r--')         # Plott forvented, rød stiplet kurve
plot(x, lgjennom, 'b-')           # Plott løpende gjennomsnitt,
                                  # blå heltrukken kurve 
xlabel('måneder')
ylabel('bonus')
title('Plott av løpende gjennomsnitt vs forventningsverdi')
legend(['forventningsverdi', 'løpende gjennomsnitt']);

Vi kan også kjøre simulasjonen mye lengre og se på det som skjer med løpende gjennomsnitt og forventningsverdi. For eksempel, la oss antar at du jobber for $10$år.

In [None]:
ant_mdr=120    #simuler nå 10 år, dvs. 120 måneder
#Først lag liste medforventningsverdi og løpende gjennomsnitt
forvented= [750]*(ant_mdr)
lgjennom = [Bonus()]          
for n in range(1,ant_mdr):    
    ny_gjennomsnitt = (Bonus()+lgjennom[n-1]*(n-1))/n
    lgjennom.append(ny_gjennomsnitt)
x = range(1,ant_mdr+1)
plot(x, forvented, 'r--')         # Plott forvented, rød stiplet kurve
plot(x, lgjennom, 'b-')
xlabel('måneder')
ylabel('bonus')
title('Plott av løpende gjennomsnitt vs forventningsverdi, 120 måneder')
legend(['forventningsverdi', 'løpende gjennomsnitt']);

Med økende antall måneder, legg merke til hvordan det løpende gjennomsnittet avviker mindre og mindre fra forventningsverdi!

**Oppgave** Vi lager en tilfeldig variabel $T$ som gir oss verdiene til en terningskast, dvs. $T$ tar verdiene $1,2,3,4,5,6$ hver med sannsynlighet $\frac{1}{6}$. 
1. Beregn forventningsverdi til $T$.
2. Hvis vi tolker forventningsverdien du har beregnet til $T$ som den gjennomsnittlige verdien vi får om vi kaster en terning mange ganger, hva overraskende hvis du sammenlikner forventningsverdi med antall av øyene du kan får ved en terningskast?

In [None]:
#Plass for dine svar (har brukt en Python celle her fordi
#det kunne være hensiktsmessig å beregne forventningsverdi ved hjelp
#av Python som kalkulator)

### Eksempel: Myntkast

Vi knipser mynt og hvis jeg får kron gi du meg $2$kr og hvis jeg får mynt får du $1$kr. La oss lage en tilfeldig variabel $G$ som gjenspeiler gevinst til deg. For å modellere situasjonen som en tilfeldig variabel må vi tenke om hvilke verdier variablen kan ta:

- Siden du får $1$kr når jeg får mynt, må vi ha $G(\text{viser mynt}) = 1$
- Siden jeg får $2$kr når jeg får kron, må vi ha $G(\text{viser kron}) = -2$

La oss antar nå at det er en fair mynt. 

**Spørsmål**: 
1. Hva er forventningsverdi til $G$? 
2. Hvor mange kroner forventer du å vinne (eller tape) hvis du spiller spillet $1000$ ganger?
3. Ville du si at spillet er fair og skulle du delta i sjansespillet?

In [None]:
#Plass for ditt svar, du kan gjerne bruke Python for utregninger

Man skulle se i utregninger at det spiller ingen roll at en av de verdier til den tilfeldige variablen $G$ er negativ den gangen (før har vi bare sett på situasjoner hvor alle verdier var positiv eller lik $0$).

#### Simulasjon myntspillet

La oss simulere nå myntspillet som du har beregnet over for å finne ut hvor mye penger vi tjener (eller taper) hvis vi spiller $1000$ ganger. Selvfølgelig er utviklingen forskjellig hver gang (avhengig av tilfeldighet). Det empiriske løpende gjennomsnittet svinger rundt forventningsverdi, noe som får de totale gevinstene til å svinge opp og ned. Men disse svingningene er lokale, og på lang sikt avviker observasjonene mindre og mindre fra forventningene.

In [None]:
def G ():
    if random.random() <=0.5:
        return(-2)
    else:
        return(1)
gevinst = [G()]    
for i in range(1,1000):
    gevinst.append(G()+gevinst[i-1])
x=range(1000)
plot(x, gevinst, 'b-')
xlabel('antall spill')
ylabel('kumulert gevinst')
title('Oppsummert gevinst (eller tap) av penger over 1000 myntspill')

### Forventningsverdi til en binomisk fordelt variabel

Vi skal se på et tilfeldig forsøk som har to utfall (f.eks. myntkast hvor vi tolker en utfall som suksess og den andre som tap). Som vi har lært kan vi beskrive den situasjonen med binomisk fordeling. 

Hvis sannsynlighet for å får suksess er $p$ er sannsynligheten for den motsatte hendelse $1-p$. Vi er interessert i forventningsverdi til en tilfeldig variabel $X$ som modellerer et binomisk forsøk med $n$ steg. Husk at sannsynlighet for å få akkurat $k$suksess ved $n$ forsøk er gitt som 
$$P(X=k) = \binom{n}{k}p^k(1-p)^{n-k}.$$
Dermed sier formelen for forventningsverdi at vi må beregne 
$$\mathbb{E}(X) = \sum_{k=0}^n k P(X=k) = \sum_{k=0}^nk\binom{n}{k}p^k(1-p)^{n-k} = np$$
Det er nå helt uklart hvordan man kommer til den enkle formen av forventningsverdi som står på høyre (regning med summen og binomialkoeffisienter er vanskelig!). Det fins en enklere måte å finne forventningsverdi til $X$:

#### Oppgave 
(a) Antar at $F$ er en tilfeldig variabel som tar to verdier $F(\text{suksess}) = 1$ og $F(\text{tap}) = 0$. Beregn forventningsverdi til $F$ (hvis suksess har sjansen $p$). 

**Plass for ditt svar, dobbeltklikk her for å skrive noe**

Vi er egentlig interessert i forventningsverdi til variablen $X$ som beskriver et binomisk forsøk med $n$-steg (variablen $F$ fra (a) gir oss bare pågrep på forventningsverdi til et binomisk forsøk med $n=1$-steg).

For å komme oss frem med saken, la oss introdusere de tilfeldige variabler
$$F_i= \begin{cases}
  1 \text{ hvis vi får en suksess i steg } i\\
  0 \text{ hvis steg } i \text{ er ikke en suksess}
  \end{cases} \text{for } i =1,2,\ldots, n
$$
(b) Antar at vi bare ser på de tilfeldige variabler $F_1$ og $F_2$. Vi kan addere $V = F_1 + F_2$ og får en tilfeldig variabel. Beskriv i ord hva betydning av den nye variablen $V$ er. Deretter beregn forventningsverdi til $V$.

**Plass for ditt svar, dobbeltklikk her for å skrive noe**

(c) Er det mulig å utrykke den tilfeldige variabel 
$$X= \text{Antall av suksess i forsøket med }n\text{-steg}$$ ved hjelp av de tilfeldige variabeler $F_i, i=1,\ldots, n$?

**Plass for ditt svar, dobbeltklikk her for å skrive noe**

(d) Se på følgende utregning av forventningsverdi til $X$ og diskuter med hverandre hvorfor det gir mening og hva betydning til de steg er:  
Tips: Vi bruker summetegn i formelen, hvis du er ikke vet hvordan man bruker den prøv å sette inn $\sum_{i=1}^n F_i = F_1 + F_2 + \cdots + F_n$.

Steg 1. $$\mathbb{E}(X) = \mathbb{E}\left(\sum_{i=1}^n F_i \right)$$  
Steg 2. Siden $X$ er sammensatt av de tilfeldige variabler $F_i$ beskriver summen av forventningsverdier til de $F_i$ forventningsverdi til $X$, dvs. 
$$\mathbb{E}(X) = \mathbb{E}\left(\sum_{i=1}^n F_i \right) = \sum_{i=1}^n \mathbb{E}(F_i)$$
Steg 3. Med (a) får vi $\mathbb{E}(X)= \sum_{i=1}^n p = np$.

**Plass for ditt svar, dobbeltklikk her for å skrive noe**

## Egenskaper til forventningsverdi

I den utregning til den forventningsverdi av den binomisk fordelt tilfeldig variabel $X$ har vi lært at vi kan trekke ut summer fra forventningsverdien. Dette egenskap kaller man linearitet av forventningsverdien. Generell gjelder:  

**Linearitet av forventningsverdi** Hvis $X$ og $Y$ er tilfeldige variabler så er $\mathbb{E}(X+Y) = \mathbb{E}(X) + \mathbb{E}(Y)$ i tillegg hvis $r$ er et reelt tall, så gjelder $\mathbb{E}(rX) = r\mathbb{E}(X)$.  

**Formell bevis at summene kan trekkes ut av forventningsverdi**
$$\begin{align*}
\mathbb{E}(X+Y) &= \sum_a \sum_b (a+b)P(X=a,Y=b) \\
&=\sum_a \sum_b aP(X=a,Y=b) + \sum_a \sum_b bP(X=a,Y=b) \\
&= \sum_a a\sum_b \underbrace{P(X=a,Y=b)}_{= P(X=a)} + \sum_b b\sum_a \underbrace{P(X=a,Y=b)}_{= P(Y=b)}\\
&= \sum_a a P(X=a) + \sum_b b P(Y=b) \\
&= \mathbb{E}(X) + \mathbb{E}(Y)
\end{align*}
$$
**Spørsmål:** Prøv å forstå beviset. Kan du lage noen liknende for å vise at forventningsverdi til $rX$ er lik $r\mathbb{E}(X)$?

#### Oppgave (Kast av to terninger)

Vi kaster to terninger og ser på summen av de to terninger.
(a) Lag noen tilfeldige variabler som kan brukes for å modellere situasjonen. 
(b) Hvordan kan vi beregne forventningsverdi til den tilfeldig forsøk?

**Plass for ditt svar, dobbeltklikk her for å skrive noe**

(c) Se på den måten vi lagde den tilfeldig variabel <code>Bonus()</code> i Python. Kopier fremgansmåten pg lag en tilfeldig variabel <code>terning</code> i Python som simulerer en terningskast og skriver ut resultatet av terningskast som verdi av den tilfeldige variablen. Hva er utfordringen hvis vi skal lage det inn i Python?

In [None]:
#Plass for dine svar. Husk at vi har importert random biblioteket
#som rd og dermed kalles funksjoner  fra dette som rd.randint (f.eks.)

(d) Forklar hvordan vi kan bruke den tilfeldig variabel <code>terning</code> fra (c) for å simulere terningskast av to (tre, fire,...) terninger og lage en forventningsverdi til summen av disse terninger (det er ikke nødvendig å lage en Python program for det men hvis dere klarer det er det kjempebra!)

**Plass for ditt svar, dobbeltklikk her for å skrive noe**

## Sammendrag

Forventningsverdi av en tilfeldig variabel er det langsiktige gjennomsnittet av dens mulige verdier når verdier har blitt realisert et stort antall ganger. Hvis vi ville beregne den er det enkelt å gjøre som den summen av produktene av verdiene og deres sannsynligheter.

Forventningsverdier er knyttet tett til den [store talls lov](https://snl.no/store_talls_lov) og vi kan forstår det som en bro mellom teoretiske forventninger og empiriske observasjoner. 