# Forventning, Varians Og Standardavvik med Simuleringer

Vi har sett på hvordan vi kan [simulere sannsynligheten for et utfall](simulere_sannsynligheter.ipynb). Med bittelitt mer bakgrunnsteori, er vi i stand til å simulere forventning, varians og standardavvik for en tilfeldig variabel også.

## Forventning

En intuitiv tolkning av forventning er at det *er verdien gjennomsnittet av en tilfeldig variabel vil konvergere mot etterhvert som vi gjentar eksperimentet mange ganger*. Med andre ord, hvis vi har en stokastisk variabel $X$, og vi gjøre et forsøk $n$ ganger og får utfall $x_1, x_2, \ldots, x_n$, så vil gjennomsnittet av disse utfallene konvergere mot forventningen til $X$ når $n$ blir stor nok.

Basert på dette argumentet, er det rimelig å bruke følgende formel for å beregne forventningen til en tilfeldig variabel $X$:

$$
E(X) \approx \frac{1}{n}\sum_{i=1}^n x_i
$$ (eq:forventning_x)

der $x_i$ er utfallene vi får når vi gjentar eksperimentet $n$ ganger.

## Varians og Standardavvik

Variansen til en tilfeldig variabel $X$ kan uttrykkes som

$$
\text{Var} (X) = E(X^2) - E(X)^2.
$$ (eq:varians_x)

Argumentet som ledet til likning {eq}`eq:forventning_x` var at gjennomsnittet av målinger av $X$ ville gå mot $E(X)$ når vi gjorde veldig mange målinger. Det samme vil være sant for målinger av $X^2$. Vi kan derfor tilnærmet $E(X^2)$ som

$$
E(X^2) \approx \frac{1}{n}\sum_{i=1}^n x_i^2. 
$$

Ved å regne ut tilnærminger til $E(X)$ og $E(X^2)$, kan vi så tilnærme verdien til variansen til $X$ ved å bruke {eq}`eq:varians_x`, 
og til standardavviket ved å bruke 

$$
\sigma = \sqrt{\text{Var} (X)}.
$$


```{admonition} Hvorfor er $\text{Var} (X) = E(X^2) - E(X)^2$?
:class: tip, dropdown

Det følger fra definisjonen av varians, men man må masere uttrykket litt:

\begin{align*}
\text{Var} (X)  & = E\left((X - E(X))^2\right) \\
                & = E\left(X^2 - 2X\cdot E(X) + E(X)^2\right) \\
                & = E(X^2)- 2E(X)E(X) + E(X)^2 \\
                & = E(X^2) - E(X)^2.
\end{align*}

der vi brukte at $E(X\cdot E(X)) = E(X)E(X) = E(X)^2$.

```

## En algoritme for å beregne forventning, varians og standardavvik

Når vi nå har formlene på plass, kan vi lage en algoritme for å beregne forventning, varians og standardavvik for en tilfeldig variabel $X$ fra en sannsynlighetsfordeling $f(X)$. {prf:ref}`algo-forventning-varians-std` viser stegvis hvordan vi kan kode dette.

```{prf:algorithm} Tilnærme forventning, varians og standardavvik til $X$ med simuleringer
:label: algo-forventning-varians-std

__Input__: Sannsynlighetsfordeling $f(X)$, antall forsøk $n$. 

__Output__: Tilnærming til forventning, varians og standardavvik for $X$.

- Sett $E(X) = 0$
- Sett $E(X^2) = 0$

- For $i = 1, 2, \ldots, n$:
    - Trekk et tilfeldig tall $x_i$ fra sannsynlighetsfordelingen $f(X)$
    - Sett $E(X) = E(X) + x_i$
    - Sett $E(X^2) = E(X^2) + x_i^2$

- Sett $E(X) = E(X)/n$ *(tilnærming til forventning)*
- Sett $E(X^2) = E(X^2)/n$ *(tilnærming til forventning av $X^2$)*

- Sett $\text{Var} (X) = E(X^2) - E(X)^2$ *(tilnærming til varians)*
- Sett $\sigma = \sqrt{\text{Var} (X)}$ *(tilnærming til standardavvik)*


```

---

## Eksempler

### Eksempel 1: Kast med én terning

Lar vi $X$ være antall øyne ved et tilfeldig terningkast med én terning, så er 

$$
E(X) = 7/2 = 3.5
$$

og

$$
\text{Var} (X) = 35/12 \approx 2.92 \qquad \text{og} \qquad \sigma = \sqrt{35/12} \approx 1.71.
$$



Vi kan tilnærme disse verdiene gjennom simulering med {prf:ref}`algo-forventning-varians-std`.
Følger vi algoritmen stegvis med Pythonkode, kan vi få noe som dette:

In [34]:
import numpy as np

n_forsøk = 100_000
X_forventning = 0 # E(X)
X_kvadrat_forventning = 0 # E(X^2)

for _ in range(n_forsøk):
    x = np.random.randint(1, 7) # Et terningkast x
    X_forventning += x # E(X) = E(X) + x
    X_kvadrat_forventning += x**2 # E(X^2) = E(X^2) + x^2

X_forventning /= n_forsøk # E(X) --> E(X) / n
X_kvadrat_forventning /= n_forsøk # E(X^2) --> E(X^2) / n

X_varians = X_kvadrat_forventning - X_forventning**2 # Var(X)
X_std = np.sqrt(X_varians) # Standardavvik SD(X) = sqrt(Var(X))

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")

X_forventning = 3.503
X_varians = 2.909
X_std = 1.706


### Eksempel 2: Kast med to terninger

La $X$ være antall øyne vi får ved to terninger. Da er 

$$
E(X) = 7,
$$

og 

$$
\text{Var} (X) = 35/6 \approx 5.83 \qquad \text{og} \qquad \sigma = \sqrt{35/6} \approx 2.42.
$$

La $X_1$ være antall øyne på terning 1 og $X_2$ være antall øyne på terning 2. Da er $X = X_1 + X_2$. I stedet for å trekke tall fra sannsynlighetsfordelingen til $X$ direkte, trekker vi heller $X_1$ og $X_2$ fra sannsynlighetsfordeling for én terning og legger resultatene sammen. 

Vi kan tilnærme disse verdiene gjennom simulering med {prf:ref}`algo-forventning-varians-std`. Følger vi algoritmen stegvis med Pythonkode, kan vi få noe som dette:

In [35]:
import numpy as np

n_forsøk = 100_000
X_forventning = 0 # E(X)
X_kvadrat_forventning = 0 # E(X^2)

for _ in range(n_forsøk):
    x1 = np.random.randint(1, 7) # Terning 1
    x2 = np.random.randint(1, 7) # Terning 2
    x = x1 + x2 # Summen av terningkastene
    X_forventning += x # E(X) = E(X) + x
    X_kvadrat_forventning += x**2 # E(X^2) = E(X^2) + x^2

X_forventning /= n_forsøk # E(X) --> E(X) / n
X_kvadrat_forventning /= n_forsøk # E(X^2) --> E(X^2) / n

X_varians = X_kvadrat_forventning - X_forventning**2 # Var(X)
X_std = np.sqrt(X_varians) # Standardavvik SD(X) = sqrt(Var(X))

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")

X_forventning = 7.000
X_varians = 5.859
X_std = 2.420


### Eksempel 3: To normalfordelinger med ulik forventning og standardavvik

Tenk deg at på en skole er det 100 elever som har tatt en prøve. Av elevene er 80 av dem jenter og 20 av dem gutter.

På prøven hadde guttene en gjennomsnittlig poengsum på 60 % med et standardavvik på 10 %, mens jentene hadde en gjennomsnittlig poengsum på 70 % med et standardavvik på 15 %. 

Anta at vi kan modellere poengsummen til en tilfeldig gutt med en normalfordeling med forventning 60 og standardavvik 10, og poengsummen til en tilfeldig jente med en normalfordeling med forventning 70 og standardavvik 15.

La $X_\text{gutt}$ være poengsummen til en tilfeldig gutt og $X_\text{jente}$ være poengsummen til en tilfeldig jente. La $X$ være poengsummen til en tilfeldig elev. 

Problemet er todelt:
1. Vi har en binomisk fordeling for hvorvidt vi trekker ut en jente eller en gutt.
    - $p_\text{jente} = 0.8$ for jente
    - $p_\text{gutt} = 0.2$ for gutt
    - Vi har nå en binomisk fordeling med $n = 1$, der vi kan velge om $p = p_\text{jente}$ eller $p = p_\text{gutt}$ når vi trekker en elev.
2. Vi må trekke ut poengsummen $X$ avhengig av om det ble jente eller gutt.
    - Hvis vi trekker en jente, så trekker vi fra normalfordelingen til $X_\text{jente}$.
    - Hvis vi trekker en gutt, så trekker vi fra normalfordelingen til $X_\text{gutt}$.

Vi kan tilnærme disse verdiene gjennom simulering med {prf:ref}`algo-forventning-varians-std`:
    

In [36]:
import numpy as np

n_forsøk = 100_000
p_gutt = 0.2 
X_forventning = 0 # E(X)
X_kvadrat_forventning = 0 # E(X^2)

gutt_forventning = 60
gutt_standardavvik = 10
jente_forventning = 70
jente_standardavvik = 15

for _ in range(n_forsøk):
    elev = np.random.binomial(n=1, p=p_gutt) # 1 = gutt, 0 = jente
    if elev == 1: # Hvis det er gutt
        x = np.random.normal(
            loc=gutt_forventning, 
            scale=gutt_standardavvik,
        )
    else: # Hvis det er jente
        x = np.random.normal(
            loc=jente_forventning,
            scale=jente_standardavvik,
        )
    X_forventning += x # E(X) = E(X) + x
    X_kvadrat_forventning += x**2 # E(X^2) = E(X^2) + x^2

X_forventning /= n_forsøk # E(X) --> E(X) / n
X_kvadrat_forventning /= n_forsøk # E(X^2) --> E(X^2) / n

X_varians = X_kvadrat_forventning - X_forventning**2 # Var(X)
X_std = np.sqrt(X_varians) # Standardavvik SD(X) = sqrt(Var(X))

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")

X_forventning = 67.979
X_varians = 215.361
X_std = 14.675


---

## Øvingsoppgaver

### Oppgave 1: Kast med tre terninger

La $X$ være summene av øynene vi får ved å kaste tre terninger. Bruk {prf:ref}`algo-forventning-varians-std` til å tilnærme forventningen, variansen og standardavviket til $X$.

*Du kan ta utgangspunkt i kodeskallet under. Du må fylle inn der det står `NotImplemented`*.

In [None]:
import numpy as np

n_forsøk = 100_000
X_forventning = 0
X_kvadrat_forventning = 0

for _ in range(n_forsøk):
    x1 = NotImplemented
    x2 = NotImplemented
    x3 = NotImplemented

    x = NotImplemented

    X_forventning = NotImplemented
    X_kvadrat_forventning = NotImplemented

X_forventning = NotImplemented
X_kvadrat_forventning = NotImplemented

X_varians = NotImplemented
X_std = NotImplemented

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")

````{dropdown} Løsningsforslag

Her er et forslag til løsning:

```python
import numpy as np

n_forsøk = 100_000
X_forventning = 0
X_kvadrat_forventning = 0

for _ in range(n_forsøk):
    x1 = np.random.randint(1, 7) # Terning 1
    x2 = np.random.randint(1, 7) # Terning 2
    x3 = np.random.randint(1, 7) # Terning 3

    x = x1 + x2 + x3 # Summen av øynene

    X_forventning += x # E(X) = E(X) + x
    X_kvadrat_forventning += x**2 # E(X^2) = E(X^2) + x^2

X_forventning /= n_forsøk # E(X) = E(X) / n
X_kvadrat_forventning /= n_forsøk # E(X^2) = E(X^2) / n

X_varians = X_kvadrat_forventning - X_forventning**2 # Var(X) = E(X^2) - E(X)^2
X_std = X_varians**0.5 # Standardavvik SD(X) = sqrt(Var(X))

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")
```

som gir utskriften

```console
X_forventning = 10.492
X_varians = 8.756
X_std = 2.959
```

````

### Oppgave 2: Høyde i populasjonen

La $X$ være høyden til en tilfeldig person i en populasjon. Høydene til jenter i populasjonen er normalfordelt med forventningsverdi $\mu = 168 \ \text{cm}$ og standardavvik $\sigma = 5 \ \text{cm}$, mens høydene til guttene er normalfordelt med forventningsverdi $\mu = 180 \ \text{cm}$ og standardavvik $\sigma = 6 \ \text{cm}$. Anta at det er like mange jenter som gutter i populasjonen. 

Bruk {prf:ref}`algo-forventning-varians-std` til å finne forventningen, variansen og standardavviket til høydene i populasjonen.

*Du kan ta utgangspunkt i kodeskallet under. Du må fylle inn der det står `NotImplemented`. Det kan være du må legge til noen linjer med kode for å løse oppgaven*.

In [None]:
import numpy as np

n_forsøk = NotImplemented
X_forventning = NotImplemented
X_kvadrat_forventning = NotImplemented

for _ in range(n_forsøk):
    # Sjekk om en tilfeldig person er gutt eller jente
    elev = NotImplemented
    if elev == NotImplemented:
        # Hvis det er gutt
        x = NotImplemented
    else:
        # Hvis det er jente
        x = NotImplemented
    
    X_forventning = NotImplemented
    X_kvadrat_forventning = NotImplemented

X_forventning = NotImplemented
X_kvadrat_forventning = NotImplemented

X_varians = NotImplemented
X_std = NotImplemented

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")

````{dropdown} Løsningsforslag

```python
import numpy as np

n_forsøk = 1_000_000 # Trekker 1 million høyder
X_forventning = 0
X_kvadrat_forventning = 0

for _ in range(n_forsøk):
    # Sjekk om en tilfeldig person er gutt eller jente
    elev = np.random.binomial(n=1, p=0.5) # 0 = gutt, 1 = jente
    if elev == 0:
        # Hvis det er gutt, mu = 180, sigma = 6
        x = np.random.normal(loc=180, scale=6)
    else:
        # Hvis det er jente, mu = 168, sigma = 5
        x = np.random.normal(loc=168, scale=5)
    
    X_forventning += x  # E(X) = E(X) + x
    X_kvadrat_forventning += x**2 # E(X^2) = E(X^2) + x^2

X_forventning /= n_forsøk # E(X) --> E(X) / n
X_kvadrat_forventning /= n_forsøk # E(X^2) --> E(X^2) / n

X_varians = X_kvadrat_forventning - X_forventning**2 # Var(X)
X_std = np.sqrt(X_varians)

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")
```

som gir utskriften

```console
X_forventning = 173.999
X_varians = 66.694
X_std = 8.167
```
med andre ord er $E(X) \approx 174 \ \text{cm}$, og $\text{Var}(X) \approx 66.7 \ \text{cm}^2$, og $\text{SD}(X) \approx 8.2 \ \text{cm}$.




````

### Oppgave 3: Terningspill

Et terningspill har følgende regler:

- Du må betale en innsats på 10 kr for å spille.
- Du skal kaste én terning per runde.
    * Hvis du får 1, 2 eller 3, så får du ingenting tilbake.
    * Hvis du får 4 eller 5, får du tilbake innsatsen din.
    * Hvis du får 6 får du tilbake dobbelt så mye som innsatsen din.


Skriv en Pythonkode der du regner ut en tilnærming til forventet gevinst samt variansen og standardavviket til gevinsten.

*Du kan ta utgangspunkt i kodeskallet under. Du må minst fylle inn der det står `NotImplemented`*.

In [None]:
import numpy as np

n_forsøk = NotImplemented
forventet_gevinst = NotImplemented
forventet_kvadrert_gevinst = NotImplemented
innsats = NotImplemented

for _ in range(n_forsøk):
    terningkast = NotImplemented
    if terningkast == 6:
        gevinst = NotImplemented
    elif terningkast == 4 or terningkast == 5:
        gevinst = NotImplemented
    else:
        gevinst = NotImplemented

    forventet_gevinst = NotImplemented
    forventet_kvadrert_gevinst = NotImplemented

forventet_gevinst = NotImplemented
forventet_kvadrert_gevinst = NotImplemented

varians = NotImplemented
standardavvik = NotImplemented

print(f"{forventet_gevinst = :.3f}")
print(f"{varians = :.3f}")
print(f"{standardavvik = :.3f}")

`````{dropdown} Løsningsforslag

````{tab} Ren Python

```python
import numpy as np

n_forsøk = 1_000_000
forventet_gevinst = 0
forventet_kvadrert_gevinst = 0
innsats = 10

for _ in range(n_forsøk):
    terningkast = np.random.randint(1, 7)
    if terningkast == 6:
        gevinst = 2 * innsats
    elif terningkast == 4 or terningkast == 5:
        gevinst = innsats
    else:
        gevinst = -innsats

    forventet_gevinst += gevinst
    forventet_kvadrert_gevinst += gevinst**2

forventet_gevinst /= n_forsøk
forventet_kvadrert_gevinst /= n_forsøk

varians = forventet_kvadrert_gevinst - forventet_gevinst**2
standardavvik = np.sqrt(varians)

print(f"{forventet_gevinst = :.3f}")
print(f"{varians = :.3f}")
print(f"{standardavvik = :.3f}")
```

````

````{tab} Vektorisert med Numpy

```python
import numpy as np

@np.vectorize
def get_gevinst(terningkast, innsats=10):
    if terningkast == 6:
        return 2 * innsats
    elif terningkast == 4 or terningkast == 5:
        return innsats
    else:
        return -innsats
    
n_forsøk = 1_000_000
terningkast = np.random.randint(1, 7, size=n_forsøk)

gevinst = get_gevinst(terningkast)
forventet_gevinst = np.mean(gevinst)
varians = np.var(gevinst)
standardavvik = np.sqrt(varians)

print(f"{forventet_gevinst = :.3f}")
print(f"{varians = :.3f}")
print(f"{standardavvik = :.3f}")
```

````

som gir utskriften

```console
forventet_gevinst = 1.663
varians = 147.147
standardavvik = 12.130
```

`````

### Oppgave 4: Europeisk Rulett

Europeisk rulett er et spill der en kule droppes ut på et roterende hjul og lander på én av 37 mulige posisjoner. Hjulet er delt inn i 37 like store sektorer, nummerert fra 0 til 36. Sektor 0 er grønn, og de andre sektorene er enten røde eller svarte. Hvis du satser på en farge og kula lander på en sektor med den fargen, så får du tilbake dobbelt så mye som du satset. Hvis du satser på et tall og kula lander på den sektoren, så får du tilbake 36 ganger så mye som du satset. Hvis du satser på noe annet, så taper du innsatsen din. {numref}`European_roulette` viser et eksempel på et europeisk ruletthjul.

```{figure} ./figurer/European_roulette.svg
---
name: European_roulette
---

Europeisk rulett med nummererte sektorer. Hentet fra [Wikimedia Commons](https://no.wikipedia.org/wiki/Rulett#/media/Fil:European_roulette.svg).
```

Anta at du spiller europeisk rulett med en innsats på 10 kr. Anta du kun satser på røde sektorer. Skriv en Pythonkode der du regner ut en tilnærming til forventet nettogevinst samt variansen og standardavviket til nettogevinsten.

*Du kan ta utgangspunkt i kodeskallet under. Du må fylle inn der det står `NotImplemented`.*

```{dropdown} Kodehint

For å sjekke om du lander på en rød sektor kan du bruke følgende kode, kan du sjekke om tallet du trekker er et partall eller oddetall. Et tall er et oddetall dersom resten av heltallsdivisjonen med 2 er 1. Du kan sjekke om et tall er et oddetall med `tall % 2 == 1`.



```

In [None]:
import numpy as np

n_forsøk = NotImplemented
forventet_netto_gevinst = NotImplemented
innsats = 10 # kroner

for _ in range(n_forsøk):
    sektor = np.random.randint(0, 38) # tall mellom 0 og 37

    if NotImplemented: # Hvis sektoren er 0´
        netto_gevinst = NotImplemented
    elif NotImplemented: # Hvis det er en rød sektor
        netto_gevinst = NotImplemented
    else: # Hvis det er en svart sektor
        netto_gevinst = NotImplemented

    forventet_netto_gevinst = NotImplemented

forventet_netto_gevinst = NotImplemented # E(X) --> E(X) / n

print(f"{forventet_netto_gevinst = :.5f}")

````{dropdown} Løsningsforslag

```python
import numpy as np

n_forsøk = 10_000_000
forventet_netto_gevinst = 0
innsats = 10

for _ in range(n_forsøk):
    sektor = np.random.randint(0, 38) # tall mellom 0 og 37

    if sektor == 0:
        netto_gevinst = -innsats
    elif sektor % 2 == 1:
        netto_gevinst = innsats
    else:
        netto_gevinst = -innsats

    forventet_netto_gevinst += netto_gevinst

forventet_netto_gevinst /= n_forsøk

print(f"{forventet_netto_gevinst = :.5f}")
```

````

### Oppgave 5: Levetid til lyspærer

La $X$ være levetiden til en tilfeldig valgt lyspære. Anta at levetiden følger eksponentialfordelingen

$$
f(x) = \frac{1}{\beta} e^{-x / \beta}, \quad x \geq 0,
$$

der $E(X) = \beta$ er den forventede levetiden til én lyspære. 

Situasjonen er som følger:

- 100 lyspærer er koblet i serie. 
- Hvis én lyspære feiler, så slutter alle å lyse. Vi anser dette som levetiden til hele systemet.
- Den forventede levetiden til én lyspære er $\beta = 40 000 \ \text{timer}$.

Regn ut forvetningen, variansen og standardavviket til levetiden til hele systemet. 

*Du kan ta utgangspunkt i kodeskallet under. Du må fylle inn der det står `NotImplemented`, og det kan hende du må legge til noen linjer med kode for å løse oppgaven*.

````{dropdown} Kodehint
Du kan trekke ett tilfeldig tall fra en eksponentialfordeling med forventning $\beta$ ved å bruke funksjonen 

```python
x = np.random.exponential(scale=beta)
```

Deretter kan du hente ut den laveste levetiden med 

```python
x = np.min(x)
```
````

In [None]:
import numpy as np

n_forsøk = NotImplemented
X_forventning = NotImplemented
X_kvadrat_forventning = NotImplemented

n_lyspærer = NotImplemented # antall lyspærer i systemet
n_feilet = 0 # teller opp antall ganger systemet feiler.

for _ in range(n_forsøk):
    minst_levetid = NotImplemented # finn den lyspæren med minst levetid
    
    X_forventning = NotImplemented
    X_kvadrat_forventning = NotImplemented

X_forventning = NotImplemented
X_kvadrat_forventning = NotImplemented

X_varians = NotImplemented
X_std = NotImplemented

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")

`````{dropdown} Løsningsforslag
````{tab} Alternativ 1: Enkel for-løkke 

```python
import numpy as np

n_forsøk = 1_000_000
X_forventning = 0
X_kvadrat_forventning = 0

n_lyspærer = 100
n_feilet = 0 # teller opp antall ganger systemet feiler.

for _ in range(n_forsøk):
    minst_levetid = np.min(np.random.exponential(scale=40_000, size=n_lyspærer))
    
    X_forventning += minst_levetid
    X_kvadrat_forventning += minst_levetid**2

X_forventning /= n_forsøk
X_kvadrat_forventning /= n_forsøk

X_varians = X_kvadrat_forventning - X_forventning**2
X_std = np.sqrt(X_varians)

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")
```

som gir utskriften

```console
X_forventning = 399.681
X_varians = 159920.476
X_std = 399.901
```
````

````{tab} Alternativ 2: Dobbel for-løkke

```python
import numpy as np

n_forsøk = 1_000_000
X_forventning = 0
X_kvadrat_forventning = 0

n_lyspærer = 100
n_feilet = 0 # teller opp antall ganger systemet feiler.

for _ in range(n_forsøk):
    minst_levetid = 1e9 # Sette en høy verdi for å være sikker på at den blir oppdatert
    for __ in range(n_lyspærer):
        levetid = np.random.exponential(scale=40_000)
        minst_levetid = min(minst_levetid, levetid)
    
    X_forventning += minst_levetid
    X_kvadrat_forventning += minst_levetid**2

X_forventning /= n_forsøk
X_kvadrat_forventning /= n_forsøk

X_varians = X_kvadrat_forventning - X_forventning**2
X_std = np.sqrt(X_varians)

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")
```
````

````{tab} Alternativ 3: Ren Numpy

```python
import numpy as np

n_forsøk = 1_000_000
n_lyspærer = 100

levetider = np.random.exponential(scale=40_000, size=(n_forsøk, n_lyspærer))
minst_levetid = np.min(levetider, axis=1)
X_forventning = np.mean(minst_levetid)
X_varians = np.var(minst_levetid)
X_std = np.std(minst_levetid)

print(f"{X_forventning = :.3f}")
print(f"{X_varians = :.3f}")
print(f"{X_std = :.3f}")
```

````

Vi kan altså konkludere at den forventede levetiden til systemet synker betraktelig når det er mange pærer koblet i serie. 

`````

### Oppgave 6: Karakter til elever ved tre skoler (modifisert oppgave fra Eksamen vår 2023 i S2)

Forskere ønsker å undersøke matematikkunnskapene til elever i videregående skole. Elever fra tre store skoler skal være med i undersøkelsen.
Karakterstatistikk fra de tre skolene viser at karakterene i matematikk er tilnærmet normalfordelt. Tabellen nedenfor viser forventningsverdi og standardavvik for hver av de tre skolene.


| Skole | Forventningsverdi | Standardavvik |
| --- | --- | --- |
| A | 3.8 | 1.2 |
| B | 3.4 | 1.4 |
| C | 4.1 | 1.1 |


Forskerne skal trekke ut 20 elever. For hver elev de skal trekke, trekker de først en tilfeldig skole og deretter en tilfeldig elev fra skolen.

#### Oppgave 6a

Lag et program som simulerer gjennomsnittskarakteren til 20 elever som er valgt ut på denne måten.

*Du kan ta utgangspunkt i kodeskallet under. Du må fylle inn der det står `NotImplemented`.*

In [18]:
import numpy as np

n_forsøk = 100_000
antall_elever = 20
skoler = ["A", "B", "C"]
X_forventet_gjennomsnitt = 0

for _ in range(n_forsøk):
    x_gjennomsnitt = 0
    for __ in range(antall_elever):
        skole = NotImplemented
        if skole == "A":
            x = NotImplemented
        elif skole == "B":
            x = NotImplemented
        else:
            x = NotImplemented

        x_gjennomsnitt = NotImplemented # Legge til karakteren

    x_gjennomsnitt = NotImplemented # Dele på antall elever
    
    # Legge til forventnings av gjennomsnittet
    X_forventet_gjennomsnitt = NotImplemented 

X_forventet_gjennomsnitt = NotImplemented # E(X) --> E(X) / n

print(f"{X_forventet_gjennomsnitt = :.3f}")


TypeError: unsupported format string passed to NotImplementedType.__format__

`````{dropdown} Løsningsforslag

Her kan vi la $X$ være gjennomsnittskarakteren til 20 tilfeldig utvalgte elever. 
Algoritmisk må vi

1. Trekke ut hvilken skole vi ønsker å trekke en elev fra.
2. Trekke eleven sin karakter tilfeldig fra normalfordelingen som hører til skolen.

Det er to alternativer her. 

1. Vi kjører en dobbel for-løkke der vi looper over antall forsøk i den ytre løkka, og antall elever i den indre. Så regner vi ut gjennomsnittet vi får ved å trekke 20 elever `n_forsøk` ganger.
2. Vi kjører en enkel løkke, trekker en skole tilfeldig og deretter en elev sin karakter. Så deler vi på `n_forsøk * antall_elever` til slutt.


````{tab} Alternativ 1
```python
import numpy as np

n_forsøk = 100_000
antall_elever = 20
skoler = ["A", "B", "C"]
X_forventet_gjennomsnitt = 0

for _ in range(n_forsøk):
    x_gjennomsnitt = 0
    for __ in range(antall_elever):
        skole = np.random.choice(skoler)
        if skole == "A":
            x = np.random.normal(loc=3.8, scale=1.2)
        elif skole == "B":
            x = np.random.normal(loc=3.4, scale=1.4)
        else:
            x = np.random.normal(loc=4.1, scale=1.1)

        x_gjennomsnitt += x

    x_gjennomsnitt /= antall_elever
    
    X_forventet_gjennomsnitt += x_gjennomsnitt

X_forventet_gjennomsnitt /= n_forsøk

print(f"{X_forventet_gjennomsnitt = :.3f}")
```
````

````{tab} Alternativ 2
```python
import numpy as np

n_forsøk = 100_000
antall_elever = 20
skoler = ["A", "B", "C"]
X_forventet_gjennomsnitt = 0

for _ in range(n_forsøk * antall_elever):
    skole = np.random.choice(skoler)
    if skole == "A":
        x = np.random.normal(loc=3.8, scale=1.2)
    elif skole == "B":
        x = np.random.normal(loc=3.4, scale=1.4)
    else:
        x = np.random.normal(loc=4.1, scale=1.1)

    
    X_forventet_gjennomsnitt += x

X_forventet_gjennomsnitt /= (n_forsøk * antall_elever)

print(f"{X_forventet_gjennomsnitt = :.3f}")
```
````

som gir utskriften 

```console
X_forventet_gjennomsnitt = 3.767
```

`````

#### Oppgave 6b



Bruk simuleringen til å estimere sannsynligheten for at karaktersnittet til de 20 elevene er høyere enn 4.

*Du kan ta utgangspunkt i kodeskallet under. Du må fylle inn der det står `NotImplemented`.*

In [None]:
import numpy as np

n_forsøk = 100_000
antall_elever = 20
skoler = ["A", "B", "C"]
n_suksess = 0

for _ in range(n_forsøk):
    x_gjennomsnitt = 0
    for __ in range(antall_elever):
        skole = NotImplemented
        if skole == "A":
            x = NotImplemented
        elif skole == "B":
            x = NotImplemented
        else:
            x = NotImplemented

        x_gjennomsnitt = NotImplemented

    # Regn ut gjennomsnittet av karakterene til 20 elever
    x_gjennomsnitt = NotImplemented

    # Legg til betingelse for om gjennomsnitt er større enn karakter 4
    if NotImplemented:
        n_suksess = NotImplemented

# Regn ut sannsynligheten for at gjennomsnittskarakter er større enn 4
sannsynlighet = NotImplemented


print(f"{sannsynlighet = :.4f}")

````{dropdown} Løsningsforslag

```python
import numpy as np

n_forsøk = 100_000
antall_elever = 20
skoler = ["A", "B", "C"]
n_suksess = 0

for _ in range(n_forsøk):
    x_gjennomsnitt = 0
    for __ in range(antall_elever):
        skole = np.random.choice(skoler)
        if skole == "A":
            x = np.random.normal(loc=3.8, scale=1.2)
        elif skole == "B":
            x = np.random.normal(loc=3.4, scale=1.4)
        else:
            x = np.random.normal(loc=4.1, scale=1.1)

        x_gjennomsnitt += x

    x_gjennomsnitt /= antall_elever

    # Legg til betingelse for om gjennomsnitt er større enn karakter 4
    if x_gjennomsnitt >= 4:
        n_suksess += 1

# Regn ut sannsynligheten for at gjennomsnittskarakter er større enn 4
sannsynlighet = n_suksess / n_forsøk


print(f"{sannsynlighet = :.4f}")
```

som gir utskriften

```console
sannsynlighet = 0.2051
```

Med andre ord er $P(X \geq 4) \approx 0.2$.

````