# Introduksjon til sannsynlighet

## Eksempelproblem

Et stort antall kort fra mange forskjellige kortstokker er spredt utover gaten. Hvor mange kort må man se på før alle 52 forskjellige kortene fra en kortstokk er sett?


## Læringsmål

- kjenne til grunnleggende begreper som utfall, hendelse, sannsynlighet, sannsynlighetsfordeling, eksperiment og betinget sannsynlighet
- kunne nevne noen sannsynlighetsfordelinger som binomisk, uniform
- koble grunnleggende begreper til kode som simulerer tilfeldige prosesser
- utforske data gjennom plotting og beregning av enkle sannsynligheter
- modellere enkle problemer, spesielt ved bruk av Bernoulli- og binomialfordelinger, og skrive kode som simulerer slike enkle problemer.

## Et raskt spørsmål før vi starter...

Lenke: https://www.menti.com/4ii97w7bfi

Kode for menti.com: 3269 1977

## Eksempel: myntkast

In [23]:
import random
import numpy as np
from util import plott_hendelse_sannsynligheter, mynt1, mynt2

In [24]:
def mynt():
    return random.sample(['kron', 'mynt'], 1)[0]

mynt()

'mynt'

## Eksempel: terningkast

In [None]:
# live-kodet

def terning():
    return random.sample([1, 2, 3, 4, 5, 6], 1)[0]

terning()


## Sannsynlighet

Sannsynligheten for å få kron når man kaster en mynt:
  
hvis vi kaster en mynt mange ganger, hvor ofte får vi kron
  


In [None]:
antall_kast = 100
kast = [mynt() for _ in range(antall_kast)]

print(f"Hvor ofte vi får kron: {round(kast.count('kron') / antall_kast * 100)}% av tiden")
print(f"Hvor ofte vi får mynt: {round(kast.count('mynt') / antall_kast * 100)}% av tiden")
print(f"Kast:\n{kast}\n")

### Sannsynlighet

In [10]:
kast = [mynt2() for _ in range(antall_kast)]

print(f"Hvor ofte vi får kron: {round(kast.count('kron') / antall_kast * 100)}% av tiden")
print(f"Hvor ofte vi får mynt: {round(kast.count('mynt') / antall_kast * 100)}% av tiden")
print(f"Kast:\n{kast}\n")

Hvor ofte vi får kron: 85% av tiden
Hvor ofte vi får mynt: 15% av tiden
Kast:
['kron', 'kron', 'kron', 'mynt', 'mynt', 'kron', 'kron', 'kron', 'mynt', 'kron', 'kron', 'mynt', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'mynt', 'kron', 'kron', 'kron', 'kron', 'mynt', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'mynt', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'mynt', 'kron', 'kron', 'mynt', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'mynt', 'kron', 'mynt', 'mynt', 'mynt', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'mynt', 'kron', 'kron', 'kron', 'kron', 'kron', 'mynt', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron', 'kron']



## Eksempel: vektet mynt

Hva skjedde med coin2?

In [None]:
import inspect
print(inspect.getsource(mynt2))

coin2 er slik at det er fire ganger så sannsynlig å få kron som det er å få mynt.

## Alternativ implementering av mynt-funksjonen

Tilbake til den originale mynten, den kunne ha blitt implementert på denne måten:

In [None]:
def mynt3():
    tilfeldig_verdi_mellom_0_og_1 = random.random()
    print(tilfeldig_verdi_mellom_0_og_1)
    return 'kron' if tilfeldig_verdi_mellom_0_og_1 < 0.5 else 'mynt'

mynt3()

### Øvelse: vektet mynt

Skriv en funksjon for å simulere en vektet mynt med eksplisitt angitt sannsynlighet for å få kron.

In [None]:
def vektet_mynt(p_kron: float = 0.3):
    pass

vektet_mynt()

## Utfall og eksperimenter

Hvis vi kaster en mynt, kan to ting skje:

  - vi kan få kron, eller
  - vi kan få mynt.

I denne sammenhengen er kron og mynt mulige **utfall** av å kaste en mynt.

Å kaste en mynt kalles da et **eksperiment**.

Mer formelt er et eksperiment en tilfeldig prosess som produserer nøyaktig ett mulig utfall.

## Utfallsrom

Et sett med alle mulige utfall kalles et **utfallsrom**.

For myntkast: utfallsrom = {kron, mynt}

Elementene i utfallsrommet skal være distinkte og gjensidig utelukkende --> unikt utfall av et eksperiment

Utfallsrommet må være kollektivt uttømmende: uansett utfallet av et eksperiment, må utfallet være en del av utfallsrommet

For myntkast: både kron og mynt må være i utfallsrommet

## Utfallsrom

Et sett med **alle mulige utfall** kalles et **utfallsrom**.

In [None]:
def mynt():
    utfallsrom = ['kron', 'mynt'] # utfallsrom med 2 mulige utfall
    utfall = random.sample(utfallsrom, 1)[0]
    return utfall

oppnådd_utfall = mynt()

print(f"Utfall: {oppnådd_utfall}")
print(f"Gyldig utfall: {oppnådd_utfall in ['kron', 'mynt']}")

## Eksempel: flere myntkast 

Hvis vi kaster en mynt 3 ganger, hva er sannsynligheten for at vi får nøyaktig 2 kron?

Hva er de mulige utfallene her?

In [None]:
def kast_mynt_n_ganger(n):
    # live-kodet:
    return tuple([mynt() for _ in range(n)])

kast_mynt_n_ganger(n=3)

Hvordan kan vi nå estimere sannsynlighetene for hendelser som å få nøyaktig 2 kron? Hvordan ville simuleringen se ut?

## Hendelse

En hendelse A er et sett med mulige utfall.

Sannsynligheten for en hendelse A, betegnet P(A), beskriver kunnskapen eller troen om den kollektive "sannsynligheten" for elementene i A.

Eksempel med myntkast:

Utfall: K, M

Eksempler på hendelser: {K}, {M}

## Hendelse

Kast en mynt 3 ganger:

Utfall: KKK, KKM, KMK, KMM, MKK, MKM, MMK, MMM

Hendelser: A = {nøyaktig 2 kron forekommer} = {KKM, KMK, MKK}

In [None]:
def estimer_sannsynlighet_for_2_kron_fra_3_kast(antall_eksperimenter: int):

    # live-kodet
    
    fikk_2_kron_antall = 0
    for _ in range(antall_eksperimenter):
        utfall = kast_mynt_n_ganger(n=3)
        fikk_2_kron_antall += int(utfall.count('kron') == 2)

    sannsynlighet_for_2_kron = fikk_2_kron_antall / antall_eksperimenter
    return sannsynlighet_for_2_kron

estimer_sannsynlighet_for_2_kron_fra_3_kast(antall_eksperimenter=1000)

### Øvelse: partall ved terningkast

Skriv en funksjon som estimerer sannsynligheten for at etter å ha kastet en rettferdig 6-sidet terning, kommer det opp et partall. Hva er det tilfeldige eksperimentet her? Hva er de mulige utfallene? Hva er hendelsen det spørres om og hvilke utfall tilsvarer denne hendelsen?

In [None]:
def estimer_partall_sannsynlighet() -> float:
    pass

## Sannsynlighetsfordeling

En sannsynlighetsfordeling gir sannsynligheten for forekomsten av forskjellige mulige utfall:

- Hvis vi kaster en mynt, hva er sannsynligheten for at vi får kron: P(kron), og hva er sannsynligheten for at vi får mynt: P(mynt)

- Hvis vi kaster en mynt 3 ganger, hva er sannsynligheten for at vi får 0 kron: P(K0), 1 kron: P(K1), 2 kron: P(K2), eller 3 kron: P(K3)

Sannsynlighetsfordeling er en matematisk funksjon som kobler ikke-overlappende hendelser til sannsynligheter som summerer til 1.

NB: En diskret sannsynlighetsfordeling kan sees som en **ordbok** i Python, hvor de ikke-overlappende hendelsene er nøkler og sannsynlighetene som tilsvarer hendelsene er verdier. En diskret sannsynlighetsfordeling tilsvarer ikke en Python-funksjon.

In [None]:
from itertools import product

def estimer_sannsynlighetsfordeling(antall_kast, antall_eksperimenter):

    # live-kodet:
    alle_mulige_utfall = list(product(['kron', 'mynt'], repeat=antall_kast))
    print(f"Utfall:\n{alle_mulige_utfall}\n")

    hendelser = list(range(antall_kast+1))
    print(f"Hendelser:\n{hendelser}\n")

    hendelse_tellinger = {hendelse: 0 for hendelse in hendelser}

    for eksperiment in range(antall_eksperimenter):
        utfall = kast_mynt_n_ganger(n=antall_kast)
        hendelse = utfall.count('kron')
        hendelse_tellinger[hendelse] += 1

    sannsynlighetsfordeling = {hendelse: telling / antall_eksperimenter for hendelse, telling in hendelse_tellinger.items()}
    
    return sannsynlighetsfordeling

sannsynlighetsfordeling = estimer_sannsynlighetsfordeling(antall_kast=3, antall_eksperimenter=100)

print(f"Sannsynlighetsfordeling: {sannsynlighetsfordeling}")

Denne måten å få sannsynlighetsfordelinger gjennom simuleringer kalles **Monte Carlo-simulering**.

### Vise resultatene av simuleringen grafisk

In [None]:
n = 3
antall_eksperimenter = 100

sannsynlighetsfordeling = estimer_sannsynlighetsfordeling(n, antall_eksperimenter)

plott_hendelse_sannsynligheter(sannsynlighetsfordeling)

### Øvelse: sannsynligheten for å få minst 1 kron

Hva er sannsynligheten for å få minst 1 kron fra 3 kast? Skriv koden for å estimere den.

In [None]:
def estimer_sannsynlighet_for_minst_1_kron_fra_3_kast(antall_eksperimenter: int):
  pass

estimer_sannsynlighet_for_minst_1_kron_fra_3_kast(antall_eksperimenter=1000)

## Eksempel: sannsynlighet for minst 1, 2 og 3 kron

Skriv nå koden for å estimere sannsynligheten for å få minst 1 kron, minst 2 kron, og minst 3 kron.

In [None]:
# live-kodet:

def estimer_sannsynlighet_for_minst_m_kron(antall_eksperimenter: int):
    antall_kast = 3
    fikk_minst_n_kron_tellinger = {i: 0 for i in range(antall_kast+1)}
    for _ in range(antall_eksperimenter):
        utfall = kast_mynt_n_ganger(n=antall_kast)
        kron_antall = utfall.count('kron')
        for minst_n in fikk_minst_n_kron_tellinger.keys():
            if minst_n >= kron_antall:
                fikk_minst_n_kron_tellinger[minst_n] += 1

    sannsynligheter = {minst_n: telling / antall_eksperimenter for minst_n, telling in fikk_minst_n_kron_tellinger.items()}
    return sannsynligheter

print(estimer_sannsynlighet_for_minst_m_kron(antall_eksperimenter=1000))

Et eksempel på output fra forrige funksjon: {0: 0.111, 1: 0.491, 2: 0.877, 3: 1.0} - **dette er ikke en gyldig sannsynlighetsfordeling!**

Hvorfor?

## Utfall vs hendelse

"Minst n kron" er en **hendelse** - den inneholder flere utfall: (kron, mynt, kron) og (kron, mynt, mynt) er to forskjellige utfall, men samme hendelse "minst 1 kron".

"Minst n kron" **kan ikke være et utfall** hvis vi ønsker å estimere sannsynligheten for minst n kron for n=1,2,3, fordi det ikke er eksklusivt: utfallet (kron, mynt, kron) tilhører både "minst 1" og "minst 2" kron-hendelser.

## Utfall vs hendelse

Utfall og hendelser er to abstraksjonsnivåer som brukes til å beskrive en tilfeldig prosess.

Utfall er elementære og lister opp alle de forskjellige mulighetene. Sannsynlighetene for alle utfall summerer til 1, ettersom ett utfall må forekomme som resultat av et eksperiment.

Hendelser er definert som sett av utfall som er av interesse. Sannsynligheter for hendelser er summen av sannsynlighetene for alle utfall som er en del av hendelsen.

## Sannsynlighetsaksiomer

Sannsynlighetsaksiomer gjelder for enhver sannsynlighet per definisjon:

- Sannsynligheten for enhver hendelse A er alltid ikke-negativ:
  P(A) >= 0
- For to hendelser A og B som ikke overlapper (disjunkte hendelser), er sannsynligheten for at begge skjer summen av deres individuelle sannsynligheter:
  P(A U B) = P(A) + P(B)
- Sannsynligheten for hele utfallsrommet (av alle mulige utfall) er lik 1.

## Tilbake til veddemålseksempelet

Hvis vi kaster en rettferdig mynt 10 ganger, hva er sannsynligheten for at vi får 5 kron og 5 mynt? Skriv koden for å simulere dette eksperimentet og empirisk estimere sannsynligheten.

Noen refleksjonspunkter:
- Hva er hendelsen i dette tilfellet?
- Hva er mulige utfall?

Skriv koden her og estimer sannsynligheten for å få nøyaktig 5 kron og 5 mynt i 10 myntkast:


In [None]:
hendelse_sannsynligheter = estimer_sannsynlighetsfordeling(antall_kast=10, antall_eksperimenter=10000)

print("Sannsynligheter for forskjellige hendelser:")
print(hendelse_sannsynligheter)

print(hendelse_sannsynligheter[5])

## Tilbake til Menti

Lenke: https://www.menti.com/4ii97w7bfi

Kode for menti.com: 3269 1977

## Empiriske og analytiske løsninger

Gjennom simuleringer kan vi estimere sannsynligheten for en hendelse.

Vi kan også ofte matematisk beskrive sannsynlighetsfordelingen og beregne den ved hjelp av en formel.

Imidlertid, i noen tilfeller vet vi enten ikke formelen eller fordelingen ville vært for vanskelig å beregne, da går vi tilbake til (Monte Carlo) simuleringer.

## Empiriske og analytiske løsninger

**Sannsynlighetsmassefunksjon**: en funksjon som gir sannsynligheten for et utfall eller en hendelse (f.eks. sannsynligheten for å få 2 kron i 3 myntkast).

Noen tilfeldige prosesser forekommer i mange forskjellige situasjoner. For eksempel kan vi kaste en mynt for å få kron/mynt, en student kan ta en eksamen hvor de består/stryker, eller en diagnostisk test som resulterer i en positiv/negativ diagnose - alle disse har en spesifikk "type tilfeldighet".

## Bernoulli-fordeling

Denne fordelingen modellerer ethvert ja/nei (1/0) spørsmål hvor ja (1) velges med sannsynlighet p.

Eksempel: et myntkast gir kron med sannsynlighet p og mynt med sannsynlighet 1-p.

<div><img src="attachment:e9d58d35-4149-476e-870e-4d27a694ff3f.png" width="40%" min-width='400px'/></div>

In [None]:
from util import plott_bernoulli_eksempler

plott_bernoulli_eksempler()

## Binomialfordeling

Binomialfordelingen beskriver antall suksesser *k* (f.eks. å få kron) i en sekvens av n forsøk (f.eks. i *n* myntkast) hvor sannsynligheten for suksess i hvert forsøk er *p*.

Sannsynligheten for å få *k* suksesser i *n* uavhengige forsøk hvis sannsynligheten for suksess er *p* kan beregnes ved hjelp av følgende sannsynlighetsmassefunksjon:

<div>
    <img src="attachment:df17fb12-d2db-4694-ad07-a545354beb99.png" width="40%" min-width='400px'/>
</div>

In [None]:
# Hva er sannsynligheten for å få nøyaktig én kron i tre kast av en rettferdig mynt?

n = 3 # antall forsøk (kast)
k = 1 # antall suksesser (kron)
p = 0.5 # sannsynlighet for suksess i ett forsøk for en rettferdig mynt

# beregner formelen:

import math

sannsynlighet_en_kron_fra_formel = round(math.factorial(n) // (math.factorial(k) * math.factorial(n-k)) * p**1 * (1-p)**2, 3)

from scipy.stats import binom

sannsynlighet_en_kron_fra_bibliotek = round(binom.pmf(k, n, p), 3)

print(f"Fra manuell beregning av formelen: {sannsynlighet_en_kron_fra_formel}")
print(f"Ved bruk av implementering fra scipy-biblioteket: {sannsynlighet_en_kron_fra_bibliotek}")

In [None]:
from util import plott_binomialfordeling_eksempel

plott_binomialfordeling_eksempel()

# Empiriske estimater vs analytiske sannsynligheter

Tidligere simulerte vi å kaste en mynt 3 ganger for å få sannsynligheten for å få forskjellige antall kron. Her er en eksempelimplementering som estimerer sannsynlighetene for disse 4 hendelsene.

### Empiriske estimater

In [None]:
def kast_mynt_n_ganger(p_kron: float, n: int):
    return ['K' if random.random() <= p_kron else 'M' for _ in range(n)]

def simuler_hendelse_sannsynligheter(p_kron: float, n: int, antall_eksperimenter: int):
    hendelse_tellinger = {i: 0 for i in range(n+1)}
    
    for eksperiment in range(antall_eksperimenter):
        utfall = kast_mynt_n_ganger(p_kron, n)
        hendelse_tellinger[utfall.count('K')] += 1
        
    sannsynlighetsfordeling = {f'K{hendelse}': telling / antall_eksperimenter for hendelse, telling in hendelse_tellinger.items()}
    
    return sannsynlighetsfordeling

hendelse_sannsynligheter_simulering = simuler_hendelse_sannsynligheter(p_kron=0.5, n=3, antall_eksperimenter=100)
print(hendelse_sannsynligheter_simulering)

### Analytiske sannsynligheter

Dette kan også beregnes ved hjelp av en formel for binomialfordeling (sannsynligheten for å få *k* suksesser i *n* uavhengige forsøk når sannsynligheten for suksess er *p*):

In [None]:
import math

def kron_antall_sannsynlighet(p_kron, n, antall_kron):
    return math.factorial(n) / (math.factorial(antall_kron) * math.factorial(n - antall_kron)) * (p_kron**antall_kron) * ((1-p_kron)**(n-antall_kron))

hendelse_sannsynligheter_fra_formel = {
    f'K{antall_kron}': kron_antall_sannsynlighet(p_kron=0.5, n=3, antall_kron=antall_kron) for antall_kron in range(4)
}

print(hendelse_sannsynligheter_fra_formel)

### Empirisk vs. analytisk sannsynlighet

Vi kan også vise de empirisk estimerte sannsynlighetene side om side med de vi beregnet analytisk:

In [None]:
from util import plott_sannsynlighet_sammenligning

plott_sannsynlighet_sammenligning(hendelse_sannsynligheter_simulering, hendelse_sannsynligheter_fra_formel)

## Kategoriske fordelinger

Når man kaster en terning én gang, er det 6 like sannsynlige mulige utfall: k=6, med sannsynligheter for hver p=1/6.

Kategorisk fordeling: generalisering av Bernoulli-fordelingen med k mulige kategorier, med sannsynlighet for hver kategori definert separat.

<div><img src="attachment:ad8ad4fa-0ab5-44e4-a811-f0d291f6f776.png" width="40%" min-width='400px' /></div>

## Multinomialfordeling

Multinomialfordelingen modellerer sannsynligheten for å få hver side av en terning når man kaster den n ganger.

I hvert av n forsøk får vi nøyaktig én av k kategorier med fast sannsynlighet for den kategorien.

Forsøkene er uavhengige.

## Uniform fordeling

Hvis vi kaster en rettferdig terning, forventer vi at alle sidene kommer opp like ofte -> hver side har samme sannsynlighet.

I en uniform fordeling er alle utfall like sannsynlige.

<div><img src="attachment:94dfd32a-c225-4593-bade-aec0221f6952.png" width="40%" min-width='400px' /></div>

### Uniform fordeling

In [None]:
from util import plott_uniform_terning

plott_uniform_terning()

## Hva skjer hvis vi kaster en mynt mange ganger: tilnærming til kontinuerlige fordelinger


In [None]:
p_kron, n, antall_eksperimenter = 0.5, 20, 1000
hendelse_sannsynligheter_sim = simuler_hendelse_sannsynligheter(p_kron, n, antall_eksperimenter)
plott_hendelse_sannsynligheter(hendelse_sannsynligheter_sim)

### Øvelse: Monopol


I spillet Monopol flytter man sin brikke rundt et brett med 40 felt, ved å kaste et par terninger hver tur. Hva er sannsynligheten for å fullføre din første runde på din femte tur?

<img src="https://images.unsplash.com/photo-1640461470346-c8b56497850a?ixlib=rb-4.0.3&ixid=MnwxMjA3fDB8MHxwaG90by1wYWdlfHx8fGVufDB8fHx8&auto=format&fit=crop&w=1674&q=80" style="height:280px; float: left; margin-top: 10px; margin-right: 10px" />

Alternativt:

Hva er sannsynligheten for at summen av verdier passerer 40 etter å ha trukket et utvalg fra et par (2) randint(1,6) kall nøyaktig 5 ganger?


Skriv en kode for å simulere dette og estimere sannsynligheten.


In [None]:
def estimer_monopol_sannsynlighet(antall_eksperimenter: int = 1000) -> float:
  pass

estimer_monopol_sannsynlighet()

## Generell prosedyre for simulering

1. *Problemspesifikk*: skriv kode for å simulere det ønskede eksperimentet
2. *Generisk*: for å simulere mange ganger, bruk Monte Carlo (MC) med en for-løkke
3. *Generisk*: Tell suksesser - hvor mange ganger hendelsen inntreffer (på tvers av MC-løkken)
4. *Generisk*: Beregn sannsynlighet som antall suksesser delt på antall MC-iterasjoner

For å i stedet beregne en full sannsynlighetsfordeling:

- Steg 3: tell i stedet hvor mange ganger hvert forskjellig utfall/hendelse inntreffer
- Steg 4: del antallet av hvert utfall/hendelse på antall MC-iterasjoner for å få sannsynligheten for hver hendelse

## Betinget sannsynlighet

Betinget sannsynlighet: en måte å resonnere om utfallet av et eksperiment basert på delvis informasjon

Vi vet at utfallet er innenfor en hendelse B - vi ønsker å kvantifisere sannsynligheten for at utfallet også tilhører en annen hendelse A

<div><img src="attachment:860b5d40-1754-4a13-ac89-ece3ee809bca.png" width="40%" min-width='400px'/></div>

## Beregne sannsynligheten for en bokstav i en tekst


In [None]:
import re

original_tekst = """To be, or not to be, that is the question, Whether 'tis nobler in the mind to suffer The slings and arrows of outrageous fortune,Or to take arms against a sea of troubles,And by opposing end them? To die: to sleep;No more; and by a sleep to say we endThe heart-ache and the thousand natural shocksThat flesh is heir to, 'tis a consummationDevoutly to be wish'd. To die, to sleep;To sleep: perchance to dream: ay, there's the rub;For in that sleep of death what dreams may comeWhen we have shuffled off this mortal coil,Must give us pause: there's the respectThat makes calamity of so long life;For who would bear the whips and scorns of time,The oppressor's wrong, the proud man's contumely,The pangs of despised love, the law's delay,The insolence of office and the spurnsThat patient merit of the unworthy takes,When he himself might his quietus makeWith a bare bodkin? who would fardels bear,To grunt and sweat under a weary life,But that the dread of something after death,The undiscover'd country from whose bournNo traveller returns, puzzles the willAnd makes us rather bear those ills we haveThan fly to others that we know not of?Thus conscience does make cowards of us all;And thus the native hue of resolutionIs sicklied o'er with the pale cast of thought,And enterprises of great pith and momentWith this regard their currents turn awry,And lose the name of action.--Soft you now!The fair Ophelia! Nymph, in thy orisonsBe all my sins remember'd."""
tekst = re.sub(r"[.,:\' ;\n\-?!]*", "", original_tekst).lower()

# print(original_tekst)
# print(tekst)

def beregn_marginal_sannsynlighet(bokstav, tekst):

    # live-kodet
    antall = tekst.count(bokstav)
    sannsynlighet = round(antall / len(tekst), 3)
        
    return sannsynlighet

def beregn_betinget_sannsynlighet(bokstav, forrige_bokstav, tekst):

    # live-kodet
    antall_forrige_bokstav = tekst.count(forrige_bokstav)
    antall_begge_bokstaver = tekst.count(forrige_bokstav + bokstav)

    betinget_sannsynlighet = round(antall_begge_bokstaver / antall_forrige_bokstav, 3)
        
    return betinget_sannsynlighet

print(beregn_marginal_sannsynlighet("a", tekst))

print(beregn_betinget_sannsynlighet("a", "h", tekst))

### Øvelse: Flere kron enn mynt i rettferdige myntkast

Vi kaster en rettferdig mynt 3 ganger. Hva er sannsynligheten for at flere kron enn mynt kommer opp hvis det første kastet er kron?

In [None]:
def estimer_flere_kron_sannsynlighet(antall_eksperimenter):
  pass

estimer_flere_kron_sannsynlighet(1000)


## Problemet fra begynnelsen

"Et stort antall kort fra mange forskjellige kortstokker er spredt utover gaten. Hvor mange kort må man se på før alle 52 forskjellige kortene fra en kortstokk er sett?"

- Hvordan ville du løst dette problemet nå?
- Hvordan formulere dette problemet i lys av sannsynlighetsteori?


### Øvelse: sum av sider ved terningkast

Du kaster en terning tre ganger. Hva er sannsynligheten for at summen av sidene er mindre enn 12?

In [None]:
def estimer_sannsynlighet_for_sum(mål_sum, antall_eksperimenter):
    pass

estimer_sannsynlighet_for_sum(12, 100)

### Øvelse: serie med kortspillkamper

Tre kortspillere spiller en serie med kamper. Sannsynligheten for at spiller 1 vinner et hvilket som helst spill er 30%, sannsynligheten for at spiller 2 vinner er 50% og sannsynligheten for at den tredje spilleren vinner er 20%. Hvis de spiller 6 spill, hva er sannsynligheten for at spiller 1 vinner minst 2 spill?


In [None]:
def estimer_vinner_sannsynlighet(spiller1_p, spiller2_p, spiller3_p, antall_spill, antall_eksperimenter):
    pass

estimer_vinner_sannsynlighet(0.3, 0.5, 0.2, 6, 10000)


# Løsninger for øvelsene

### Øvelse: vektet mynt

In [None]:
def vektet_mynt(p_kron: float = 0.3) -> str:
    utfall = 'kron' if random.random() < p_kron else 'mynt'
    return utfall

vektet_mynt()

### Øvelse: partall ved terningkast

In [None]:
def terning():
    return random.choice(list(range(1, 7)))

def estimer_partall_sannsynlighet(antall_eksperimenter: int = 1000) -> float:
    partall_skjedde = 0

    for _ in range(antall_eksperimenter):
        utfall = terning() # spesifikt tall som kom opp
        partall_skjedde += int(utfall % 2 == 0) # tell en hendelse til hvis tallet er partall

    return partall_skjedde / antall_eksperimenter

estimer_partall_sannsynlighet()

### Øvelse: sannsynligheten for å få minst 1 kron

In [18]:
def estimer_sannsynlighet_for_minst_1_kron_fra_3_kast(antall_eksperimenter: int):
    fikk_minst_1_kron_antall = 0
    for _ in range(antall_eksperimenter):
        utfall = kast_mynt_n_ganger(n=3, p_kron=0.5)
        fikk_minst_1_kron_antall += int(utfall.count('kron') >= 2)

    sannsynlighet_for_minst_1_kron = fikk_minst_1_kron_antall / antall_eksperimenter
    return sannsynlighet_for_minst_1_kron

estimer_sannsynlighet_for_minst_1_kron_fra_3_kast(antall_eksperimenter=1000)

0.492

### Øvelse: Monopol

In [19]:
def estimer_monopol_sannsynlighet(antall_eksperimenter: int) -> float:
    suksesser = 0

    for eksperiment in range(antall_eksperimenter):
        utfall = [[terning() for _ in range(2)] for _ in range(5)]
        verdi = sum(sum(terninger) for terninger in utfall)
        if verdi > 40:
            suksesser += 1

    return suksesser / antall_eksperimenter

estimer_monopol_sannsynlighet(1000)

0.148

## Øvelse: Flere kron enn mynt i rettferdige myntkast

In [20]:
def estimer_flere_kron_sannsynlighet(antall_eksperimenter: int) -> float:

    flere_kron_totalt = 0
    kron_først = 0

    for eksperiment in range(antall_eksperimenter):
        utfall = [mynt() for _ in range(3)]
        if utfall[0] == 'kron':
            kron_først += 1
            if utfall.count('kron') > utfall.count('mynt'):
                flere_kron_totalt += 1
    return round(flere_kron_totalt / kron_først, 3)


estimer_flere_kron_sannsynlighet(1000)


0.749

## Øvelse: sum av sider ved terningkast

In [21]:
def estimer_sannsynlighet_for_sum(mål_sum, antall_eksperimenter):

    hendelser = ['mindre_enn_mål', 'større_lik_mål']
    sannsynlighetsfordeling = {hendelse: 0 for hendelse in hendelser}
    for eksperiment in range(antall_eksperimenter):
        utfall = [terning() for _ in range(3)]
        if sum(utfall) < mål_sum:
            sannsynlighetsfordeling['mindre_enn_mål'] += 1
        else:
            sannsynlighetsfordeling['større_lik_mål'] += 1

    sannsynlighetsfordeling = {hendelse: telling / antall_eksperimenter for hendelse, telling in sannsynlighetsfordeling.items()}

    return sannsynlighetsfordeling

estimer_sannsynlighet_for_sum(12, 100)

{'mindre_enn_mål': 0.62, 'større_lik_mål': 0.38}

## Øvelse: serie med kortspillkamper

In [22]:
def estimer_vinner_sannsynlighet(spiller1_p, spiller2_p, spiller3_p, antall_spill, antall_eksperimenter):

    hendelser = ['spiller1_vinner_2_pluss', 'spiller1_vinner_1_minus']
    sannsynlighetsfordeling = {hendelse: 0 for hendelse in hendelser}

    for eksperiment in range(antall_eksperimenter):
        spiller1_seire = 0
        for spill in range(antall_spill):
            spiller1_seire += random.random() < spiller1_p

        if spiller1_seire >= 2:
            sannsynlighetsfordeling['spiller1_vinner_2_pluss'] += 1
        else:
            sannsynlighetsfordeling['spiller1_vinner_1_minus'] += 1

    sannsynlighetsfordeling = {hendelse: telling / antall_eksperimenter for hendelse, telling in sannsynlighetsfordeling.items()}

    return sannsynlighetsfordeling


estimer_vinner_sannsynlighet(0.3, 0.5, 0.2, 6, 10000)


{'spiller1_vinner_2_pluss': 0.5762, 'spiller1_vinner_1_minus': 0.4238}