# Python og stokastikk og statistikk

<Strong>Velkommen!</Strong> I dette notatboka skal vi se litt på hvordan vi kan bruke Python for utregninger knyttet til sannsynlighetsteori.

## Statistikk

Mange av de konsepter som sentralmål og spredningsmål vi var interessert i statistikk i fins i pakken <code>statistics</code> (Se [Statistics pakke](https://docs.python.org/3/library/statistics.html)). Det er ofte ønskelig at vi også skriver ut tabell og grafer for å få en visuell intrykk av data. Funksjoner som kan det fins i <code>matplotlib.pyplot</code> pakke. Vi laster begge to inn nå:

In [None]:
import statistics as stat
import matplotlib.pyplot as plt

Den statistikk pakke har mange funksjoner vi trenger for å gjøre statistikk. Her er noen eksempler:

In [None]:
#trenger noen data for å jobbe med pakken
data = [1,2,3,-2,-0.333,5]
print(data)

#gjennomsnitt kalles i Python 'mean' (som på engelsk)
gjennom= stat.mean(data)
print('Gjennomsnitt:', gjennom)

#median
median = stat.median(data)
print('Median er ' , median)

**Spørsmål:** Sammenlikn median med data vi har gitt. Hvorfor får vi resultatet?

In [None]:
?stat.median

In [None]:
#Spredningsmål kan også beregnes
savvik     =stat.stdev(data)             #Standardavvik
variasjon  =stat.variance(data)          #Variasjon
print('standardavvik:', savvik, 'Variasjon:', variasjon)

Vi skal bruke Python nå for å lage en typisk diagram som man ville kanskje se på i statistikk.

In [None]:
x = ["Volvo","BMW","Opel","Ford","Tesla","Nissan"]
y = [1,3,6,7,6,9]
plt.bar(x,y)
plt.xlabel("Merke")
plt.ylabel("Antall")
plt.show()

#### Oppgave

Gå inn på yr.no-velg Levanger og langtidsvarsel. Lag en oversikt over forventet makstemperatur de neste 7 dagene.
Tips: <code> x = ['dag' , 'dag', ...] y =[temp , temp, ...]</code>

Du kan bruke et linjediagram <code>plt.plot</code> for å vise forventet utvikling over tid.
Også lag nye $x$-label og $y$-label som passer.

In [None]:
#Skriv din kode under her og husk å kjøre den ved trykk av SHIFT + ENTER

## Stokastikk og sannsynlighet

I sannsynlighetsteori bryr vi oss om tilfeldige hendelser og for dette trenger vi å generere noen tilfeldige tall. Det vanlige Python kan det ikke selv og vi må laste inn noen pakke som kan hantere tilfeldighet. Pakken heter <code>random</code> (se [Random pakke](https://docs.python.org/3/library/random.html) for mer informasjon) og vi laster det inn nå:

In [None]:
import random   #last inn pakke random som har sannsynlighetsfunksjoner  

Merk at vi kan gjøre livet enklere hvis vi bruker istedet av <code>import</code> kommandoen
```Python 
from random import *```
siden vi kan deretter kalle alle funksjoner ved bruk av <code>funksjonsnavn</code> og ikke <code>random.funksjonsnavn</code>. Men vi skal ikke gjøre det nå for å synnliggjøre hvilke funksjoner kommer fra random pakken.

### Randint()
La oss kaste først en terning:

In [None]:
#Kast av en terning ved bruk av randint funksjonen 
terning = random.randint(1,6)
print(terning)

Funksjonen <code>randint(a,b)</code> genererer et tilfeldig tall mellom $a$ og $b$ (begge to inkludert). 

### Choice()

<code>choice()</code> returnerer en tilfeldig verdi fra en liste med elementer (en liste er en av datatypene som fins i Python, vi har en jupyternotatbok om disse hvis du ønsker å finne ut mer). Praktisk dersom man trenger å trekke et tilfeldig kort fra en kortstokk f.eks.

In [None]:
farger= ['Hjerter','Ruter','Kløver','Spar']
farge = random.choice(farger)
verdi = random.randint(1,13)
print("Kort: ", farge , " ", verdi)

### shuffle()
Dersom man trenger å legge elementene i en tilfeldig rekkefølge, så har random en funksjon som heter <code>shuffle()</code>:

In [None]:
list = ['en','to','tre','fire','fem']
random.shuffle(list)
print(list)

### random()

Dersom man har behov for en tilfeldig verdi mellom $0$ og $1$, så kan man benytte <code>random()</code>. Her ser du noen måter å bruke denne funksjonen:

In [None]:
#velg et tilfeldig tall mellom 0 og 1
a = random.random()   #Husk at vi trenger random.random() :-(
print(a)              #Men vi har nå bestemmt oss å bruke den uten enkle syntaks, prøv å tast inn
                      #from random import random
                      #og se hva skjer 

In [None]:
b = random.random() * 100 # lag et tilfeldig tall mellom 0 og 100
print(b)
c = 1+random.random()     # og nå et tilfeldig tall mellom 1 og 2
print(c)

##### Tilfeldige tall?

Er de tallene vi lager med <code>random()</code> (eller noen av de andre metoder fra pakken) virkelig tilfeldig? 

In [None]:
random.seed(2)

print(random.random())
print(random.random())
print(random.random())

Hvis vi kaller funksjonenene skal de alltid skrive ut følgende tallene:
```Python
0.9560342718892494
0.9478274870593494
0.05655136772680869
```
Ser ikke tilfeldig ut hvis det skjer hver gang, ikke sant? Grunnen til det er kilden til tilfeldighet i programmene og algoritmene våre. De er ikke tilfeldig men vi bruker et matematisk triks som kalles en pseudotilfeldig tallgenerator. Den er avhengig av noen som kalles "seed" og hvis vi velger den får vi alltid det samme resultat.

En tilfeldig tallgenerator er et system som genererer tilfeldige tall fra en sann kilde til tilfeldighet. Ofte kilden er noe fysisk, for eksempel en geigerteller, hvor resultatene blir omgjort til tilfeldige tall. Vi trenger ikke ekte tilfeldighet og dermed er pseudotilfeldige tall god nok for oss.

### Oppgave

Vi kaster en vanlig terning.

a) Regn ut sannsynligheten for at du får minst $5$ når du slår terningen en gang. Skriv inn formel for sannsynlighet først ($P(\text{terning viser minst }5)=...$)

**Celle for dine utregninger (dobbeltklikk her for å skrive inn tekst)**

b) Skriv en dataprogram i Python som kaster terningen 10 ganger og skriver ut svaret. Hvor mange ganger fikk du minst 5? 

In [None]:
#Kode ditt skriver du under, trykk SHIFT + ENTER for å kjøre den

c) Tenk på hvordan du kunne lage et dataprogram som hjelper deg å kaste en terning 51 ganger.

In [None]:
#Kode ditt skriver du under, trykk SHIFT + ENTER for å kjøre den