In [2]:
import panel as pn; pn.extension()
from utilities.helper_functions import make_plot

In [3]:
import matplotlib.pyplot as plt

SMALL_SIZE = 12
MEDIUM_SIZE = 14
BIGGER_SIZE = 14

plt.rc('font', size=SMALL_SIZE)          # controls default text sizes
plt.rc('axes', titlesize=BIGGER_SIZE)     # fontsize of the axes title
#plt.rc('axes', labelsize=MEDIUM_SIZE)    # fontsize of the x and y labels
plt.rc('xtick', labelsize=SMALL_SIZE)    # fontsize of the tick labels
plt.rc('ytick', labelsize=SMALL_SIZE)    # fontsize of the tick labels
plt.rc('legend', fontsize=SMALL_SIZE)    # legend fontsize
plt.rc('figure', titlesize=BIGGER_SIZE)  # fontsize of the figure title

#### Innledning

Vi vil vurdere om en påstand eller hypotese om en fordeling er fordeling med utvalget av observasjoner fra fordelingen som blir realisert. 

Et konkret eksempel er vurdering av effekt av vaksine (og eventuelle bivirkninger) der vi sammenligner test- og kontrollgruppe og vurdere om observerte forskjeller er forenelig med at det ikke er effekt.

Vi vil avgjøre om observerte forskjeller er forenelig med tilfeldige variasjoner.

#### Formelt rammeverk

Vi bruker en testobservator $T$ med kjent fordeling gitt at hypotesen er sann. Vi forkaster hypotesen dersom vi observerer en realisering $T=t$ som er lite sannsynlig.. altså, hvis den er langt ute i halen. Kan i praksis ikke utelukke 100% at realiseringen kommer fra den gitt fordelingen som samsvarer med hypotesen, så vi må avgrense.

Vi konstruerer et intervall $[t_l, t_u]$ der $P(t_l<T< t_u)=1-\alpha$. Dette intervallet medfører en partisjonering av utfallsmengden til testobservatoren. Hvis den lander inni beholder vi, og utenfor så forkaster vi. Størrelsen på beholdningsintervallet avhenger av nivået $\alpha$. Det bestemmer også sannsynligheten for å feilaktig forkaste hypotesen.

I praksis er hypotesen nesten alltid usann. Dette medfører at den realiserte testobservatoren $t$ vi observerer nesten alltid kommer fra en annen sann men ukjent fordeling. Sannsynligheten for at vi feilaktig unngår å forkaste nullhypotesen tilsvarer sannsynligheten for at testobservatoren lander i $[t_l, t_u]$ under den sanne, ukjente fordelingen. 

Styrken til testen er 1-P(type II). Vi kan si at dette avhenger av tre ting:
1. Hvor stor forskjell det er på sentraltendensen i fordeling til testobservator under nullhypotese og sann fordeling... hvis større differanse så er det mindre overlapp og mindre sannsynlighet for at lander i beholdningsregion. Vil altså være større sannsynlighet for å forkaste dersom større forskjell. 
2. Hvor stor spredning det er i fordelingen til testobservator. Hvis mer konsentrert er det mindre overlapp. Dette avhenger av antall observasjoner og spredning til enkeltobservasjoner. Flere observasjoner gir mer styrke slik at vi kan oppdage mindre forskjeller (større sannsynlighet for å korrekt forkaste hypotese).
3. Nivået på testen (hvor stor del av fordelingen som beholdningsregion omfatter..). Lavere nivå, mer sannsynlighet for å korrekt forkaste. Trade-off her.

#### Eksempel

Kjøre to eksempler
1. Normalfordeling med kjent varians
2. Bernoullifordeling

Trenger ikke å generere noen utvalg; altså skal være mulig å regne på analytisk.

In [4]:
# lager widgets for alle ting som kan endres

μ_true_widget = pn.widgets.FloatSlider(value=0, start=-1, end=1,  step=0.1, name='Sann gjennomsnitt')
σ_true_widget = pn.widgets.FloatSlider(value=1, start=0.1, end=2, step=0.1, name='Sann standardavvik')
μ_hyp_widget = pn.widgets.FloatSlider(value=0, start=-1, end=1,  step=0.1, name='Nullhypotese')
N_widget = pn.widgets.IntSlider(start=1, step=1, end=50, value=25, name='Utvalgsstørrelse')
α_widget = pn.widgets.RadioButtonGroup(options=[0.01,0.05, 0.1], value=0.05, name='Nivå')

Må definere en funksjon der output er de funksjonene..

In [5]:
bound_fn = pn.bind(make_plot,
                     μ_true=μ_true_widget,
                     σ_true=σ_true_widget,
                     μ_hyp=μ_hyp_widget,
                     N=N_widget,
                     α=α_widget)                    

lage pane med description

In [6]:
with open('utilities/forklaring.txt',encoding='utf-8') as f:
    text = f.read()
title = '### Normalfordeling med kjent varians\n#### Test av hypotese om gjennomsnitt'

In [7]:
layout = pn.Column(
             pn.Row(
                 pn.Column(pn.pane.Markdown(title),
                         μ_true_widget, 
                         σ_true_widget,
                         μ_hyp_widget,
                         N_widget,
                         'Nivå:',
                         α_widget),
                 bound_fn),
            pn.pane.Markdown(text))
                   

In [8]:
layout.servable()

In [9]:
layout.show()

Launching server at http://localhost:61094


<bokeh.server.server.Server at 0x1fc1db7ce88>