Übersicht:

https://www.eit.hs-karlsruhe.de/dfss/statistics/hypothesentest/hypothesentests-fuer-den-vergleich-zweier-normalverteilungen/zusammenfassung-der-hypothesentests-fuer-den-vergleich-zweier-normalverteilungen.html

In [10]:
import numpy as np
import pandas as pd
import scipy.io
import math
from scipy.stats import t       #t-Verteitung
from scipy.stats import f       #f-Verteilung 
from scipy.stats import norm    #Standartnormalverteilung
from scipy.stats import chi2    #Chi-Quadrat-Verteilung 
from scipy import stats
import matplotlib.pyplot as plt
import seaborn as sns
from pandas.plotting import scatter_matrix
%matplotlib inline

01: Test auf gleiche Mittelwerte bei bekannter Varianz (Zwei-Stichproben-z-Test)

In [11]:
#https://www.eit.hs-karlsruhe.de/dfss/statistics/hypothesentest/hypothesentests-fuer-den-vergleich-zweier-normalverteilungen/test-auf-gleiche-mittelwerte-bei-bekannter-varianz-zwei-stichproben-z-test.html

"""Matlab file laden"""
x1 = scipy.io.loadmat('Schmelzwaerme.mat')['VA']
x1 = np.ravel(x1) #ravel ordnet die Elemente neu an; aus mehreren Arrays wird ein Array

x2 = scipy.io.loadmat('Schmelzwaerme.mat')['VB']
x2 = np.ravel(x2) #ravel ordnet die Elemente neu an; aus mehreren Arrays wird ein Array

N = len(x1)
M = len(x2)

"""Wahl eines Signifikanzniveaus """
alpha = 0.05        #Entweder vorgegeben oder selber wählen (5% ist Std)
Gamma = 1- alpha

"""Parameter c1 und c2 aus der inversen Standardnormalverteilung"""
c1 = norm.ppf((1-Gamma)/2)    #Bestimmung von c1 (Umkehrfunktion)
c2 = norm.ppf((1+Gamma)/2)    #Bestimmung von c2 (Umkehrfunktion)

"""Berechnung des Mittelwertes aus der Stichprobe"""
x1_q = np.mean(x1)
x2_q = np.mean(x2)

x0 = x1_q - x2_q

"""Nullhypothese"""
mü0 = 0     #mü1-mü2 = mü0 

"""Vorgabewerte"""
sigma = 0.024   #Vorgabe aus Aufgabe. Anpassen!
sigma_quad = sigma**2

"""Bestimmung der Annahmegrenzen"""
mü_c1 = mü0 + c1* np.sqrt(sigma_quad * ((1/N)+(1/M)))
mü_c2 = mü0 + c2* np.sqrt(sigma_quad * ((1/N)+(1/M)))

print(np.round(mü_c1,4),"< x_q <",np.round(mü_c2,4))

-0.0211 < x_q < 0.0211


02: Test auf gleiche Mittelwerte bei unbekannter Varianz (Zwei-Stichproben-t-Test)

In [12]:
#https://www.eit.hs-karlsruhe.de/dfss/statistics/hypothesentest/hypothesentests-fuer-den-vergleich-zweier-normalverteilungen/test-auf-gleiche-mittelwerte-bei-unbekannter-varianz-zwei-stichproben-t-test.html
"""Matlab file laden"""
x1 = scipy.io.loadmat('Schmelzwaerme.mat')['VA']
x1 = np.ravel(x1) #ravel ordnet die Elemente neu an; aus mehreren Arrays wird ein Array

x2 = scipy.io.loadmat('Schmelzwaerme.mat')['VB']
x2 = np.ravel(x2) #ravel ordnet die Elemente neu an; aus mehreren Arrays wird ein Array

N = len(x1)
M = len(x2)

"""Wahl eines Signifikanzniveaus """
alpha = 0.05        #Entweder vorgegeben oder selber wählen (5% ist Std)
Gamma = 1- alpha

"""Parameter c1 und c2 aus der  inversen t-Verteilung mit N + M - 2 Freiheitsgraden"""
c1 = t.ppf((1-Gamma)/2, N+M-2)    #Bestimmung von c1 (Umkehrfunktion)
c2 = t.ppf((1+Gamma)/2, N+M-2)    #Bestimmung von c2 (Umkehrfunktion)

"""Berechnung des Mittelwertes aus der Stichprobe"""
x1_q = np.mean(x1)
x2_q = np.mean(x2)

x0 = x1_q - x2_q

"""Berechnung der Varianz der Stichproben"""
s1 = np.std(x1, ddof=1)
s2 = np.std(x2, ddof=1)

s_quad = ((N-1)*(s1**2) + (M-1)*(s2**2))/(N+M-2)
s = np.sqrt(s_quad)

"""Nullhypothese"""
mü0 = 0     #mü1-mü2 = mü0 Anpassen!

"""Bestimmung der Annahmegrenzen"""
mü_c1 = mü0 + c1* np.sqrt((1/N)+(1/M))* s
mü_c2 = mü0 + c2* np.sqrt((1/N)+(1/M))* s

print(np.round(mü_c1,4),"< x_q <",np.round(mü_c2,4))

"""Berechnung des p-Values mit der t-Verteilung"""
p = t.cdf((x0-mü0)/(np.sqrt(((1/N)+(1/M)))*s), N+M-2)

-0.0262 < x_q < 0.0262


03: Test auf gleiche Varianz zweier Normalverteilungen (F-Test)

In [13]:
#https://www.eit.hs-karlsruhe.de/dfss/statistics/hypothesentest/hypothesentests-fuer-den-vergleich-zweier-normalverteilungen/test-auf-gleiche-varianz-zweier-normalverteilungen-f-test.html
"""Matlab file laden"""
x1 = scipy.io.loadmat('Schmelzwaerme.mat')['VA']
x1 = np.ravel(x1) #ravel ordnet die Elemente neu an; aus mehreren Arrays wird ein Array

x2 = scipy.io.loadmat('Schmelzwaerme.mat')['VB']
x2 = np.ravel(x2) #ravel ordnet die Elemente neu an; aus mehreren Arrays wird ein Array

N = len(x1)
M = len(x2)

N=16
M=16

"""Wahl eines Signifikanzniveaus """
alpha = 0.05        #Entweder vorgegeben oder selber wählen (5% ist Std)
Gamma = 1- alpha

"""Parameter c1 und c2 aus der inversen f-Verteilung mit (N - 1|M - 1) Freiheitsgraden"""
c1 = f.ppf(alpha/2, N-1, M-1)    #Bestimmung von c1 (Umkehrfunktion)
c2 = f.ppf((1-(alpha/2)), N-1, M-1)    #Bestimmung von c2 (Umkehrfunktion)

"""Berechnung der Stichprobenvarianzen"""
s1 = np.std(x1, ddof=1)
s2 = np.std(x2, ddof=1)

s1_quad = s1**2
s2_quad = s2**2

s1_quad = 0.001382
s2_quad = 0.000433

"""Nullhypothese"""
v0 = 1  #Sigma1^2 = Sigma2^2 -> v0 =1

"""Bestimmung des Annahmebereichs"""
sig12_min = c1*v0
sig12_max = c2*v0


print(np.round(sig12_min,4),"< s1^2/s2^2 <",np.round(sig12_max,4))

"""Berechnung des p-Values mit der t-Verteilung"""
p = 1-f.cdf((s1_quad/s2_quad)*(1/v0), N-1, M-1)

0.3494 < s1^2/s2^2 < 2.8621
