# 5	Schätzung unbekannter Parameter


### 5.1	Thermische Ausdehnung von Kunststoffen

Es liegt eine Stichprobe mit N = 40 Messwerten vor. Von der Grundgesamtheit sind weder Mittelwert noch Standardabweichung bekannt. Der Mittelwert der Stichprobe beträgt  $\bar x$ = 19.5818 mm und eine Standardabweichung von s = 2.4857 mm.




In [1]:
""" Bibliotheken importieren"""
from scipy.io import loadmat
from scipy.stats import t     # t-Verteitung
from scipy.stats import chi2  # Chi-Quadrat-Verteilung 
import numpy as np
'''Laden des Datensatzes'''
data=loadmat('AusdehnungKunststoff')['AusdehnungKunststoff']
N=len(data)
'''Mittelwert und Standardabweichung'''
dataquer= np.mean(data)
s=np.std(data, ddof=1)
dataquer, s

(19.58175, 2.485787176050151)

##### a) Der Konfidenzbereich für den Mittelwert bei unbekannter Varianz berechnet sich über


$\bar x - \frac{{{c_2} \cdot s}}{{\sqrt N }} < \mu  \le \bar x - \frac{{{c_1} \cdot s}}{{\sqrt N }}$

Die Konstanten c1,2 ergeben sich mit der mit der inversen t-Verteilung mit N - 1 Freiheitsgraden zu


${c_1} = {F^{ - 1}}\left( {0.025} \right) =  - 2.0227$


${c_2} = {F^{ - 1}}\left( {0.975} \right) = {\rm{2}}{\rm{.0227}}$



Damit lautet der Konfidenzbereich für den Mittelwert 

${\rm{18}}{\rm{.7868}}\,\,mm < \mu  \le {\rm{20}}{\rm{.3768}}\,\,mm$



In [2]:
'''Konfidenzbereiche des Mittelwerts'''
c1=t.ppf(0.025,df=N-1)
c2=t.ppf(0.975,df=N-1)
mu_min=dataquer-((c2*s)/np.sqrt(N))
mu_max=dataquer-((c1*s)/np.sqrt(N))

c1,c2, mu_min,mu_max

(-2.0226909117347285, 2.022690911734728, 18.78675669614893, 20.376743303851068)

b) Der Konfidenzbereich der Varianz wird abgeschätzt mit 

$\frac{{{s^2} \cdot \left( {N - 1} \right)}}{{{c_2}}} < {\sigma ^2} \le \frac{{{s^2} \cdot \left( {N - 1} \right)}}{{{c_1}}}$


Dabei ergeben sich die beiden Konstanten ${c_{1,2}}$ aus der inversen Chi-Quadrat-Verteilung mit 
N - 1 = 39 Freiheitsgraden zu

${c_1} = {F^{ - 1}}\left( {0.025} \right) = {\rm{23}}{\rm{.6543}}$

und

${c_2} = {F^{ - 1}}\left( {0.975} \right) = {\rm{58}}{\rm{.1201}}$


Damit lautet das Konfidenzintervall für die Varianz 

$4.1461{\rm{ }}m{m^2} < {\sigma ^2} \le {\rm{10}}{\rm{.1871 }}m{m^2}$

beziehungsweise für die Standardabweichung

${\rm{2}}{\rm{.0362 }}mm < \sigma  \le {\rm{3}}{\rm{.1917 }}mm$


In [3]:
'''Konfidenzbereiche der Kenngrößen'''
C1_v=chi2.ppf(0.025,df=N-1)
C2_v=chi2.ppf(0.975,df=N-1)
v_min=((s**2)*(N-1))/C2_v
v_max=((s**2)*(N-1))/C1_v
s_min=np.sqrt(v_min)
s_max=np.sqrt(v_max)

C1_v, C2_v, v_min, v_max, s_min, s_max

(23.654324557593025,
 58.12005973468633,
 4.146354608031798,
 10.187835924600245,
 2.0362599559073487,
 3.1918389565578407)

c) Der Prognosebereich für zukünftige Stichprobenwerte berechnet sich nach

$\bar x + {c_1} \cdot s \cdot \sqrt {1 + \frac{1}{N}}  < x \le \bar x + {c_2} \cdot s \cdot \sqrt {1 + \frac{1}{N}} \$



Wie unter Teil a) werden die Konstanten c1,2 mit der inversen t-Verteilung mit N - 1 = 39 Freiheitsgraden berechnet. Es ergibt sich ein Prognosebereich für $\gamma  = 99.73\;\% $  von

${\rm{11}}{\rm{.5180}}\,\,mm < x \le {\rm{27}}{\rm{.6455}}\,\,mm$



In [4]:
''' Prognoseintervall zukünftige Stichprobenwerte'''
c1_prog=t.ppf(0.00135,df=N-1)
c2_prog=t.ppf(0.99865,df=N-1)
Prog_min=dataquer + c1_prog*s*np.sqrt(1+(1/N))
Prog_max=dataquer + c2_prog*s*np.sqrt(1+(1/N))

Prog_min , Prog_max

(11.517975832646284, 27.64552416735374)