# **Datenanalyse Hypotesentests & statistische Prozesskontroller (SPC)**
#### *Autoren: Marcel Kattirs & Yatheesh Sugumar*
#### 22.12.2025

## **Einleitung in das Thema**

In vielen Industriebranchen, zum Beispiel in der Automobil‑, Elektronik‑ oder Lebensmittelproduktion, werden Produkte in großen Stückzahlen hergestellt. Schon kleine Schwankungen im Produktionsprozess können zu Ausschuss, Nacharbeit oder Qualitätsproblemen beim Kunden führen, weshalb eine systematische und frühzeitige Überwachung der Prozessqualität notwendig ist.

Statistische Prozesskontrolle (Statistical Process Control, SPC) nutzt Methoden der Statistik, um Produktionsprozesse laufend anhand von Messdaten zu beobachten und zu steuern. Dabei werden Qualitätskennzahlen wie Mittelwerte, Spannweiten oder Ausschussanteile in sogenannten Kontrollkarten dargestellt, die neben einer Mittellinie auch obere und untere Eingriffsgrenzen enthalten; Überschreitungen dieser Grenzen oder charakteristische Muster deuten auf besondere Störeinflüsse hin und signalisieren, dass der Prozess nicht mehr stabil ist.

Ergänzend dazu ermöglichen Hypothesentests eine formale Bewertung von Prozessänderungen. Mit statistischen Tests wie dem t‑Test und der Varianzanalyse (Analysis of Variance, ANOVA) lässt sich prüfen, ob sich Kenngrößen eines Prozesses – etwa der Mittelwert einer Qualitätsmessgröße – nach einer Änderung tatsächlich signifikant verändert haben oder ob beobachtete Unterschiede auch durch zufällige Schwankungen erklärbar sind.

Ziel dieses Notebooks ist es, die grundlegenden Ideen von Hypothesentests (t‑Test und ANOVA) und statistischer Prozesskontrolle zu erläutern und anhand eines Datensatzes zu demonstrieren, wie sich beide Ansätze kombinieren lassen, um Prozessänderungen in der industriellen Qualitätssicherung zu bewerten. Als theoretische Grundlage dient insbesondere das Lehrbuch „Introduction to Statistical Quality Control“ von Douglas C. Montgomery, das SPC und Control Charts als Standardwerk umfassend beschreibt.
​

## **Theoretische Grundlagen**
#### Mathematische und statistische Herleitung

Ein Hypothesentest prüft mit Hilfe einer Stichprobe eine Aussage über die Grundgesamtheit. Die **Nullhypothese $H_0$** beschreibt typischerweise "kein Unterschied", z.B. $ \mu_1 = \mu_2 $ (Mittelwerte zweier Prozesse sind gleich). Die **Alternativhypothese $H_1$** beschreibt den interessierenden Effekt, z.B. $ \mu_1 \neq \mu_2 $ [1, Kap. 10].
 

Aus den Stichprobendaten wird eine **Teststatistik $T$** berechnet, die unter $H_0$ einer bekannten Verteilung folgt. Der **p-Wert** ist die Wahrscheinlichkeit, unter $H_0$ einen mindestens so extremen Wert beobachten: $$ p = P(T \geq t_{obs} | H_0) $$
Liegt $ p < \alpha $ (häufig $\alpha = 0{,}05$), wird $H_0 $ verworfen [1, S.456-460].

t-Test (Welch-t-Test für ungleiche Varianzen):

Für zwei unabhängige Stichproben $ X_1, \dots, X_{n_1}$ und $Y_1, \dots, Y_{n_2} $ mit den Mittelwerten $\bar{X}, \bar{Y}$ und Varianzen $s_X^2, s_Y^2$: $$ t = \frac{\bar{X} - \bar{Y}}{\sqrt{\frac{s_X^2}{n_1} + \frac{s_Y^2}{n_2}}} $$
$t$ folgt ungefähr einer t-Verteilung [1, S. 458].

ANOVA (einfaktoriell):
Bei *k* Gruppen zerlegt ANOVA die Gesamtvarianz: $$ SS_gesamt = SS_B + SS_W $$
F-Statistik: $$ F = \frac{MS_B}{MS_W} = \frac{SS_B / (k-1)}{SS_W / (N-k)} $$
$F$ folgt einer F-Verteilung mit $ (k-1, N-k) $ Freiheitsgraden [1, Kap. 10].

#### Zentrale Begriffe und Modelle

##### Hypothesentests
- **Nullhypothese** $H_0$: "kein Unterschied" – z.B. $H_0: \mu_1 = \mu_2$ [1, Kap. 10]
- **Alternativhypothese** $H_1$: "Unterschied vorhanden" – z.B. $H_1: \mu_1 \neq \mu_2$ [1, S. 456]
- **Signifikanzniveau** $\alpha = 0{,}05$: Fehler 1. Art (5%) [1, S. 457]
- **p-Wert**: $p < \alpha$ → $H_0$ verwerfen [1, S. 458]


##### t-Test
- **Anwendung**: 2 Gruppen (vorher/nachher) [1, S. 458]
- **Annahmen**: Normalverteilt, unabhängig
- **Welch-t-Test**: Ungleiche Varianzen $s_X^2 \neq s_Y^2$ [1] [2]
- **Interpretation**: $p < 0{,}05$ → signifikant


##### ANOVA
- **Anwendung**: ≥3 Gruppen (Maschine A/B/C) [1, Kap. 10]
- **Zerlegung**: $SS_{\text{gesamt}} = SS_B + SS_W$
- **F-Statistik**: $F = \frac{MS_B}{MS_W}$ [1, S. 460]


##### Statistische Prozesskontrolle (SPC)
- **Zufällige Ursachen**: Normale Schwankung [1, S. 5]
- **Spezielle Ursachen**: Maschine defekt [1, S. 6]
- **Phase I/II**: Stabilisieren/Überwachen [1, Kap. 5]

##### Control Charts
| Chart | Datenart | Überwacht | Center Line | Grenzen |
|-------|----------|-----------|-------------|---------|
| **X̄** | Stetig | Mittelwert | $\bar{\bar{X}}$ | $\bar{\bar{X}} \pm A_2 \bar{R}$ [1] |
| **R** | Stetig | Streuung | $\bar{R}$ | $D_3 \bar{R}$ bis $D_4 \bar{R}$ [1] |
| **p** | Attribut | Ausschuss | $\bar{p}$ | $\bar{p} \pm 3\sqrt{\frac{\bar{p}(1-\bar{p})}{n}}$ [1] |

#### Literaturbezug

**Montgomery (2013)**: SPC-Grundlagen [Kap. 1], Control Charts [Kap. 5], Hypothesentests [Kap. 10] **[1]**

**Ruxton (2006)**: Welch-t-Test für ungleiche Varianzen **[2]**

**Literatur:**
[1] Montgomery, D. C. (2013). *Introduction to Statistical Quality Control* (7th ed.). Wiley.  
[2] Ruxton, G. D. (2006). *Behavioral Ecology*, 17(1), 688-690

## **Praktischer Teil (Code)**

In [None]:
# HIER IST PYTHON CODE (PLATZHALTER)

## **Diskussion / Fazit**

#### Bewertung der Methode, Grenzen, Ausblick

*PLATZHALTER*

## **Literaturverzeichnis**

*PLATZHALTER*