# Wachstum von *Escherichia coli* bei verschiedenen Temperaturen

In diesem Notebook untersucht ihr, wie sich die Wachstumsgeschwindigkeit von *Escherichia coli* unter verschiedenen Temperaturen verändert.  
Ihr werdet Daten **simulieren**, **analysieren** und **interpretieren**.

👉 Das Notebook richtet sich an Studierende ohne Programmiererfahrung.

## Ziele
- Simulation mikrobiologischer Daten
- Deskriptive Statistik (Mittelwert, Standardabweichung)
- Datenvisualisierung (Boxplots)
- Auswahl und Durchführung geeigneter statistischer Tests (t-Test, ANOVA)


In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from itertools import combinations

sns.set(style="whitegrid")


## 1. Parameter setzen

Bitte wählt hier die Temperaturen aus, die ihr untersuchen wollt, und die Anzahl an Replikaten (Wiederholungen) pro Temperatur.


In [None]:
# Beispielwerte – ihr könnt sie anpassen
temperaturen = [30, 37, 42]  # <- Liste von Temperaturen in °C
anzahl_replikate = 3         # <- Anzahl biologischer Replikate


## 2. Datensimulation

Basierend auf eurer Auswahl simulieren wir OD600-Werte nach 8 Stunden Wachstum.


In [None]:
np.random.seed(42)
daten = []

for temp in temperaturen:
    if temp == 37:
        mittelwert = 1.0
    elif temp < 37:
        mittelwert = 0.7 - 0.05 * abs(37 - temp)
    else:
        mittelwert = 0.6 - 0.07 * abs(37 - temp)
        
    for _ in range(anzahl_replikate):
        wert = np.random.normal(loc=mittelwert, scale=0.05)
        daten.append({"Temperatur": temp, "OD600": max(wert, 0)})

df = pd.DataFrame(daten)
df.head()


## 3. Deskriptive Statistik und Visualisierung

Wie sieht das Wachstum bei den verschiedenen Temperaturen aus?


In [None]:
print("Deskriptive Statistik:")
print(df.groupby("Temperatur")["OD600"].agg(["mean", "std"]))

plt.figure(figsize=(8,5))
sns.boxplot(x="Temperatur", y="OD600", data=df)
plt.title("Wachstum von E. coli bei verschiedenen Temperaturen")
plt.ylabel("OD600 nach 8 Stunden")
plt.xlabel("Temperatur (°C)")
plt.show()


## 4. Statistische Analyse

🧠 Überlegt zuerst selbst:  
- Habt ihr **zwei Gruppen**? → t-Test  
- Habt ihr **mehr als zwei Gruppen**? → ANOVA

Danach führen wir eine ANOVA sowie t-Tests durch:


In [None]:
gruppen = [df[df["Temperatur"] == temp]["OD600"] for temp in temperaturen]
F, p = stats.f_oneway(*gruppen)
print(f"ANOVA: F = {F:.2f}, p = {p:.4f}")

print("\nPaarweise t-Tests:")
for t1, t2 in combinations(temperaturen, 2):
    gruppe1 = df[df["Temperatur"] == t1]["OD600"]
    gruppe2 = df[df["Temperatur"] == t2]["OD600"]
    t_stat, p_val = stats.ttest_ind(gruppe1, gruppe2)
    print(f"{t1}°C vs {t2}°C: t = {t_stat:.2f}, p = {p_val:.4f}")


## 5. Reflexion

Diskutiert in der Gruppe:
- Welche Temperatur zeigte das beste Wachstum?
- Waren die Unterschiede statistisch signifikant?
- Was könnten biologische Gründe für die Unterschiede sein?
