# Statistik I für Naturwissenschaftler*innen: Übungsblatt 3

Bitte beachten Sie: in der Online-Klausur werden Sie nicht nach Rechenwegen gefragt werden. Die Angabe von numerisch korrekten Ergebnissen reicht dort aus. Insofern macht es Sinn, dass Sie sich zur Zeitersparnis mit Python vertraut machen.

## Aufgabe 1

Bei einer Untersuchung von Waldbäumen wurde festgestellt, dass 35% der Bäume einer bestimmten Art von einem Pilz befallen sind. Wenn wir zufällig 100 Bäume untersuchen, wie hoch ist dann die Wahrscheinlichkeit, dass genau 30 Bäume befallen sind?

## Aufgabe 2

Folgende Tabelle zeigt die empirische Verteilung der Studiengänge zufällig ausgewählter Teilnehmer*innen an einer geographischen Exkursion:

| Studiengang $k$ | Geographie      | Umweltwissenschaften     | Geologie      | Biologie      | Humanbiologie      | Andere      |
|----------------|--------|--------|--------|--------|--------|--------|
| $P(X = k)$       | 0.35 | 0.25 | 0.15 | 0.12 | 0.08 | 0.05 |

   a) Wie hoch ist die Wahrscheinlichkeit, dass eine zufälliger Teilnehmer*in Geographie oder Umweltwissenschaft studiert?
   
   b)Wie hoch ist die Wahrscheinlichkeit, dass eine Teilnehmerin entweder Geologie, Biologie oder Humanbiologie studiert?
 

## Aufgabe 3

Eine Zufallsvariable $X$ ist stetig gleichverteilt auf dem Intervall von 0 bis 20.

   a) Geben Sie die Dichtefunktion an

   b) Bestimmten Sie die Wahrscheinlichkeit $P(3.5 < X \leq 9)$
   

## Aufgabe 4

In diesem Ordner finden Sie eine Tabelle der Flächeninhalte unter dem Graphen der Standardnormalverteilung (normal_quantile_table.csv). Nutzen Sie diese Tabelle (oder die aus dem Vorlesungsskript zu Themenblock 3), um folgende Werte anzugeben:

  a) Das 75\%-Quantil: $\tilde{z}_{0.75}$
  
  b) Den Flächeninhalt unter der Dichtefunktion auf dem Intervall von $z = 0.99$ bis $z = 1.44$: $P(0.99 < Z \leq 1.44)$
  
  c) Das 3\%-Quantil: $\tilde{z}_{0.03}$
  
  d) Den Flächeninhalt unter der Dichtefunktion auf dem Intervall von $z = -\infty$ bis $z = -2$: $P(Z \leq -2)$

Üben Sie außerdem den Umgang mit Python, insbesondere mit den Methoden `cdf()` und `ppf()`.

## Aufgabe 5

In einer klinischen Studie wurden 600 Patienten mit einer bestimmten Erkrankung untersucht:

* 320 Patienten erhielten das neue Medikament A
* 280 Patienten erhielten das Standardmedikament B
* Von den Medikament A-Patienten zeigten 48 Nebenwirkungen
* Von den Medikament B-Patienten zeigten 42 Nebenwirkungen

Hängt die Wahrscheinlichkeit für Nebenwirkungen von der Art der Medikation ab?

# Code zum Generieren der Quantils-Tabelle (Normalverteilung)

In [None]:
import pandas as pd
import numpy as np
import scipy.stats as stats

def generate_normal_quantile_table(filename="normal_quantile_table.csv"):
    """
    Generates a normal quantile table with rows ranging from 0.0 to 2.9 in steps of 0.1
    and columns ranging from 0 to 9, and exports it to a CSV file.
    Rows are labeled with Z-scores in 0.0, 0.1, ..., 2.9 format.
    Probabilities are rounded to **five decimal places**.
    """

    # Define first and second decimal ranges
    first_decimals = np.arange(0.0, 3.0, 0.1)  # 0.0, 0.1, ..., 2.9
    second_decimals = np.arange(0, 10)         # 0, 1, ..., 9

    # Initialize a 2D list to hold the data
    data = []

    for first in first_decimals:
        row_data = []
        for second in second_decimals:
            # Correct Z-score: first (tenths) + second (hundredths)
            z = first + second / 100
            cdf = round(stats.norm.cdf(z), 5)  # Round to 5 decimal places
            row_data.append(cdf)
        data.append(row_data)

    # Create the DataFrame
    df = pd.DataFrame(data, columns=second_decimals)
    df.index = [f"{x:.1f}" for x in first_decimals]  # Format index to 1 decimal place
    df.index.name = "z \ *"  # Fixed: No backslash needed
    df.columns.name = "Second Decimal"

    # Export to CSV
    df.to_csv(filename)

    return df

# Generate the table and export it
quantile_table = generate_normal_quantile_table()
print("Table generated and exported to normal_quantile_table.csv")