# Probability, Odds & Likelihood: Key Concepts

| Concept                              | Formula                                                                                  | Range                                | Example                                                                                              | Interpretation                                                                                                                           |
| ------------------------------------ | ---------------------------------------------------------------------------------------- | ------------------------------------ | ---------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------- |
| **Probability (Wahrscheinlichkeit)** | $P = \frac{\#\text{successes}}{\#\text{total}}$                                          | $0 \to 1$                            | Beim Würfeln eine 6 zu werfen:<br>$P(6) = \frac{1}{6} \approx 0.1667 \approx 16{,}7\%$               | “16,7% chance that a 6 occurs.” → misst, **wie _häufig_ ein Ereignis eintritt**.                                                           |
| **Odds (Quoten)**                    | $O = \frac{P(\text{Erfolg})}{1 - P(\text{Erfolg})}$                                      | $0 \to \infty$                       | $\text{Odds}(6) = \frac{1/6}{5/6} = 1/5 = 0.2$                                                        | “1 Erfolg pro 5 Misserfolge.” → misst das **_Verhältnis_ ‘Erfolg’ vs. ‘kein Erfolg’**.                                                    |
| **Log-Odds (Logit)**                 | $\text{logit}(P) = \ln\!\left(\frac{P}{1 - P}\right)$                                    | $-\infty \to \infty$                 | $\ln(0.2) = -1.609$                                                                                  | Wird von logistischer Regression verwendet → macht das Modell **linear**.                                                               |
| **Likelihood (Likelihood-Funktion)** | $\mathcal{L}(\theta \mid x) = P(x \mid \theta)$ (als Funktion von $\theta$)             | $0 \to \infty$ (kein oberes Limit)   | Münze zeigt in 10 Würfen **7× Kopf**:<br>$\mathcal{L}(p) = p^7 (1-p)^3$                              | **Misst, wie gut ein Parameterwert die beobachteten Daten erklärt.** Keine Wahrscheinlichkeit → dient zum **Parametervergleich (MLE)**.<br>Beispiel: "Wenn ich 7 Köpfe beim Wurf einer "fairen" Münze gesehen habe – wie plausibel ist p=0.5? p=0.7? p=0.9?"|


## Probability
### Example Coin Toss
How likely (wahrscheinlich) is it, that out of 10 tosses of a fair coin, I get heads (H) all the time?

When you flip a fair coin, there are **two possible outcomes**: heads (H) or tails (T).
* Probability of heads on a single flip: $P(H) = 0.5$

**Coin flips are independent events**, the outcome of one flip does not affect the others.

* For independent events, the probability of all events happening is:
$P(A \text{ and } B \text{ and } C …) = P(A) \cdot P(B) \cdot P(C) \cdot …$

You want heads on all 10 flips:

$P(\text{10 heads}) = P(H)^1 \cdot P(H)^2 \cdot … \cdot P(H)^{10} = (0.5)^{10}$

$(0.5)^{10} = \frac{1}{2^{10}} = \frac{1}{1024} \approx 0.0009766$

### Example dataset
Assume a dataset:
* 10000 values
* 30% of the values are 1
* 70% are 0

If I pick randomly a value out of the dataset, how LIKELY is it, I pick 1 vs. 0?

**Step 1: What we know**
* Total number of observations: $N = 10{,}000$
* Fraction of ones (class 1): $30\% = 0.3$
* Fraction of zeros (class 0): $70\% = 0.7$

**Step 2: Express as probabilities**
When you draw a single item at random from the dataset, you’re sampling from a **discrete distribution**.

$P(1) = \frac{\text{\# of ones}}{N} = \frac{0.3 \times 10{,}000}{10{,}000} = 0.3$

$P(0) = \frac{\text{\# of zeros}}{N} = \frac{0.7 \times 10{,}000}{10{,}000} = 0.7$

**Result:**
* Chance of picking a 1 = 30%
* Chance of picking a 0 = 70%

### Wahrscheinlichkeit: Binomialbeispiel

**Frage:**  
Wenn die Münze fair ist ($p = 0,5$), wie wahrscheinlich ist es, genau 7 Köpfe in 10 Würfen zu beobachten?

Das ist ein **Binomialproblem**. Die Formel lautet:

$P(X=7 \mid p) = \binom{10}{7} \, p^7 (1-p)^3$

**Schritt 1 — Kombinationsfaktor**

$\binom{10}{7} = \frac{10!}{7! \, 3!} = \frac{10 \cdot 9 \cdot 8 \cdot 7!}{7! \cdot (3 \cdot 2 \cdot 1)} = \frac{720}{6} = 120$


**Schritt 2 — Potenzen für $p = 0.5$**

$p^7 = 0.5^7 = 0.5 \cdot 0.5 \cdot 0.5 \cdot 0.5 \cdot 0.5 \cdot 0.5 \cdot 0.5 = \frac{1}{128} = 0.0078125$

$(1-p)^3 = 0.5^3 = 0.5 \cdot 0.5 \cdot 0.5 = \frac{1}{8} = 0.125$


**Schritt 3 — Produkt der Potenzen**

$p^7 (1-p)^3 = 0.0078125 \times 0.125 = 0.0009765625$


**Schritt 4 — Mit dem Kombinationsfaktor multiplizieren**

$P(X=7 \mid p=0.5) = 120 \times 0.0009765625 = 0.1171875$

**Ergebnis in Prozent:**

$0.1171875 \approx 11.71875\% \approx 11.72\%$

**Interpretation:**  
Wenn die Münze fair ist, ist die Wahrscheinlichkeit, genau 7 Köpfe in 10 Würfen zu bekommen, ca. **11,72%**.


## Odds
Sometimes, especially in logistic regression, we use odds instead of probabilities.

$\text{Odds of 1} = \frac{P(1)}{P(0)} = \frac{0.3}{0.7} = 0.4286$

**These odds mean:**
“For every 1 that appears, about 2.33 zeros appear” (because 1 / 0.4286 ≈ 2.33).

**And the log-odds would be:**
$\text{logit}(P(1)) = \ln\left(\frac{P(1)}{P(0)}\right) = \ln(0.4286) = -0.847$

## Probability vs. Likelihood

> **Wahrscheinlichkeit sagt:**
> Wenn ich wüsste, wie die Welt ist, wie wahrscheinlich wären diese Daten?

> **Likelihood sagt:**
> Da ich diese Daten gesehen habe — wie wahrscheinlich ist eine bestimmte Version der Welt?