In dieser Mini-Challenge untersuchen wir, ob ein Block die Wahrscheinlichkeit, einen Wurf im Basketball zu treffen, reduziert. Dazu vergleichen wir die Trefferwahrscheinlichkeit bei Würfen mit Block und ohne Block.

Unser Ziel ist, die Hypothese zu testen, dass ein Block einen negativen Einfluss auf die Wurfquote hat.

## 1) Daten Sammlung

Wir haben unsere eigene Daten gesammelt in einem Spiel mit drei Spieler.
![Hits vs Blocks](plots/player_hits_blocks.png)
![Throws Blocked](plots/throws_blocked.png)
![Throws by Type](plots/throws_by_type.png)

### a) Ereignisräume

#### &#10022; Zufallsexperiment
Wir wählen zufällig **einen Wurf** aus dem Datensatz aus und beobachten, ob dieser **getroffen oder verfehlt** wurde.
Zusätzlich wird vermerkt, ob der Wurf **geblockt** wurde und welche **Wurfart** (z. B. Wurf, Layup, 3er-Wurf) vorlag.

#### &#10022; Ereignisraum
$$
\Omega = \text{(Ja, Nein)} \in \text{Block} \times \text{(Wurf, Lay-up, 3-Wurf)} \in \text{Wurfart} \times \text{(Alexis, Jakov, Loukas)} \in \text{Spieler}
$$
$$|\Omega| = 2 \times 3 \times 3 = 18$$


Der Ereignisraum Ω enthält alle möglichen Ergebnisse eines Versuchs, bei dem Block, Wurfart und Spieler gleichzeitig festgelegt werden. Jedes Element von Ω ist also ein Tripel (Block,Wurfart,Spieler), das einen vollständig bestimmten Ausgang beschreibt.

#### &#10022; Zufallsvariable
- **Punkten** = {0,2,3}

#### &#10022; Ziel der Analyse
Wir wollen prüfen, ob **Blocken die Trefferwahrscheinlichkeit senkt**, also ob gilt:

$$
P(\text{Treffer} \mid \text{Block}) < P(\text{Treffer} \mid \text{kein Block})
$$

Wenn dieser Unterschied statistisch signifikant ist, bedeutet das, dass ein Block tatsächlich einen negativen Einfluss auf die Trefferquote hat.

## 2) Wahrscheinlichkeit

Für unsere Arbeit haben wir uns entschieden die Binomialverteilung anzuwenden, die die Erstellung eines einfachen Modells ermöglicht. Die Binomialverteilung beschreibt die Anzahl von Treffern bei einer Anzahl an Wiederholungen $n$, wobei es nur **Treffer und Niete** gibt und die Wahrscheinlichkeit bleibt **konstant**.

$$P(x) = \binom{n}{x}\,*p^x*(1-p)^{n-x}$$
-   $x$ = Erfolgreiche Treffer
-   $n$ = Anzahl Versuche
-   $p$ = Konstante Wahrscheinlichkeit

### a) Wahrscheinlichkeit p per Spieler berechnen

In [None]:
import importlib
import spielerstats
import binomialverteilung_ultis

# reload
importlib.reload(binomialverteilung_ultis)
importlib.reload(spielerstats)
from spielerstats import get_player_stats
from binomialverteilung_ultis import binomial_pmf

# Alexis
print(get_player_stats("Alexis"))

# Beispiel Alexis' Wahrscheinlichkeit 5 von 10 Würfen zu treffen ohne Blocks
wahrscheinlichkeit1 = binomial_pmf(5, 10, 0.2) * 100
print(f"Alexis macht 10 Würfe ohne Block. Was ist die Wahrscheinlichkeit 5 von den zu treffen? {wahrscheinlichkeit1:.2f}%")

# Jakov
print(get_player_stats("Jakov"))

# Beispiel Jakovs Wahrscheinlichkeit 5 von 10 Würfen zu treffen ohne Blocks
wahrscheinlichkeit2 = binomial_pmf(5, 10, 0.16) * 100
print(f"Jakov macht 10 Würfe ohne Block. Was ist die Wahrscheinlichkeit 5 von den zu treffen? {wahrscheinlichkeit2:.2f}%")

# Loukas
print(get_player_stats("Loukas"))

# Beispiel Loukas' Wahrscheinlichkeit 5 von 10 Würfen zu treffen ohne Blocks
wahrscheinlichkeit3 = binomial_pmf(5,10,0.25) * 100
print(f"Loukas macht 10 Würfe ohne Block. Was ist die Wahrscheinlichkeit 5 von den zu treffen? {wahrscheinlichkeit3:.2f}%")

Obwohl die Trefferquoten darauf hindeuten, dass Blocken die Wurfleistung verschlechtert, reicht eine rein deskriptive Betrachtung nicht aus. Ein statistischer Test ist notwendig, um zu beurteilen, ob der beobachtete Unterschied zufällig entstanden sein könnte, insbesondere bei kleinen Stichproben wie in unserem Datensatz.

### b) Hypothesentest

Ziel ist es zu testen, ob ein Block die Trefferwahrscheinlichkeit eines Wurfes reduziert. Dazu vergleichen wir die Trefferhäufigkeiten aus zwei Gruppen:

- Würfe **ohne Block**
- Würfe **mit Block**

Da in unserem Datensatz sehr wenige blockierte Würfe vorliegen, eignet sich der **Fisher-Exact-Test**. Dieser Test ist speziell für kleine Stichproben und Tabellen mit wenigen Ereignissen entwickelt worden und funktioniert auch dann, wenn eine Kategorie sehr selten oder sogar Null ist (z.B. kein Treffer unter Block).

Wir betrachten dazu eine 2×2-Kontingenztafel:

|                | Treffer | Fehlwurf |
|----------------|--------:|---------:|
| ohne Block     |    a    |    b     |
| mit Block      |    c    |    d     |

Die Hypothesen lauten:

- $H_0: p_{block} = p_{no-block}$
  (Block hat keinen Einfluss auf die Trefferwahrscheinlichkeit)

- $H_1: p_{block} < p_{no-block}$
  (Block reduziert die Trefferwahrscheinlichkeit)

Da geprüft wird, ob Blocken die Trefferquote **senkt**, wird ein **einseitiger** Fisher-Exact-Test verwendet.

Wenn der p-Wert kleiner als 0.05 ist, gibt es statistisch signifikante Evidenz dafür, dass ein Block die Wahrscheinlichkeit eines erfolgreichen Wurfs reduziert.

Der Test basiert auf der hypergeometrischen Verteilung. Für die oben dargestellte 2×2-Tabelle berechnet sich die Wahrscheinlichkeit unter $H_0$ wie folgt:

$$p_{Wert} = \frac{\binom{a+b}{a} \cdot \binom{c+d}{c}}{\binom{a+b+c+d}{a+c}}$$


Der p-Wert ergibt sich durch Summation aller Tabellen, die mindestens so viele Fehlwürfe unter Block zeigen wie die beobachtete Tabelle.

### Interpretation von p-Werten

| p-Wert-Bereich               | Bedeutung                       | Interpretation im Kontext | Schlussfolgerung |
|------------------------------|---------------------------------|--------------------------|------------------|
| $p_{wert} < 0,01$            | sehr starke Evidenz gegen $H_0$ | Blocken reduziert Trefferwahrscheinlichkeit **sehr wahrscheinlich** | Effekt ist statistisch hochsignifikant |
| $0,01 \le p_{wert} < 0,05$   | moderate Evidenz gegen $H_0$    | Hinweis darauf, dass Blocken die Trefferwahrscheinlichkeit reduziert | Effekt ist statistisch signifikant |
| $0,05 \le p_{wert} < 0{,}10$ | schwache Evidenz                | mögliches Signal, aber **unsicher** | Trend, aber **nicht signifikant** |
| $p_{wert} \ge 0,10$          | keine Evidenz                   | Daten unterstützen keinen Block-Effekt | Kein signifikanter Effekt nachweisbar |

In [None]:
import importlib
import fisher_hypothesentest

# reload
importlib.reload(fisher_hypothesentest)
from fisher_hypothesentest import fisher_hypothesentest

print("Gibt es eine Signifikante Unterschied zwischen Alexis' Wahrscheinlichkeit ein Wurf zu treffen Ohne oder Unten Block?", fisher_hypothesentest("Alexis", "Wurf"))
print("Gibt es eine Signifikante Unterschied zwischen Alexis' Wahrscheinlichkeit ein Lay-up zu treffen Ohne oder Unten Block?", fisher_hypothesentest("Alexis", "Lay-up"))
print("Gibt es eine Signifikante Unterschied zwischen Alexis' Wahrscheinlichkeit ein 3-Wurf zu treffen Ohne oder Unten Block?", fisher_hypothesentest("Alexis", "3-Wurf"))
print("Gibt es eine Signifikante Unterschied zwischen Loukas' Wahrscheinlichkeit ein Wurf zu treffen Ohne oder Unten Block?", fisher_hypothesentest("Loukas", "Wurf"))
print("Gibt es eine Signifikante Unterschied zwischen Loukas' Wahrscheinlichkeit ein Lay-up zu treffen Ohne oder Unten Block?", fisher_hypothesentest("Loukas", "Lay-up"))
print("Gibt es eine Signifikante Unterschied zwischen Loukas' Wahrscheinlichkeit ein 3-Wurf zu treffen Ohne oder Unten Block?", fisher_hypothesentest("Loukas", "3-Wurf"))
print("Gibt es eine Signifikante Unterschied zwischen Jakovs Wahrscheinlichkeit ein Wurf zu treffen Ohne oder Unten Block?", fisher_hypothesentest("Jakov", "Wurf"))
print("Gibt es eine Signifikante Unterschied zwischen Jakovs Wahrscheinlichkeit ein Lay-up zu treffen Ohne oder Unten Block?", fisher_hypothesentest("Jakov", "Lay-up"))
print("Gibt es eine Signifikante Unterschied zwischen Jakovs Wahrscheinlichkeit ein 3-Wurf zu treffen Ohne oder Unten Block?", fisher_hypothesentest("Jakov", "3-Wurf"))

### Ergebnisse des Fisher-Exact-Tests

| Spieler | Wurfart | p-Wert | Fazit |
|--------|---------|-------|-------|
| Alexis | Wurf | — | kein Hinweis auf Block-Effekt |
| Alexis | Lay-up | — | kein Hinweis auf Block-Effekt |
| Alexis | 3-Wurf | — | kein Hinweis auf Block-Effekt |
| Loukas | Wurf | 1 | kein Hinweis auf Block-Effekt |
| Loukas | Lay-up | 1 | kein Hinweis auf Block-Effekt |
| Loukas | 3-Wurf | — | kein Hinweis auf Block-Effekt |
| Jakov | Wurf | 1 | kein Hinweis auf Block-Effekt |
| Jakov | Lay-up | — | kein Hinweis auf Block-Effekt |
| Jakov | 3-Wurf | — | kein Hinweis auf Block-Effekt |

Die Analyse ergab in keiner Kombination aus Spieler und Wurfart statistisch signifikante Unterschiede. Ursache ist die sehr geringe Anzahl blockierter Würfe, wodurch keine ausreichende Teststärke vorliegt, um Effekte nachweisen zu können

### c) Einfluss der Pässe auf den Versuch
Um vorherzusagen, ob ein Wurf geblockt wird, berechnen wir die Wahrscheinlichkeit eines Blocks abhängig von der Anzahl der Pässe vor dem Wurf.

**a) Blockwahrscheinlichkeit für eine bestimmte Passanzahl**

Für eine gegebene Anzahl von passen $k$ berechnen wir:
$$P(Block|Pässe = k) = \frac{Anzahl~der~geblockten~Würfe~mit~k~Pässen}{Gesamtzahl~der~Würfe~mit~k~Pässen}$$
Diese Wahrscheinlichkeit zeigt, wie oft in der Vergangenheit nach k Pässen ein Block passiert ist.

**b) Gesamte Blockwahrscheinlichkeit als Fallback**

Falls für eine bestimmte Passanzahl $k$ keine Daten vorliegen, verwenden wir die allgemeine historische Blockrate:
$$P_{gesamt}= \frac{Anzahl~aller~geblockten~Würfe}{Gesamtzahl~aller~Würfe}$$
Dieser Wert dient als Ersatzwahrscheinlichkeit.

**c) Auswahl der verwendeten Wahrscheinlichkeit**

Die endgültige Wahrscheinlichkeit, dass der aktuelle Wurf geblockt wird, ist:
$$
\hat{P} =
\begin{cases}
P(\text{Block} \mid \text{Pässe}=k), & \text{wenn Daten für } k \text{ existieren}, \\[6pt]
P_{\text{gesamt}}, & \text{sonst}.
\end{cases}
$$

**d) Entscheidungsregel**

Ob ein Block vorhergesagt wird, hängt vom gewählten Schwellenwert τ (z.B. τ = 0.5) ab:
$$
\text{Vorhersage} =
\begin{cases}
\text{Block}, & \hat{P} \ge \tau, \\[6pt]
\text{Kein Block}, & \hat{P} < \tau .
\end{cases}
$$




In [None]:
import importlib
import pässengegenblock

# reload
importlib.reload(pässengegenblock)
from pässengegenblock import predict_block_by_passes

# Zu entscheiden, ob eine Versuch blockiert wird oder nicht haben wir als Schwellenwert τ = 0.5 ausgewählt

print("Wird eine Versuch nach 0 Pässe blockiert?", predict_block_by_passes(0))
print("Wird eine Versuch nach 1 Pass blockiert?", predict_block_by_passes(1))
print("Wird eine Versuch nach 2 Pässe blockiert?", predict_block_by_passes(2))
print("Wird eine Versuch nach 3 Pässe blockiert?", predict_block_by_passes(3, 0.1)) # Der Schwellenwert kann definiert werden
print("Wird eine Versuch nach 4 Pässe blockiert?", predict_block_by_passes(4))
print("Wird eine Versuch nach 5 Pässe blockiert?", predict_block_by_passes(5))

Die Auswertung zeigt, dass die Blockwahrscheinlichkeit von der Anzahl der vorhergehenden Pässe abhängt. Nach sehr wenigen Pässen (0–1) ist das Blockrisiko gering, da die Abschlüsse schneller und für die Defense schwerer vorhersehbar sind. Die höchste Blockrate tritt bei drei Pässen auf, während sie bei vier oder mehr Pässen wieder sinkt, weil längere Ballzirkulation die Defense in Bewegung bringt. Insgesamt ergibt sich ein Muster, bei dem mittlere Passzahlen die grösste Blockgefahr erzeugen. In unserem Datensatz lässt sich dieser Effekt jedoch nur schwach erkennen, da die Stichprobe aufgrund der kurzen Spielzeit bzw. geringen Variabilität begrenzt ist.

## 3) Simulation
Anhand der Berechnungen wird nun eine Simulation entwickelt, die sowohl die individuelle Trefferwahrscheinlichkeit der Spieler als auch die Blockwahrscheinlichkeit berücksichtigt. In der Simulation kann man zwei Teams definieren, die jeweiligen Spieler zuordnen und festlegen, wie jedes Team seine 100 Versuche auf die Spieler aufteilen soll, um die beste Gewinnchance zu erreichen. Somit können wir viele verschiedene Strategien ausprobieren.

**a) Die Wahrscheinlichkeit**

Die Simulation liefert zwei Arten von Ergebnissen: **Das erwartete Ergebnis (theoretisch)** auf Basis der Wahrscheinlichkeiten und ein **Monte-Carlo-Ergebnis (simuliert) mit Zufallsvariabilität.

**1. Blockwahrscheinlichkeit aus den Pässen**

Zuerst wird bestimmt, wie wahrscheinlich es ist, dass ein Wurfversuch geblockt wird:
$$
\hat{P} =
\begin{cases}
P(\text{Block} \mid \text{Pässe}=k), & \text{wenn Daten für } k \text{ existieren}, \\[6pt]
P_{\text{gesamt}}, & \text{sonst}.
\end{cases}
$$
Dies liefert eine **Blockwahrscheinlichkeit**, abhängig von der Anzahl der Pässe.

**2. Trefferwahrscheinlichkeit des Spielers (mit und ohne Block)**

Aus den Spielerstatistiken werden zwei weitere Wahrscheinlichkeiten bestimmt:
- $p_{ob}$ = Trefferwahrscheinlichkeit **ohne Block**
- $p_b$ = Trefferwahrscheinlichkeit **unter Block**
$$P(x) = \binom{n}{x}\,*p^x*(1-p)^{n-x}$$

**3. Wie kombiniert das Modell die Wahrscheinlichkeiten?**

Die zentrale Grösse ist die effektive Trefferwahrscheinlichkeit eines Wurfversuchs:
$$p_{eff} = (1-P(Block)) * p_{nb} + P(Block) * p_b$$

Die Gesamtwahrscheinlichkeit eines Treffers ist daher das gewichtete Mittel der beiden Trefferwahrscheinlichkeiten.

$$\textbf{Beispiel: Effektive Trefferwahrscheinlichkeit bei 3 Pässen}$$

Aus dem Datensatz ergibt sich für drei Pässe die Blockwahrscheinlichkeit
$$P(\text{Block} \mid \text{Pässe}=3) = 0.167.$$

Für einen Spieler mit
$$p_{nb} = 0.40 \quad \text{(Trefferwahrscheinlichkeit ohne Block)}$$

$$p_{b} = 0.05 \quad \text{(Trefferwahrscheinlichkeit unter Block)}$$

ergibt sich die effektive Trefferwahrscheinlichkeit durch die gewichtete Kombination der beiden Fälle:

$$p_{\text{eff}}= (1 - P(\text{Block})) \cdot p_{nb} + P(\text{Block}) \cdot p_{b}.$$

Einsetzen der Werte:
$$p_{\text{eff}} = (1 - 0.167)\cdot 0.40  + (0.167)\cdot 0.05.$$

Rechnung der beiden Anteile:
$$0.833 \cdot 0.40 = 0.3332$$

$$0.167 \cdot 0.05 = 0.00835$$

Damit ergibt sich:
$$p_{\text{eff}} = 0.3332 + 0.00835 = 0.34155.$$

$$\boxed{p_{\text{eff}} \approx 0.342}$$

Der Spieler trifft also im Mittel zu etwa $34.2\%$, obwohl seine ungebockte Trefferquote $40\%$ beträgt.


**4. Erwartete Treffer (basiert auf der Binomialverteilung)**

Wenn ein Spieler $n$ Versuche hat, ist die Trefferzahl binomialverteilt:
$$X = Binomial(n,p_{eff})$$
Der Erwartungswert ist:
$$E[X] = n * p_{eff}$$
Und der erwartete Punktbetrag:
$$E[Punkte]=E[X]*Punkte pro Treffer$$
Damit erhalten wir das **theoretische erwartete Ergebnis**

**5. Monte-Carlo-Simulation**

Die Simulation erzeugt die Ergebnisse stochastisch, indem wir für jeden Wurf:
- einen zufälligen Block simuliert mit $P(Block)$:
    - Falls $Zufallszahl < P(Block)$ der Versuch findet unten Block statt
    - Falls $Zufallszahl > P(Block)$ der Versuch findet ohne Block statt
- basierend darauf $p_{nb}$ oder $p_b$ verwendet,
- Zufallszahlen zieht, ob ein Treffer erfolgt:
    - Falls blockiert $Zufallszahl muss > p_b$ zu punkten
    - Falls nicht blockiert $Zufallszahl muss > p_{nb}$ zu punkten
- daraus Punkte zählt.

**Binomialverhalten in der Monte-Carlo-Simulation**

In der Monte-Carlo-Simulation wird die binomiale Trefferverteilung nicht mit der
Binomialformel
$$P(X = x) = \binom{n}{x} p^x (1-p)^{n-x}$$
berechnet.
Stattdessen wird das zugrunde liegende Zufallsexperiment direkt simuliert.

Für jeden der $n$ Wurfversuche passiert Folgendes:

1. Es wird eine Zufallszahl gezogen, um zu entscheiden, ob der Versuch geblockt wird.
2. Es wird eine zweite Zufallszahl gezogen, um zu bestimmen, ob der Versuch (unter Block oder ohne Block) getroffen wird.
3. Am Ende werden alle Treffer gezählt.

Damit entsteht die Trefferzahl

$$X = \sum_{i=1}^{n} \mathbf{1}(\text{Treffer beim Versuch } i)$$

also die Summe unabhängiger Bernoulli-Versuche.
Genau dadurch entsteht automatisch eine **binomiale Verteilung**, auch wenn die Formel
nicht explizit verwendet wird.

Die Simulation benötigt daher die Binomialformel nicht direkt, das Sampling selbst
*ist* das binomiale Verfahren.
Würde man z. B. **10 000 Spiele simulieren**, dann würde das Histogramm der erzielten
Treffer nahezu exakt der theoretischen Binomialverteilung entsprechen.

**6. Fazit**

Dies erzeugt zwei Ergebnissen. Ein Ergebnis ist das Erwartete und bleibt immer gleich (wenn man die Strategie nicht ändert). Das andere Ergebnis enthält eine natürliche Varianz (durch das Ziehen der Zufallszahlen) und ermöglicht dadurch, realistische Spielsituationen mit Schwankungen abzubilden, die im erwarteten theoretischen Modell nicht sichtbar wären.

In [None]:
import importlib
import simulation

importlib.reload(simulation)
from simulation import (
    simulate_match_from_player_specs,
    expected_match_from_player_specs,
    expected_details_from_player_specs,
    plot_match_barcharts,
    plot_expected_details_barcharts
)

player_specs = [
    # name,    team,     total, wurf,  3er, layup, passes
    ("Alexis", "Wind",   50,    25,   9,    16,    2),
    ("Jakov",  "Wind",   50,    30,   10,   10,    3),
    ("Loukas", "Blitz", 100,    20,   10,   70,    0),
]

# Erwartete Total-Punkte:
result_exp = expected_match_from_player_specs("Wind", "Blitz", player_specs)
print(result_exp)

# Erwartete Verteilung pro Spieler/Wurfart:
exp_details = expected_details_from_player_specs("Wind", "Blitz", player_specs)
plot_expected_details_barcharts(exp_details)

# Eine Simulation:
result_sim = simulate_match_from_player_specs("Wind", "Blitz", player_specs)
print(result_sim)
plot_match_barcharts(result_sim)