In [None]:
%%HTML
<style>
    body {
        --vscode-font-family: "CMU Sans Serif"
    }
</style>

In [25]:
import matplotlib.pyplot as plt
plt.rcParams.update({
    "text.usetex": True,
    "font.family": "sans-serif",
    "font.sans-serif": ["Computer Modern Sans Serif"]})
plt.rcParams['text.latex.preamble'] = r'\usepackage{sansmath} \sansmath'

In [26]:
from IPython.display import display, clear_output, HTML
import time

def countdown_timer(minutes):
    total_seconds = minutes * 60
    for seconds in range(total_seconds, 0, -1):
        mins, secs = divmod(seconds, 60)
        time_str = f"{mins:02}'{secs:02}''"
        clear_output(wait=True)
        # HTML with styling
        display(HTML(f'<div style="font-size: 24px; color: blue; font-weight: bold;">Time remaining: {time_str}</div>'))
        time.sleep(1)
    clear_output(wait=True)
    # Final message with different styling
    display(HTML('<div style="font-size: 24px; color: green; font-weight: bold;">Time\'s up!</div>'))

In [None]:


import matplotlib.pyplot as plt
import numpy as np
from matplotlib.patches import Rectangle

# Topics and x-axis values
topics = ["interface", "", "", "", "Python basics", "", "", "", "data manipulation", "",  "visualization", "", "practice", ""]
x_values = np.arange(1, 15)

# Create figure and axis objects with adjusted y-axis height
fig, ax1 = plt.subplots(figsize=(10*1.4, 0.75*1.4))  # Slightly more vertical space
ax1.set(xlim=(0, 14), xticks=x_values - 0.5, xlabel='Course Progression')
ax1.set_xticks(x_values - 0.5)  # Align grid lines with x_values
ax1.set_xticklabels(x_values, ha='center')
ax1.yaxis.set_visible(False)

# Secondary axis for labels without ticks
ax2 = ax1.twiny()
ax2.set(xlim=ax1.get_xlim(), xticks=x_values - 0.5)
ax2.set_xticklabels(topics, ha='center')
ax2.tick_params(axis='x', length=0)

# Add rectangles for progress
progress_info = [(0, "orange", 1), (1, "dodgerblue", 1), (2, "dodgerblue", 1), (3, "dodgerblue", 1),
                 (4, "dodgerblue", 1), (5, "dodgerblue", 1), (6, "dodgerblue", 1), (7, "dodgerblue", 1),
                 (8, "dodgerblue", 1), (9, "dodgerblue", 1), (10, "dodgerblue", 0.75)]
for x, color, alpha in progress_info:
    ax1.add_patch(Rectangle((x, 0), 1, 1, facecolor=color, alpha=alpha, edgecolor="gainsboro", linewidth=0.5))

# Add text annotations
annotations = [
    (0.5, "Jupyter\n\nLaTeX"),
    (1.5, "math\n\n(SymPy)"),
    (2.5, "strings\n\nlists"),
    (3.5, "other\ndata\nstructures"),
    (4.5, "control\nstructures"),
    (5.5, "functions"),
    (6.5, "arrays"),
    (7.5, "more\narrays"),
    (8.5, "pandas\nbasics"),
    (9.5, "pandas\nadvanced"),
    (10.5, "seaborn")
]
for x, label, *color in annotations:
    ax1.text(x, 0.5, label, ha='center', va='center', fontsize=9, color=color[0] if color else 'black')

plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;<div style="width: 48%; line-height: 1.5;">

## A common mistake

</div>
<div style="width: 48%; line-height: 1.5;<div style="width: 48%; line-height: 1.5;color: grey;">

## Ein häufiger Fehler

</div>
</div>

In [None]:
import seaborn as sns
import pandas as pd

df = sns.load_dataset('titanic')
df = df[["survived", "pclass", "sex", "age", "fare", "deck", "embark_town", "alone"]].copy()
df = df.dropna(subset=['age'])

df.corr(numeric_only=True).round(2)

In [None]:
df.corr(numeric_only=True).style.background_gradient(cmap="bwr", vmin=-1, vmax=1).format("{:.2f}")

In [None]:
correlation = df.corr(numeric_only=True).round(2)

correlation.style.background_gradient(cmap="bwr", vmin=-1, vmax=1).format("{:.2f}")

In [None]:
correlation.corr(numeric_only=True).style.background_gradient(cmap="bwr", vmin=-1, vmax=1).format("{:.2f}")

<div class="alert alert-block alert-light">

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;<div style="width: 48%; line-height: 1.5;">

## Warm-up

Copy `07_wine_reviews_sample.csv` to your current folder.

1. Find the best wine for each price point: group the DataFrame by the `price` column.
For each group, apply the command that finds the *index of the wine* with the maximum points.
Use `iloc` to select the corresponding rows, resulting in a DataFrame that shows the best-rated wine for each price.

2. Group the wines by variety and calculate the minimum, maximum, median, and mean values for each group.

</div>
<div style="width: 48%; line-height: 1.5;<div style="width: 48%; line-height: 1.5;color: grey;">

## Aufwärmen

Kopieren Sie `07_wine_reviews_sample.csv` in Ihren aktuellen Ordner.

1. Finden Sie den besten Wein für jeden Preispunkt: gruppieren Sie den DataFrame nach der Spalte `price`.
Wenden Sie für jede Gruppe den Befehl an, der den *Index des Weines* mit der höchsten Punktzahl findet.
Verwenden Sie `iloc`, um die entsprechenden Zeilen auszuwählen, was zu einem DataFrame führt, der den bestbewerteten Wein für jeden Preis anzeigt.

2. Gruppieren Sie die Weine nach Sorten und berechnen Sie für jede Gruppe den Minimal-, Maximal-, Median- und Mittelwert.

</div>
</div>

```python
import pandas as pd

wine_reviews = pd.read_csv('07_wine_reviews_sample.csv')
```

In [None]:
countdown_timer(15)

In [None]:

df = pd.read_csv('07_wine_reviews_sample.csv')

# Task 1: Best wine for a given price
df.iloc[df.groupby("price")["points"].idxmax()]

In [None]:

df.groupby("variety")["price"].agg(["min", "max", "mean", "median"])

<div style="text-align: center;">
    <img src="https://seaborn.pydata.org/_images/logo-wide-lightbg.svg" style="width: 60%; max-width: 500px;">
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

**Seaborn** is a Python library for data visualization built on top of **Matplotlib**, the foundational library for plotting. 

If you're new to data visualization in Python, it might seem natural to begin with Matplotlib. However, there are some compelling reasons to start with Seaborn instead: 

1. Seaborn is beginner-friendly: 
Seaborn offers simple commands for creating complex visualizations with a single function call.

2. Professional-looking plots by default:
Seaborn’s default styles automatically adjust colors, grids, and other aesthetic elements to make your plots visually appealing. 

3. Seamless integration with pandas DataFrames.

4. Specialized statistical plots:
Seaborn includes built-in tools for creating statistical plots that would require significant effort to implement in Matplotlib.

But remember: 
While *Seaborn is excellent for quickly creating beautiful and statistically informative plots, Matplotlib provides complete control* over every aspect of your plots. If you need to customize your visualizations beyond what Seaborn offers (such as adding multiple subplots, intricate annotations, or unconventional layouts) Matplotlib is indispensable.
        
</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

**Seaborn** ist eine Python-Bibliothek zur Datenvisualisierung, die auf **Matplotlib** aufbaut, der grundlegenden Bibliothek für das Plotten.

Wenn Sie neu in der Datenvisualisierung in Python sind, liegt es nahe, mit Matplotlib zu beginnen. Es gibt jedoch einige gute Gründe, stattdessen mit Seaborn zu beginnen:

1. Seaborn ist anfängerfreundlich:
Seaborn bietet einfache Befehle zur Erstellung komplexer Visualisierungen mit einem einzigen Funktionsaufruf.

2. Professionell aussehende Plots als Standard:
Die Standardstile von Seaborn passen automatisch Farben, Raster und andere ästhetische Elemente an, um Ihre Plots visuell ansprechend zu gestalten.

3. Nahtlose Integration mit pandas DataFrames.

4. Spezialisierte statistische Diagramme:
Seaborn enthält integrierte Werkzeuge zur Erstellung statistischer Diagramme, die in Matplotlib nur mit erheblichem Aufwand zu implementieren wären.

Aber denken Sie daran:
Während *Seaborn hervorragend geeignet ist, um schnell schöne und statistisch aussagekräftige Plots zu erstellen, bietet Matplotlib vollständige Kontrolle* über jeden Aspekt Ihrer Plots. Wenn Sie Ihre Visualisierungen über die Möglichkeiten von Seaborn hinaus anpassen möchten (z. B. durch das Hinzufügen mehrerer Subplots, komplizierter Anmerkungen oder unkonventioneller Layouts), ist Matplotlib unverzichtbar.
        
</div>
</div>

<div style="text-align: center;">
    <img src="https://coursereport-production.imgix.net/uploads/image/file/223/Lighthouse_Labs_Data_Viz_Tools_infographic.png?auto=compress%2Cformat&w=800&h=1264&dpr=2&q=50" style="width: 500px;">
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

# Overview of Seaborn's Plots

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

# Übersicht über Seaborns Plots

</div>
</div>

<div style="text-align: center;">
    <img src="https://seaborn.pydata.org/_images/function_overview_8_0.png" style="width: 60%; max-width: 400px;">
</div>

<div class="alert alert-info" role="alert">

### Disclaimer

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

This overview provides a broad, though not exhaustive, summary of plot types. While it covers the most common use cases, you are encouraged to explore the [Seaborn documentation](https://seaborn.pydata.org/tutorial/introduction.html) to discover additional options that may better suit your specific needs.

</div>
<div style="width: 4%;">
</div>
<div style="width: 48%; line-height: 1.5; color: grey;">

Dieser Überblick bietet eine umfassende, aber nicht vollständige, Zusammenfassung der Plot-Typen. Sie deckt zwar die gängigsten Anwendungsfälle ab, aber wir empfehlen Ihnen, die [Seaborn-Dokumentation](https://seaborn.pydata.org/tutorial/introduction.html) zu studieren, um zusätzliche Optionen zu entdecken, die Ihren speziellen Anforderungen besser entsprechen.

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

To begin, we import the necessary libraries:
        
</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Zu Beginn importieren wir die erforderlichen Bibliotheken:
        
</div>
</div>

In [34]:
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

sns.set_palette("bright")

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

Not only is Seaborn optimized for use with pandas, but it also comes with several built-in educational datasets, making it easy to practice data visualization without the need to source external data.

You can access these datasets using `sns.load_dataset('dataset_name')`.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Seaborn ist nicht nur für die Verwendung mit pandas optimiert, sondern wird auch mit mehreren eingebauten Lerndatensätzen geliefert, die es einfach machen, die Datenvisualisierung zu üben, ohne dass externe Daten benötigt werden.

Sie können auf diese Datensätze mit `sns.load_dataset('dataset_name')` zugreifen.

</div>
</div>

| **Dataset**     | **Description**                                                                                          | **Beschreibung**                                                                                  |
|------------------|----------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------|
| **`'anscombe'`**  | Data illustrating Anscombe's quartet (datasets with identical statistics but different distributions).    | Daten, die Anscombes Quartett veranschaulichen (Datensätze mit identischen Statistiken, aber unterschiedlichen Verteilungen). |
| **`'attention'`** | Dataset showing results of a psychology experiment on the effects of attention.                          | Datensatz mit Ergebnissen eines psychologischen Experiments zu den Auswirkungen von Aufmerksamkeit.     |
| **`'car_crashes'`** | Statistics on car crashes and related factors in the United States.                                    | Statistiken zu Autounfällen und verwandten Faktoren in den USA.                                         |
| **`'diamonds'`**  | Characteristics and prices of 54,000 diamonds.                                                          | Eigenschaften und Preise von 54.000 Diamanten.                                                         |
| **`'dots'`**      | Simulated data showing the effect of various treatments over time.                                       | Simulierte Daten, die die Wirkung verschiedener Behandlungen über die Zeit zeigen.                      |
| **`'dowjones'`**  | Daily closing values of the Dow Jones Industrial Average (historical dataset).                           | Tägliche Schlusswerte des Dow Jones Industrial Average (historischer Datensatz).                        |
| **`'exercise'`**  | Data on exercise habits categorized by time and type of activity.                                        | Daten zu Trainingsgewohnheiten, kategorisiert nach Zeit und Aktivitätstyp.                              |
| **`'flights'`**   | Monthly passenger numbers for a decade.                                                                 | Monatliche Passagierzahlen über ein Jahrzehnt.                                                          |
| **`'fmri'`**      | Simulated data from an fMRI experiment measuring brain responses.                                        | Simulierte Daten aus einem fMRT-Experiment, das Gehirnreaktionen misst.                                 |
| **`'geyser'`**    | Old Faithful geyser eruption data (durations and intervals).                                             | Daten zu Eruptionen des Old Faithful Geysirs (Dauer und Intervalle).                                    |
| **`'glue'`**      | Simulated data illustrating properties of adhesives.                                                     | Simulierte Daten, die die Eigenschaften von Klebstoffen veranschaulichen.                              |
| **`'healthexp'`** | Data on health expenditures across countries.                                                            | Daten zu Gesundheitsausgaben in verschiedenen Ländern.                                                  |
| **`'iris'`**      | Classic dataset of flower measurements from three species of iris.                                       | Klassischer Datensatz mit Blütenmessungen von drei Schwertlilienarten.                                  |
| **`'mpg'`**       | Data on fuel efficiency for cars (miles per gallon).                                                     | Daten zur Kraftstoffeffizienz von Autos (Meilen pro Gallone).                                           |
| **`'penguins'`**  | Measurements of penguins from different species and islands.                                             | Messungen von Pinguinen verschiedener Arten und Inseln.                                                 |
| **`'planets'`**   | Data on exoplanets and their characteristics.                                                            | Daten zu Exoplaneten und ihren Eigenschaften.                                                           |
| **`'seaice'`**    | Historical data on Arctic sea ice extent.                                                                | Historische Daten zur Ausdehnung des arktischen Meereises.                                              |
| **`'taxis'`**     | Data on New York City taxi trips.                                                                        | Daten zu Taxifahrten in New York City.                                                                  |
| **`'tips'`**      | Data on tips received by waitstaff in a restaurant.                                                      | Daten zu Trinkgeldern, die vom Restaurantpersonal erhalten wurden.                                      |
| **`'titanic'`**   | Passenger data from the Titanic disaster.                                                                | Passagierdaten aus der Titanic-Katastrophe.                                                             |

In [None]:
tips = sns.load_dataset('tips')

tips

In [None]:
tips.info()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

As an illustration, I’ll demonstrate how to create the same plot using both Seaborn and Matplotlib. We’ll revisit this plot later today, but for now, focus on comparing the amount of programming effort required for each approach.
        
</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Zur Veranschaulichung zeige ich Ihnen, wie Sie dieselbe Grafik sowohl mit Seaborn als auch mit Matplotlib erstellen können. Wir werden dieses Diagramm später noch einmal betrachten, aber jetzt sollten wir uns auf den Vergleich des Programmieraufwands konzentrieren, der für jeden Ansatz erforderlich ist.
        
</div>
</div>

In [None]:
sns.pairplot(tips)
plt.suptitle('Pair plot with Seaborn (as a rule, do not use plot titles in scientific reports)', y=1.02)
plt.show()

In [None]:
# Define numeric variables and create the pair plot manually with matplotlib
numeric_vars = ['total_bill', 'tip', 'size']
fig, axes = plt.subplots(len(numeric_vars), len(numeric_vars), figsize=(7.5, 7.5), sharex='col')

# Iterate over each subplot
for i, var1 in enumerate(numeric_vars):
    for j, var2 in enumerate(numeric_vars):
        ax = axes[i, j]
        if i == j:  # Diagonal: Histogram for each variable
            ax.hist(tips[var1], bins=15, alpha=0.7, edgecolor='black')
            ax.set_xlabel(var1 if j == len(numeric_vars) - 1 else '')
            ax.set_ylabel(var1 if i == 0 else '')
        else:  # Off-diagonal: Scatter plot
            ax.scatter(tips[var2], tips[var1], alpha=0.7, edgecolor='white')
            if i == len(numeric_vars) - 1:
                ax.set_xlabel(var2)
            if j == 0:
                ax.set_ylabel(var1)

# Adjust the layout and add a title
fig.suptitle('Pair plot with Matplotlib (as a rule, do not use plot titles in scientific reports)')
plt.tight_layout()
plt.show()

<div style="text-align: center;">
    <img src="https://seaborn.pydata.org/_images/function_overview_8_0.png" style="width: 160px; height: 350px; object-fit: cover; overflow: hidden; object-position: left;">
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

# Relational
## Scatter Plots

The scatter plot **`sns.scatterplot()`** is a mainstay of statistical visualization. It depicts the joint distribution of two variables using *a cloud of points, where each point represents an observation* in the dataset. This depiction allows the eye to infer a substantial amount of information about whether there is any meaningful relationship between them.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

# Relational
## Streudiagramme

Das Streudiagramm **`sns.scatterplot()`** ist ein Hauptbestandteil der statistischen Visualisierung. Es stellt die gemeinsame Verteilung zweier Variablen mit Hilfe *einer Punktwolke dar, wobei jeder Punkt eine Beobachtung* im Datensatz darstellt. Diese Darstellung ermöglicht es dem Auge, eine beträchtliche Menge an Informationen darüber abzuleiten, ob es eine sinnvolle Beziehung zwischen den Variablen gibt.

</div>
</div>

In [None]:
# Load sample data
tips = sns.load_dataset('tips')

plt.figure(figsize=(5, 4))

# Scatter plot
sns.scatterplot(x=tips['total_bill'], y=tips['tip'])

plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

- `sns.scatterplot()` is a Seaborn function for creating a scatter plot.

- `x=tips['total_bill']` specifies which column in the dataset to use for the x-axis.

- `y=tips['tip']` specifies which column in the dataset to use for the y-axis.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

- `sns.scatterplot()` ist eine Seaborn-Funktion zur Erstellung eines Streudiagramms.

- `x=tips['total_bill']` gibt an, welche Spalte des Datensatzes für die x-Achse verwendet werden soll.

- `y=tips['tip']` gibt an, welche Spalte des Datensatzes für die y-Achse zu verwenden ist.

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.6;">

- `plt.figure(figsize=(5, 4))` sets the overall figure size in inches.

- `plt.show()` renders the figure in the notebook or terminal. Without `plt.show()`, the plot might not display in some environments.

</div>
<div style="width: 48%; line-height: 1.6;color: grey;">

- Mit `plt.figure(figsize=(5, 4))` wird die Gesamtgröße des Plots in Zoll festgelegt.

- `plt.show()` stellt die Abbildung im Notebook oder Terminal dar. Ohne `plt.show()` wird die Darstellung in einigen Umgebungen möglicherweise nicht angezeigt.

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

### Semantic mapping

While the points are plotted in two dimensions, another dimension can be added to the plot by adding more formatting options according to a third variable. 

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

### Semantisches Mapping

Während die Punkte in zwei Dimensionen gezeichnet werden, kann eine weitere Dimension zur Darstellung hinzugefügt werden, indem weitere Formatierungsoptionen entsprechend einer dritten Variable hinzugefügt werden.

</div>
</div>

In [None]:
fig, axes = plt.subplots(1, 4, figsize=(15, 4.5), sharex=True, sharey=True)

# Plot 1: Different Markers
sns.scatterplot(ax=axes[0],x=tips['total_bill'], y=tips['tip'], style=tips["time"])
axes[0].set_title('Different markers')

# Plot 2: Different Colors (Categorical)
sns.scatterplot(ax=axes[1],x=tips['total_bill'], y=tips['tip'], hue=tips["smoker"])
axes[1].set_title('Different colors (categorical)')

# Plot 3: Different Colors (Numeric)
sns.scatterplot(ax=axes[2], x=tips['total_bill'], y=tips['tip'], hue=tips["size"])
axes[2].set_title('Different colors (numeric)')

# Plot 4: Different Sizes
sns.scatterplot(ax=axes[3], x=tips['total_bill'], y=tips['tip'], size=tips["size"])
axes[3].set_title('Different sizes')

# Adjust layout
plt.tight_layout()
plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

##### 1. Style semantics

You can use different markers with `style=df_name["column_name"]`.

##### 2. Hue semantics

You can also use different colors with `hue=df_name["column_name"]`.

In seaborn, this is referred to as using a *hue semantic*, because the color of the point gains meaning.

When the hue semantic is *categorical* (Yes/No), the default qualitative palette is applied. If the hue semantic is numeric, the default coloring switches to a *sequential* palette. <br> [More color palettes.](https://seaborn.pydata.org/tutorial/color_palettes.html)

##### 3. Size semantics

The third kind of semantic variable changes the size (`size=df_name["column_name"]`) of each point.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

##### 1. Stil-Semantik

Sie können verschiedene Marker `style=df_name["column_name"]` verwenden.

##### 2. Farbton-Semantik

Sie können auch verschiedene Farben mit `hue=df_name["column_name"]` verwenden.

In Seaborn wird dies als *Farbton-Semantik* bezeichnet, da die Farbe des Punktes an Bedeutung gewinnt.

Wenn die Farbtonsemantik *kategorisch* (Yes/No) ist, wird die qualitative Standardpalette verwendet. Wenn der semantische Farbton numerisch ist, wird die Standardfarbgebung auf eine *sequenzielle* Palette umgestellt. [Weitere Farbpaletten.](https://seaborn.pydata.org/tutorial/color_palettes.html)


##### 3. Größe Semantik

Die dritte Art von semantischer Variable verändert die Größe (`size=df_name["column_name"]`) der einzelnen Punkte:

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

## Line Plots

With some datasets, you may want to understand changes in one variable as a function of time, or a similarly continuous variable. In this situation, a good choice is to draw a line plot (**`sns.lineplot()`**).

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

## Liniendiagramme

Bei einigen Datensätzen möchten Sie vielleicht die Veränderungen einer Variable in Abhängigkeit von der Zeit oder einer ähnlich kontinuierlichen Variable verstehen. In diesem Fall bietet sich die Erstellung eines Liniendiagramms an (**`sns.lineplot()`**).

</div>
</div>

In [None]:
dowjones = sns.load_dataset("dowjones")

dowjones

In [None]:
plt.figure(figsize=(5, 4))

# Line plot
sns.lineplot(x=dowjones["Date"], y=dowjones["Price"])

plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

### Aggregation and uncertainty

More complex datasets will have multiple measurements for the same value of the `x` variable:
</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

### Aggregation und Unsicherheit

Bei komplexeren Datensätzen gibt es mehrere Messungen für denselben Wert der Variablen `x`:

</div>
</div>

In [None]:
fmri = sns.load_dataset("fmri")

fmri

In [None]:
plt.figure(figsize=(5, 4))

# Scatter plot to see the raw data
sns.scatterplot(x=fmri["timepoint"], y=fmri["signal"])

plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

The default behavior in `sns.lineplot` is to aggregate the multiple measurements at each `x` value by plotting the mean and the *95% confidence interval* around the mean.

The 95% confidence interval quantifies the certainty of the mean.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Standardmäßig fasst `sns.lineplot` die Mehrfachmessungen für jeden `x`-Wert zusammen, indem es den Mittelwert und das *95 %-Konfidenzintervall* um den Mittelwert herum aufträgt.

Das 95%-Konfidenzintervall quantifiziert die Sicherheit des Mittelwertes.

</div>
</div>

In [None]:
fig, axes = plt.subplots(1, 2, figsize=(7, 3.5), sharex=True, sharey=True)

# Plot 1
sns.lineplot(ax=axes[0], x=fmri["timepoint"], y=fmri["signal"])
sns.scatterplot(ax=axes[0], x=fmri["timepoint"], y=fmri["signal"], alpha=0.5, marker='.')
axes[0].set_title('Error: Confidence Interval (Default)')

# Plot 2
sns.lineplot(ax=axes[1], x=fmri["timepoint"], y=fmri["signal"], errorbar="sd")
sns.scatterplot(ax=axes[1], x=fmri["timepoint"], y=fmri["signal"], alpha=0.5, marker='.')
axes[1].set_title('Error: Standard Deviation')

# Adjust layout
plt.tight_layout()
plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

Another good option, especially with larger data, is to represent the spread of the distribution at each timepoint by plotting the *standard deviation* (`errorbar='sd'`) instead of a confidence interval.

The standard deviation quantifies how spread out the data is.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Eine weitere gute Möglichkeit, vor allem bei größeren Datenmengen, ist die Darstellung der Streuung der Verteilung zu jedem Zeitpunkt, indem die *Standardabweichung* (`errorbar='sd'`) anstelle eines Konfidenzintervalls aufgetragen wird.

Die Standardabweichung gibt an, wie groß die Streuung der Daten ist.

</div>
</div>

<div style="text-align: center;">
    <figure style="display: inline-block;">
        <img src="https://seaborn.pydata.org/_images/error_bars_2_0.svg" style="width: 500px;">
        <figcaption>
            <a href="https://seaborn.pydata.org/tutorial/error_bars.html">Which error estimation should you use?</a>
            <br>
            <a href="https://seaborn.pydata.org/tutorial/error_bars.html">Welche Fehlerabschätzung sollte man verwenden?</a>
        </figcaption>
    </figure>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

### Semantic mapping

The `sns.lineplot()` function has the same flexibility as `sns.scatterplot()`: it can show up to three additional variables by modifying the hue, size, and style of the plot elements. 

Using semantics in `sns.lineplot()` will also determine how the data get aggregated. For example, adding a hue semantic with two levels splits the plot into two lines and error bands, coloring each to indicate which subset of the data they correspond to.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

### Semantisches Mapping

Die Funktion `sns.lineplot()` hat die gleiche Flexibilität wie `sns.scatterplot()`: sie kann bis zu drei zusätzliche Variablen anzeigen, indem sie den Farbton, die Größe und den Stil der Plot-Elemente verändert.

Die Verwendung von Semantiken in `sns.lineplot()` bestimmt auch, wie die Daten aggregiert werden. Wenn man zum Beispiel eine Farbtonsemantik mit zwei Ebenen hinzufügt, wird das Diagramm in zwei Linien und Fehlerbänder aufgeteilt, die jeweils eingefärbt werden, um anzuzeigen, welcher Teilmenge der Daten sie entsprechen.

</div>
</div>

In [None]:
fmri

In [None]:
fig, axes = plt.subplots(1, 4, figsize=(12, 3.5), sharex=True, sharey=True)

# Plot 1: Different Colors
sns.lineplot(ax=axes[0], x=fmri["timepoint"], y=fmri["signal"], hue=fmri["event"])
axes[0].set_title('Different colors')

# Plot 2: Different Line Styles
sns.lineplot(ax=axes[1], x=fmri["timepoint"], y=fmri["signal"], style=fmri["event"])
axes[1].set_title('Different line styles')

# Plot 3: Different Markers
sns.lineplot(ax=axes[2], x=fmri["timepoint"], y=fmri["signal"], style=fmri["event"], dashes=False, markers=True)
axes[2].set_title('Different markers')

# Plot 4: Different Colors and Markers
sns.lineplot(ax=axes[3], x=fmri["timepoint"], y=fmri["signal"], hue=fmri["event"], style=fmri["event"], dashes=False, markers=True)
axes[3].set_title('Different colors and markers')

# Adjust layout
plt.tight_layout()
plt.show()

<div class="alert alert-block alert-light">

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;<div style="width: 48%; line-height: 1.5;">

#### Exercise

Load the Titanic dataset using Seaborn's built-in `load_dataset` function.

1. Plot a scatter plot with:
   - `x` as `age` and `y` as `fare`.
   - Color the points based on `pclass` using the `hue` argument.
   - Use the `Set2` color palette for a distinct color scheme.
   - Apply a logarithmic scale to the y-axis (`plt.yscale('log')`) to better visualize the wide range of fare values.

2. Use a line plot with:
   - `x` as `age` and `y` as `fare`.
   - Use both `hue` and `style` on `alone`.
   - Set `errorbar='sd'` to include a shaded region representing the standard deviation of fares.

</div>
<div style="width: 48%; line-height: 1.5;<div style="width: 48%; line-height: 1.5;color: grey;">

#### Übung

Laden Sie den Titanic-Datensatz mit der integrierten `load_dataset`-Funktion von Seaborn.

1. Erstellen Sie ein Streudiagramm mit den folgenden Einstellungen:  
   - Verwenden Sie `age` als `x`-Achse und `fare` als `y`-Achse.  
   - Färben Sie die Punkte basierend auf der `pclass` mithilfe des `hue`-Arguments ein.  
   - Nutzen Sie die Farbpalette `Set2` für ein unterscheidbares Farbschema.  
   - Wenden Sie eine logarithmische Skala auf die y-Achse an (`plt.yscale('log')`), um die große Spannweite der Ticketpreise besser darzustellen.

2. Erstellen Sie ein Liniendiagramm mit den folgenden Einstellungen:  
   - Verwenden Sie `age` als `x`-Achse und `fare` als `y`-Achse.  
   - Nutzen Sie sowohl `hue` als auch `style`, um Passagiere zu unterscheiden, die alleine gereist sind (`alone`).  
   - Setzen Sie `errorbar='sd'`, um eine schattierte Fläche einzufügen, die die Standardabweichung der Ticketpreise darstellt.
   
</div>
</div>

```python
sns.scatterplot(..., palette='Set2')
```

In [None]:
countdown_timer(15)

In [None]:

titanic = sns.load_dataset('titanic')

sns.scatterplot(x=titanic['age'], y=titanic['fare'],  hue=titanic['pclass'], palette='Set2')
plt.yscale('log')

plt.show()

sns.lineplot(x=titanic['age'], y=titanic['fare'], hue=titanic['alone'], style=titanic['alone'], errorbar='sd')

plt.show()

<div style="text-align: center;">
    <img src="https://seaborn.pydata.org/_images/function_overview_8_0.png" style="width: 155px; height: 350px; object-fit: cover; overflow: hidden;"">
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

# Distributions
## Histogram and KDE Plot

A histogram (**`sns.histplot()`**) is a bar plot where the axis representing the data variable is divided into a set of discrete bins and the count of observations falling within each bin is shown using the height of the corresponding bar.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

# Verteilungen
## Histogramm und KDE-Plot

Ein Histogramm (**`sns.histplot()`**) ist ein Balkendiagramm, bei dem die Achse, die die Datenvariable darstellt, in eine Reihe von diskreten Feldern unterteilt ist und die Anzahl der Beobachtungen, die in jedes Feld fallen, durch die Höhe des entsprechenden Balkens dargestellt wird.

</div>
</div>

In [None]:
tips

In [None]:
fig, axes = plt.subplots(1, 4, figsize=(12, 3.5), sharex=True, sharey=True)

sns.histplot(ax=axes[0], x=tips['total_bill'], edgecolor='white')
axes[0].set_title('Default number of bins')

sns.histplot(ax=axes[1], x=tips['total_bill'], bins=20, color='coral')
axes[1].set_title('Custom number of bins')

sns.histplot(ax=axes[2], x=tips['total_bill'], binwidth=1, color='salmon')
axes[2].set_title('Custom bin width')

sns.histplot(ax=axes[3], x=tips['total_bill'], kde=True, color='goldenrod')
axes[3].set_title(r'with KDE')

# Adjust layout
plt.tight_layout()
plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

A histogram aims to approximate the underlying probability density function that generated the data by binning and counting observations. 

A **Kernel density estimation (KDE) (`kde=True`)** smooths the observations with a Gaussian kernel, producing a continuous density estimate.

*Because of smoothing procedure, the KDE curve may extend to unrealistic values.*
There is also a dedicated companion function, `sns.kdeplot()`. 
However, I personally prefer to avoid using it due to the potential inaccuracies introduced by the smoothing process.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Ein Histogramm zielt darauf ab, die zugrundeliegende Wahrscheinlichkeitsdichtefunktion, die die Daten erzeugt hat, durch Einteilung und Zählung der Beobachtungen anzunähern.

Ein **Kernel Density Estimation (KDE)-Plot (`kde=True`)** glättet die Beobachtungen mit einem Gaußschen Kernel, wodurch eine kontinuierliche Dichteschätzung entsteht.

*Aufgrund des Glättungsverfahrens kann die KDE-Kurve auf unrealistische Werte ansteigen.*
Es gibt auch eine spezielle Begleitfunktion, `sns.kdeplot()`.
Ich persönlich ziehe es jedoch vor, sie wegen der möglichen Ungenauigkeiten, die durch den Glättungsprozess entstehen, nicht zu verwenden.

</div>
</div>

In [None]:
fig, axes = plt.subplots(1, 4, figsize=(12, 3.5), sharex=True, sharey=True)

sns.histplot(ax=axes[0], x=tips['total_bill'], hue=tips["smoker"], edgecolor='white')
axes[0].set_title('Layered (default)')

sns.histplot(ax=axes[1], x=tips['total_bill'], hue=tips["smoker"], element='step')
axes[1].set_title('Step plot')

sns.histplot(ax=axes[2], x=tips['total_bill'], hue=tips["smoker"], multiple='stack', edgecolor='white')
axes[2].set_title('Stacked')

sns.histplot(ax=axes[3], x=tips['total_bill'], hue=tips["smoker"], multiple='dodge', edgecolor='white')
axes[3].set_title('Dodged')

# Adjust layout
plt.tight_layout()
plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

`histplot()` provides support for conditional subsetting via the hue semantic. 
Assigning a variable to `hue` will draw a separate histogram for each of its unique values and distinguish them by color.

By default, the different histograms are overlapped and, in some cases, they may be difficult to distinguish. 
One option is to change the visual representation of the histogram from a bar plot to a “step” plot (`element='step'`).

Alternatively, instead of layering each bar, they can be “stacked” (`multiple='stack'`).

Another option is “dodge” the bars (`multiple='dodge'`), which moves them horizontally and reduces their width. This ensures that there are no overlaps and that the bars remain comparable in terms of height.

</div>
<div style="width: 48%; line-height: 1.3;color: grey;">

`histplot()` bietet Unterstützung für die bedingte Unterteilung über die Farbtonsemantik.
Die Zuweisung einer Variablen zu `hue` zeichnet ein separates Histogramm für jeden ihrer eindeutigen Werte und hebt diese farblich hervor.

Standardmäßig überlagern sich die verschiedenen Histogramme und sind daher in manchen Fällen schwer zu unterscheiden.
Eine Möglichkeit besteht darin, die Darstellung des Histogramms von einem Balkendiagramm in ein "Stufen"-Diagramm zu ändern (`element='step'`).

Alternativ können die einzelnen Balken auch "gestapelt" werden, anstatt sie übereinander zu legen (`multiple='stack'`).

Eine weitere Option ist das "Abwedeln" der Balken (`multiple='dodge'`). Dabei werden die Balken horizontal verschoben und ihre Breite verringert, wodurch Überschneidungen vermieden und die Höhen der Balken besser vergleichbar werden.

</div>
</div>

<div class="alert alert-block alert-light">

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;<div style="width: 48%; line-height: 1.5;">

#### Exercise

Create a histogram to visualize the distribution of family sizes among Titanic passengers. 

- Add a new column `family_size` by summing `sibsp` (siblings/spouses aboard) and `parch` (parents/children aboard). 
- Use `hue='pclass'` to differentiate passenger classes, display the bars side-by-side (`multiple='dodge'`), and use `palette='Set1'` to change the color scheme.

</div>
<div style="width: 48%; line-height: 1.5;<div style="width: 48%; line-height: 1.5;color: grey;">

#### Übung

Erstellen Sie ein Histogramm, um die Verteilung der Familiengrößen unter den Passagieren der Titanic zu visualisieren.

- Fügen Sie eine neue Spalte `family_size` hinzu, indem Sie `sibsp` (Geschwister/Ehepartner an Bord) und `parch` (Eltern/Kinder an Bord) addieren.
- Verwenden Sie `hue='pclass'` zur Unterscheidung der Passagierklassen, zeigen Sie die Balken nebeneinander an (`multiple='dodge'`) und verwenden Sie `palette='Set1'`, um die Farbpalette zu ändern.

</div>
</div>

In [None]:
countdown_timer(15)

In [None]:

# Create a new column for family size
titanic['family_size'] = titanic['sibsp'] + titanic['parch']

# Histogram for family size with hue for alone status
sns.histplot(data=titanic, x='family_size', discrete=True, hue='pclass', multiple='dodge', palette='Set1')

plt.show()

<div style="text-align: center;">
    <img src="https://seaborn.pydata.org/_images/function_overview_8_0.png" style="width: 165px; height: 350px; object-fit: cover; overflow: hidden; object-position: right;">
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

# Categorical
## Categorical Scatterplots

Categorical scatter plots display individual data points where one axis represents categories and the other represents a quantitative variable. These plots show how values are distributed across different categories.

**Categorical plots can be seen as the visual equivalent of `groupby()` operations in pandas**.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

# Kategorisch
## Kategorische Streudiagramme

Kategorische Streudiagramme zeigen einzelne Datenpunkte, wobei eine Achse Kategorien und die andere eine quantitative Variable darstellt. Diese Diagramme veranschaulichen, wie sich Werte über verschiedene Kategorien verteilen.

**Kategorische Diagramme können als visuelles Äquivalent zu `groupby()`-Operationen in pandas betrachtet werden**.

</div>
</div>

In [None]:
tips.head()

In [None]:
fig, axes = plt.subplots(3, 2, figsize=(10, 10), sharex=True, sharey=True)

sns.scatterplot(ax=axes[0,0], x=tips['day'], y=tips['total_bill'])
axes[0,0].set_title('Scatter plot (does not look good)')

sns.scatterplot(ax=axes[0,1], x=tips['day'], y=tips['total_bill'], hue=tips["smoker"])
axes[0,1].set_title('Scatter plot with hue semantics')

sns.stripplot(ax=axes[1,0], x=tips['day'], y=tips['total_bill'])
axes[1,0].set_title('Strip plot (better)')

sns.stripplot(ax=axes[1,1], x=tips['day'], y=tips['total_bill'], hue=tips["smoker"])
axes[1,1].set_title('Strip plot with hue semantics')

sns.swarmplot(ax=axes[2,0], x=tips['day'], y=tips['total_bill'])
axes[2,0].set_title('Swarm plot (best, but intensive)')

sns.swarmplot(ax=axes[2,1], x=tips['day'], y=tips['total_bill'], hue=tips["smoker"], palette='husl')
axes[2,1].set_title('Swarm plot with hue semantics')

# Adjust layout
plt.tight_layout()
plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

There are two different categorical scatter plots in Seaborn to resolve the main challenge in representing categorical data with a scatter plot, which is that all of the points belonging to one category would overlap along the axis corresponding to the categorical variable.

**`stripplot()`** adjusts the positions of points on the categorical axis with a small amount of random “jitter” to minimize overlap.

**`swarmplot()`** adjusts the points along the categorical axis using an algorithm that prevents them entirely from overlapping. It can give a better representation of the distribution of observations, although it only works well for relatively small datasets.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

In Seaborn gibt es zwei verschiedene Arten kategorischer Streudiagramme, um das Hauptproblem beim Darstellen kategorialer Daten zu lösen: die Überlappung aller Punkte, die zu einer Kategorie gehören, entlang der Achse der kategorialen Variable.

**`stripplot()`** passt die Position der Punkte auf der kategorialen Achse mithilfe eines kleinen zufälligen "Jitters" an, um Überlappungen zu minimieren.

**`swarmplot()`** verschiebt die Punkte entlang der kategorialen Achse mithilfe eines Algorithmus, der eine vollständige Überlappung verhindert. Dies ermöglicht eine präzisere Darstellung der Verteilung der Beobachtungen, funktioniert jedoch am besten bei vergleichsweise kleinen Datensätzen.

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

## Comparing Distributions

As the size of the dataset grows, categorical scatter plots become limited in the information they can provide about the distribution of values within each category. When this happens, there are several approaches for summarizing the distributional information in ways that facilitate easy comparisons across the category levels.

The first is the **`sns.boxplot()`**. This kind of plot shows the three [quartile](http://www.statistics4u.com/fundstat_eng/cc_quartile.html) values of the distribution along with extreme values. 

The “whiskers” extend to points that lie within 1.5 times the interquartile range, IQR: the range between the first quartile Q1 (the 25th percentile) and the third quartile Q3 (the 75th percentile), and then observations that fall outside this range are displayed independently. These values are called *outliers*.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

## Vergleich von Verteilungen

Je größer der Datensatz wird, desto weniger Informationen können kategoriale Streudiagramme über die Verteilung der Werte innerhalb jeder Kategorie liefern. In diesem Fall gibt es mehrere Ansätze, um die Verteilungsinformationen so zusammenzufassen, dass einfache Vergleiche zwischen den einzelnen Kategorien möglich sind.

Der erste ist der **`sns.boxplot()`**. Diese Art der Darstellung zeigt die drei [Quartil-Werte](http://www.statistics4u.com/fundstat_eng/cc_quartile.html) der Verteilung zusammen mit den Extremwerten.

Die "Whisker" erstrecken sich auf die Punkte, die innerhalb des 1,5-fachen Interquartilsbereichs (IQR) liegen: der Bereich zwischen dem ersten Quartil Q1 (dem 25. Perzentil) und dem dritten Quartil Q3 (dem 75. Perzentil), und dann werden Beobachtungen, die außerhalb dieses Bereichs liegen, unabhängig angezeigt. Diese Werte werden als *Ausreißer* bezeichnet.

</div>
</div>

<div style="text-align: center;">
    <img src="https://datadudes.wordpress.com/wp-content/uploads/2016/04/box_plot_anatomy.png" style="width: 650px;">
</div>

In [None]:
fig, axes = plt.subplots(2, 3, figsize=(12, 7), sharex=True, sharey=True)

sns.boxplot(ax=axes[0,0], x=tips['day'], y=tips['total_bill'], color='greenyellow')
axes[0,0].set_title('Box plot')

sns.boxplot(ax=axes[1,0], x=tips['day'], y=tips['total_bill'], hue=tips["smoker"], palette='Set2')
axes[1,0].set_title('Box plot with hue semantics')

sns.violinplot(ax=axes[0,1], x=tips['day'], y=tips['total_bill'], color='aquamarine')
axes[0,1].set_title('Violin plot')

sns.violinplot(ax=axes[1,1], x=tips['day'], y=tips['total_bill'], hue=tips["smoker"], palette='husl', inner="stick")
axes[1,1].set_title('Violin plot with hue semantics and inner structure')

sns.barplot(ax=axes[0,2], x=tips['day'], y=tips['total_bill'], errorbar='sd', color='lightskyblue')
axes[0,2].set_title('Bar plot (with standard deviation)')

sns.barplot(ax=axes[1,2], x=tips['day'], y=tips['total_bill'], errorbar='sd', hue=tips["smoker"], palette='Set1')
axes[1,2].set_title('Bar plot with hue semantics (and standard deviation)')

# Adjust layout
plt.tight_layout()
plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

A different approach is a **`sns.violinplot()`**, which combines a boxplot with the kernel density estimation.
This approach uses the kernel density estimate to provide a richer description of the distribution of values. Additionally, the quartile and whisker values from the boxplot are shown inside the violin.
There are also options for the plot that is drawn on the interior of the violins, including ways to show each individual observation instead of the summary boxplot values (e.g., `inner="stick"`).

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Ein anderer Ansatz ist **`sns.violinplot()`**, der einen Boxplot mit der Kernel-Dichte-Schätzung kombiniert.
Bei diesem Ansatz wird die Kernel-Dichte-Schätzung verwendet, um eine umfassendere Beschreibung der Verteilung der Werte zu liefern. Zusätzlich werden die Quartil- und Whisker-Werte aus dem Boxplot innerhalb der Violine angezeigt.
Es gibt auch Optionen für das Diagramm, das auf der Innenseite der Violinen gezeichnet wird, einschließlich der Möglichkeit, jede einzelne Beobachtung anstelle der zusammengefassten Boxplot-Werte anzuzeigen (z.B., `inner="stick"`).

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

For some applications, you might want to focus on summarizing the central tendency of the values in each category, rather than displaying the full distribution. 
A common visualization for this purpose is the bar plot. 
In Seaborn, the **`sns.barplot()`** function handles this by working with the entire dataset and calculating an estimate for each category (by default, `estimator=mean`, but it could also be `median`, `sum`, or other functions). 

When a category contains multiple observations, `sns.barplot()` also calculates a confidence interval for the estimate, which is displayed as error bars (`errorbar=`, like for `lineplot()`) on the plot. 
This approach provides a concise summary of the data, making it ideal for corporate presentations where audience engagement and statistical literacy may be limited (true story).

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Bei einigen Anwendungen möchten Sie sich vielleicht auf die Zusammenfassung der zentralen Tendenz der Werte in jeder Kategorie konzentrieren, anstatt die gesamte Verteilung darzustellen. 
Eine gängige Visualisierung für diesen Zweck ist das Balkendiagramm. 
In Seaborn übernimmt die Funktion **`sns.barplot()`** diese Aufgabe, indem sie mit dem gesamten Datensatz arbeitet und einen Schätzwert für jede Kategorie berechnet (standardmäßig `estimator=mean`, aber es könnte auch `median`, `sum` oder eine andere Funktion sein). 
Wenn eine Kategorie mehrere Beobachtungen enthält, berechnet `sns.barplot()` auch ein Konfidenzintervall für die Schätzung, das als Fehlerbalken in der Darstellung angezeigt wird (`errorbar=`, wie für `lineplot()`). 
Dieser Ansatz bietet eine prägnante Zusammenfassung der Daten und eignet sich daher ideal für Unternehmenspräsentationen, bei denen das Engagement und die statistischen Kenntnisse der Zuhörer möglicherweise begrenzt sind (wahre Geschichte).

</div>
</div>

<div class="alert alert-block alert-light">

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;<div style="width: 48%; line-height: 1.5;">

#### Exercise

1. Create a boxplot to compare the distribution of ticket prices (fare) across different passenger classes (`pclass`).

2. Visualize the distribution of family size (`family_size`) for each passenger class (`pclass`) using a violin plot. Include `sticks` for the inner part of the violin plot.

3. Create a bar plot to compare the average ticket price (`fare`) for passengers based on their survival status (`alive`) and gender (`sex`). Use the hue parameter to differentiate between genders and the palette parameter to set the color scheme to `Set2`.

</div>
<div style="width: 48%; line-height: 1.35;<div style="width: 48%; line-height: 1.5;color: grey;">

#### Übung

1. Erstellen Sie ein Boxplot, um die Verteilung der Ticketpreise (`fare`) in den verschiedenen Passagierklassen (`pclass`) zu vergleichen.

2. Visualisieren Sie die Verteilung der Familiengröße (`family_size`) für jede Passagierklasse (`pclass`) mithilfe eines Violinplots. Fügen Sie `sticks` für den inneren Teil des Violinplots hinzu.

3. Erstellen Sie ein Balkendiagramm, um die durchschnittlichen Ticketpreise (`fare`) der Passagiere basierend auf ihrem Überlebensstatus (`alive`) und Geschlecht (`sex`) zu vergleichen. Verwenden Sie den `hue`-Parameter, um zwischen den Geschlechtern zu unterscheiden, und den `palette`-Parameter, um das Farbschema auf `Set2` einzustellen.

</div>
</div>

In [None]:
countdown_timer(15)

In [None]:
sns.boxplot(x=titanic['pclass'], y=titanic['fare'])

plt.show()

sns.violinplot(x=titanic['pclass'], y=titanic['family_size'], inner='sticks', color='skyblue')

plt.show()

sns.barplot(x=titanic['alive'], y=titanic['fare'], hue=titanic['sex'], palette='Set2')

plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

# Pairwise Data Relationships
## Heatmaps

Heatmaps (**`sns.heatmap()`**) are a visual tool for exploring pairwise relationships in data, especially when variables are numerous. By using color intensity to represent the strength or magnitude of a relationship (e.g., correlation), heatmaps provide a quick and intuitive overview of patterns or associations between variables in a dataset. 

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

# Paarweise Datenbeziehungen
## Heatmaps

Heatmaps (**`sns.heatmap()`**) sind ein visuelles Werkzeug zur Untersuchung paarweiser Beziehungen in Daten, insbesondere wenn viele Variablen vorhanden sind. Durch die Verwendung von Farbintensität, um die Stärke oder Größe einer Beziehung (z. B. Korrelation) darzustellen, bieten Heatmaps einen schnellen und intuitiven Überblick über Muster oder Zusammenhänge zwischen Variablen in einem Datensatz.

</div>
</div>

In [None]:
iris = sns.load_dataset('iris')

iris

<div style="text-align: center;">
    <img src="https://www.researchgate.net/profile/Gayan_De_Silva2/publication/366849054/figure/fig24/AS:11431281110951871@1672824232108/2-Petal-and-Sepal-of-Iris-flowers-As-input-data-the-network-should-be-provided-a-dataset.png" style="width: 300px;">
</div>

In [None]:
sns.heatmap(iris.corr(numeric_only=True), annot=True, cmap='bwr_r', vmin=-1, vmax=1, linewidths=0.5)

plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

Using `vmin=-1` and `vmax=1` in a heatmap ensures that the color scale is symmetric around zero. 
In this configuration, values closer to -1 and 1 are mapped to the extreme ends of the colormap, while 0 is mapped to the midpoint of the colormap, which is often white.
([Choosing color maps](https://matplotlib.org/stable/users/explain/colors/colormaps.html#diverging))

##### **Use with caution:**

Heatmaps are less effective at highlighting clusters, trends, or anomalies, which can sometimes be obscured by the aggregated nature of the visualization.

**Anscombe's Quartet is a collection of four datasets with nearly identical statistical properties (mean, variance, correlation, and regression line) but vastly different visual patterns, demonstrating the importance of visualizing data rather than relying solely on summary statistics. Looking only at the heatmaps, you would never know how different the datasets are:**

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Durch die Verwendung von `vmin=-1` und `vmax=1` in einer Heatmap wird sichergestellt, dass die Farbskala symmetrisch um Null herum ist.
In dieser Konfiguration werden Werte, die näher an -1 und 1 liegen, den extremen Enden der Farbkarte zugeordnet, während 0 dem Mittelpunkt der Farbkarte zugeordnet wird, der häufig weiß ist.
([Farbkarten auswählen](https://matplotlib.org/stable/users/explain/colors/colormaps.html#diverging))

##### **Mit Vorsicht zu verwenden:**

Heatmaps sind jedoch weniger effektiv, um Cluster, Trends oder Anomalien hervorzuheben, da diese durch die aggregierte Natur der Visualisierung manchmal verborgen bleiben können.

**Anscombes Quartett ist eine Sammlung von vier Datensätzen mit nahezu identischen statistischen Eigenschaften (Mittelwert, Varianz, Korrelation und Regressionslinie), aber sehr unterschiedlichen visuellen Mustern, die zeigen, wie wichtig es ist, Daten zu visualisieren, anstatt sich nur auf zusammenfassende Statistiken zu verlassen. Wenn man sich nur die Heatmaps anschaut, würde man nie erfahren, wie unterschiedlich die Datensätze sind:**

</div>
</div>

In [None]:
fig, axes = plt.subplots(2, 4, figsize=(10, 4.5))

anscombe = sns.load_dataset('anscombe')

# List of datasets
datasets = ['I', 'II', 'III', 'IV']

# Loop through datasets to create heatmaps and scatterplots
for i, dataset in enumerate(datasets):
    row = i // 2  # Determine the row index
    col = (i % 2)  # Determine the column index for heatmaps (left side)
    
    # Heatmap (left side)
    sns.heatmap(data=anscombe[anscombe['dataset'] == dataset][['x', 'y']].corr(), 
                cmap='bwr_r', vmin=-1, vmax=1, linewidths=0.5, annot=True, ax=axes[row, col])
    axes[row, col].set_title(f'Heatmap - {dataset}')
    
    # Scatterplot (right side)
    sns.scatterplot(data=anscombe[anscombe['dataset'] == dataset], x='x', y='y', ax=axes[row, col + 2])
    axes[row, col + 2].set_title(f'Scatterplot - {dataset}')

# General title
#fig.suptitle(f"Anscombe's Quartet:\nLooking only at the heatmaps, you would never know how different the datasets are", fontsize=16, y=1.02)

# Adjust layout
plt.tight_layout()
plt.show()

<div style="text-align: center;">
<img src="DinoSequentialSmaller.gif" style="width: 600px;">
        <figcaption>
            The Datasaurus Dozen is another example demonstrating that datasets with similar summary statistics can have vastly different distributions when visualized.
            <br>
            Das Datasaurus-Dutzend ist ein weiteres Beispiel dafür, dass Datensätze mit ähnlichen zusammenfassenden Statistiken bei der Visualisierung sehr unterschiedliche Verteilungen aufweisen können.
        </figcaption>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

## Pair Plots 

A pairplot (**`sns.pairplot()`**) is a visualization in Seaborn designed to explore pairwise relationships between numerical variables in a dataset. 
It creates a grid of plots, where each variable is plotted against every other variable, showing scatterplots for relationships and histograms (or KDEs) for individual distributions. 

Pairplots are particularly useful for identifying correlations, clusters, or patterns in data, offering a comprehensive view of all pairwise interactions at once.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

## Pair Plots 

Ein Pairplot (**`sns.pairplot()`**) ist eine in Seaborn verfügbare Visualisierung, die darauf ausgelegt ist, paarweise Beziehungen zwischen numerischen Variablen in einem Datensatz zu untersuchen.  
Es erstellt ein Raster aus Plots, in dem jede Variable gegen jede andere Variable dargestellt wird, wobei Scatterplots für Beziehungen und Histogramme (oder KDEs) für einzelne Verteilungen gezeigt werden.  

Pairplots sind besonders nützlich, um Korrelationen, Cluster oder Muster in Daten zu identifizieren und bieten eine umfassende Übersicht über alle paarweisen Interaktionen auf einmal.

</div>
</div>

In [None]:
sns.pairplot(iris, height=1.5, markers='.')

plt.show()

In [None]:
sns.pairplot(iris, height=1.5, markers='.', hue='species')

plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

The `sns.pairplot()` function with `kind="reg"` generates pairwise scatterplots **with regression lines and a 95% confidence interval for that regression.** 
It overlays a linear regression line on the scatterplots, helping to visualize both the relationships between variables and the potential trends in the data.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Die Funktion `sns.pairplot()` mit `kind="reg"` erzeugt paarweise Streudiagramme **mit Regressionslinien und einem 95%-Konfidenzintervall für diese Regression.**
Sie überlagert die Streudiagramme mit einer linearen Regressionslinie und hilft so, sowohl die Beziehungen zwischen den Variablen als auch die potenziellen Trends in den Daten zu visualisieren.

</div>
</div>

In [None]:
sns.pairplot(iris, markers='+', hue='species', kind='reg')

plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

# Controlling figure aesthetics

Visualizations are central to communicating quantitative insights to an audience.

Matplotlib is highly customizable, but it can be hard to know what settings to tweak to achieve an attractive plot. 

Seaborn comes with a number of customized themes and a high-level interface for controlling the look of figures.

## Themes

```python
sns.set_style("ticks")
sns.set_style("white")
sns.set_style("dark")
sns.set_style("whitegrid")
sns.set_style("darkgrid")
```

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

# Kontrolle der Ästhetik der Figuren

Visualisierungen sind von zentraler Bedeutung für die Vermittlung quantitativer Erkenntnisse an ein Publikum.

Matplotlib ist in hohem Maße anpassbar, aber es kann schwierig sein, zu wissen, welche Einstellungen man vornehmen muss, um eine attraktive Darstellung zu erhalten. 
<br>
Seaborn wird mit einer Reihe von angepassten Stilen und einer übersichtlichen Schnittstelle zur Steuerung des Aussehens der Zahlen geliefert.

## Themes

```python
sns.set_style("ticks")
sns.set_style("white")
sns.set_style("dark")
sns.set_style("whitegrid")
sns.set_style("darkgrid")
```

</div>
</div>

In [None]:
import numpy as np

def sinplot(n=10, flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, n + 1):
        plt.plot(x, np.sin(x + i * .5) * (n + 2 - i) * flip)

f = plt.figure(figsize=(15, 3))
gs = f.add_gridspec(1, 5)

with sns.axes_style("ticks"):
    ax = f.add_subplot(gs[0])
    sinplot(6)
    ax.set_title("ticks")

with sns.axes_style("white"):
    ax = f.add_subplot(gs[1])
    sinplot(6)
    ax.set_title("white")

with sns.axes_style("dark"):
    ax = f.add_subplot(gs[2])
    sinplot(6)
    ax.set_title("dark")

with sns.axes_style("whitegrid"):
    ax = f.add_subplot(gs[3])
    sinplot(6)
    ax.set_title("whitegrid")

with sns.axes_style("darkgrid"):
    ax = f.add_subplot(gs[4])
    sinplot(6)
    ax.set_title("darkgrid")

f.tight_layout()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

## Scaling plot elements

The size of a plot should be tailored to the specific context in which it will be presented, as different settings have unique requirements for readability and visual impact.

At some point, your professor will complain that your plots are barely readable. Seaborn provides the ability to increase the size of text and other elements easily, without needing to adjust manual settings.

To adjust the overall context of Seaborn plots (including text size, line thickness, and other elements), you can use:

```python
sns.set_context('notebook') # Default
sns.set_context('paper')
sns.set_context('talk')
sns.set_context('poster')
```

`context=` controls the scale of the plot elements. Options:

- `'paper'`: Smallest elements.

- `'notebook'`: Balanced for Jupyter notebooks (default).

- `'talk'`: Larger elements, great for presentations.

- `'poster'`: Largest elements, ideal for posters.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

## Skalierung der Plot-Elemente

Die Größe eines Plots sollte auf den spezifischen Kontext, in dem er präsentiert wird, zugeschnitten sein, da unterschiedliche Umgebungen besondere Anforderungen an die Lesbarkeit und die visuelle Wirkung stellen.

Irgendwann wird sich Ihr Professor darüber beschweren, dass Ihre Plots kaum lesbar sind. Seaborn bietet die Möglichkeit, die Größe von Text und anderen Elementen einfach zu erhöhen, ohne dass manuelle Einstellungen vorgenommen werden müssen.

Sie können den Gesamtkontext von Seaborn-Plots (einschließlich Textgröße, Liniendicke und anderer Elemente) anpassen:

```python
sns.set_context('notebook') # Default
sns.set_context('paper')
sns.set_context('talk')
sns.set_context('poster')
```

`context=` steuert den Maßstab der Plot-Elemente. Optionen:

- `'paper'`: Kleinste Elemente.

- `'notebook'`: Ausgewogen für Jupyter-Notebooks (Standard).

- `'talk'`: Größere Elemente, ideal für Präsentationen.

- `'poster'`: Größere Elemente, ideal für Poster.

</div>
</div>

In [70]:
sns.set_context()

In [None]:
fig, axes = plt.subplots(1, 4, figsize=(12, 3.5))

# Define contexts and titles
contexts = ["paper", "notebook", "talk", "poster"]
titles = ["Paper", "Notebook (Default)", "Talk", "Poster"]

# Loop through axes, applying individual contexts
for ax, context, title in zip(axes.flatten(), contexts, titles):
    with sns.plotting_context(context):  # Apply context
        plt.sca(ax)  # Set current axis
        sinplot(6)  # Draw the sine plot
        ax.set_title(title)  # Set title
        # Adjust tick labels explicitly to reflect the context
        ax.tick_params(axis='both', labelsize=plt.rcParams['axes.labelsize'])

# Adjust layout
plt.tight_layout()
plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

## Saving Your Plots

You can save your plots by clicking the "Save as" icon that appears when you hover over your figure, or by using Matplotlib's `plt.savefig()` function. The latter provides additional customization options, such as setting the resolution or enabling a transparent background.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

## Speichern Ihrer Plots

Sie können Ihre Plots speichern, indem Sie auf das „Save as“-Symbol klicken, das erscheint, wenn Sie den Mauszeiger über Ihren Plot bewegen, oder indem Sie die Matplotlib-Funktion `plt.savefig()` verwenden. Letztere bietet zusätzliche Anpassungsoptionen, wie z.B. die Einstellung der Auflösung oder die Aktivierung eines transparenten Hintergrunds.

</div>
</div>

```python
plt.savefig('figure_name.png', dpi=300, transparent=True, bbox_inches='tight')
```

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

### **Argument against titles in scientific plots**

Figure titles may be helpful for presentations, educational materials, or informal visualizations, but it is generally unnecessary and potentially counterproductive to use them in professional scientific plots. 

Scientific publications universally require detailed figure captions placed below the figure, explaining its content, purpose, and context.
A title adds redundancy by duplicating the information already provided in the caption and occupying valuable space.

*ChatGPT often includes titles when generating plots. However, relying on this can be a telltale sign of AI assistance, especially in professional or scientific contexts where a title is less commonly used.*

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

### **Argument gegen Titel in wissenschaftlichen Darstellungen**

Abbildungstitel können für Präsentationen, Lehrmaterial oder informelle Visualisierungen hilfreich sein, aber es ist im Allgemeinen unnötig und potenziell kontraproduktiv, sie in professionellen wissenschaftlichen Darstellungen zu verwenden.
<br>
Wissenschaftliche Veröffentlichungen erfordern in der Regel ausführliche Bildunterschriften, die unter der Abbildung platziert werden und deren Inhalt, Zweck und Kontext erläutern.
Ein Titel führt zu Redundanz, indem er die Informationen, die bereits in der Bildunterschrift enthalten sind, verdoppelt und wertvollen Platz belegt.
<br>
*In ChatGPT werden bei der Erstellung von Diagrammen häufig Titel eingefügt. Dies kann jedoch ein verräterisches Zeichen für KI-Hilfe sein, insbesondere in professionellen oder wissenschaftlichen Kontexten, in denen ein Titel seltener verwendet wird.*

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

**From now on, the use of titles will be considered a mistake.**

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

**Von nun an wird die Verwendung von Titeln als Fehler betrachtet.**

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

It is, however, acceptable to use smaller titles in subplots to label individual panels. 

These titles can include identifiers like "a)", "b)", etc., to distinguish each panel and make it easier to reference them in figure captions and the text of the publication.

</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

Es ist jedoch zulässig, in Subplots kleinere Titel zu verwenden, um einzelne Felder zu kennzeichnen.

Diese Titel können Bezeichnungen wie "a)", "b)" usw. enthalten, um die einzelnen Tafeln zu unterscheiden und die Bezugnahme auf sie in den Bildunterschriften und im Text der Veröffentlichung zu erleichtern.

</div>
</div>

In [None]:
fig, axes = plt.subplots(2, 4, figsize=(10, 5))

# List of datasets
datasets = ['I', 'II', 'III', 'IV']

# Loop through datasets to create heatmaps and scatterplots
for i, dataset in enumerate(datasets):
    row = i // 2  # Determine the row index
    col = (i % 2)  # Determine the column index for heatmaps (left side)
    
    # Heatmap (left side)
    sns.heatmap(data=anscombe[anscombe['dataset'] == dataset][['x', 'y']].corr(), 
                cmap='bwr_r', vmin=-1, vmax=1, linewidths=0.5, annot=True, ax=axes[row, col])
    axes[row, col].set_title(f'Heatmap - {dataset}')
    
    # Scatterplot (right side)
    sns.scatterplot(data=anscombe[anscombe['dataset'] == dataset], x='x', y='y', ax=axes[row, col + 2])
    axes[row, col + 2].set_title(f'Scatterplot - {dataset}')

# General title
fig.suptitle("Avoid: A title adds redundancy and occupies valuable space", fontsize=16, y=1.02, color="red")

# Adjust layout
plt.tight_layout()
plt.show()

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

## Formatting Labels

By default, Seaborn generates $x$ and $y$ labels based on the corresponding column headers. 
These labels may appear as unformatted "raw" text, particularly if they originate from instrument-generated data.

You can always override and customize axes labels by using:

    ```python
    plt.xlabel('X-Axis Label')
    plt.ylabel('Y-Axis Label')
    ```

</div>
<div style="width: 48%; line-height: 1.3;color: grey;">

## Beschriftungen formatieren

Standardmäßig erzeugt Seaborn $x$- und $y$-Beschriftungen auf der Grundlage der entsprechenden Spaltenüberschriften.
Diese Beschriftungen können als unformatierter "roher" Text erscheinen, insbesondere wenn sie aus gerätegenerierten Daten stammen.

Sie können die Achsenbeschriftungen jederzeit überschreiben und anpassen, indem Sie:

    ```python
    plt.xlabel('X-Axis Label')
    plt.ylabel('Y-Axis Label')
    ```
benutzen.

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

**1. f-Strings (`f""`)**
- Use `f""` to embed Python expressions directly into strings. Variables or expressions wrapped in curly braces `{}` are evaluated and inserted into the string.

```python
decay_rate = 0.5
label = f"Decay Rate: {decay_rate}"
```

**2. Raw Strings (`r""`)**
- Use `r""` to treat backslashes (`\`) as literal characters, avoiding escape sequences.
- This is especially useful for LaTeX-style math expressions in plot labels.

```python
label = r"$\sin(x)$"
```

**3. Combined Raw f-Strings (`rf""`)**
- Combine both `f""` and `r""` to create a string that supports both variable interpretation and raw formatting.
- Useful for dynamically embedding variables into LaTeX-style math expressions.

```python
decay_rate = 0.5
label = rf"f(x) = $\sin(2 \pi x) \cdot e^{{-{decay_rate} \cdot x}}$"
```

</div>
<div style="width: 48%; line-height: 1.3;color: grey;">

**1. f-Strings (`f""`)**
- Verwenden Sie `f""`, um Python-Ausdrücke direkt in Zeichenketten einzubetten. Variablen oder Ausdrücke, die in geschweifte Klammern `{}` eingeschlossen sind, werden ausgewertet und in die Zeichenkette eingefügt.

```python
decay_rate = 0.5
label = f"Decay Rate: {decay_rate}"
```

**2. Raw Strings (`r""`)**
- Verwenden Sie `r""`, um Backslashes (`\`) als Literalzeichen zu behandeln und Escape-Sequenzen zu vermeiden.
- Dies ist besonders nützlich für mathematische Ausdrücke im LaTeX-Stil in Beschriftungen.

```python
label = r"$\sin(x)$"
```

**3. Combined Raw f-Strings (`rf""`)**
- Kombinieren Sie `f""` und `r""`, um eine Zeichenkette zu erstellen, die sowohl Variableninterpretation als auch Rohformatierung unterstützt.
- Nützlich für die dynamische Einbettung von Variablen in mathematische Ausdrücke im LaTeX-Stil.

```python
decay_rate = 0.5
label = rf"f(x) = $\sin(2 \pi x) \cdot e^{{-{decay_rate} \cdot x}}$"
```

</div>
</div>

<div style="display: flex; justify-content: space-between;">
<div style="width: 48%; line-height: 1.5;">

### Quick Guide to Common $\LaTeX$ Commands for Equations 

In $\LaTeX$, functions such as $\sin$, $\cos$, $\tan$, $\ln$, $\log$, $\exp$, and others require a **backslash** (`\`) before the function name to be correctly formatted as mathematical operators.

- Correct Usage: $\sin(x)$, $\cos(x)$, $\tan(x)$, $\ln(x)$, $\log(x)$, $\exp(x)$

- Incorrect Usage: $sin(x)$, $cos(x)$, $tan(x)$, $ln(x)$, $log(x)$, $exp(x)$

</div>
<div style="width: 4%;">
</div>
<div style="width: 48%; line-height: 1.5;color: grey;">

### Kurzanleitung für gängige $\LaTeX$-Befehle für Gleichungen

In $\LaTeX$ benötigen Funktionen wie $\sin$, $\cos$, $\tan$, $\ln$, $\log$, $\exp$ und andere einen **backslash** (`\`) vor dem Funktionsnamen, um korrekt als mathematische Operatoren formatiert zu werden.

- Korrekte Verwendung: $\sin(x)$, $\cos(x)$, $\tan(x)$, $\ln(x)$, $\log(x)$, $\exp(x)$

- Falsche Verwendung: $sin(x)$, $cos(x)$, $tan(x)$, $ln(x)$, $log(x)$, $exp(x)$

</div>
</div>

|   Description                   |  Beschreibung                      |      Syntax                        |     Rendering                        |
|------------------------------------------|------------------------------------------|--------------------------------------------|------------------------------------|
| Superscript                              | Hochstellung                             | `$x^n, x^{nmk}$`                                | $ x^n, x^{nmk} $                            |
| Subscript                                | Tiefstellung                             | `$x_i, x_{ijk}$`                                 | $ x_i, x_{ijk} $                            |
| Superscript + Subscript          | Hochstellung + Tiefstellung                      | `$x_i^n$`                                 | $ x_i^n $                            |
| Fractions                                | Brüche                                   | `$\frac{a}{b}$`                              | $ \frac{a}{b} $                    |
| Square Root                              | Quadratwurzel                            | `$\sqrt{x}, \sqrt[n]{x}$`                  | $ \sqrt{x}, \sqrt[n]{x} $          |
| Greek Letters                            | Griechische Buchstaben                   | `$\alpha, \beta, \gamma, \delta, \epsilon, \phi$`      | $ \alpha, \beta, \gamma, \delta, \epsilon, \phi $ |
| Alternative Greek Letters                            | Alternative Griechische Buchstaben                   | `$\varepsilon, \varphi$`      | $\varepsilon, \varphi $ |
| Plus-Minus Sign                          | Plus-Minus-Zeichen                       | `$\pm$`                                      | $ \pm $                            |
| Multiplication Dot                       | Multiplikationspunkt                     | `$\cdot$`                                    | $ \cdot $                          |
| Infinity                                 | Unendlichkeit                            | `$\infty$`                                   | $ \infty $                         |
| Summation                                | Summenzeichen                            | `$\sum_{i=1}^{n}$`                           | $ \sum_{i=1}^{n} $                 |
| Integral                                 | Integralzeichen                          | `$\int_{a}^{b}$`                             | $ \int_{a}^{b} $                   |
| Trigonometric Functions | Trigonometrische Funktionen | `$\sin, \cos, \tan$`                          | $ \sin, \cos, \tan $               |
| Logarithms and Exponentials              | Logarithmen und Exponentialfunktionen     | `$\log, \ln, \exp$`                            | $ \log, \ln, \exp $                |
| Auto-sized Parentheses                   | Automatische Klammergrößen               | `$\left( \frac{a}{b} \right)$`               | $ \left( \frac{a}{b} \right) $     |
| Auto-sized Brackets                      | Automatische eckige Klammern             | `$\left[ \frac{a}{b} \right]$`               | $ \left[ \frac{a}{b} \right] $     |
| Auto-sized Curly Braces                  | Automatische geschweifte Klammern        | `$\left\{ \frac{a}{b} \right\}$`             | $ \left\{ \frac{a}{b} \right\} $   |
| Equality, Less Than, Greater Than        | Gleichheit, kleiner als, größer als      | `$=, <, >$`                                  | $ =, <, > $                        |
| Not Equal                                | Ungleich                                 | `$\neq$`                                     | $ \neq $                           |
| Greater/Less Than or Equal To | Größer gleich, kleiner gleich          | `$\geq, \leq$`                               | $ \geq, \leq $                     |
| Approximation                            | Annäherung                               | `$\approx$`                                  | $ \approx $                        |
| Right/Left Arrow       | Pfeil rechts/links               | `$\rightarrow, \leftarrow$`                                  | $ \rightarrow, \leftarrow$                        |
| Long Right/Left Arrow       | Langer Pfeil rechts/links               | `$\longrightarrow, \longleftarrow$`                                  | $ \longrightarrow, \longleftarrow$  
| Equilibrium Arrow       | Pfeil des Gleichgewichts               | `$\rightleftharpoons$` | $\rightleftharpoons$
| Degree       | Grad               | `$^\circ$`                                  | $ ^\circ$  