# Scatterplots

Ein Scatterplot (Punktdiagramm) visualisiert die Beziehung zwischen zwei numerischen Variablen, indem er einzelne Punkte in einem Koordinatensystem darstellt, wobei die x- und y-Koordinaten jeweils die Werte der beiden Variablen repräsentieren.
Ideal, um verstreute Daten zu visualisieren. 

In [3]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(42)

## Beispiel
Einen Datensatz mit 100 zweidimensionalen Punkten erstellen, der aus einer mehrdimensionalen normalverteilten Zufallsverteilung mit dem Mittelwert $[1,1]$ und der Kovarianzmatrix
\begin{bmatrix}
2 & 1 \\
1 & 2
\end{bmatrix} generiert wurde, wodurch die Punkte eine elliptische Streuung mit Korrelation aufweisen. Zur Erinnerung: Die Kovarianz misst die lineare Abhängigkeit zwischen zwei Variablen – ein positiver Wert zeigt eine gemeinsame Zunahme, ein negativer eine gegenläufige Entwicklung. Die Kovarianzmatrix ist eine symmetrische Matrix, die die paarweisen Kovarianzen mehrerer Variablen enthält und deren Streuung sowie Wechselbeziehungen beschreibt.

In [1]:
cov = [
    [2, 1],
    [1, 2]
]
mean = [1, 1]


## Marker, Colors und Colorbar.
Die Default-Marker des Scatterplots sind Kreise. Wir können das durch das Attribut `marker` anpassen, wie wir das auch von den `Lineplots` kennen. Die übergebene Liste `colors` muss genausoviele Einträge enthalten wie N. 

## Fläche der Marker und Colorbar
via dem Argument `s` lässt sich für jeden Datenpunkt eine Fläche angeben. Die übergebene Liste `area` muss genausoviele Einträge enthalten, wie N.

Um eine Legende für die übergebenen Colors anzuzeigen, kann man eine `colorbar` einblenden.

In Matplotlib wird standardmäßig die "viridis"-Colormap verwendet, wenn keine andere angegeben wird (Kleine Werte sind dunkelviolett/blau, Größere Werte gehen über grün bis zu gelb).

In [30]:
# weitere verfügbare Themes
plt.colormaps()[:10]

['magma',
 'inferno',
 'plasma',
 'viridis',
 'cividis',
 'twilight',
 'twilight_shifted',
 'turbo',
 'Blues',
 'BrBG']

## Scatterplot mit Pandas Dataframe
Pandas bietet einen Wrapper, um komfortabel gleich den Dataframe zu plotten. Dazu nutzen wir die `plot`-Methode des Dataframes (oder Series) und übergeben mit `kind` die Art des Plots. Über `x` und `y` können wir die Spalten des Dataframes definieren, die geplottet werden sollen. Über `s` können wir die Spalte angeben, die die Größe symbolisiert, und über `c` die Spalte, die die Farbwerte repräsentiert.

Falls wir noch eine `Colorbar` oder `Labels` brauchen, geben wir die über `ptl` wie gewohnt an.

## Aufgabe
Erzeuge einen Scatterplot mit zufälligen Erdbebenpositionen, indem du 200 zufällige Breitengrade (-90 bis 90) und Längengrade (-180 bis 180) generierst, deren Magnituden (2.5 bis 8.0) als Farben (cmap="hot") und Punktgrößen (s=magnitudes**2) dargestellt werden, füge eine Farbskala mit plt.colorbar(label="Magnitude") hinzu und beschrifte Achsen sowie Titel, um eine simulierte globale Erdbebenkarte zu visualisieren.

Die Längen-und Breitengrade sowie Magnituden sind gleichverteilt (np.random.uniform)

In [3]:
import numpy as np
import matplotlib.pyplot as plt

# Anzahl der Erdbeben
num_earthquakes = 200

# Zufällige Breitengrade (-90 bis 90), 200 Einträge
latitudes = ...

# Zufällige Längengrade (-180 bis 180)
longitudes = ...

# Zufällige Magnituden (2.5 bis 8.0)
magnitudes = ...

# Scatterplot erstellen


# Farbskala hinzufügen


# Titel und Achsenbeschriftung (title: Simulierte Erdbeben weltweit, xlabel: Längengrad, ylabel: Breitengrad)

# Anzeige des Plots

