## Python Setup

Import der benötigten Bibliotheken:

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

* **Pandas**: Bearbeitung und Analyse von Daten ([Dokumentation](https://pandas.pydata.org/))

* **Matplotlib**: Erstellung von Abbildungen ([Dokumentation](https://matplotlib.org/))

* **Seaborn**: Vereinfachte Erstellung von statistischen Abbildungen - auf Basis von Matplotlib. ([Dokumentation](https://seaborn.pydata.org/))

# Daten

Daten (CSV-Datei) mit Hilfe von pandas aus einem GitHub-Repository importieren und mit der Bezeichnung `df` speichern.

In [None]:
df = pd.read_csv('https://raw.githubusercontent.com/kirenz/daten/main/statistik/00-1-shipman-opfer.csv')

Wir verschaffen uns zunächst einen Überblick über die Daten. 

In [None]:
# Überblick
df.info()

In [None]:
# Tabellenkopf (erste 5 Zeilen)
df.head()

In [None]:
# Die letzten 3 Zeilen der Tabelle anzeigen lassen
df.tail(3)

Daten bei Bedarf anpassen

In [None]:
# Löschen von fractionalDeathYear
df.drop(['fractionalDeathYear'], axis=1, inplace=True)

In [None]:
# Übersicht über Datenformate
df.dtypes

In [None]:
# Anpassung der Variable gender
df["gender"] = df["gender"].astype("category")

In [None]:
# Prüfung, ob Anpassung erfolgreich war
df.dtypes

In [None]:
# Änderung der Einträge in Variable gender (von 0 zu Weiblich und 1 zu Männlich)
df = df.replace({'gender': {0:'Weiblich', 1:'Männlich'}})

In [None]:
# Prüfung, ob Änderung erfolgreich war
df.gender.head()

In [None]:
# Umbenennung von Variablen
df.rename(columns={ 'Age': 'Alter', 
                    'yearOfDeath': 'Todesjahr', 
                    'gender': 'Geschlecht'}, 
                    inplace=True)

# Analyse

In [None]:
df.describe()

## Streudiagramm

In [None]:
sns.scatterplot(data=df, x="Todesjahr", y="Alter");

## Streudiagramm mit Geschlecht

In [None]:
sns.scatterplot(data=df, x="Todesjahr", y="Alter", hue="Geschlecht");

## Streudiagramm mit Dichtefunktion

In [None]:
sns.jointplot(data=df, x="Todesjahr", y="Alter", hue="Geschlecht");