<h1>Verschiedene Graphiken für das Darstellen ganzer Datensätze</h1>

<h2>Vorbereitungen</h2>

Zunächst müssen die import-Befehle der Bibliotheken durchgeführt werden, die genutzt werden. Dazu gehören z.B. die plotly-Bibliothek zum Zeichnen der Graphen oder die Pandas-Bibliothek zum Verwalten der Datensätze.

In [18]:
from ipyleaflet import Map, Marker, LayersControl, MarkerCluster, LayerGroup, WidgetControl, Polyline, Popup
from ipywidgets import IntSlider, Play, Layout, Output, VBox, HTML, Button, Dropdown, Combobox, HBox, Text, AppLayout
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
#import time
import datetime
import chart_studio.plotly as py
import plotly.graph_objects as go
import cufflinks as cf
from IPython.display import clear_output
cf.go_offline()
cf.set_config_file(offline=False, world_readable=True)

## Ein (einfaches) Dataframe erstellen

Um ein einfaches DataFrame erstellen zu können, müssen zunächst die jeweiligen Daten in einem (zweidimensionalen) Arry abgespeichert werden und können dann in ein DataFrame überführt werden.

In [51]:
daten = [[1,0],[2,1],[3,2],[4,-1]]
df = pd.DataFrame(data = daten, columns = ['x','y'])
df = df.set_index('x')
print(df)

   y
x   
1  0
2  1
3  2
4 -1


Um nun eine erste Graphik zu erstellen, muss eine Figure-Umgebung angelegt werden, in die dann die Graphen nach und nach eingetragen werden. Dabei werden jeweils die Daten der x- und y-Werte festgelegt. Da der x-Wert unser Index ist, muss hier auch darauf verwiesen werden mit <code>df.index</code>

In [65]:
fig = go.Figure()
# Add traces
fig.add_trace(go.Scatter(x=df.index, y=df['y']))
fig.show()

Erstelle nun ein eigenes DataFrame und eine eigene Graphik, in der dieses dargestellt wird. Hier erhältst Du zusätzliche Informationen, wie Du die Graphiken mit Legenden/Beschriftungen versehen kannst: https://plotly.com/python/text-and-annotations/#text-on-scatter-plots-with-graph-objects

In [None]:
#Platz, um DataFrame zu erstellen

In [None]:
#Platz, um Graphik zu erzeugen

## Ein DataFrame aus einer csv-Datei erstellen

Zuerst werden die Daten eingelesen:

In [47]:
df = pd.read_csv('Daten/temp.csv', parse_dates=['value'])

Damit die einzelnen Spalten des Datensatzes den richtigen Datentyp haben (<code>datetime</code> für Uhrzeit/Datum und <code>numeric</code> für den gemessenen Wert (hier Temperatur)) müssen beide Spalten konvertiert werden. Dies entspricht quasi dem Casten in Java. Zudem wird der Index auf den Zeitstempel gesetzt, damit dieser Wert später auf der x-Achse angezeigt wird und der Datensatz damit durchlaufen werden kann.

In [48]:
df['timestamp'] = pd.to_datetime(df['timestamp'], dayfirst=True,errors='coerce')
df['value'] = pd.to_numeric(df['value'], errors='coerce')
if df.index.name != 'timestamp':
    df = df.set_index('timestamp')

Hier funktioniert das Plotten des DataFrames genau wie auch vorher. Allerdings muss man hier die Spaltennamen anpassen.

In [43]:
fig = go.Figure()
# Add traces
fig.add_trace(go.Scatter(x=df.index, y=df['value']))
fig.show()

## Datensätze filtern

Um nun zwei Tage als eigene Datensätze zu speichern, wird ein Filter angewandt:

In [4]:
df_Apr12 = df[(df.index.day==12) & (df.index.month==4) & (df.index.year==2020)]
df_Apr20 = df[(df.index.day==20) & (df.index.month==4) & (df.index.year==2020)]

<h2>Mehrere Datensätze als Graph in einer Graphik</h2>

<h3>Variante 1: Sequenzielles Hinzufügen in eine figure</h3>

Zunächst muss eine Figure-Umgebung angelegt werden, in die dann die Graphen nach und nach eingetragen werden. Dabei werden jeweils die Daten der x- und y-Werte festgelegt. <br>
<i>Tipp: Durch die property <code>.index</code> greift man auf den Index des Datensatzes zu - den wir weiter oben als Zeitstempel festgelegt haben.</i><br>
Als letztes muss noch der Befehl gegeben werden, dass die figure angezeigt wird.

In [5]:
fig = go.Figure()
# Add traces
fig.add_trace(go.Scatter(x=df_Apr12.index, y=df_Apr12['value'],mode='lines',name='12. April'))
fig.add_trace(go.Scatter(x=df_Apr20.index, y=df_Apr20['value'],mode='lines',name='20. April'))
fig.show()

Wie man sieht, werden die beiden Graphen zwar in einer Graphik angezeigt, allerdings nicht "übereinanderliegend", da die x-Werte sich im Datum unterscheiden. Hierzu müssen die x-Werte auf den gleichen Tag festgelegt werden (also bspw. den 12.04.)

In [6]:
fig = go.Figure()
# Add traces
fig.add_trace(go.Scatter(x=df_Apr12.index, y=df_Apr12['value'],mode='lines',name='12. April'))
fig.add_trace(go.Scatter(x=df_Apr12.index, y=df_Apr20['value'],mode='lines',name='20. April'))
fig.show()

Alternativ lassen sich die Graphiken auch in einem Plot nach und nach eingeben. Hierbei fällt allerdings der dynamische Aspekt der Graphik weg, man kann bspw. nichtmehr über den Graph "drüberschweben", sodass weitere Infos am Mauszeiger erscheinen. Dafür können später einfacher änderungen am Label und an der Legende gemacht werden.

In [7]:
plt.plot(df_Apr12.index, df_Apr12['value'], label = "12. April")
plt.plot(df_Apr12.index,df_Apr20['value'], label = "20. April")
plt.legend()
plt.show()

NameError: name 'plt' is not defined