In [None]:
##############################################################################################################################################
#                                                  DAS PROGRAMM HAT DIE FOLGENDEN FEATURES:                                                  #
#____________________________________________________________________________________________________________________________________________#
#                                                                                                                                            #
#                                 1) Der Wechsel des Datensatzes ist innerhalb der Datenbank des DWD möglich                                 #
#                                 2) Automatische Erkennung des ersten und des letzten Jahres im Datensatzes                                 #
#                                        3) Automatische Untersuchung des Datensatzes auf Datenlücken                                        #
#                      3.1) Ggf. Ausgabe der fehlenden Jahre und Berücksichtigung der Datenlücke(n) im weiteren Verlauf                      #
#                  3.2) Sonst freie Wahl eines individuell gewählten Betrachtungszeitraumes (z.B. Normalperiode = 30 Jahre                   #
#                                                      4) Wahl des Modus (HDD oder CDD)                                                      #
#                                                    5) Prävention fehlerhafter Eingaben                                                     #
#                                           5.1) Z.B. andere Eingaben beim Modus als HDD oder CDD                                            #
#                     5.2) Den (lückenlosnen) Datensatz übersteigende bzw. negative Eingaben bei der Betrachtungsperiode                     #
#                                             5.3). Ggf. Aufforderung zur Korrektur der Eingabe                                              #
#                      6) Automatische Erkennung von Schaltjahren und ggf. Berücksichtigung bei der Berechnung der HDDs                      #
#       7) Diverse [INFOS]/[WARNUNGEN] an entsprechenden Stellen um den Nutzer bei seinen Eingaben zu unterstützen bzw. zu informieren       #
#                       8) Auf Wunsch graphische Ausgabe der CDDs/HDDs inkl. Mittelwert über den Betrachtungszeitraum                        #
#                      9) Bepreisung von Wetter-Optionen in Abhängigkeit vom Modus für eine beliebige Vertragslaufzeit                       #
#               10) Auf Wunsch automatische Trendbereinigung der Messreihe mit entsprechenden Konsequenzen auf die Fair-Values               #
#                                                                                                                                            #
##############################################################################################################################################
#Version 1.4 (online)

Source Code:
<br>
© Thomas Robert Holy 2019
<br>
Version 1.4 (online)

Die Datensätze stammen vom Deutschen Wetterdienst und sind hier abrufbar: https://opendata.dwd.de/climate_environment/CDC/observations_germany/climate/daily/kl/historical/

![](DWD-Logo.jpg)

# Grundlegene Einstellungen

Erweitertes Ausgabefeld für Outputs:

In [None]:
%%javascript
IPython.OutputArea.auto_scroll_threshold = 9999;

Import der nötigen Packages:

In [None]:
import numpy as np
import pandas as pd 
import sys
import matplotlib.pyplot as plt
import math
import operator
import datetime as dt
from sklearn.linear_model import LinearRegression
from scipy import stats

Einstellungen wie Formatierung Output, Größe der Grafiken:

In [None]:
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:100% !important; }</style>"))

SCREEN_WIDTH = 140
centered = operator.methodcaller('center', SCREEN_WIDTH)

pd.set_option('display.width', 125)
plt.rcParams["figure.figsize"] = 20,10

# Erster Programmteil

Hier werden einige Funktionen definiert.

In [None]:
def get_month(x):
    return x.month
def get_year(x):
    return x.year
def get_day(x):
    return x.day  

def kmzinsabfrage():
    while True:
        try:
            global kmzins
            kmzins = float(input('|' + centered('Bitte geben Sie einen Kapitalmarktzins (z.B. 5) ein! ') + '| '))
        except ValueError:
            print('|' + centered('[FEHLER] Bitte geben Sie den Kapitalmarktzins als reelle Zahl ein!') + '| ')
        else:
            print('|' + centered('[INFO] Es mit einem Kapitalmarktzins i.H.v. ' + str(kmzins) + ' % kalkuliert.') + '| ')
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            kmzins = kmzins/100
            break        

def ticksizeabfrage():
    while True:
        try:
            global ticksize
            ticksize = float(input('|' + centered('Bitte geben Sie eine TickSize (z.B. 100) ein! ') + '| '))
        except ValueError:
            print('|' + centered('[FEHLER] Bitte geben Sie den TickSize als reelle Zahl ein!') + '| ')
        else:
            print('|' + centered('[INFO] Es mit einem TickSize i.H.v. ' + str(ticksize) + ' kalkuliert.') + '| ')
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            ticksize = ticksize
            break  

def detrend_hdd(): 
    global hdd_list
    series = hdd_list
    X = [i for i in range(0, len(series))]
    X = np.reshape(X, (len(X), 1))
    y = hdd_list
    model = LinearRegression()
    model.fit(X, y)
    trend = model.predict(X)
    detrended = [y[i]-trend[i] for i in range(0, len(series))] + np.mean(series)
    hdd_list = detrended
    dynrange = sorted(hdd_list)
    def addFirstAndLast(x):
        return dynrange[0], dynrange[-1]
    dynmin = max(0, int(dynrange[0] - 400))
    dynmax = int(dynrange[-1] + 200)
    for a,b in zip(untersuchtejahre, hdd_list): 
        plt.text(a - 0.25 , b + 10, str(round(b,2)), rotation=90)
    z = np.polyfit(untersuchtejahre, hdd_list, 1)
    p = np.poly1d(z)
    plt.plot(untersuchtejahre, p(untersuchtejahre),"r--", label='Trendlinie', color='black')
    plt.bar(untersuchtejahre, detrended)
    plt.xlabel('Jahr')
    plt.ylabel('HDDs')
    plt.axhline(y = hdd_mittelwert, color='red', label="Mittelwert")
    plt.legend(loc='upper left')
    plt.grid() 
    plt.title('HDD-Werte innerhalb der jeweiligen Akkumulationsperiode im Betrachtungszeitraum') # Label Überschrift
    plt.ylim(bottom=dynmin)
    plt.ylim(top=dynmax)
    plt.show()   
    
def detrend_cdd(): 
    global cdd_list
    series = cdd_list
    X = [i for i in range(0, len(series))]
    X = np.reshape(X, (len(X), 1))
    y = cdd_list
    model = LinearRegression()
    model.fit(X, y)
    trend = model.predict(X)
    detrended = [y[i]-trend[i] for i in range(0, len(series))] + np.mean(series)
    cdd_list = detrended
    dynrange = sorted(cdd_list)
    def addFirstAndLast(x):
        return dynrange[0], dynrange[-1]
    dynmin = max(0, int(dynrange[0] - 400))
    dynmax = int(dynrange[-1] + 200)
    for a,b in zip(untersuchtejahre, cdd_list): 
        plt.text(a - 0.25 , b + 10, str(round(b,2)), rotation=90)
    z = np.polyfit(untersuchtejahre, cdd_list, 1)
    p = np.poly1d(z)
    plt.plot(untersuchtejahre, p(untersuchtejahre),"r--", label='Trendlinie', color='black')
    plt.bar(untersuchtejahre, detrended)
    plt.xlabel('Jahr')
    plt.ylabel('CDDs') 
    plt.axhline(y = cdd_mittelwert, color='red', label="Mittelwert") 
    plt.legend(loc='upper left') 
    plt.grid() 
    plt.title('CDD-Werte innerhalb der jeweiligen Akkumulationsperiode im Betrachtungszeitraum') # Label Überschrift
    plt.ylim(bottom=dynmin) 
    plt.ylim(top=dynmax)
    plt.show()   

def detrend_hdd2(): 
    global hdd_list
    series = hdd_list 
    X = [i for i in range(0, len(series))]
    X = np.reshape(X, (len(X), 1))
    y = hdd_list
    model = LinearRegression()
    model.fit(X, y)
    trend = model.predict(X)
    detrended = [y[i]-trend[i] for i in range(0, len(series))] + np.mean(series)
    hdd_list = detrended     

def detrend_cdd2(): 
    global cdd_list
    series = cdd_list
    X = [i for i in range(0, len(series))]
    X = np.reshape(X, (len(X), 1))
    y = cdd_list
    model = LinearRegression()
    model.fit(X, y)
    trend = model.predict(X)
    detrended = [y[i]-trend[i] for i in range(0, len(series))] + np.mean(series)
    cdd_list = detrended
    
def trendbereinigung_hdd():
    trendbereinigung = None
    while trendbereinigung not in ('Ja', 'Nein', 'ja', 'nein'):
        trendbereinigung = input('|' + centered('[EINGABE] Soll die Messreihe Trendbereinigt werden? Geben Sie "Ja" oder "Nein" ein: ') + '| ')
        if trendbereinigung == 'Ja' or trendbereinigung == 'ja':
            detrend_hdd()
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
        elif trendbereinigung == 'Nein' or trendbereinigung == 'nein':
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            pass
        else:
            print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')

def trendbereinigung_cdd():
    trendbereinigung = None
    while trendbereinigung not in ('Ja', 'Nein', 'ja', 'nein'):
        trendbereinigung = input('|' + centered('[EINGABE] Soll die Messreihe Trendbereinigt werden? Geben Sie "Ja" oder "Nein" ein: ') + '| ')
        if trendbereinigung == 'Ja' or trendbereinigung == 'ja':
            detrend_cdd()
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
        elif trendbereinigung == 'Nein' or trendbereinigung == 'nein':
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            pass
        else:
            print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')

def trendbereinigung_hdd2():
    trendbereinigung = None
    while trendbereinigung not in ('Ja', 'Nein', 'ja', 'nein'):
        trendbereinigung = input('|' + centered('[EINGABE] Soll die Messreihe Trendbereinigt werden? Geben Sie "Ja" oder "Nein" ein: ') + '| ')
        if trendbereinigung == 'Ja' or trendbereinigung == 'ja':
            detrend_hdd2()
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
        elif trendbereinigung == 'Nein' or trendbereinigung == 'nein':
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            pass
        else:
            print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')

def trendbereinigung_cdd2():
    trendbereinigung = None
    while trendbereinigung not in ('Ja', 'Nein', 'ja', 'nein'):
        trendbereinigung = input('|' + centered('[EINGABE] Soll die Messreihe Trendbereinigt werden? Geben Sie "Ja" oder "Nein" ein: ') + '| ')
        if trendbereinigung == 'Ja' or trendbereinigung == 'ja':
            detrend_cdd2()
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
        elif trendbereinigung == 'Nein' or trendbereinigung == 'nein':
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            pass
        else:
            print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')

def hddpraemieplot():
    laufzeit = []
    for i in range (1, periodenzaehler+1):
        laufzeit.append(i)
    laufzeit = laufzeit[::-1]
    hdd_mittelwert = sum(hdd_list)/periodenzaehler
    hddjahr_list = pd.DataFrame(
        {'Jahr': untersuchtejahre,
        'HDDs': hdd_list})

    hddpayoff_list = pd.DataFrame()
    hddpayoff_list['Laufzeit'] = laufzeit
    hddpayoff_list = hddpayoff_list.set_index('Laufzeit')
    hddpayoff_list['HDD_Jahr'] = hdd_list
    hddpayoff_list['Mittelwert'] = hdd_mittelwert 
    hddpayoff_list['Ticksize'] = ticksize 
    hddpayoff_list['HDD_STRIKE'] = np.where( hddpayoff_list['HDD_Jahr'] >= hdd_mittelwert, hdd_list, 0)
    hddpayoff_list['Payoff'] = hddpayoff_list['HDD_STRIKE'] * hddpayoff_list['Ticksize'] - hddpayoff_list['Mittelwert'] * hddpayoff_list['Ticksize']
    hddpayoff_list['ZERO'] = 0
    hddpayoff_list['Real_Payoff'] = hddpayoff_list[['Payoff', 'ZERO']].values.max(1)
    print('|' + centered('[INFO] Das Dataframe zur Ermittlung des tatsächlich angefallen Payoff ergibt sich wie folgt: ') + '| ')
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
    print(hddpayoff_list)
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
    hddpraemie_list = pd.DataFrame() 
    hddpraemie_list['Laufzeit'] = laufzeit 
    hddpraemie_list['Jahr'] = untersuchtejahre 
    hddpraemie_list['Jahr'] = hddpraemie_list['Jahr'] + betrachtungszeitraum
    hddpraemie_list = hddpraemie_list.set_index('Laufzeit') 
    hddpraemie_list['Laufzeit'] = laufzeit                              
    hddpraemie_list['SummeLaufzeiten'] = hddpayoff_list['Real_Payoff'].sum()
    kmzins_liste = []
    for i in laufzeit:
        x = math.exp(-i*kmzins)
        kmzins_liste.append(x)
    hddpraemie_list['Diskontfaktor'] = kmzins_liste 
    hddpraemie_list['Mittelwert'] = hddpraemie_list['SummeLaufzeiten'] / betrachtungszeitraum 
    hddpraemie_list['FairValue'] = hddpraemie_list['Mittelwert'] * hddpraemie_list['Diskontfaktor'] 
    hddpraemie_list = hddpraemie_list[::-1]
    hddpraemie_list['Jahr'] = hddpraemie_list['Jahr'].loc[::-1].values
    print('|' + centered('[INFO] Das Dataframe zur Ermittlung des Fair Values für die jeweiligen Laufzeiten ergibt sich wie folgt: ') + '| ')
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
    print(hddpraemie_list)   
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')                                  
    hddpraemie_list.plot(kind='bar',x='Jahr',y='FairValue')
    plt.xlabel('Jahr')
    plt.ylabel('Fair-Value')
    plt.legend(loc='upper right')
    plt.grid()
    plt.title('Fair-Values der ' + str(modus) + '-Wetter-Option für die jeweiligen Laufzeiten')
    fairvalue = hddpraemie_list['FairValue'].values.tolist()
    dynrange = sorted(fairvalue)
    def addFirstAndLast(x):
        return dynrange[-1]
    dynmin = 0 
    dynmax = int(dynrange[-1] + 500) 
    for i, v in enumerate(fairvalue):
        plt.text(i-0.195, v + 200, str(round(v, 2)), color='black', va="center", rotation=90)
    plt.ylim(bottom=dynmin, top=dynmax)
    plt.show() 

def cddpraemieplot():
    laufzeit = []
    for i in range (1, periodenzaehler+1):
        laufzeit.append(i)
    laufzeit = laufzeit[::-1]
    cdd_mittelwert = sum(cdd_list)/periodenzaehler
    cddjahr_list = pd.DataFrame(
                {'Jahr': untersuchtejahre,
                'CDDs': cdd_list})
    cddpayoff_list = pd.DataFrame() 
    cddpayoff_list['Laufzeit'] = laufzeit 
    cddpayoff_list = cddpayoff_list.set_index('Laufzeit')
    cddpayoff_list['CDD_Jahr'] = cdd_list
    cddpayoff_list['Mittelwert'] = cdd_mittelwert 
    cddpayoff_list['Ticksize'] = ticksize 
    cddpayoff_list['CDD_STRIKE'] = np.where( cddpayoff_list['CDD_Jahr'] >= cdd_mittelwert, cdd_list, 0) 
    cddpayoff_list['Payoff'] = cddpayoff_list['CDD_STRIKE'] * cddpayoff_list['Ticksize'] - cddpayoff_list['Mittelwert'] * cddpayoff_list['Ticksize']
    cddpayoff_list['ZERO'] = 0 
    cddpayoff_list['Real_Payoff'] = cddpayoff_list[['Payoff', 'ZERO']].values.max(1) 
    print('|' + centered('[INFO] Das Dataframe zur Ermittlung des tatsächlich angefallen Payoff ergibt sich wie folgt: ') + '| ')
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
    print(cddpayoff_list)
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
    cddpraemie_list = pd.DataFrame() 
    cddpraemie_list['Laufzeit'] = laufzeit 
    cddpraemie_list['Jahr'] = untersuchtejahre 
    cddpraemie_list['Jahr'] = cddpraemie_list['Jahr'] + betrachtungszeitraum 
    cddpraemie_list = cddpraemie_list.set_index('Laufzeit')
    cddpraemie_list['Laufzeit'] = laufzeit                             
    cddpraemie_list['SummeLaufzeiten'] = cddpayoff_list['Real_Payoff'].sum() 
    kmzins_liste = []
    for i in laufzeit:
        x = math.exp(-i*kmzins)
        kmzins_liste.append(x)                                    
    cddpraemie_list['Diskontfaktor'] = kmzins_liste 
    cddpraemie_list['Mittelwert'] = cddpraemie_list['SummeLaufzeiten'] / betrachtungszeitraum 
    cddpraemie_list['FairValue'] = cddpraemie_list['Mittelwert'] * cddpraemie_list['Diskontfaktor']
    cddpraemie_list = cddpraemie_list[::-1]
    cddpraemie_list['Jahr'] = cddpraemie_list['Jahr'].loc[::-1].values
    print('|' + centered('[INFO] Das Dataframe zur Ermittlung des Fair Values für die jeweiligen Laufzeiten ergibt sich wie folgt: ') + '| ')
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
    print(cddpraemie_list)   
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')                                  
    cddpraemie_list.plot(kind='bar',x='Jahr',y='FairValue')
    plt.xlabel('Jahr')
    plt.ylabel('Fair-Value') 
    plt.legend(loc='upper left')
    plt.grid() 
    plt.title('Fair-Values der ' + str(modus) + '-Wetter-Option für die jeweiligen Laufzeiten') 
    fairvalue = cddpraemie_list['FairValue'].values.tolist() 
    dynrange = sorted(fairvalue)
    def addFirstAndLast(x):
        return dynrange[-1]
    dynmin = 0 
    dynmax = int(dynrange[-1] + 500) 
    for i, v in enumerate(fairvalue):
        plt.text(i-0.195, v + 200, str(round(v, 2)), color='black', va="center", rotation=90)
    plt.ylim(bottom=dynmin, top=dynmax)
    plt.show()

## Hier kannst Du einen Datensatz auswählen und beim ausführen des nächsten Feldes eingeben. Dann musst musst Du die Eingabe mit ENTER bestätigen.

Derzeit verfügbare Datensätze:
sonneberg, nuernbergnetzstall, nuernberg, muenchenstadt, karlsruhe, jenasternwarte, hohenpeissenberg, brocken, berlintempelhof, berlinschoenefeld, aachen, altenburg, augsburg, bamberg, bochum, bonn-roleber, braunschweig, bremen, bremerhafen, chemniz, cottbus, dresden-klotsche, duesseldorf, frankfurt, friedrichshaven, goerlitz, goettingen, greifswald, hamburg-fuhlsbuettel, hannover, hof, kaiserslautern, koeln-bonn, leipzig-holzhaus, muehlheim

Abfrage welcher Datensatz eingelesen werden soll und anschließendes einlesen des Datensatzes:

In [None]:
print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
datensatz = input('|' + centered('[EINGABE] Bitte geben Sie den Namen des Datensatzes ein (Nur der Name ohne die Endung .csv): ') + '| ')
print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
print('|' + centered('[INFO] Quelle: Deutscher Wetterdienst) ') + '| ')
print('|' + centered('[INFO] Abruf der Daten unter https://opendata.dwd.de/climate_environment/CDC/observations_germany/climate/daily/kl/historical/ (Siehe ReadMe)') + '| ')
print('#--------------------------------------------------------------------------------------------------------------------------------------------#')

df = pd.read_csv(datensatz + '.csv',
                 sep=";",
                 decimal=".",
                 usecols=['MESS_DATUM', ' TMK'])

# Zweiter Programmteil:

Hier wird der Datensatz automatisch auf Datenlücken und Umfang untersucht.

In [None]:
df['MESS_DATUM'] = pd.to_datetime(df['MESS_DATUM'], format='%Y%m%d')
df['DAY'] = df['MESS_DATUM'].apply(get_day)
df['MONTH'] = df['MESS_DATUM'].apply(get_month)
df['YEAR'] = df['MESS_DATUM'].apply(get_year)
df['Zero'] = 0
df[' TMK'] = df[' TMK']
df[' TMK'] = df[' TMK'].replace([-999], 18)
df['Diff_HDD'] = 18 - df[' TMK'] 
df['Diff_CDD'] = df[' TMK'] - 18 
df['HDD'] = df[['Diff_HDD', 'Zero']].values.max(1)
df['CDD'] = df[['Diff_CDD', 'Zero']].values.max(1)

auskunft_begin_daten = df[1:2]['YEAR'].item()
auskunft_ende_daten = df[-2:-1]['YEAR'].item()

zeitspanne = (int(auskunft_ende_daten) - int(auskunft_begin_daten))
moeglichebtrachtungsperioden = []
for i in range(1,(zeitspanne+1)):
    moeglichebtrachtungsperioden.append(i)

liste = []
for i in range(zeitspanne):
    startdatum = (str(auskunft_ende_daten - i - 1)) + '-05-01'
    enddatum = (str(auskunft_ende_daten - i - 1)) + '-09-30'
    mask = pd.date_range(startdatum, end=enddatum, freq='1D')
    liste.append(mask)

for i in range(zeitspanne):
    startdatum = (str(auskunft_ende_daten - i - 1)) + '-11-01'
    enddatum = (str(auskunft_ende_daten - i)) + '-02-28'
    mask2 = pd.date_range(startdatum, end=enddatum, freq='1D')
    liste.append(mask2)

liste = [item for sub_list in liste for item in sub_list]
liste = pd.to_datetime(liste)

helpdf = pd.DataFrame()
helpdf['FehlendeTage'] = np.setdiff1d(liste, df['MESS_DATUM'])
helpdf['JahrInDemTageFehlen'] = helpdf['FehlendeTage'].apply(get_year)
x = helpdf['JahrInDemTageFehlen'].values.tolist()
fehlendejahre = np.unique(x)
print('#_____________________________________________________________________________________________________________________________________________#')
print('#' + centered('Die Ergebnisse der Datensatzprüfung sind in diesem Dataframe dargestellt: ') + '#')
print(helpdf)
print('#_____________________________________________________________________________________________________________________________________________#')

zeitspanne = (int(auskunft_ende_daten) - int(auskunft_begin_daten))
moeglichebtrachtungsperioden = []
for i in range(1,(zeitspanne+1)):
    moeglichebtrachtungsperioden.append(i)

datensatz_jahre_soll = []
for i in range(auskunft_begin_daten, (auskunft_ende_daten+1)):
    datensatz_jahre_soll.append(auskunft_begin_daten)
    auskunft_begin_daten += 1
if len(fehlendejahre) > 0:
    updatebetrachtungszeitraum = max(datensatz_jahre_soll) - max(fehlendejahre)
else:
    updatebetrachtungszeitraum = moeglichebtrachtungsperioden

auskunft_begin_daten = df[1:2]['YEAR'].item()
auskunft_ende_daten = df[-2:-1]['YEAR'].item()

if len(fehlendejahre) > 0:
    moeglichebtrachtungsperioden = []
    for i in range(0, (updatebetrachtungszeitraum)):
        moeglichebtrachtungsperioden.append(i)
        auskunft_ende_daten - i

# Dritter Programmteil

Hier werden die Ergebnisse der Datensatzprüfung ausgeben, welche als Grundlage für die nächsten Eingaben dienen.
Hier kann nun der `Betrachtungszeitraum` (1-maximal mögliche Betrachtungsperioden) und der `Modus` (HDD/CDD oder TMK (Jahresdurchscnittstemperatur)) gewählt werden. Außerdem können HDDs/CDDs optional visualisiert werden und es kann eine Trendbereinigung durchgeführt werden. Anschließend kann noch ein Kapitalmarktzins und eine Tick-Size gewählt werden, mit denen eine Call-Option im Rahmen eines einfachen versicherungsmathematischen Ansatzes (Burn-Analysis) bepreist wird.

In [None]:
print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
print('|' + centered('[INFO] Der vorliegende Datensatz reicht bis zum Jahr ' + str(auskunft_ende_daten) + ' und beginnt mit dem Jahr ' + str(auskunft_begin_daten) + '.') + '| ')
print('|' + centered('[INFO] Damit umfasst der Datensatz ' + str(zeitspanne) + ' Jahre.') + '| ')
print('#--------------------------------------------------------------------------------------------------------------------------------------------#')

if len(fehlendejahre) > 1:
    print ('|' + centered('[INFO] In dem vorliegenden Datensatz fehlen leider Informationen in den folgenden Jahren: ' + str(fehlendejahre) + '.') + '| ')
    print('|' + centered('[INFO] Damit verkürzt sich der maximal mögliche Betrachtungszeitraum auf ' + str(updatebetrachtungszeitraum-1) + ' Jahre.' ) + '| ') 
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
elif len(fehlendejahre) == 1:
    print ('|' + centered('[INFO] In dem vorliegenden Datensatz fehlen leider Information im Jahr: ' + str(fehlendejahre) + '.') + '| ')
    print('|' + centered('[INFO] Damit verkürzt sich der maximal mögliche Betrachtungszeitraum auf ' + str(updatebetrachtungszeitraum-1) + ' Jahre.' ) + '| ') 
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
else:
    print ('|' + centered('[INFO] Die Prüfung des Datensatzes auf fehlende Jahre ergab, dass der Datensatz vollständig ist.') + '| ')
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')

betrachtungszeitraum = None
while betrachtungszeitraum not in moeglichebtrachtungsperioden:
    betrachtungszeitraum = int(input('|' + centered('[EINGABE] Bitte geben Sie den Betrachtungszeitraum ein. (Empfohlen sind 30 Akkumulationsperioden (=Normalperiode)): ') + '| '))
    if betrachtungszeitraum in moeglichebtrachtungsperioden:
        pass
    else:
        print('|' + centered('[FEHLER!] Der Betrachtungszeitraum darf nicht größer als die dem Datensatz zugrundeliegende Anzahl der Jahre (ohne Datenlücke).') + '| ')
print('#--------------------------------------------------------------------------------------------------------------------------------------------#')

modus = None
while modus not in ('CDD','HDD','hdd','cdd', 'TMK', 'tmk'):
    modus = input('|' + centered('[EINGABE] Bitte geben sie den Modus der Untersuchung ein (HDD CDD, TMK (Jahresdurchschnitt)): ')+ '| ')
    if modus == 'CDD' or modus == 'cdd':
        pass
    elif modus == 'HDD' or modus == 'hdd':
        pass
    elif modus == 'TMK' or modus == 'tmk':
        pass
    else:
        print('|' + centered('[WARNUNG] Bitte geben sie HDD oder CDD ein! ')+ '| ')
print('#--------------------------------------------------------------------------------------------------------------------------------------------#')

betrachtungsperioden = []
for i in range(1,(betrachtungszeitraum+1)):
    betrachtungsperioden.append(i)
untersuchtejahre = []
for i in betrachtungsperioden:
    x = auskunft_ende_daten - (i-1)
    untersuchtejahre.append(x)
untersuchtejahre = untersuchtejahre[::-1] 

schaltjahre = []
keineschaltjahre = []
for j in untersuchtejahre:
    jahr = j
    bedingung1 = (jahr % 4 == 0)      
    bedingung2 = (jahr % 100 == 0)    
    bedingung3 = (jahr % 400 == 0)   
    istSchaltjahr = ( bedingung1 and not bedingung2 ) or bedingung3
    if istSchaltjahr:
        schaltjahre.append(jahr)
    else: 
        keineschaltjahre.append(jahr)
  
startdatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum) + '-01-01')
enddatum = (str(df[-1:]['YEAR'].item()) + '-' + str(df[-1:]['MONTH'].item()) + '-' + str(df[-1:]['DAY'].item()))

print('|' + centered('[INFO] Das Startdatum wurde gemäß des Betrachtungszeitraumes (' + str(betrachtungszeitraum) + ' Jahre) auf den ' + str(startdatum) + ' festgelegt.') + '| ')
print('|' + centered('[INFO] Das Enddatum wurde gemäß des letzten verfügbaren Dateneintrags auf den ' + str(enddatum) + ' festgelegt.') + '| ')
print('#--------------------------------------------------------------------------------------------------------------------------------------------#')

df = df.set_index('MESS_DATUM')
periodenzaehler = 0

if modus == 'HDD' or modus == 'hdd':
    hdd_list = []    
    for i in betrachtungsperioden:
        startdatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler) + '-11-01')
        enddatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler + 1) + '-02-28')
        enddatumjahr = int((df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler + 1)
        if enddatumjahr in schaltjahre:
            enddatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler + 1) + '-02-29')
            mask = pd.date_range(startdatum, end=enddatum, freq='1D')
            hdd = round(df.loc[mask, 'HDD'].sum(), 2) 
            periodenzaehler += 1
        else:
            startdatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler) + '-11-01')
            enddatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler + 1) + '-02-28')
            mask = pd.date_range(startdatum, end=enddatum, freq='1D')
            hdd = round(df.loc[mask, 'HDD'].sum(), 2) 
            periodenzaehler += 1
        hdd_list.append(hdd)

    visualisierung = None
    while visualisierung not in ('Ja', 'Nein', 'ja', 'nein'):
        visualisierung = input('|' + centered('[EINGABE] Soll die Ausgabe visualisiert werden? Geben Sie "Ja" oder "Nein" ein: ') + '| ')

        if visualisierung == 'Nein' or visualisierung == 'nein':
            hddjahr_list = pd.DataFrame(
                {'Jahr': untersuchtejahre,
                'HDD': hdd_list})
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            print('|' + centered('[INFO] Das Dataframe ergibt sich wie folgt: ') + '| ')
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            print(hddjahr_list)
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
                  
            trendbereinigung_hdd2()             
            kmzinsabfrage()
            ticksizeabfrage()
            hddpraemieplot()

            erneut = None
            while erneut not in ('Ja', 'ja', 'Nein', 'nein'):
                erneut = input('|' + centered('[EINGABE] Möchten Sie die Berechnungen mit anderen Parametern erneut durchführen? Geben Sie "Ja" oder "Nein" ein. ') + '| ')
                if erneut == 'Ja' or erneut == 'ja':
                    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
                    kmzinsabfrage()
                    ticksizeabfrage()
                    hddpraemieplot()
                elif erneut == 'Nein' or erneut == 'nein':
                    sys.exit(0)
                else:
                    print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')

        elif visualisierung == 'Ja' or visualisierung == 'ja':

            hdd_mittelwert = sum(hdd_list)/periodenzaehler
            hddjahr_list = pd.DataFrame(
                {'Jahr': untersuchtejahre,
                'HDDs': hdd_list})

            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            print('|' + centered('[INFO] Das Dataframe ergibt sich wie folgt: ') + '| ')
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            print(hddjahr_list)
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            
            print('|' + centered('[INFO] Es sollte sich ein Fenster geöffnet haben, welches das Dataframe visualisiert. ') + '| ')
            print('|' + centered('[INFO] Bei den jeweiligen Jahren handelt es sich um die Periode November (Vorjahr) bis März (angebenenes Jahr)') + '| ')
            print('|' + centered('[INFO] Schließen Sie das Fenster, um darüber zu entscheiden ob Sie fortfahren möchten! ') + '| ')
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            
            dynrange = sorted(hdd_list)
            def addFirstAndLast(x):
                return dynrange[0], dynrange[-1]
            dynmin = max(0, int(dynrange[0] - 400))
            dynmax = int(dynrange[-1] + 200)

            for a,b in zip(untersuchtejahre, hdd_list): 
                plt.text(a - 0.25 , b + 10, str(b), rotation=90)

            z = np.polyfit(untersuchtejahre, hdd_list, 1)
            p = np.poly1d(z)
            plt.plot(untersuchtejahre, p(untersuchtejahre),"r--", label='Trendlinie', color='black')

            slope, intercept, r_value, p_value, std_err = stats.linregress(untersuchtejahre,hdd_list)
            print('|' + centered('[INFO] Der Trend ergibt sich wie folgt: ' + str(slope)) + '| ')   
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            plt.bar(untersuchtejahre, hdd_list)
            plt.xlabel('Jahr') 
            plt.ylabel('HDDs')  
            plt.axhline(y = hdd_mittelwert, color='red', label="Mittelwert")
            plt.legend(loc='upper left') 
            plt.grid() 
            plt.title('HDD-Werte innerhalb der jeweiligen Akkumulationsperiode im Betrachtungszeitraum') # Label Überschrift
            plt.ylim(bottom=dynmin) 
            plt.ylim(top=dynmax) 
            plt.show()
            
            trendbereinigung_hdd()
            
            fortfahren = None
            while fortfahren not in ('Ja', 'ja', 'Nein', 'nein'):
                fortfahren = input('|' + centered('[EINGABE] Wenn Sie fortfahren möchten, dann geben Sie "Ja" ein. Ansonsten beenden Sie das Programm mit "Nein". ') + '| ')
                if fortfahren == 'Ja' or fortfahren == 'ja':
                    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
                    pass
                elif fortfahren == 'Nein' or fortfahren == 'nein':
                    sys.exit(0)
                else:
                    print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')

            kmzinsabfrage()
            ticksizeabfrage()
            hddpraemieplot()

            erneut = None
            while erneut not in ('Ja', 'ja', 'Nein', 'nein'):
                erneut = input('|' + centered('[EINGABE] Möchten Sie die Berechnungen mit anderen Parametern erneut durchführen? Geben Sie "Ja" oder "Nein" ein. ') + '| ')
                if erneut == 'Ja' or erneut == 'ja':
                    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
                    kmzinsabfrage()
                    ticksizeabfrage()
                    hddpraemieplot()
                elif erneut == 'Nein' or erneut == 'nein':
                    sys.exit(0)
                else:
                    print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')
            
        else:
            print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')
            
            
elif modus == 'CDD' or modus == 'cdd':
    cdd_list = []

    for i in betrachtungsperioden:
        startdatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler + 1) + '-05-01')
        enddatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler + 1) + '-09-30')
        mask = pd.date_range(startdatum, end=enddatum, freq='1D')
        cdd = round(df.loc[mask, 'CDD'].sum(), 2) 
        periodenzaehler += 1
        cdd_list.append(cdd)

    visualisierung = None
    while visualisierung not in ('Ja', 'Nein', 'ja', 'nein'):
        visualisierung = input('|' + centered('[EINGABE] Soll die Ausgabe visualisiert werden? Geben Sie "Ja" oder "Nein" ein: ') + '| ')

        if visualisierung == 'Nein' or visualisierung == 'nein':
            cddjahr_list = pd.DataFrame(
                {'Jahr': untersuchtejahre,
                'CDD': cdd_list})
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            print('|' + centered('[INFO] Das Dataframe ergibt sich wie folgt: ') + '| ')
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            print(cddjahr_list)
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            
            trendbereinigung_cdd2()
            kmzinsabfrage()
            ticksizeabfrage()
            cddpraemieplot()

            erneut = None
            while erneut not in ('Ja', 'ja', 'Nein', 'nein'):
                erneut = input('|' + centered('[EINGABE] Möchten Sie die Berechnungen mit anderen Parametern erneut durchführen? Geben Sie "Ja" oder "Nein" ein. ') + '| ')
                if erneut == 'Ja' or erneut == 'ja':
                    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
                    kmzinsabfrage()
                    ticksizeabfrage()
                    cddpraemieplot()
                elif erneut == 'Nein' or erneut == 'nein':
                    sys.exit(0)
                else:
                    print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')

        elif visualisierung == 'Ja' or visualisierung == 'ja':
            cdd_mittelwert = sum(cdd_list)/periodenzaehler
            cddjahr_list = pd.DataFrame(
                {'Jahr': untersuchtejahre,
                'CDDs': cdd_list})

            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            print('|' + centered('[INFO] Das Dataframe ergibt sich wie folgt: ') + '| ')
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            print(cddjahr_list)
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            
            print('|' + centered('[INFO] Es sollte sich ein Fenster geöffnet haben, welches das Dataframe visualisiert. ') + '| ')
            print('|' + centered('[INFO] Bei den jeweiligen Jahren handelt es sich um die Periode November (Vorjahr) bis März (angebenenes Jahr)') + '| ')
            print('|' + centered('[INFO] Schließen Sie das Fenster, um darüber zu entscheiden ob Sie fortfahren möchten! ') + '| ')
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')

            dynrange = sorted(cdd_list)
            def addFirstAndLast(x):
                return dynrange[0], dynrange[-1]
            dynmin = max(0, int(dynrange[0] - 400))
            dynmax = int(dynrange[-1] + 200)

            #----------------------------------------------------------
            for a,b in zip(untersuchtejahre, cdd_list): 
                plt.text(a - 0.25 , b + 10, str(b), rotation=90)

            z = np.polyfit(untersuchtejahre, cdd_list, 1)
            p = np.poly1d(z)
            plt.plot(untersuchtejahre, p(untersuchtejahre),"r--", label='Trendlinie', color='black')
            #----------------------------------------------------------

            slope, intercept, r_value, p_value, std_err = stats.linregress(untersuchtejahre,cdd_list)
            print('|' + centered('[INFO] Der Trend ergibt sich wie folgt: ' + str(slope)) + '| ')   
            print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
            plt.bar(untersuchtejahre, cdd_list)
            plt.xlabel('Jahr') 
            plt.ylabel('CDDs')
            plt.axhline(y = cdd_mittelwert, color='red', label="Mittelwert")
            plt.legend(loc='upper right') 
            plt.grid() 
            plt.title('CDD-Werte innerhalb der jeweiligen Akkumulationsperiode im Betrachtungszeitraum') # Label Überschrift
            plt.ylim(bottom=dynmin) 
            plt.ylim(top=dynmax) 
            plt.show()

            trendbereinigung_cdd()
            
            fortfahren = None
            while fortfahren not in ('Ja', 'ja', 'Nein', 'nein'):
                fortfahren = input('|' + centered('[EINGABE] Wenn Sie fortfahren möchten, dann geben Sie "Ja" ein. Ansonsten beenden Sie das Programm mit "Nein". ') + '| ')
                if fortfahren == 'Ja' or fortfahren == 'ja':
                    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
                    pass
                elif fortfahren == 'Nein' or fortfahren == 'nein':
                    sys.exit(0)
                else:
                    print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')
     
            kmzinsabfrage()
            ticksizeabfrage() 
            cddpraemieplot()                 

            erneut = None
            while erneut not in ('Ja', 'ja', 'Nein', 'nein'):
                erneut = input('|' + centered('[EINGABE] Möchten Sie die Berechnungen mit anderen Parametern erneut durchführen? Geben Sie "Ja" oder "Nein" ein. ') + '| ')
                if erneut == 'Ja' or erneut == 'ja':
                    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
                    kmzinsabfrage()
                    ticksizeabfrage()
                    cddpraemieplot()
                elif erneut == 'Nein' or erneut == 'nein':
                    sys.exit(0)
                else:
                    print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')
        else:
            print('|' + centered('[WARNUNG] Geben Sie "Ja" oder "Nein" ein! ') + '| ')            
            
else:
 
    tmk_list = []

    for i in betrachtungsperioden:
        startdatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler + 1) + '-01-01')
        enddatum = (str(int(df[-1:]['YEAR'].item()) - betrachtungszeitraum + periodenzaehler + 1) + '-12-31')
        mask = pd.date_range(startdatum, end=enddatum, freq='1D')
        tmk = round((round(df.loc[mask, ' TMK'].sum(), 2)/365),2) 
        periodenzaehler += 1
        tmk_list.append(tmk)
        
        
    tmk_mittelwert1 = sum(tmk_list)/periodenzaehler    
    tmk_list = [round(tmk_mittelwert1,2) if x >= 15.0 else x for x in tmk_list]    
 
    tmk_mittelwert = sum(tmk_list)/periodenzaehler
    tmkjahr_list = pd.DataFrame(
        {'Jahr': untersuchtejahre,
        'TMKs': tmk_list})

    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
    print('|' + centered('[INFO] Das Dataframe ergibt sich wie folgt: ') + '| ')
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
    print(tmkjahr_list)
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')     
    print('|' + centered('[INFO] Es sollte sich ein Fenster geöffnet haben, welches das Dataframe visualisiert. ') + '| ')
    print('|' + centered('[INFO] Bei den jeweiligen Jahren handelt es sich um die Periode November (Vorjahr) bis März (angebenenes Jahr)') + '| ')
    print('|' + centered('[INFO] Schließen Sie das Fenster, um darüber zu entscheiden ob Sie fortfahren möchten! ') + '| ')
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')
    
    if tmk_mittelwert1 > tmk_mittelwert:
       print('|' + centered('[INFO] Es wurde eine Umstimmigkeit im Datensatz entdeckt!') + '| ')
       print('|' + centered('[INFO] Der/Die betroffe(n) Wert(e) wurde(n) neutralisiert, indem er/sie auf den Mittelwert (' + str(round(tmk_mittelwert,2)) + ') gesetzt wurde(n).') + '| ')
            
    dynrange = sorted(tmk_list)
    def addFirstAndLast(x):
        return dynrange[0], dynrange[-1]
    dynmin = max(tmk_mittelwert - 4,0) 
    dynmax = int(dynrange[-1] + int(0.2*max(tmk_list)))

    #----------------------------------------------------------
    for a,b in zip(untersuchtejahre, tmk_list): 
        plt.text(a - 0.25 , b + 0.25, str(b), rotation=90)

    z = np.polyfit(untersuchtejahre, tmk_list, 1)
    p = np.poly1d(z)
    plt.plot(untersuchtejahre, p(untersuchtejahre),"r--", label='Trendlinie', color='black')
    #----------------------------------------------------------

    slope, intercept, r_value, p_value, std_err = stats.linregress(untersuchtejahre,tmk_list)
    print('|' + centered('[INFO] Der Trend ergibt sich wie folgt: ' + str(slope)) + '| ')   
    print('#--------------------------------------------------------------------------------------------------------------------------------------------#')

    plt.bar(untersuchtejahre, tmk_list)
    plt.xlabel('Jahr') 
    plt.ylabel('Jahresdurchschnittstemperatur') 
    plt.axhline(y = tmk_mittelwert, color='red', label="Mittelwert") 
    plt.legend(loc='upper right') 
    plt.grid() 
    plt.title('TMK-Werte innerhalb der jeweiligen Akkumulationsperiode im Betrachtungszeitraum') 
    plt.ylim(bottom=dynmin) 
    plt.ylim(top=dynmax) 
    plt.show() 

## Bitte Beachten:

Es handelt sich um nicht bereinigte Datensätze, weshalb Verzerrungen und Ausreißer möglich sind!
<br>
Beispiel Leipzig-Holzhaus: Die Jahre mit einer Durchschnittstemperatur i.H.v 10.15°C entsprechem dem Mittelwert. Der Grund liegt darin, dass Messfehler im Vorfeld neutralisiert werden indem Sie auf 18°C gesetzt werden. Dieser Wert ist für HDDs/CDDs neutral aber eben nicht für die Jahresdurchscnittstemperatur. Um die Grafik dennoch interpretierbar zu machen, werden die "Ausreißer" neutralisiert.