In [None]:
import pathlib

import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px

In [None]:
datapath = pathlib.Path("./data")

In [None]:
csv_files = sorted(datapath.glob("*.csv"))

In [None]:
csv_files

In [None]:
df_bevolkerung = pd.read_csv(csv_files[0], sep=";").set_index("Jahr")
df_bevolkerung.columns = ["Insgesamt", "männlich_absolut", "männlich_relativ", "weiblich_absolut", "weiblich_relativ"]

df_wohnungen = pd.read_csv(csv_files[1], sep=";", decimal=",").set_index("Jahr")
df_wohnungen.columns = ["Gebäude", "Wohnungen", "Belegungsziffer"]

df_fordervolumen = pd.read_csv(csv_files[2], sep=";", na_values=["-"]).fillna(0).set_index("Jahr")
df_fordervolumen.columns = ["Mietwohnungen", "Häuser", "Wohnheimplätze", "Flüchtlinge_Mietwohnungen", "Flüchtlinge_Häuser", "Modernisierung", "Pflegewohnheim", "Studierende", "Eigentum", "Insgesamt"]

df_fordereinheiten = pd.read_csv(csv_files[3], sep=";").set_index("Jahr")
df_fordereinheiten.columns = ["Mietwohnungen", "Häuser", "Wohnheimplätze", "Flüchtlinge_Mietwohnungen", "Flüchtlinge_Häuser", "Modernisierung", "Pflegewohnheim", "Studierende", "Eigentum", "Insgesamt"]

df_zuzug = pd.read_csv(csv_files[4], sep=";").set_index("Jahr")
df_zuzug.columns = ["Geburten", "Sterbefälle", "Geburtenbilanz", "Zuzug", "Fortzug", "Wanderungsbilanz"]

## Infos

* 2017 und 2020 wurden Studienwohnheime gefördert
* Land NRW entscheidet über Fördermaßnahmen, mglw. Betrachtung auf Landesebene noch interessant

## Fragen

* Ist das Fördervolumen einer Fördermaßnahme abhängig von den aktuellen Marktpreisen für Gebäudebau?
* Ist das Fördervolumen einer Modernisierungsmaßnahme abhängig von der Höhe der Modernisierungskosten?
* Haben sich die förderbaren Maßnahmen verändert?
* Kommen wir irgendwie an Daten zu durchschnittlichen Wohnflächen? (m2)
* Wie entwickelt sich die Fläche des gesamten Wohnungsneubaus?
* Wie ist der Haushalt von Dortmund aufgestellt? Gibt es da Einsparpotential in verschiedenen Bereichen?

In [None]:
df_fordervolumen["Insgesamt"].plot.bar()
plt.ylabel("Fördervolumen insgesamt / €")

In [None]:
df_fordereinheiten["Insgesamt"].plot.bar()
plt.ylabel("Anzahl Fördereinheien insgesamt")

In [None]:
(df_fordervolumen["Insgesamt"] / df_fordereinheiten["Insgesamt"]).plot.bar()
plt.ylabel("Fördervolumen pro Fördereinheit / €")
plt.title("Insgesamt")

ohne Studienwohnheime

In [None]:
((df_fordervolumen["Insgesamt"] - df_fordervolumen["Studierende"]) / (df_fordereinheiten["Insgesamt"] - df_fordereinheiten["Studierende"])).plot.bar()
plt.ylabel("Fördervolumen pro Fördereinheit / €")
plt.title("Ohne Studierendenwohnheime")

In [None]:
fig, ax = plt.subplots()

(df_fordervolumen["Modernisierung"] / df_fordereinheiten["Modernisierung"]).plot.bar()
plt.ylabel("Fördervolumen pro Fördereinheit / €")
plt.title("Nur Modernisierungsmaßnahmen")

## Bevölkerungszahlen

In [None]:
df_wohnungen["Belegungsziffer"].plot(label="Offiziell")
(df_bevolkerung["Insgesamt"] / df_wohnungen["Wohnungen"]).plot(label="Berechnet")

plt.ylabel("Belegungsziffer")
plt.legend()

In [None]:
df_bevolkerung.Insgesamt.diff() - df_zuzug.Wanderungsbilanz - df_zuzug.Geburtenbilanz