In [3]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import r2_score

# Liste von Städten mit ihren jährlichen Quadratmeterpreisen
data_list = [
    ("Berlin", {
        2024: 23.75, 2023: 21.6, 2022: 23.57, 2021: 15.14, 2020: 15.11, 2019: 13.41, 2018: 12.65,
        2017: 11.4, 2016: 10.46, 2015: 11.65, 2014: 9.03, 2013: 8.47, 2012: 7.66, 2011: 6.94, 2010: 6.42
    }),
    ("München", {
        2024: 22.86, 2023: 22.04, 2022: 20.88, 2021: 20.79, 2020: 23.03, 2019: 21.25, 2018: 19.29,
        2017: 18.56, 2016: 18.38, 2015: 19.48, 2014: 15.5, 2013: 14.61, 2012: 14.34, 2011: 12.9, 2010: 12.8
    }),
    ("Hamburg", {
        2024: 16.29, 2023: 15.29, 2022: 14.87, 2021: 14.15, 2020: 13.47, 2019: 12.95, 2018: 12.99,
        2017: 12.71, 2016: 11.88, 2015: 12.6, 2014: 11.14, 2013: 10.99, 2012: 10.56, 2011: 10.17, 2010: 10.11
    }),
    ("Freiburg", {
        2024: 13.70, 2023: 13.20, 2022: 14.25, 2021: 14.91, 2020: 15.17, 2019: 13.37, 2018: 13.56,
        2017: 13.38, 2016: 10.80, 2015: 11.96, 2014: 9.90, 2013: 10.83, 2012: 9.73, 2011: 9.38, 2010: 10.28
    }),
    ("Frankfurt am Main", {
        2024: 19.94, 2023: 19.29, 2022: 17.14, 2021: 16.76, 2020: 21.99, 2019: 15.52, 2018: 16.78,
        2017: 14.53, 2016: 14.10, 2015: 15.43, 2014: 13.43, 2013: 12.19, 2012: 11.92, 2011: 10.95, 2010: 11.49
    }),
    ("Stuttgart", {
        2024: 19.94, 2023: 19.29, 2022: 17.14, 2021: 16.76, 2020: 21.99, 2019: 15.52, 2018: 16.78,
        2017: 14.53, 2016: 14.10, 2015: 15.43, 2014: 13.43, 2013: 12.19, 2012: 11.92, 2011: 10.95, 2010: 11.49
    }),
    ("Heidelberg", {
        2024: 16.26, 2023: 14.44, 2022: 14.74, 2021: 14.51, 2020: 14.01, 2019: 12.74, 2018: 12.87,
        2017: 11.96, 2016: 11.24, 2015: 11.88, 2014: 10.74, 2013: 10.37, 2012: 10.18, 2011: 9.72, 2010: 9.91
    }),
    ("Mainz", {
        2024: 14.53, 2023: 13.93, 2022: 13.77, 2021: 13.24, 2020: 13.08, 2019: 11.79, 2018: 12.27,
        2017: 12.10, 2016: 10.76, 2015: 11.40, 2014: 10.21, 2013: 10.42, 2012: 10.03, 2011: 9.17, 2010: 9.98
    }),
    ("Potsdam", {
        2024: 13.48, 2023: 13.07, 2022: 12.88, 2021: 13.04, 2020: 11.81, 2019: 10.99, 2018: 10.65,
        2017: 10.29, 2016: 9.81, 2015: 9.59, 2014: 8.71, 2013: 8.63, 2012: 8.12, 2011: 8.08, 2010: 7.50
    }),
    ("Köln", {
        2024: 15.07, 2023: 14.56, 2022: 14.24, 2021: 13.50, 2020: 13.39, 2019: 12.37, 2018: 12.48,
        2017: 11.71, 2016: 11.05, 2015: 11.97, 2014: 10.09, 2013: 9.67, 2012: 9.28, 2011: 8.51, 2010: 8.53
    })
]

# Funktion zur Vorhersage der Immobilienpreise für eine bestimmte Stadt und ein bestimmtes Jahr
def forecast_for_city(city, prices, forecast_year):
    # Daten für die Stadt in ein DataFrame konvertieren
    data = [[year, price] for year, price in prices.items()]
    df = pd.DataFrame(data, columns=["Jahr", "Preis"])
    
    # Entfernen des Vorhersagejahres, falls es in den Daten enthalten ist
    if forecast_year in df["Jahr"].values:
        df = df[df["Jahr"] != forecast_year]
    
    # Unabhängige und abhängige Variablen definieren
    X = df[["Jahr"]]
    y = df["Preis"]
    
    # Daten in Trainings- und Testsets aufteilen
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    # Verschiedene Modelle initialisieren
    models = {
        "Linear Regression": LinearRegression(),
        "Polynomial Regression": PolynomialFeatures(degree=2),
        "Decision Tree": DecisionTreeRegressor(random_state=42),
        "Random Forest": RandomForestRegressor(n_estimators=100, random_state=42)
    }

    # Dictionaries zur Speicherung der Vorhersagen und Genauigkeiten
    predictions = {}
    accuracies = {}

    # Lineares Regressionsmodell trainieren und Vorhersage durchführen
    model_lr = models["Linear Regression"]
    model_lr.fit(X_train, y_train)
    y_pred_lr = model_lr.predict(X_test)
    r2_lr = r2_score(y_test, y_pred_lr)
    predictions["Linear Regression"] = model_lr.predict([[forecast_year]])[0]
    accuracies["Linear Regression"] = r2_lr * 100

    # Polynomiale Regression trainieren und Vorhersage durchführen
    poly = models["Polynomial Regression"]
    X_poly = poly.fit_transform(X)
    X_train_poly, X_test_poly, y_train_poly, y_test_poly = train_test_split(X_poly, y, test_size=0.2, random_state=42)
    model_pr = LinearRegression()
    model_pr.fit(X_train_poly, y_train_poly)
    y_pred_pr = model_pr.predict(X_test_poly)
    r2_pr = r2_score(y_test_poly, y_pred_pr)
    predictions["Polynomial Regression"] = model_pr.predict(poly.transform([[forecast_year]]))[0]
    accuracies["Polynomial Regression"] = r2_pr * 100

    # Entscheidungsbaum-Regressor trainieren und Vorhersage durchführen
    model_dt = models["Decision Tree"]
    model_dt.fit(X_train, y_train)
    y_pred_dt = model_dt.predict(X_test)
    r2_dt = r2_score(y_test, y_pred_dt)
    predictions["Decision Tree"] = model_dt.predict([[forecast_year]])[0]
    accuracies["Decision Tree"] = r2_dt * 100

    # Random-Forest-Regressor trainieren und Vorhersage durchführen
    model_rf = models["Random Forest"]
    model_rf.fit(X_train, y_train)
    y_pred_rf = model_rf.predict(X_test)
    r2_rf = r2_score(y_test, y_pred_rf)
    predictions["Random Forest"] = model_rf.predict([[forecast_year]])[0]
    accuracies["Random Forest"] = r2_rf * 100

    # Rückgabe der Vorhersagen und Genauigkeiten für die Stadt
    return predictions, accuracies

# Jahr der Vorhersage eingeben
forecast_year = 2024

# Vorhersagen für alle Städte durchführen
all_predictions = {}
all_accuracies = {}
for city, prices in data_list:
    predictions, accuracies = forecast_for_city(city, prices, forecast_year)
    all_predictions[city] = predictions
    all_accuracies[city] = accuracies

# Ergebnisse anzeigen
for city, predictions in all_predictions.items():
    print(f"\nVorhersagen für {city} für das Jahr {forecast_year}:")
    for model, prediction in predictions.items():
        print(f"{model}: {prediction:.2f} €/m²")
        print(f"Genauigkeit in {city} für {model}: {all_accuracies[city][model]:.2f} %")

# Durchschnittliche Genauigkeit pro Modell berechnen
average_accuracy_per_model = {}

# Initialisiere die Summen für die Modelle
total_lr_accuracy = 0
total_pr_accuracy = 0
total_dt_accuracy = 0
total_rf_accuracy = 0

# Zähle die Städte für den Durchschnitt
num_cities = len(all_accuracies)

# Summiere die Genauigkeiten für jedes Modell über alle Städte
for city, accuracies in all_accuracies.items():
    total_lr_accuracy += accuracies["Linear Regression"]
    total_pr_accuracy += accuracies["Polynomial Regression"]
    total_dt_accuracy += accuracies["Decision Tree"]
    total_rf_accuracy += accuracies["Random Forest"]

# Durchschnitt berechnen
average_accuracy_per_model["Linear Regression"] = total_lr_accuracy / num_cities
average_accuracy_per_model["Polynomial Regression"] = total_pr_accuracy / num_cities
average_accuracy_per_model["Decision Tree"] = total_dt_accuracy / num_cities
average_accuracy_per_model["Random Forest"] = total_rf_accuracy / num_cities

# Ergebnisse ausgeben
print("\nDurchschnittliche Genauigkeit pro Modell:")
for model, accuracy in average_accuracy_per_model.items():
    print(f"{model}: {accuracy:.2f} %")





Vorhersagen für Berlin für das Jahr 2024:
Linear Regression: 20.30 €/m²
Genauigkeit in Berlin für Linear Regression: 94.93 %
Polynomial Regression: 24.80 €/m²
Genauigkeit in Berlin für Polynomial Regression: 99.30 %
Decision Tree: 23.57 €/m²
Genauigkeit in Berlin für Decision Tree: 96.01 %
Random Forest: 20.40 €/m²
Genauigkeit in Berlin für Random Forest: 98.73 %

Vorhersagen für München für das Jahr 2024:
Linear Regression: 24.35 €/m²
Genauigkeit in München für Linear Regression: 91.10 %
Polynomial Regression: 21.70 €/m²
Genauigkeit in München für Polynomial Regression: 93.66 %
Decision Tree: 20.88 €/m²
Genauigkeit in München für Decision Tree: 87.78 %
Random Forest: 21.06 €/m²
Genauigkeit in München für Random Forest: 95.51 %

Vorhersagen für Hamburg für das Jahr 2024:
Linear Regression: 15.25 €/m²
Genauigkeit in Hamburg für Linear Regression: 97.53 %
Polynomial Regression: 15.40 €/m²
Genauigkeit in Hamburg für Polynomial Regression: 98.27 %
Decision Tree: 14.87 €/m²
Genauigkeit in 

