### Durchschnittlicher Airbnb Preis je Stadtteil in Zürich
### Durchschnittliche Verfügbarkeit je Stadtteil

In [None]:
from airbnb_analysis_service import AirbnbAnalysisService
import pandas as pd
import matplotlib.pyplot as plt

if __name__ == "__main__":

    # create service class
    airbnbAnalysis = AirbnbAnalysisService()

    # get all tables in form of a list
    listings = airbnbAnalysis.get_listings()

    print(f"listings {listings}")

    # Schritt 1: Umwandeln in DataFrames
    listings_df = pd.DataFrame([l.__dict__ for l in listings])
    
    # Schritt 2: Daten aufbereiten
    listings_df['price'] = pd.to_numeric(listings_df['price'], errors='coerce').fillna(0)
    listings_df['number_of_reviews'] = pd.to_numeric(listings_df['number_of_reviews'], errors='coerce')
    listings_df['availability_365'] = pd.to_numeric(listings_df['availability_365'], errors='coerce')
    
    # Schritt 3: Gruppieren nach Stadtteil ("neighbourhood_group_cleansed")
    grouped = listings_df.groupby('neighbourhood_group_cleansed').agg({
        'price': 'mean',
        'availability_365': 'mean',
        'number_of_reviews': 'mean',
        'id': 'count'
    }).rename(columns={'id': 'listings_count'}).reset_index()
    
    # Schritt 4: Ausgabe der Metriken
    print("\nDurchschnittswerte pro Stadtteil (neighbourhood_group_cleansed):\n")
    print(grouped.sort_values('price', ascending=False))
    
    # Schritt 5: Visualisierung
    plt.figure(figsize=(12, 6))
    plt.bar(grouped['neighbourhood_group_cleansed'], grouped['price'])
    plt.xticks(rotation=45)
    plt.ylabel("Durchschnittlicher Preis (CHF)")
    plt.title("⭑ Durchschnittlicher Airbnb Preis je Stadtteil in Zürich")
    plt.tight_layout()
    plt.show()
    
    plt.figure(figsize=(12, 6))
    plt.bar(grouped['neighbourhood_group_cleansed'], grouped['availability_365'], color='orange')
    plt.xticks(rotation=45)
    plt.ylabel("Verfügbare Tage pro Jahr")
    plt.title("📅 Durchschnittliche Verfügbarkeit je Stadtteil")
    plt.tight_layout()
    plt.show()  

# Durchschnittlicher Nachfrage pro Stadtkreis (Insgesamt)

In [None]:
from airbnb_analysis_service import AirbnbAnalysisService
import pandas as pd
import matplotlib.pyplot as plt

if __name__ == "__main__":

    # create service class
    airbnbAnalysis = AirbnbAnalysisService()

    # get all tables in form of a list
    listings = airbnbAnalysis.get_listings()

    print(f"listings {listings}")

    # Schritt 1: Umwandeln in DataFrames
    listings_df = pd.DataFrame([l.__dict__ for l in listings])
    
    # Schritt 2: Daten aufbereiten
    listings_df['number_of_reviews'] = pd.to_numeric(listings_df['number_of_reviews'], errors='coerce')
    
    # Schritt 3: Gruppieren nach Stadtteil ("neighbourhood_group_cleansed")
    grouped = listings_df.groupby('neighbourhood_group_cleansed').agg({
        'number_of_reviews': 'mean',
        'id': 'count'
    }).rename(columns={'id': 'listings_count'}).reset_index()
    
    # Schritt 4: Sortieren nach durchschnittlicher Nachfrage
    print("\nDurchschnittliche Nachfrage (Reviews) je Stadtteil:\n")
    print(grouped.sort_values('number_of_reviews', ascending=False))
    
    # Schritt 5: Visualisierung
    plt.figure(figsize=(12, 6))
    plt.bar(grouped['neighbourhood_group_cleansed'], grouped['number_of_reviews'], color='green')
    plt.xticks(rotation=45)
    plt.ylabel("Durchschnittliche Anzahl Reviews")
    plt.title("Nachfrage je Stadtteil (Durchschnittliche Reviews)")
    plt.tight_layout()
    plt.show()

    

Ab Schritt 3 beginnt die eigentliche Analyse der Nachfrageverteilung über die Stadtteile hinweg.

Zunächst wird der Datensatz nach dem Feld neighbourhood_group_cleansed gruppiert. Dieses Feld repräsentiert die verschiedenen Stadtkreise von Zürich, also geografische Bezirke, in denen sich die jeweiligen Airbnb-Angebote befinden. Durch die Gruppierung können Kennzahlen pro Stadtteil berechnet werden, was für Standortvergleiche unerlässlich ist.

Im Rahmen der Gruppierung werden zwei Kennzahlen berechnet:

    Der Mittelwert der Anzahl Bewertungen (number_of_reviews) für jede Gruppe. Dieser Wert gibt an, wie oft eine durchschnittliche Unterkunft in diesem Stadtteil von Gästen bewertet wurde – also ein Maß für die durchschnittliche Nachfrage.

    Die Anzahl der Inserate (id) pro Stadtteil, die durch die Zählung der eindeutigen IDs ermittelt wird. Dieser Wert zeigt, wie viele Airbnb-Angebote es insgesamt pro Stadtteil gibt.

Das Ergebnis dieser Aggregation wird in einem neuen DataFrame gespeichert und die Spalte mit den gezählten Inseraten wird anschließend umbenannt in listings_count, damit sie selbsterklärender ist.

Im nächsten Schritt wird dieser aggregierte Datensatz nach der durchschnittlichen Anzahl Bewertungen sortiert. Dadurch erhält man eine absteigende Rangliste der Stadtteile – von der höchsten zur niedrigsten durchschnittlichen Nachfrage.

Zur besseren Übersicht folgt eine grafische Darstellung: Mit Hilfe eines Balkendiagramms werden die Stadtteile (x-Achse) den jeweiligen Durchschnittswerten der Bewertungen (y-Achse) gegenübergestellt. So erkennt man auf einen Blick, in welchen Stadtteilen besonders viele Bewertungen abgegeben wurden – was auf eine hohe Nutzung und Attraktivität der Unterkünfte in diesen Stadtteilen hindeutet. Die Visualisierung nutzt eine klare Farbwahl (grün), Drehung der X-Achsenbeschriftung (damit alle Stadtteile lesbar sind) und passende Achsentitel sowie Diagrammtitel zur besseren Verständlichkeit.

# Durchschnittlicher Nachfrage pro Stadtkreis (pro Monat)

In [None]:
from airbnb_analysis_service import AirbnbAnalysisService
import pandas as pd
import matplotlib.pyplot as plt

if __name__ == "__main__":

    # create service class
    airbnbAnalysis = AirbnbAnalysisService()

    # get all tables in form of a list
    listings = airbnbAnalysis.get_listings()

    print(f"listings {listings}")

    # Schritt 1: Umwandeln in DataFrames
    listings_df = pd.DataFrame([l.__dict__ for l in listings])
    
    # Schritt 2: Daten aufbereiten
    listings_df['reviews_per_month'] = pd.to_numeric(listings_df['reviews_per_month'], errors='coerce')
    
    # Schritt 3: Gruppieren nach Stadtteil ("neighbourhood_group_cleansed")
    grouped = listings_df.groupby('neighbourhood_group_cleansed').agg({
        'reviews_per_month': 'mean',
        'id': 'count'
    }).rename(columns={'id': 'listings_count'}).reset_index()
    
    # Schritt 4: Sortieren nach durchschnittlicher Nachfrage
    print("\nDurchschnittliche Nachfrage (Reviews) je Stadtteil:\n")
    print(grouped.sort_values('reviews_per_month', ascending=False))

    
    # Schritt 5: Visualisierung
    plt.figure(figsize=(12, 6))
    plt.bar(grouped['neighbourhood_group_cleansed'], grouped['reviews_per_month'], color='green')
    plt.xticks(rotation=45)
    plt.ylabel("Durchschnittliche Anzahl Reviews")
    plt.title("Nachfrage je Stadtteil (Durchschnittliche Reviews)")
    plt.tight_layout()
    plt.show()

# Verteilung der Raumtypen je Stadtteil

In [None]:
from airbnb_analysis_service import AirbnbAnalysisService
import pandas as pd
import matplotlib.pyplot as plt

if __name__ == "__main__":

    # create service class
    airbnbAnalysis = AirbnbAnalysisService()

    # get all tables in form of a list
    listings = airbnbAnalysis.get_listings()

    print(f"listings {listings}")

    # Schritt 1: Umwandeln in DataFrame
    listings_df = pd.DataFrame([l.__dict__ for l in listings])

    # Schritt 2: Daten aufbereiten
    listings_df['room_type'] = listings_df['room_type'].fillna('Unbekannt')

    # Schritt 3: Gruppieren nach Stadtteil und room_type (Anzahl Listings zählen)
    grouped = listings_df.groupby(['neighbourhood_group_cleansed', 'room_type']).size().reset_index(name='count')

    # Schritt 4: Pivotieren (damit jede room_type eine Spalte wird)
    pivot_df = grouped.pivot(index='neighbourhood_group_cleansed', columns='room_type', values='count').fillna(0)

    print("\nAnzahl Listings und Raumtyp je Stadtteil:\n")
    print(pivot_df)

    # Schritt 5: Visualisierung – gruppiertes Balkendiagramm
    pivot_df.plot(kind='bar', figsize=(12, 6))

    plt.title("Verteilung der Raumtypen je Stadtteil")
    plt.ylabel("Anzahl Listings")
    plt.xlabel("Stadtteil")
    plt.xticks(rotation=45)
    plt.legend(title='Room Type')
    plt.tight_layout()
    plt.show()


# Beste Investmentchancen nach Stadtteil

In [None]:
from airbnb_analysis_service import AirbnbAnalysisService
import pandas as pd
import matplotlib.pyplot as plt

if __name__ == "__main__":

    # create service class
    airbnbAnalysis = AirbnbAnalysisService()

    # get all tables in form of a list
    listings = airbnbAnalysis.get_listings()

    print(f"listings {listings}")

    # Schritt 1: Umwandeln in DataFrames
    listings_df = pd.DataFrame([l.__dict__ for l in listings])
    
    # Schritt 2: Daten aufbereiten
    listings_df['number_of_reviews'] = pd.to_numeric(listings_df['number_of_reviews'], errors='coerce')
    listings_df['price'] = pd.to_numeric(listings_df['price'], errors='coerce')
    
    # Schritt 3: Gruppieren nach Stadtteil ("neighbourhood_group_cleansed")
    investment_df = listings_df.groupby('neighbourhood_group_cleansed').agg({
        'price': 'mean',
        'number_of_reviews': 'mean',
        'id': 'count'
    }).rename(columns={'id': 'listings_count'}).reset_index()
    
    # Neue Spalte: einfache Investment Score (skalierter Mittelwert)
    investment_df['investment_score'] = (
        (investment_df['price'] - investment_df['price'].min()) / (investment_df['price'].max() - investment_df['price'].min()) +
        (investment_df['number_of_reviews'] - investment_df['number_of_reviews'].min()) / (investment_df['number_of_reviews'].max() - investment_df['number_of_reviews'].min())
    ) / 2

    # Ausgabe sortiert nach Score
    print("\nInvestment-Chancen Ranking nach Stadtteil:\n")
    print(investment_df.sort_values('investment_score', ascending=False))

    # Visualisierung
    plt.figure(figsize=(12, 6))
    plt.bar(investment_df['neighbourhood_group_cleansed'], investment_df['investment_score'], color='darkred')
    plt.xticks(rotation=45)
    plt.ylabel("Investment Score (0-1)")
    plt.title("Beste Investmentchancen nach Stadtteil")
    plt.tight_layout()
    plt.show()

    

# Beste Investmentchancen nach Stadtteil (mit Gewichtung)

In [None]:
from airbnb_analysis_service import AirbnbAnalysisService
import pandas as pd
import matplotlib.pyplot as plt

if __name__ == "__main__":

    # create service class
    airbnbAnalysis = AirbnbAnalysisService()

    # get all tables in form of a list
    listings = airbnbAnalysis.get_listings()

    print(f"listings {listings}")

    # Schritt 1: Umwandeln in DataFrames
    listings_df = pd.DataFrame([l.__dict__ for l in listings])
    
    # Schritt 2: Daten aufbereiten
    listings_df['price'] = pd.to_numeric(listings_df['price'], errors='coerce').fillna(0)
    listings_df['number_of_reviews'] = pd.to_numeric(listings_df['number_of_reviews'], errors='coerce')
    listings_df['availability_365'] = pd.to_numeric(listings_df['availability_365'], errors='coerce')

    # Schritt 3: Gruppieren nach Stadtteil
    grouped = listings_df.groupby('neighbourhood_group_cleansed').agg({
        'price': 'mean',
        'number_of_reviews': 'mean',
        'availability_365': 'mean',
        'id': 'count'
    }).rename(columns={'id': 'listings_count'}).reset_index()

    # Schritt 4: Investment Score berechnen mit Gewichtung
    # Gewichtung anpassen (Was ist wichtiger für unsere Investmentfirma, was gewichtet sie mehr?)
    weight_price = 0.6
    weight_reviews = 0.4

    # Skalierung (0–1) für Preis und Reviews
    grouped['price_scaled'] = (grouped['price'] - grouped['price'].min()) / (grouped['price'].max() - grouped['price'].min())
    grouped['reviews_scaled'] = (grouped['number_of_reviews'] - grouped['number_of_reviews'].min()) / (grouped['number_of_reviews'].max() - grouped['number_of_reviews'].min())

    # Gewichteter Investment Score
    grouped['investment_score'] = (
        grouped['price_scaled'] * weight_price + 
        grouped['reviews_scaled'] * weight_reviews
    )

    # Schritt 5: Ausgabe sortiert nach Investment Score
    print("\nInvestment Ranking je Stadtteil (gewichteter Score):\n")
    print(grouped.sort_values('investment_score', ascending=False))

    # Schritt 6: Visualisierung

    plt.figure(figsize=(12, 6))
    sorted_grouped = grouped.sort_values('investment_score', ascending=False)
    plt.bar(sorted_grouped['neighbourhood_group_cleansed'], sorted_grouped['investment_score'], color='purple')
    plt.xticks(rotation=45)
    plt.ylabel("Investment Score")
    plt.title("Investment-Potenzial nach Stadtteil (gewichteter Score)")
    plt.tight_layout()
    plt.show()

    

# Erklärung
### Beste Investmentchancen nach Stadtteil (mit Gewichtung)

Das Ziel dieses Codes ist es, herauszufinden, welche Stadtteile in Zürich aus Investorensicht am attraktivsten für Airbnb-Vermietungen sind. Dafür werden zwei Hauptfaktoren berücksichtigt: der durchschnittliche Preis und die Nachfrage, gemessen an der durchschnittlichen Anzahl an Bewertungen (Reviews). Diese beiden Faktoren werden in einem einheitlichen Score zusammengeführt, dem sogenannten Investment-Score.

Zunächst wird die Datenbasis aufbereitet: Der Preis (price), die Anzahl Bewertungen (number_of_reviews) und die Verfügbarkeit im Jahr (availability_365) werden in numerische Werte umgewandelt. Nicht-numerische oder fehlerhafte Daten werden ignoriert oder auf 0 gesetzt. Anschließend wird die Tabelle nach Stadtteilen gruppiert (in der Spalte neighbourhood_group_cleansed), sodass man pro Stadtteil den durchschnittlichen Preis, die durchschnittliche Bewertungshäufigkeit, die Verfügbarkeit und die Anzahl der Inserate erhält.

Um die verschiedenen Metriken (Preis und Reviews) vergleichbar zu machen, werden sie skaliert – das heißt: Die Werte werden so umgerechnet, dass sie immer im Bereich von 0 bis 1 liegen. Der niedrigste Wert wird dabei zu 0, der höchste zu 1, und alle anderen liegen dazwischen. Das geschieht separat für den Preis und die Reviews.

Danach kommt ein wichtiger Teil: der gewichtete Score. Da du z. B. Preis mit 60 % (0.6) und Reviews mit 40 % (0.4) gewichten willst, wird der Investment-Score für jeden Stadtteil so berechnet: `Investment-Score = (skalierter Preis * 0.6) + (skalierte Reviews * 0.4)`

So ergibt sich ein Wert, der widerspiegelt, wie attraktiv ein Stadtteil für Investoren ist – je höher der Score, desto besser das Potenzial.

Abschließend werden die Stadtteile nach ihrem Score sortiert und in einem Balkendiagramm visualisiert. So kann man auf einen Blick erkennen, welche Quartiere das größte Investment-Potenzial haben

#### Beispiel
Wenn z. B. der Kreis 5 einen hohen Preis hat (gut für Einnahmen) und viele Bewertungen (Hinweis auf hohe Nachfrage), wird er einen hohen Score bekommen. Ein Stadtteil mit nur günstigen, aber selten gebuchten Wohnungen hingegen wird niedriger abschneiden.