In [8]:
#Fixe WC's
import geopandas as gpd

# Datei laden
wcFix = gpd.read_file("../data/Rohdaten/zueri_wc_geojson/data/stzh.poi_zueriwc_view.json")

# Datentypen prüfen
print("Datentypen:")
print(wcFix.dtypes)

# Nullwerte zählen
print("\nNullwerte pro Spalte:")
print(wcFix.isnull().sum().sort_values(ascending=False))

# Shape & Vorschau
print("\n Form:", wcFix.shape)
print("\n Erste 5 Zeilen:")
print(wcFix.head())

# Anzahl eindeutiger Werte je Spalte
print("\n Eindeutige Werte pro Spalte:")
print(wcFix.nunique().sort_values(ascending=False))

# Duplikate prüfen
print("\n️ Doppelte Zeilen:", wcFix.duplicated().sum())
print(" Doppelte Geometrien:", wcFix.geometry.duplicated().sum())

# Spalten mit nur einem Wert?
print("\n Spalten mit nur einem Wert:")
print(wcFix.columns[wcFix.nunique() <= 1])

# Beispiel: Welche wcFix-Typen gibt es?
print("\n Typenübersicht:")
print(wcFix["typ"].value_counts())


📌 Datentypen:
adr_inter                        object
adresse                          object
adrzus_int                       object
behindertenparkplatz             object
bemerkung                        object
ccmail                           object
da                               object
datum                            object
datum_cms                        object
dep                              object
editor                           object
erforderlichedokumente           object
fax                              object
hausnummer                       object
hindernisfreiheit                object
infrastruktur                    object
isbetriebsferien_gebaeude        object
isbetriebsferien_schalter        object
kategorie                        object
mail                             object
name                             object
namenzus                         object
objectid                         object
oeffnungszeiten_gebaeude_di      object
oeffnungszeiten_gebaeude_d

### 📝 Datenprüfung: Fixe öffentliche Toiletten Zürich (ZüriWC)

Die erste Prüfung des Datensatzes zeigt, dass 25 öffentliche Toilettenstandorte in der Stadt Zürich erfasst wurden. Insgesamt sind 59 Attribute pro Eintrag vorhanden.

**Datenstruktur:**
- Alle Einträge enthalten gültige Geometrien (Punktdaten).
- Die Daten liegen überwiegend im `object`-Format vor, einschliesslich einiger Spalten, die potenziell als kategorisch oder numerisch sinnvoll wären (z.B. `kreis`, `gebuehren`).

**Nullwerte:**
- Mehrere Spalten enthalten fast ausschliesslich fehlende Werte, darunter `adr_inter`, `adrzus_int`, `datum_cms`, `fax`, `tel2` u.a.
- Diese Felder erscheinen redundant oder irrelevant für unsere Analyse und können entfernt werden.

**Spalten mit nur einem (oder keinem) eindeutigen Wert:**
- 37 Spalten zeigen nur eine Ausprägung oder sind komplett leer.
- Diese Felder tragen keine differenzierende Information bei und können für eine reduzierte, analytische Version des Datensatzes ausgeschlossen werden.

**Duplikate:**
- Es existieren keine doppelten Zeilen oder Geometrien → gute Datenqualität hinsichtlich Eindeutigkeit.

**Erste Einblicke:**
- Es existieren nur zwei Typen von Toiletten: `nicht rollstuhlgängig` (21x) und `Pissoir` (4x).
- Alle Einträge sind auf 10 verschiedene Stadt-Kreise (`kreis`) verteilt.
- Das Attribut `gebuehren` weist fünf verschiedene Textvarianten auf (z.B. „Gebührenfrei“, „Gebührenfrei.“) → Vereinheitlichung notwendig.

**Fazit:**
Für die weitere Analyse empfiehlt sich eine Reduktion des Datensatzes auf relevante Spalten wie Name, Typ, Gebühren, Öffnungszeiten, Standort (Koordinaten & Adresse) und Kreis. Optional kann durch den Import weiterer Dateien (z.B. `mobil_view.json`) eine Erweiterung auf mobile oder temporäre Toilettenstandorte erfolgen.


In [10]:
#Mobile WC's
import geopandas as gpd

# Datei laden
wcMobil = gpd.read_file("../data/Rohdaten/zueri_wc_geojson/data/stzh.poi_zueriwc_mobil_view.json")

# Datentypen prüfen
print("Datentypen:")
print(wcMobil.dtypes)

# Nullwerte zählen
print("\nNullwerte pro Spalte:")
print(wcMobil.isnull().sum().sort_values(ascending=False))

# Shape & Vorschau
print("\n Form:", wcMobil.shape)
print("\n Erste 5 Zeilen:")
print(wcMobil.head())

# Anzahl eindeutiger Werte je Spalte
print("\n Eindeutige Werte pro Spalte:")
print(wcMobil.nunique().sort_values(ascending=False))

# Duplikate prüfen
print("\n️ Doppelte Zeilen:", wcMobil.duplicated().sum())
print(" Doppelte Geometrien:", wcMobil.geometry.duplicated().sum())

# Spalten mit nur einem Wert?
print("\n Spalten mit nur einem Wert:")
print(wcMobil.columns[wcMobil.nunique() <= 1])



Datentypen:
adr_inter                        object
adresse                          object
adrzus_int                       object
behindertenparkplatz             object
bemerkung                        object
ccmail                           object
da                               object
datum                            object
datum_cms                        object
dep                              object
editor                           object
erforderlichedokumente           object
fax                              object
hausnummer                       object
hindernisfreiheit                object
infrastruktur                    object
isbetriebsferien_gebaeude        object
isbetriebsferien_schalter        object
kategorie                        object
mail                             object
name                             object
namenzus                         object
objectid                         object
oeffnungszeiten_gebaeude_di      object
oeffnungszeiten_gebaeude_do 

### 📝 Datenprüfung: Mobile WC-Anlagen Zürich (ZüriWC – mobil)

Der Datensatz enthält **20 mobile öffentliche Toilettenanlagen** in der Stadt Zürich mit **53 Attributen** pro Eintrag. Alle Einträge enthalten gültige Geometriedaten in Form von Punktobjekten.

**Datenstruktur:**
- Alle Datentypen sind als `object` klassifiziert, außer der Spalte `geometry`.
- 20 verschiedene `poi_id`, `adresse`, `zvv_label` etc. → keine Duplikate vorhanden.

**Nullwerte:**
- Mehrere Felder (z.B. `adr_inter`, `datum_cms`, `fax`, `hausnummer`) weisen durchgehend oder nahezu vollständig Nullwerte auf.
- Diese Spalten liefern keinen Mehrwert für die Analyse und können entfernt werden.

**Spalten mit nur einem (oder keinem) eindeutigen Wert:**
- 39 Spalten haben nur eine Ausprägung oder sind leer (z.B. `zahlungsmittel_telefon`, `oeffnungszeiten_schalter_*`, `suchen`).
- → Diese Spalten sind **nicht relevant** für analytische Fragestellungen.

**Duplikate:**
- Es sind **keine doppelten Zeilen oder Geometrien** vorhanden – die Datenqualität ist gut.

**Inhaltliche Auffälligkeiten:**
- Die Spalte `bemerkung` enthält teilweise hilfreiche Informationen zur saisonalen Verfügbarkeit der Anlagen (z.B. „von April bis Oktober geöffnet“) – dies kann für eine temporale Nutzungsanalyse verwendet werden.
- Die Spalten `typ` und `kreis` fehlen im mobilen Datensatz. Eine spätere Ergänzung ist sinnvoll, wenn mobile WCs ebenfalls in die Versorgungsscore-Berechnung aufgenommen werden sollen.

**Fazit:**
Für die weitere Arbeit empfiehlt sich eine Reduktion des mobilen WC-Datensatzes auf die wichtigsten Spalten: Name, Adresse, Bemerkung, Infrastruktur, Öffnungszeiten (falls relevant) und Geometrie. Optional kann die `bemerkung`-Spalte analysiert werden, um **zeitliche Verfügbarkeit** (z.B. Sommerbetrieb) herauszufiltern. Die fehlende `typ`- und `kreis`-Zuordnung sollte später ergänzt werden (z.B. per Spatial Join mit Kreis-Shapefile).

