## 🧪 Step 1: Research & Data Modelling

### Playground Berlin (Spielplatz)

In [10]:
import pandas as pd
from geopy.geocoders import Nominatim
from time import sleep

In [11]:
df = pd.read_csv("/Users/dianaterraza/Desktop/webeet.io/layered-populate-data-pool-da/recreational_zones/sources/playground.csv", sep=';')

In [12]:
df.head()

Unnamed: 0,Technischer Schlüssel,Schlüssel,Objektnummer,Bezirk,Ortsteil,Art der Grünanlage,Name des Spielplatzes,Namenszusatz des Spielplatzes,Baujahr,letztes Sanierungsjahr,Größe in m² (Kataster),Widmung,Nummer des Planungsraumes,Name des Planungsraumes,Nettospielfläche in m²
0,00008100_002f2c6b,00008100:002f2c6b,19441,Tempelhof-Schöneberg,Lichtenrade,Spielplatz,Nuthestr. 26,-,-,-,-,-,-,-,-
1,00008100_0033cfac,00008100:0033cfac,35098,Reinickendorf,Tegel,Spielplatz,Borsigdamm 4 (Spielplatz),-,-,-,503190,-,12200413,Tegel Süd,-
2,00008100_0032a99a,00008100:0032a99a,21AS10,Lichtenberg,Lichtenberg,Spielplatz,Gudrunstr. 14 Spielplatz,-,-,-,71300,gewidmet,11300725,Nibelungenviertel,-
3,00008100_00199411,00008100:00199411,00156,Marzahn-Hellersdorf,Marzahn,Spielplatz,Hohenwalder/Schorfheider Straße -Dreieck,seit 1990 pädagog. betreuter Spielplatz,1988,-,393400,gewidmet,10100104,Golliner Straße,-
4,00008100_00281623,00008100:00281623,150072,Treptow-Köpenick,Schmöckwitz,Spielplatz,Biebersdorfer Weg 12/ Lübbenauer Weg 23 Sch KSP,-,-,-,90000,gewidmet,09301227,Karolinenhof,-


In [13]:
df.columns

Index(['Technischer Schlüssel', 'Schlüssel', 'Objektnummer', 'Bezirk',
       'Ortsteil', 'Art der Grünanlage', 'Name des Spielplatzes',
       'Namenszusatz des Spielplatzes', 'Baujahr', 'letztes Sanierungsjahr',
       'Größe in m² (Kataster)', 'Widmung', 'Nummer des Planungsraumes',
       'Name des Planungsraumes', 'Nettospielfläche in m²'],
      dtype='object')

### Rename the Columns 

In [15]:
df.rename(columns={
    'Technischer Schlüssel': 'technical_id',
    'Schlüssel': 'key',
    'Objektnummer': 'object_number',
    'Bezirk': 'neighborhood',
    'Ortsteil': 'locality',
    'Art der Grünanlage': 'green_area_type',
    'Name des Spielplatzes': 'playground_name',
    'Namenszusatz des Spielplatzes': 'playground_suffix',
    'Baujahr': 'year_built',
    'letztes Sanierungsjahr': 'last_renovation_year',
    'Größe in m² (Kataster)': 'area_sqm',
    'Widmung': 'dedication',
    'Nummer des Planungsraumes': 'planning_area_number',
    'Name des Planungsraumes': 'planning_area_name',
    'Nettospielfläche in m²': 'net_play_area_sqm'
}, inplace=True)


In [16]:
df.columns

Index(['technical_id', 'key', 'object_number', 'neighborhood', 'locality',
       'green_area_type', 'playground_name', 'playground_suffix', 'year_built',
       'last_renovation_year', 'area_sqm', 'dedication',
       'planning_area_number', 'planning_area_name', 'net_play_area_sqm'],
      dtype='object')

### Create full Address Column 

In [17]:
df['Full Address'] = (
    df['playground_name'].astype(str) + ", " +
    df['planning_area_name'].astype(str) + ", Berlin, Germany"
)

df.head()

Unnamed: 0,technical_id,key,object_number,neighborhood,locality,green_area_type,playground_name,playground_suffix,year_built,last_renovation_year,area_sqm,dedication,planning_area_number,planning_area_name,net_play_area_sqm,Full Address
0,00008100_002f2c6b,00008100:002f2c6b,19441,Tempelhof-Schöneberg,Lichtenrade,Spielplatz,Nuthestr. 26,-,-,-,-,-,-,-,-,"Nuthestr. 26, -, Berlin, Germany"
1,00008100_0033cfac,00008100:0033cfac,35098,Reinickendorf,Tegel,Spielplatz,Borsigdamm 4 (Spielplatz),-,-,-,503190,-,12200413,Tegel Süd,-,"Borsigdamm 4 (Spielplatz), Tegel Süd, Berlin, ..."
2,00008100_0032a99a,00008100:0032a99a,21AS10,Lichtenberg,Lichtenberg,Spielplatz,Gudrunstr. 14 Spielplatz,-,-,-,71300,gewidmet,11300725,Nibelungenviertel,-,"Gudrunstr. 14 Spielplatz, Nibelungenviertel, B..."
3,00008100_00199411,00008100:00199411,00156,Marzahn-Hellersdorf,Marzahn,Spielplatz,Hohenwalder/Schorfheider Straße -Dreieck,seit 1990 pädagog. betreuter Spielplatz,1988,-,393400,gewidmet,10100104,Golliner Straße,-,"Hohenwalder/Schorfheider Straße -Dreieck, Goll..."
4,00008100_00281623,00008100:00281623,150072,Treptow-Köpenick,Schmöckwitz,Spielplatz,Biebersdorfer Weg 12/ Lübbenauer Weg 23 Sch KSP,-,-,-,90000,gewidmet,09301227,Karolinenhof,-,Biebersdorfer Weg 12/ Lübbenauer Weg 23 Sch KS...


### Lets look for duplicates 

In [18]:
# Count duplicate Full Address values
duplicates = df['Full Address'].duplicated().sum()
print(f"Found {duplicates} duplicate addresses.")

Found 27 duplicate addresses.


### Create a unique address DataFrame

In [19]:
unique_addresses = df[['Full Address']].drop_duplicates().copy()

### Geocode only the unique addresses using OpenStreetMap’s Nominatim API

In [20]:
geolocator = Nominatim(user_agent="berlin-geocoder")

def geocode_address(address):
    try:
        location = geolocator.geocode(address)
        sleep(1)
        if location:
            return pd.Series([location.latitude, location.longitude])
    except:
        return pd.Series([None, None])

In [33]:
# Geocode unique addresses
unique_addresses[['Latitude', 'Longitude']] = unique_addresses['Full Address'].apply(geocode_address)

TypeError: object of type 'NoneType' has no len()