# Onderzoek Openstreetmap wijken en buurten

In [1]:
# openstreetmap API package
# can be installed in conda cmd with:
# conda config --prepend channels conda-forge
# conda create -n ox --strict-channel-priority osmnx
from osmnx import geometries

import pandas as pd 
import numpy as np

## pak de gezondheid wijken en buurten data

In [2]:
gezondheids_df = pd.read_csv('data/Gezondheid_wijk_en_buurt_2020.csv')
display(gezondheids_df)

Unnamed: 0,Leeftijd,Marges,Perioden,WijkenEnBuurten,Gemeentenaam,SoortRegio,Regioaanduiding/Codering (),ErvarenGezondheidGoed,Ondergewicht,NormaalGewicht,Overgewicht,ErnstigOvergewicht,VoldoetAanAlcoholRichtlijn,Drinker,ZwareDrinker,OvermatigeDrinker
0,18 jaar of ouder,Waarde,2020.0,Nederland,Nederland,Land,NL01,78.4,2.0,47.4,50.8,15.6,43.9,78.5,8.4,6.3
1,18 jaar of ouder,Waarde,2020.0,Aa en Hunze,Aa en Hunze,Gemeente,GM1680,80.5,1.7,45.0,53.9,15.8,42.9,80.1,7.2,6.6
2,18 jaar of ouder,Waarde,2020.0,Wijk 00 Annen,Aa en Hunze,Wijk,WK168000,81.4,1.6,46.7,53.0,15.2,40.1,80.9,7.0,5.9
3,18 jaar of ouder,Waarde,2020.0,Annen,Aa en Hunze,Buurt,BU16800000,81.3,1.6,46.4,53.2,15.3,40.0,80.7,7.0,5.8
4,18 jaar of ouder,Waarde,2020.0,Verspreide huizen Annen,Aa en Hunze,Buurt,BU16800009,84.4,1.6,51.9,49.1,12.4,42.2,85.0,7.2,7.4
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
17336,18 jaar of ouder,Waarde,2020.0,Gerenbroek,Zwolle,Buurt,BU01935150,83.1,1.7,46.8,52.7,15.7,42.0,81.8,7.9,6.1
17337,18 jaar of ouder,Waarde,2020.0,Oude Mars,Zwolle,Buurt,BU01935160,92.3,1.7,59.0,40.7,9.8,33.5,91.0,9.2,6.4
17338,18 jaar of ouder,Waarde,2020.0,Wijk 52 Soestweteringlanden,Zwolle,Wijk,WK019352,84.1,1.8,49.2,49.8,13.0,38.7,83.4,9.7,7.3
17339,18 jaar of ouder,Waarde,2020.0,Windesheim,Zwolle,Buurt,BU01935200,84.3,1.7,48.1,50.9,13.8,37.7,83.2,10.6,7.8


### data opschonen

In [3]:
# Sum van alle Nan values per coloumn
print(f'Voordat we de null-waardes droppen hebben we: {len(gezondheids_df)}  in de dataset')
print(gezondheids_df.isnull().sum())
gezondheids_df.dropna(inplace=True)
# veel wijken en buurten bevatten als null waarde bij de gezondheidsdata een '.'
gezondheids_df = gezondheids_df.drop(gezondheids_df[gezondheids_df.Ondergewicht == '.'].index)
print(f'Nadat we de null-waardes droppen hebben we: {len(gezondheids_df)} in de  dataset')

Voordat we de null-waardes droppen hebben we: 17341  in de dataset
Leeftijd                       0
Marges                         5
Perioden                       5
WijkenEnBuurten                5
Gemeentenaam                   5
SoortRegio                     5
Regioaanduiding/Codering ()    5
ErvarenGezondheidGoed          5
Ondergewicht                   5
NormaalGewicht                 5
Overgewicht                    5
ErnstigOvergewicht             5
VoldoetAanAlcoholRichtlijn     5
Drinker                        5
ZwareDrinker                   5
OvermatigeDrinker              5
dtype: int64
Nadat we de null-waardes droppen hebben we: 16568 in de  dataset


## pak alle bars en fastfood restaurants in Nederland, opentreetmap

Omdat de osmnx functie die gebruikt word bij het zoeken in een plaats niet werkt voor Nederland, word er alsnog per gemeente gezocht naar faciliteiten.

In [4]:
places = []

for ind_r, row_b in gezondheids_df.iterrows():
    if row_b['SoortRegio'] == 'Gemeente':
        places.append(str(row_b['Gemeentenaam']) + ', Nederland')


Kies welke facalliteiten gezocht moeten worden. iedere faciliteit apart omdat we aparte layers in QGis willen hebben.

In [5]:
amenities = {'amenity': ['bar', 'pub', 'biergarten', 'fast_food']}

doorloop de lijst met plaatsen en zoek voor de tags.

In [6]:
NL_amenities = []
i = 0
print('start searching')

while i < len(places):
    
    try:
        # Zoek naar faciliteiten in een gemeente.
        amenity_data = geometries.geometries_from_place(places[i], amenities)
        
        # pak het type en coordinaten van de faciliteiten.
        amenity_type, amenity_coords = amenity_data['amenity'], amenity_data['geometry']

        # zet de faciliteit data in de list.
        for typ, coord in zip(amenity_type, amenity_coords):
            # als de coordinaten van een faciliteit en point is.
            if coord.geom_type == 'Point':
                long_lat = list(coord.coords[0])
                NL_amenities.append([typ, long_lat[0], long_lat[1]])
            # als de coordinaten van een faciliteit en polygon is.
            else:
                long_lat = list(coord.exterior.coords[0])
                NL_amenities.append([typ, long_lat[0], long_lat[1]])
                
    except:
        # print de gemeente waar een error is.
        # of de gemeente is niet gevonden in Openstreetmap of de gemeente heeft geen van de gezochte faciliteiten.
        print(places[i] + ' niet gevonden.')
        
    print('procent doorzocht: %d' % (i/len(places)*100), end='\r')
    i += 1

start searching
Eemnes, Nederland niet gevonden.
Landerd, Nederland niet gevonden.
Langedijk, Nederland niet gevonden.
Mill en Sint Hubert , Nederland niet gevonden.
Opmeer, Nederland niet gevonden.
Rozendaal, Nederland niet gevonden.
Sint Anthonis, Nederland niet gevonden.
procent doorzocht: 99

In [7]:
df = pd.DataFrame(NL_amenities, columns = ['faciliteit', 'longitude', 'latitude'])

In [8]:
df.to_csv('data\osm_nl_faciliteiten.csv')

  df.to_csv('data\osm_nl_faciliteiten.csv')
