# Exploratie van de inschrijvingen

In [2]:
%matplotlib notebook

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import geopandas

from shapely.geometry import Point

**Data inlezen**

In [3]:
data = pd.read_csv("data.csv")

In [4]:
data['geometry'] = data.apply(lambda x: Point(x['longitude'], x['latitude']), axis=1)

In [5]:
data = geopandas.GeoDataFrame(data)

Coordinaten referentiesysteem naar UTM:

In [6]:
data.crs = {'init': 'epsg:4326', 'no_defs': True}

In [7]:
data = data.to_crs(epsg=31370)

OpenStreetMap straten:

In [8]:
streets = geopandas.read_file("layer_openstreetmap_streets.shp")

## Meetlocaties op een kaart

In [9]:
ax = streets.plot(color='k', figsize=(13,10))
data.plot(ax=ax, color='r', zorder=10, alpha=0.5)
ax.set(xlim=(146000, 160000), ylim=(206000, 219000))

<IPython.core.display.Javascript object>

[(146000, 160000), (206000, 219000)]

Er zijn een aantal locaties die zeer ver van Antwerpen liggen:

In [10]:
ax = streets.plot(color='k')
data.plot(ax=ax, color='r', zorder=10, alpha=0.5)

<IPython.core.display.Javascript object>

<matplotlib.axes._subplots.AxesSubplot at 0xb866cc0>

## Type gebouwen?

In [11]:
fig, ax = plt.subplots()
data['gebouw_type'].dropna().value_counts().plot(kind='bar', ax=ax, rot=0)

<IPython.core.display.Javascript object>

<matplotlib.axes._subplots.AxesSubplot at 0xbf3ccf8>

## Op de eerste verdieping of niet?

In [12]:
plt.figure()
data['verdiep_1'].value_counts().plot(kind='bar', rot=0)

<IPython.core.display.Javascript object>

<matplotlib.axes._subplots.AxesSubplot at 0xbfd3748>

## En indien niet, welke verdieping dan wel?

In [13]:
m = {'gelijkvloers': ['gelijkvloers'],
     '2de': ['2', 'tweede verdieping', '2e verdieping', '2de verdieping', '2e', 'tweede', '2de verdiep', 'op de tweede verdieping'],
     '3de': ['3', 'derde verdieping', 'derde', '3e', '3de verdieping', 'op de 3de verdieping', '3de ved.', '3e verdieping'],
     '4de': ['4', '4de verdieping', '4e', 'vierde', 'vierde verdieping'],
     '5de': ['5', 'verdieping 5', '5e verdieping', '5de verdieping'],
     '6de': ['6', '6de verdieping', '6e verdieping', '6 de'],
     '7de': ['7', '7de verdieping'],
     '8ste': ['8', '8ste verdieping']}
m2 = {val: key for key in m for val in m[key]}

In [14]:
verdiep = data['verdiep_ander'].dropna().astype(str).str.lower()

In [15]:
plt.figure()
verdiep.replace(m2).value_counts().head(8).plot(kind='bar', rot=0)

<IPython.core.display.Javascript object>

<matplotlib.axes._subplots.AxesSubplot at 0xc6d7a90>

## In welk type straat liggen de meetlocaties?

Dit gebruikt de types zoals ze in OpenStreetMap zitten, onderaan staat ook een kaartje waarop is aangeduid welke straat welk type is (probleem is wel dat de kaart van OpenStreetMap niet helemaal volledig is).

In [16]:
def closest_road(point, streets):
    """Distance to the nearest road [m] (OpenStreetMap)"""
    dist = streets.distance(point)
    return pd.Series([dist.min(), dist.idxmin()], index=['d_closest', 'closest'])

In [17]:
data[['d_closest', 'closest']] = data.geometry.apply(lambda x: closest_road(x, streets))

In [18]:
data['closest_type'] = data['closest'].replace(streets['highway'])

In [19]:
plt.figure()
data['closest_type'][data['d_closest'] < 15].value_counts().plot(kind='bar', rot=0)

<IPython.core.display.Javascript object>

<matplotlib.axes._subplots.AxesSubplot at 0xc81bbe0>

In [195]:
streets.plot(column='highway', legend=True, cmap='Set1', alpha=1)

<IPython.core.display.Javascript object>

<matplotlib.axes._subplots.AxesSubplot at 0x17d77630>