## 1. Vorbereitung des Datensatzes

### Zweck:
Anreicherung der in QGIS zusammengeführten Datenbasis (U_VM_A_L_BRW_TL.geojson) mit den von der Google Maps Geocode API erweiterten Geoinformationen (geo_information.csv), sowie Vorbereitung der Datenbasis für weitere Verarbeitungen (Identifikation von Null Werten, Ableitung neuer Features etc.)
Auf die Anreicherung des Datensatzes mit weiteren Wetterdaten wie zunächst vorgesehen musste verzichtet werden, da keine tagesgenauen Datumsinformationen zu den jeweiligen Unfällen vorliegen.

In [1]:
import geopandas as gpd
import pandas as pd
import numpy as np
pd.options.display.max_columns = None
crash_data = gpd.read_file('../01_Source/U_VM_A_L_BRW_TL.geojson') 
geo_information = pd.read_csv('../01_Source/geo_information.csv', sep=';')
crash_data = pd.merge(crash_data, geo_information, on ='OBJECTID',  how='inner')


import numpy as np
import datetime
 

In [2]:
#Ermittlung von Features, die aufgrund fehlender Werte bearbeitet werden müssen
crash_data.info()

<class 'geopandas.geodataframe.GeoDataFrame'>
Int64Index: 13649 entries, 0 to 13648
Data columns (total 67 columns):
OBJECTID              13649 non-null int64
ULAND                 13649 non-null int64
UREGBEZ               13649 non-null int64
UKREIS                13649 non-null int64
UGEMEINDE             13649 non-null int64
UJAHR                 13649 non-null int64
UMONAT                13649 non-null int64
USTUNDE               13649 non-null int64
UWOCHENTAG            13649 non-null int64
UKATEGORIE            13649 non-null int64
UART                  13649 non-null int64
UTYP1                 13649 non-null int64
ULICHTVERH            13649 non-null int64
IstRad                13649 non-null int64
IstPKW                13649 non-null int64
IstFuss               13649 non-null int64
IstKrad               13649 non-null int64
IstGkfz               13649 non-null int64
IstSonstige           13649 non-null int64
STRZUSTAND            13649 non-null int64
LINREFX               1

In [3]:
# Ableitung Label Schwerverletzt/getötet Ja=1/Nein=0
crash_data["UKATEGORIE"] = crash_data["UKATEGORIE"]/2
crash_data['TARGET'] = 0 #0 leicht verletzt 1= Schwer Verletzt/getötet
crash_data.loc[crash_data["UKATEGORIE"] <= 1, ['TARGET']] = 1

# Anreicherung von IDs mit Kontextinformationen

# Unfallart
uart_df = pd.DataFrame({'UART' : [1,2,3,4,5,6,7,8,9,10], 'UART_Value':["Zusammenstoß mit anfahrendem / anhaltendem / ruhendem Fahrzeug",
                "Zusammenstoß mit vorausfahrendem / wartendem Fahrzeug",
                "Zusammenstoß mit seitlich in gleicher Richtung fahrendem Fahrzeug",
                "Zusammenstoß mit entgegenkommendem Fahrzeug",
                "Zusammenstoß mit einbiegendem / kreuzendem Fahrzeug",
                "Zusammenstoß zwischen Fahrzeug und Fußgänger",
                "Aufprall auf Fahrbahnhindernis",
                "Abkommen von Fahrbahn nach rechts",
                "Abkommen von Fahrbahn nach links",
                "Unfall anderer Art"]})

crash_data = pd.merge(crash_data, uart_df, on ='UART',  how='left')
crash_data['UART_Value'] = crash_data['UART_Value'].fillna("Unbekannt")

#Wochentag
wochentag_df = pd.DataFrame({'UWOCHENTAG':[1,2,3,4,5,6,7],
                                 'UWOCHENTAG_Value':['Sonntag','Montag','Dienstag','Mittwoch','Donnerstag','Freitag','Samstag']})
wochentag_df


crash_data = pd.merge(crash_data, wochentag_df, on ='UWOCHENTAG',  how='left')
crash_data['UWOCHENTAG_Value'] = crash_data['UWOCHENTAG_Value'].fillna("Unbekannt")

#Licht
licht_df = pd.DataFrame({'ULICHTVERH':[0,1,2],
                                 'ULICHTVERH_Value':['Tageslicht','Dämmerung','Dunkelheit']})


crash_data = pd.merge(crash_data, licht_df, on ='ULICHTVERH',  how='left')
crash_data['ULICHTVERH_Value'] = crash_data['ULICHTVERH_Value'].fillna("Unbekannt")
    
#Unfalltyp
unfalltyp_df = pd.DataFrame({'UTYP1':[1,2,3,4,5,6,7],
                                 'UTYP1_Value':['Fahrunfall','Abbiegeunfall','Einbiegen / Kreuzen-Unfall','Überschreitenunfall','Unfall durch ruhenden Verkehr','Unfall im Längsverkehr','sonstiger Unfall']})

crash_data = pd.merge(crash_data, unfalltyp_df, on ='UTYP1',  how='left')
crash_data['UTYP1_Value'] = crash_data['UTYP1_Value'].fillna("Unbekannt")

#Straßenzustand
str_zustand_df = pd.DataFrame({'STRZUSTAND':[0,1,2],
                                 'STRZUSTAND_Value':['trocken','nass/feucht/schlüpfrig','winterglatt']})
crash_data = pd.merge(crash_data, str_zustand_df, on ='STRZUSTAND',  how='left')
crash_data['STRZUSTAND_Value'] = crash_data['STRZUSTAND_Value'].fillna("Unbekannt")


In [4]:
# Berechnung zusätzlicher Features: Anteile von Verkehrsteilnehmern am Straßenverkehr 

crash_data['DTV'] = crash_data['DTV'].fillna(crash_data['DTV'].mean())
crash_data["ANTEIL_PKW"] = crash_data["PKW"]*100/crash_data["DTV"]
crash_data["ANTEIL_PKW"] = crash_data["ANTEIL_PKW"].fillna(crash_data["ANTEIL_PKW"].mean())
crash_data["ANTEIL_LKW"] = crash_data["LKW"]*100/crash_data["DTV"]
crash_data["ANTEIL_LKW"] = crash_data["ANTEIL_LKW"].fillna(crash_data["ANTEIL_LKW"].mean())
crash_data["ANTEIL_LIEFERWAGEN"] = crash_data["LIEFERWAGEN"]*100/crash_data["DTV"]
crash_data["ANTEIL_LIEFERWAGEN"] = crash_data["ANTEIL_LIEFERWAGEN"].fillna(crash_data["ANTEIL_LKW"].mean())
crash_data["ANTEIL_LINIENBUSSE"] = crash_data["LINIENBUSSE"]*100/crash_data["DTV"]
crash_data["ANTEIL_LINIENBUSSE"] = crash_data["ANTEIL_LINIENBUSSE"].fillna(crash_data["ANTEIL_LKW"].mean())
crash_data.loc[crash_data["ANTEIL_LINIENBUSSE"] == np.inf, ['DTV']] = crash_data.loc[crash_data["ANTEIL_LINIENBUSSE"] == np.inf, ['LINIENBUSSE']]
crash_data.loc[crash_data["ANTEIL_LINIENBUSSE"] == np.inf, ['ANTEIL_LINIENBUSSE']] = 100
crash_data["ANTEIL_REISEBUSSE"] = crash_data["REISEBUSSE"]*100/crash_data["DTV"]
crash_data["ANTEIL_REISEBUSSE"] = crash_data["ANTEIL_REISEBUSSE"].fillna(crash_data["ANTEIL_REISEBUSSE"].mean())
crash_data["ANTEIL_KRAD"] = crash_data["KRAD"]*100/crash_data["DTV"]
crash_data["ANTEIL_KRAD"] = crash_data["ANTEIL_KRAD"].fillna(crash_data["ANTEIL_KRAD"].mean())
crash_data = crash_data.drop(["PKW","LKW","LIEFERWAGEN","LINIENBUSSE","REISEBUSSE","KRAD"], axis=1)
crash_data = crash_data.drop(["UKATEGORIE"], axis=1)

In [5]:
crash_data.describe()

Unnamed: 0,OBJECTID,ULAND,UREGBEZ,UKREIS,UGEMEINDE,UJAHR,UMONAT,USTUNDE,UWOCHENTAG,UART,UTYP1,ULICHTVERH,IstRad,IstPKW,IstFuss,IstKrad,IstGkfz,IstSonstige,STRZUSTAND,LINREFX,LINREFY,METER,DTV,EW2010,GFZ,WERT_VES,LAT,LON,postal_code,TARGET,ANTEIL_PKW,ANTEIL_LKW,ANTEIL_LIEFERWAGEN,ANTEIL_LINIENBUSSE,ANTEIL_REISEBUSSE,ANTEIL_KRAD
count,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,11689.0,13647.0,13313.0,11114.0,8388.0,13649.0,13649.0,13609.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0,13649.0
mean,190757.504506,11.0,0.0,5.424793,5.424793,2018.0,6.728405,13.473441,4.057513,3.626713,3.887171,0.446699,0.380321,0.817056,0.151147,0.157814,0.032457,0.13305,0.195472,797784.714863,5826565.0,212.232355,19578.636691,9840.139037,1.931591,41.808417,52.507661,13.388595,12002.414726,0.162356,82.408776,2.762958,9.124827,1.897258,0.400124,2.494525
std,30324.88951,0.0,0.0,3.495025,3.495025,0.0,3.175898,4.773724,1.779208,2.147327,1.895501,0.796455,0.485483,0.386635,0.358205,0.36458,0.177216,0.339641,0.408232,6614.33007,5157.698,241.785709,12425.282859,5899.990231,1.159272,787.939231,0.046722,0.096822,1330.929794,0.368791,2.811902,1.251582,2.614687,2.86602,0.37521,0.761024
min,112695.0,11.0,0.0,1.0,1.0,2018.0,1.0,0.0,1.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,778444.6987,5809746.0,12.0,0.0,321.0,0.1,5.0,52.346532,13.094676,10115.0,0.0,19.879518,0.0,2.762958,0.0,0.0,0.431061
25%,198395.0,11.0,0.0,2.0,2.0,2018.0,4.0,10.0,3.0,2.0,2.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,793462.7915,5823267.0,110.0,10980.0,5735.0,1.0,30.0,52.478603,13.326103,10627.0,0.0,81.840431,1.983471,10.194731,0.246914,0.261814,2.070131
50%,201810.0,11.0,0.0,5.0,5.0,2018.0,7.0,14.0,4.0,5.0,3.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,797762.1994,5826844.0,167.0,19350.0,9236.0,2.0,30.0,52.510399,13.387512,12203.0,0.0,82.557528,2.762958,10.199101,1.577061,0.354687,2.494525
75%,205222.0,11.0,0.0,8.0,8.0,2018.0,9.0,17.0,6.0,5.0,6.0,1.0,1.0,1.0,0.0,0.0,0.0,0.0,0.0,801550.2442,5829905.0,254.0,24030.0,12958.0,2.5,30.0,52.5382,13.444049,13347.0,0.0,83.78744,3.150912,10.20202,2.762958,0.425753,2.793651
max,208853.0,11.0,0.0,12.0,12.0,2018.0,12.0,23.0,7.0,9.0,7.0,2.0,1.0,1.0,1.0,1.0,1.0,1.0,2.0,822060.5092,5842633.0,6418.0,89544.0,31699.0,4.5,72189.0,52.655866,13.7381,16816.0,1.0,87.555556,18.683109,10.460251,100.0,6.896552,7.407407


In [6]:
# Elliminierung von Null Werten, sowie Handling von unmöglichen Werten (bsp. Tempolimit 999999)
crash_data.loc[crash_data["WERT_VES"] > 100, ['WERT_VES']] = 50
crash_data['WERT_VES'] = crash_data['WERT_VES'].fillna(50)
crash_data['GESLAERM'] = crash_data['GESLAERM'].fillna("mittel")
crash_data['DTV'] = crash_data['DTV'].fillna(crash_data['DTV'].mean())
crash_data['DTV'] = crash_data['DTV'].fillna(0)
crash_data['METER'] = crash_data['METER'].fillna(crash_data['METER'].mean())

In [7]:
# Berechnung zusätzlicher Features: Durchschnittliche Anzahl an Unfällen je Kreis/Gemeinde 
avg_ukreis = crash_data.groupby('UKREIS')['OBJECTID'].count()
count_target_ukreis = crash_data.groupby('UKREIS')['TARGET'].sum()
join_ukreis = pd.merge(avg_ukreis, count_target_ukreis, on ='UKREIS',  how='inner')
join_ukreis['UKREIS_AVG_TARGET'] = join_ukreis['TARGET']*100 / join_ukreis['OBJECTID']

avg_ugemeinde = crash_data.groupby('UGEMEINDE')['OBJECTID'].count()
count_target_ugemeinde = crash_data.groupby('UGEMEINDE')['TARGET'].sum()
join_ugemeinde = pd.merge(avg_ugemeinde, count_target_ugemeinde, on ='UGEMEINDE',  how='inner')
join_ugemeinde['UGEMEINDE_AVG_TARGET'] = join_ugemeinde['TARGET']*100 / join_ugemeinde['OBJECTID']

join_ugemeinde = join_ugemeinde.drop(["OBJECTID","TARGET"], axis=1)
join_ukreis = join_ukreis.drop(["OBJECTID","TARGET"], axis=1)

# Berechnung zusätzlicher Features: Anzahl an schweren und allgemeinen Unfällen je Verkehrsmenge 

avg_dtv = crash_data.groupby('STR_NAME')['DTV'].mean()
count_crashes_by_street = crash_data.groupby('STR_NAME')['OBJECTID'].count()
count_fatal_crashes_by_street = crash_data.groupby('STR_NAME')['TARGET'].sum()
join_dtv = pd.merge(avg_dtv, count_crashes_by_street, on ='STR_NAME',  how='inner')
join_dtv = pd.merge(join_dtv, count_fatal_crashes_by_street, on ='STR_NAME',  how='inner')
join_dtv['CRASH_BY_DTV'] = (join_dtv['OBJECTID']* 100000 / join_dtv['DTV'])
join_dtv['CRASH_BY_DTV'] = join_dtv['CRASH_BY_DTV'].round(3)
join_dtv['CRASH_BY_DTV'] = join_dtv['CRASH_BY_DTV']
join_dtv['FATAL_CRASH_BY_DTV'] = join_dtv['TARGET']* 100000/ join_dtv['DTV']
join_dtv['FATAL_CRASH_BY_DTV'] = join_dtv['FATAL_CRASH_BY_DTV'].round(3)
join_dtv['FATAL_CRASH_BY_DTV'] = join_dtv['FATAL_CRASH_BY_DTV']

join_dtv.loc[join_dtv['DTV'] == 0, 'CRASH_BY_DTV'] = 0
join_dtv.loc[join_dtv['DTV'] == 0, 'FATAL_CRASH_BY_DTV'] = 0

#Gefährlichkeitsindex für eine Straße bestimmen
street_distance = crash_data.groupby('STR_NAME')['METER'].mean()
join_dtv = pd.merge(join_dtv, street_distance, on ='STR_NAME',  how='inner')

#Der Index bildet den relativen Anteil eines Unfalls an der Verkehrmenge auf einer Straße ab
join_dtv['Indicator'] = 1* 100000/ join_dtv['DTV']
join_dtv.loc[join_dtv['DTV'] == 0, 'Indicator'] = 0
join_dtv.loc[join_dtv['Indicator'] == 0, 'Indicator'] = join_dtv['Indicator'].mean()







In [8]:
#Bei einer Betrachtung der Daten scheint es vereinzelt starke Ausreißer nach oben zu geben (Indicator Max 81.14 bei)
#einem oberen Quartil von 0.64. 
join_dtv.describe()

Unnamed: 0,DTV,OBJECTID,TARGET,CRASH_BY_DTV,FATAL_CRASH_BY_DTV,METER,Indicator
count,1118.0,1118.0,1118.0,1118.0,1118.0,1118.0,1118.0
mean,12918.311606,10.455277,1.765653,114.765069,21.739515,210.574726,19.371153
std,9531.7993,14.901925,2.716474,611.863822,161.914334,191.956576,79.247581
min,0.0,1.0,0.0,0.0,0.0,21.0,1.401798
25%,6484.5,2.0,0.0,28.86,0.0,127.7625,5.774742
50%,10399.5,6.0,1.0,59.4605,8.751,174.9,9.615849
75%,17316.818182,12.0,2.0,116.176,22.3015,242.439904,15.421412
max,71336.945274,201.0,31.0,18965.517,5172.414,4745.928571,1724.137931


In [9]:
#Normalisierung des Indikatoren zwischen 0 und 10
#Die unten stehende Formel funktioniert, da Min(join_dtv['Indicator']) = 0
#Das Beibehalten der Kardinalskala mit dem Wissen, dass sich die meisten Werte zwischen 1/81 - 7/81
#bewegen werden ist explizit gewünscht, da im Rahmen folgender Analysen mit diesen weitergerechnet werden soll.
join_dtv['Indicator'] = 10 * join_dtv['Indicator']/join_dtv['Indicator'].max()

In [10]:
join_dtv = join_dtv.drop(["OBJECTID","TARGET","DTV","METER"], axis=1)
crash_data = pd.merge(crash_data, join_ukreis, on ='UKREIS',  how='left')
crash_data = pd.merge(crash_data, join_ugemeinde, on ='UGEMEINDE',  how='left')
crash_data = pd.merge(crash_data, join_dtv, on ='STR_NAME',  how='left')

crash_data['FATAL_CRASH_BY_DTV'] = crash_data['FATAL_CRASH_BY_DTV'].fillna(crash_data['FATAL_CRASH_BY_DTV'].mean())
crash_data['CRASH_BY_DTV'] = crash_data['CRASH_BY_DTV'].fillna(crash_data['CRASH_BY_DTV'].mean())

In [11]:
crash_data.head()

Unnamed: 0,OBJECTID,ULAND,UREGBEZ,UKREIS,UGEMEINDE,UJAHR,UMONAT,USTUNDE,UWOCHENTAG,UART,UTYP1,ULICHTVERH,IstRad,IstPKW,IstFuss,IstKrad,IstGkfz,IstSonstige,STRZUSTAND,LINREFX,LINREFY,METER,STR_NAME,DTV,HERKUNFT,NAME,KNAME,PLR_NAME,EW2010,VBUS,VBUS_PERS,GESLAERM,GESLAERM_PERS,GEMEINDE,BEZIRK,ANWERT,BRW,NUTZUNG,GFZ,VERFAHRENSART,STICHTAG,BEITRAGSZUSTAND,LUMNUM,ELEM_NR,VRICHT_TXT,WERT_VES,ZEIT_T,TAG_T,DURCH_T,DANN_T,DAT_T,geometry,LAT,LON,formatted_address,address_components,postal_code,sublocality,street_number,route,TARGET,UART_Value,UWOCHENTAG_Value,ULICHTVERH_Value,UTYP1_Value,STRZUSTAND_Value,ANTEIL_PKW,ANTEIL_LKW,ANTEIL_LIEFERWAGEN,ANTEIL_LINIENBUSSE,ANTEIL_REISEBUSSE,ANTEIL_KRAD,UKREIS_AVG_TARGET,UGEMEINDE_AVG_TARGET,CRASH_BY_DTV,FATAL_CRASH_BY_DTV,Indicator
0,198728,11,0,10,10,2018,3,11,5,5,3,0,0,1,0,0,0,0,0,814987.3095,5829184.0,212.232355,,19575.767816,,,,Mahlsdorf Nord,8818.0,mittel,niedrig - sehr niedrig,mittel,niedrig - sehr niedrig,Berlin,Marzahn-Hellersdorf,,360,W - Wohngebiet,0.4,,2019-01-01T00:00:00,Beitragsfrei nach BauGB,[[url]],62540035_62540036.02,beide Richtungen,30.0,,,angeordnete Verkehrseinschränkung,,,"MULTIPOLYGON (((814997.310 5829184.012, 814996...",52.521509,13.643731,"Schongauerstraße 20, 12623 Berlin, Germany","[{""long_name"": ""20"", ""short_name"": ""20"", ""type...",12623.0,Bezirk Marzahn-Hellersdorf,20,Schongauerstraße,0,Zusammenstoß mit einbiegendem / kreuzendem Fah...,Donnerstag,Tageslicht,Einbiegen / Kreuzen-Unfall,trocken,82.408776,2.762958,2.762958,2.762958,0.400124,2.494525,21.266234,21.266234,182.305072,31.958161,
1,196865,11,0,10,10,2018,1,18,2,5,3,2,0,1,0,0,0,0,0,814875.2039,5830058.0,220.0,Lemkestr.,6108.0,"Modellrechnung 2014, VMZ",,,Mahlsdorf Nord,8818.0,mittel,niedrig - sehr niedrig,mittel,niedrig - sehr niedrig,Berlin,Marzahn-Hellersdorf,,360,W - Wohngebiet,0.4,,2019-01-01T00:00:00,Beitragsfrei nach BauGB,[[url]],62550001_62550021.01,beide Richtungen,30.0,07:00 - 17:00,Montag bis Freitag,Kinder,Zeitangabe,,"MULTIPOLYGON (((814885.204 5830057.780, 814884...",52.529404,13.642912,"Lemkestraße 112B, 12623 Berlin, Germany","[{""long_name"": ""112B"", ""short_name"": ""112B"", ""...",12623.0,Bezirk Marzahn-Hellersdorf,112B,Lemkestraße,0,Zusammenstoß mit einbiegendem / kreuzendem Fah...,Montag,Dunkelheit,Einbiegen / Kreuzen-Unfall,trocken,81.777996,3.601834,10.21611,2.619515,0.261952,1.522593,21.266234,21.266234,153.846,51.282,0.148718
2,202456,11,0,10,10,2018,6,7,4,5,3,0,1,1,0,0,0,0,0,814271.9549,5828041.0,212.232355,,19575.767816,,,,Alt-Mahlsdorf,3852.0,niedrig - sehr niedrig,niedrig - sehr niedrig,niedrig - sehr niedrig,mittel,Berlin,Marzahn-Hellersdorf,,360,W - Wohngebiet,0.4,,2019-01-01T00:00:00,Beitragsfrei nach BauGB,[[url]],62530003_62540023.02,beide Richtungen,30.0,,,angeordnete Verkehrseinschränkung,,,"MULTIPOLYGON (((814281.955 5828040.742, 814281...",52.511678,13.632143,"Lortzingstraße 22, 12623 Berlin, Germany","[{""long_name"": ""22"", ""short_name"": ""22"", ""type...",12623.0,Bezirk Marzahn-Hellersdorf,22,Lortzingstraße,1,Zusammenstoß mit einbiegendem / kreuzendem Fah...,Mittwoch,Tageslicht,Einbiegen / Kreuzen-Unfall,trocken,82.408776,2.762958,2.762958,2.762958,0.400124,2.494525,21.266234,21.266234,182.305072,31.958161,
3,201726,11,0,10,10,2018,6,13,4,5,3,0,0,1,0,0,1,0,0,814205.008,5830068.0,212.232355,,19575.767816,,,,Mahlsdorf Nord,8818.0,mittel,niedrig - sehr niedrig,mittel,niedrig - sehr niedrig,Berlin,Marzahn-Hellersdorf,,360,W - Wohngebiet,0.4,,2019-01-01T00:00:00,Beitragsfrei nach BauGB,[[url]],62550008_62550009.03,beide Richtungen,30.0,,,angeordnete Verkehrseinschränkung,,,"MULTIPOLYGON (((814215.008 5830068.156, 814214...",52.529883,13.633075,"Am Schlehdorn 24, 12623 Berlin, Germany","[{""long_name"": ""24"", ""short_name"": ""24"", ""type...",12623.0,Bezirk Marzahn-Hellersdorf,24,Am Schlehdorn,0,Zusammenstoß mit einbiegendem / kreuzendem Fah...,Mittwoch,Tageslicht,Einbiegen / Kreuzen-Unfall,trocken,82.408776,2.762958,2.762958,2.762958,0.400124,2.494525,21.266234,21.266234,182.305072,31.958161,
4,200478,11,0,10,10,2018,5,20,7,5,3,1,0,1,0,0,0,0,0,814755.4276,5829893.0,254.0,Lemkestr.,3852.0,"Modellrechnung 2014, VMZ",,,Mahlsdorf Nord,8818.0,mittel,niedrig - sehr niedrig,mittel,niedrig - sehr niedrig,Berlin,Marzahn-Hellersdorf,,360,W - Wohngebiet,0.4,,2019-01-01T00:00:00,Beitragsfrei nach BauGB,[[url]],62550028_62550029.02,beide Richtungen,30.0,,,angeordnete Verkehrseinschränkung,,,"MULTIPOLYGON (((814765.428 5829893.128, 814764...",52.527997,13.640996,"Lemkestr./Greifswalder Str. (Berlin), 12623 Be...","[{""long_name"": ""Lemkestr./Greifswalder Str. (B...",12623.0,Bezirk Marzahn-Hellersdorf,,Lemkestr./Greifswalder Str. (Berlin),0,Zusammenstoß mit einbiegendem / kreuzendem Fah...,Samstag,Dämmerung,Einbiegen / Kreuzen-Unfall,trocken,81.178609,2.777778,10.202492,3.894081,0.415369,1.531672,21.266234,21.266234,153.846,51.282,0.148718


In [12]:
crash_data.shape

(13649, 77)

In [13]:
#Save Dataset
crash_data.to_file("../01_Source/consolidatedDataSet.geojson", driver='GeoJSON')