In [1]:
import pandas as pd
import numpy as np

In [2]:
from docs.data_translation_tables.pricina_category import pricina_category  as pricina_translation_dict

In [3]:
path_prefix = "sources/"

In [4]:
columns_renaming = {
    'Y': 'point_y',
    'X': 'point_x',
    'POINT_Y': 'point_y',
    'POINT_X': 'point_x',
    'rok': 'year',
    'mesic': 'month',
    'den': 'day',
    'zavineni': 'caused_by',
    'viditelnost': 'visibility',
    'cas': 'time',
    'hodina': 'hour',
    'mesic_t': 'month_text',
    'doba': 'day_night',
    'den_v_tydnu': 'weekday',
    'alkohol': 'alcohol',
    'alkohol_vinik': 'alcohol_offender',
    'hlavni_pricina': 'main_cause',
    'srazka': 'collision_with',
    'pricina': 'cause',
    'stav_vozovky': 'road_condition',
    'povetrnostni_podm': 'weather',
    'rozhled': 'view_condition',
    'misto_nehody': 'accident_place',
    'druh_komun': 'road_type',
    'usmrceno_os': 'no_casualties',
    'tezce_zran_os': 'no_injured_major',
    'lehce_zran_os': 'no_injured_minor',
    'hmotna_skoda': 'material_damage_price',
    'smrt': 'death',
    'smrt_dny': 'days_to_death',
    'vek_skupina': 'age_group',
    'chodec_pohlavi': 'pedestrian_sex',
    'pohlavi': 'sex',
    'stav_chodce': 'pedestrian_condition',
    'stav_ridic': 'driver_condition',
    'ovliveni_ridice': 'driver_circumstances',
    'chovani_chodce': 'pedestrian_behaviour',
    'situace_nehody': 'accident_circumstances',
    'prvni_pomoc': 'first_aid',
    'nasledky_chodce': 'pedestrain_consequences',
    'nasledek': 'consequences',
    'nazev': 'location',
    'druh_vozidla': 'vehicle_type',
    'osoba': 'person',
    'ozn_osoba': 'person_circumstances'
    
}

In [5]:
sources = {}
sources["bike_accidents"] = pd.read_csv("sources/bike_accidents.csv")
sources["ped_accidents"] = pd.read_csv("sources/pedestrian_accidents.csv")
sources["ped_crossings"] = pd.read_csv("sources/pedestrian_crossings.csv")
sources["pub_trans_stops"] = pd.read_csv("sources/public_transport_stops.csv")
sources["street_lights"] = pd.read_csv("sources/street_lights.csv")
sources["street_slopes"] = pd.read_csv("sources/street_slopes.csv")
sources["traffic_accidents"] = pd.read_csv("sources/traffic_accidents.csv", low_memory=False)

In [19]:
srazka1 = sources['bike_accidents']['srazka'].unique()
srazka2 = sources['traffic_accidents']['srazka'].unique()
srazka3 = sources['ped_accidents']['srazka'].unique()

srazka4 = np.concatenate((srazka1, srazka2, srazka3), axis=0)
np.unique(srazka4)

array(['havárie', 'jiný druh nehody', 'srážka s chodcem',
       'srážka s domácím zvířetem',
       'srážka s jedoucím nekolejovým vozidlem', 'srážka s lesní zvěří',
       'srážka s pevnou překážkou', 'srážka s tramvají',
       'srážka s vlakem', 'srážka s vozidlem zaparkovaným, odstaveným'],
      dtype=object)

In [7]:
a1 = sources['bike_accidents']['pricina'].unique()
a2 = sources['traffic_accidents']['pricina'].unique()
a3 = sources['ped_accidents']['pricina'].unique()

a4 = np.concatenate((a1, a2, a3), axis=0)
np.unique(a4)

array(['bezohledná, agresivní, neohleduplná jízda',
       'chodci na vyznačeném přechodu', 'chyby při udání směru jízdy',
       'defekt pneumatiky způsobený průrazem nebo náhlým únikem vzduchu',
       'jiná technická závada (vztahuje se i na přípojná vozidla)',
       'jiné nedání přednosti', 'jiný druh nepřiměřené rychlosti',
       'jiný druh nesprávného předjíždění',
       'jiný druh nesprávného způsobu jízdy',
       'jízda (vjetí) jednosměrnou ulicí, silnicí (v protisměru)',
       'jízda na "červenou" 3-barevného semaforu',
       'jízda po nesprávné straně vozovky, vjetí do protisměru',
       'nedodržení bezpečné vzdálenosti za vozidlem',
       'nehoda při provádění služebního zákroku (pronásledování pachatele atd.)',
       'nehoda v důsledku použití (policií) prostředků k násilnému zastavení vozidla (zastavovací pásy, zábrana, vozidlo atd.)',
       'nepřizpůsobení rychlosti bočnímu, nárazovému větru (i při míjení, předjíždění vozidel)',
       'nepřizpůsobení rychlosti 

In [20]:
alkohol1 = sources['bike_accidents']['alkohol'].unique()
alkohol2 = sources['traffic_accidents']['alkohol'].unique()
alkohol3 = sources['ped_accidents']['alkohol'].unique()

alkohol4 = np.concatenate((alkohol1, alkohol2, alkohol3), axis=0)
np.unique(alkohol4)

array(['Ano, obsah alkoholu v krvi 1,5‰ a více',
       'Ano, obsah alkoholu v krvi do 0,24 ‰',
       'Ano, obsah alkoholu v krvi od 0,24‰ do 0,5‰',
       'Ano, obsah alkoholu v krvi od 0,5‰ do 0,8‰',
       'Ano, obsah alkoholu v krvi od 0,8‰ do 1,0‰',
       'Ano, obsah alkoholu v krvi od 1,0‰ do 1,5‰', 'Ne', 'Nezjišťován',
       'Pod vlivem alkoholu a drog', 'Pod vlivem drog'], dtype=object)

In [24]:
zavineni1 = sources['bike_accidents']['zavineni'].unique()
zavineni2 = sources['traffic_accidents']['zavineni'].unique()
zavineni3 = sources['ped_accidents']['zavineni'].unique()

zavineni4 = np.concatenate((zavineni1, zavineni2, zavineni3), axis=0)
np.unique(zavineni4)

array(['chodcem', 'jiné zaviněn', 'jiným účastníkem silničního provozu',
       'lesní zvěří, domácím zvířectvem', 'technickou závadou vozidla',
       'závadou komunikace', 'řidičem motorového vozidla',
       'řidičem nemotorového vozidla'], dtype=object)

In [35]:
pohlavi1 = sources['bike_accidents']['pohlavi'].fillna("unknown").astype(str).unique()
pohlavi2 = sources['traffic_accidents']['pohlavi'].fillna("unknown").astype(str).unique()
pohlavi3 = sources['ped_accidents']['chodec_pohlavi'].fillna("unknown").astype(str).unique()

pohlavi4 = np.concatenate((pohlavi1, pohlavi2, pohlavi3), axis=0)
np.unique(pohlavi4)

array(['chlapec (do 15 let)', 'dívka (do 15 let)', 'muž', 'unknown',
       'žena'], dtype=object)

In [8]:
sources['bike_accidents']['cause'] = sources['bike_accidents']['pricina'].replace(pricina_translation_dict)
sources['bike_accidents']

Unnamed: 0,X,Y,objectid,join_count,target_fid,id,d,e,datum,den,...,cas,hodina,mesic_t,den_v_tydnu,vek_skupina,nazev,point_x,point_y,globalid,cause
0,16.520742,49.171130,1,1,1,60040140073,-604774.832,-1162719.750,2014/08/03 00:00:00+00,7,...,430,4.0,srpen,neděle,19-24,Brno-Bosonohy,16.520742,49.171130,{CD1B3254-7DD0-478E-8B3A-C6221ADC3DAB},violation of traffic signs or rules
1,16.629810,49.223757,2,1,2,60206100089,-596241.506,-1157759.125,2010/01/21 00:00:00+00,4,...,1829,18.0,leden,čtvrtek,33-44,Brno-sever,16.629810,49.223757,{83269995-7595-4174-B258-92B2231CF8F2},improper driving style
2,16.571311,49.261030,3,1,3,60206100307,-600030.289,-1153180.212,2010/02/24 00:00:00+00,3,...,1720,17.0,únor,středa,45-60,Brno-Ivanovice,16.571311,49.261030,{F98B29BD-7F50-4A68-9A36-F3DAF63FD2DC},violation of traffic signs or rules
3,16.589660,49.218688,4,1,4,60206100503,-599209.677,-1158005.435,2010/03/30 00:00:00+00,2,...,1420,14.0,březen,úterý,71 a více,Brno-Královo Pole,16.589660,49.218688,{F8CC97C0-6BED-4228-9E62-E25252C6753F},violation of traffic signs or rules
4,16.611466,49.207198,5,1,5,60206100563,-597767.666,-1159446.543,2010/04/08 00:00:00+00,4,...,2015,20.0,duben,čtvrtek,33-44,Brno-střed,16.611466,49.207198,{62D9178E-9D24-42B2-9894-86AB90A88090},improper driving style
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1341,16.623636,49.189508,1342,1,1343,60206212215,-597097.074,-1161497.603,2021/12/15 00:00:00+00,3,...,1520,15.0,prosinec,středa,33-44,Brno-střed,16.623636,49.189508,{0F60262C-F90A-4AB6-BDB7-B613B2C322E0},improper driving style
1342,16.634303,49.211623,1343,1,1344,60206212298,-596060.646,-1159135.843,2021/12/27 00:00:00+00,1,...,1550,15.0,prosinec,pondělí,,Brno-sever,16.634303,49.211623,{69BAD7E2-8FEA-41CC-958D-D0F1C6461720},improper driving style
1343,16.634303,49.211623,1344,1,1345,60206212298,-596060.646,-1159135.843,2021/12/27 00:00:00+00,1,...,1550,15.0,prosinec,pondělí,7-11,Brno-sever,16.634303,49.211623,{89A5E8CB-9EDC-4076-972B-E2E0550E7099},improper driving style
1344,16.519409,49.218671,1345,1,1346,60306141036,-604297.243,-1157453.764,2014/11/05 00:00:00+00,3,...,1715,17.0,listopad,středa,33-44,Brno-Bystrc,16.519409,49.218671,{0EDEA221-1575-46F3-8CDC-E549767433E2},violation of traffic signs or rules


In [9]:
columns = ["POINT_Y", "POINT_X", "rok", "mesic", "den", "zavineni", "viditelnost", "cas", "hodina", "mesic_t", "doba", "den_v_tydnu", "alkohol", "alkohol_vinik", "hlavni_pricina", "srazka", "pricina", "stav_vozovky", "povetrnostni_podm", "rozhled", "misto_nehody", "druh_komun", "usmrceno_os", "tezce_zran_os", "lehce_zran_os", "hmotna_skoda", "smrt", "smrt_dny", "vek_skupina", "chodec_pohlavi", "stav_chodce", "chovani_chodce", "situace_nehody", "prvni_pomoc", "nasledky_chodce", "nazev"]
ped_accidents_dict = sources["ped_accidents"][columns].rename(columns=columns_renaming).fillna("unknown").to_dict(orient="records")
with open(path_prefix + "ped_accidents.js", "w") as out:
    out.write("export const pedestrian_accidents_json = " + str(ped_accidents_dict))

In [10]:
columns = ["POINT_Y", "POINT_X", "rok", "mesic", "den", "zavineni", "viditelnost", "cas", "hodina", "mesic_t", "doba", "den_v_tydnu", "alkohol", "alkohol_vinik", "hlavni_pricina", "srazka", "pricina", "stav_vozovky", "povetrnostni_podm", "rozhled", "misto_nehody", "druh_komun", "usmrceno_os", "tezce_zran_os", "lehce_zran_os", "hmotna_skoda", "smrt", "smrt_dny", "druh_vozidla", "stav_ridic", "ovlivneni_ridice", "osoba", "ozn_osoba", "pohlavi", "nasledek"]
traffic_accidents_dict = sources["traffic_accidents"][columns].rename(columns=columns_renaming).fillna("unknown").to_dict(orient="records")
with open(path_prefix + "traffic_accidents.js", "w") as out:
    out.write("export const traffic_accidents_json = " + str(traffic_accidents_dict))

In [11]:
columns = ["point_y", "point_x", "rok", "mesic", "den", "srazka", "pricina", "alkohol", "zavineni", "nasledky", "stav_vozovky", "povetrnostni_podm", "viditelnost", "rozhled", "misto_nehody", "druh_komun", "druh_vozidla", "stav_ridic", "ovlivneni_ridice", "osoba", "ozn_osoba", "pohlavi", "nasledek", "usmrceno_os", "tezce_zran_os", "lehce_zran_os", "hmotna_skoda", "cas", "hodina", "den_v_tydnu", "vek_skupina", "nazev"]
bike_accidents_dict = sources["bike_accidents"][columns].rename(columns=columns_renaming).fillna("unknown").to_dict(orient="records")
with open(path_prefix + "bike_accidents.js", "w") as out:
    out.write("export const bike_accidents_json = " + str(bike_accidents_dict))

In [12]:
columns = ["Y", "X", "datum_instalace"]
sources["street_lights"][columns].to_json(path_prefix  + "street_lights.json", orient="records")

In [13]:
columns = ["Y", "X", "stop_name"]
sources["pub_trans_stops"][columns].to_json(path_prefix + "pub_trans_stops.json", orient="records")