# Dopravní nehody v České republice za rok 2020

Z důvodu dopravních nehod zemře ročně v České republice velký počet lidí. Mnohonásobně vyšší počet osob je pak zraněn a finanční ztráty jsou taktéž enormní. V této krátké statistické studii budeme tato čísla vyhodnocovat. Hlavním cílem bude zjistit, co bylo příčinou nehod a zda není možné nehodám předejít. Zajímá nás, jak velkou roli hrál lidský faktor a zda by řidiče nebylo možné nahradit počítačem, který by mohl chybovost snížit. Může snaha automobilového průmyslu o vyrobení samoříditelných aut zachránit lidské životy? Pojďme se podívat.

In [1]:
import numpy as np
from os import listdir
from os.path import isfile, join
import pandas as pd

In [2]:
year = 2019

In [3]:
data_folder = './data/' + str(year)
months_folders = [join(data_folder, month_folder) for month_folder in sorted(listdir(data_folder))]

In [4]:
files_desc = [
    "praha",
    "stredocesky",
    "jihocesky",
    "plzensky",
    "ustecky",
    "kralovehradecky",
    "jihomoravsky",
    "moravskoslezsky",
    "none",
    "none",
    "none",
    "none",
    "none",
    "none",
    "olomoucky",
    "zlinsky",
    "vysocina",
    "pradubicky",
    "liberecky",
    "karlovarsky",
    "chodci"
]

In [5]:
data = [] # pole mesicu (indexovano od nuly)
# data = [data_leden, data_unor, ...]
# data_leden = {"prazsky" = pdObject, "stredocesky" = pdObject, ...}

for m in months_folders:
    month_data = {} # data from each district
    for i, f in enumerate(sorted(listdir(m))):
        if files_desc[i] != "none" and files_desc[i] != "chodci":
            month_data[files_desc[i]] = pd.read_csv(join(m, f), sep=';', header=None, low_memory=False)
            month_data[files_desc[i]] = month_data[files_desc[i]].drop_duplicates(subset=[0])
    data.append(month_data)

all_data_pds = [m[kraj] for m in data for kraj in m]
all_data_with_duplicates = pd.concat(all_data_pds) # whole year, all districts
all_data = all_data_with_duplicates.drop_duplicates(subset=[0]) # drop duplicates (by id of the accident)

In [6]:
print(f"Za rok {year} \n - zemřelo {all_data[13].sum()} lidí \n\
 - bylo těžce zraněno {all_data[14].sum()} lidí \n\
 - bylo lehce zraněno {all_data[15].sum()} lidí \n\
 - újma na majetku činila {all_data[16].sum() // 1000} milionů Kč \n\
 - celkem nehod bylo {all_data.shape[0]}")

Za rok 2019 
 - zemřelo 559 lidí 
 - bylo těžce zraněno 1858 lidí 
 - bylo lehce zraněno 24099 lidí 
 - újma na majetku činila 68404 milionů Kč 
 - celkem nehod bylo 107591


In [16]:
v_obci = all_data[all_data[63] == 1]
ve_meste = all_data[all_data[63] == 2]

print(f"Nehod v obci: {v_obci.shape[0]} {v_obci[v_obci[9] == 1].shape[0]/v_obci.shape[0]}\n\
Nehod mimo obec: {ve_meste.shape[0]} a {ve_meste[ve_meste[9] == 1].shape[0]/ve_meste.shape[0]}")

Nehod v obci: 71727 0.17347721220739748
Nehod mimo obec: 35864 a 0.23215480704885122
