# Analiza prometnih nesreč v Sloveniji

In [1]:
import numpy as np
import pandas as pd

In [2]:
import plotly.graph_objs as go
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
init_notebook_mode(connected=True)

Uvoz podatkov:

In [3]:
dnevi=pd.read_csv('data/po_dnevih.csv', sep=";")#
udelezenci=pd.read_csv('data/po_vrstah_udelezencev.csv', sep=";")
ceste=pd.read_csv('data/po_vrsti_ceste.csv', sep=";")
meseci=pd.read_csv('data/po_mesecih.csv', sep=";")
regije=pd.read_csv('data/po_regijah.csv', sep=";")
lokacije=pd.read_csv('data/po_lokaciji.csv', sep=";")
ura=pd.read_csv('data/po_urah.csv', sep=";")
alkohol=pd.read_csv('data/alkohol.csv', sep=";")

Zamenjava manjkajočih podatkov s povprečjem:

In [4]:
alkohol["Stopnje alkoholiziranosti 0,80 in več"].fillna(alkohol.groupby("Kategorija")["Stopnje alkoholiziranosti 0,80 in več"].transform("mean"), inplace=True)
alkohol["Stopnje alkoholiziranosti 0,80 in več"] = alkohol["Stopnje alkoholiziranosti 0,80 in več"].astype(int)

Izračun števila prometnih nesreč po dnevih v tednu, razdeljenih po vrsti nesreče in izris grafa:

In [5]:
# 
dnevi_sum = dnevi.groupby(['Dan v tednu'], as_index = False).agg({'Prometne nesreče s smrtnim izidom': [np.sum],
                                                                  'Prometne nesreče s telesno poškodbo': [np.sum],
                                                                  'Prometne nesreče z materialno škodo': [np.sum],
                                                                  'Prometne nesreče - SKUPAJ': [np.sum]
                                                                 }) 

dnevi_sum.columns = ["dan_v_tednu", "st_smrt", "st_telesna_poskodba", "st_materialna_skoda", "skupaj"]    
dnevi_max=dnevi_sum.iloc[dnevi_sum["skupaj"].idxmax()]["dan_v_tednu"]
dnevi_sum = dnevi_sum.sort_values(by="skupaj", ascending=[False])
dnevi_max

#dnevi_sum;

'Petek'

In [6]:
# draws plot
trace1 = go.Bar(
    y=dnevi_sum["dan_v_tednu"],
    x=dnevi_sum["st_smrt"],
    name='Število nesreč s smrtnim izidom',
    orientation = "h",
    marker=dict(
        color='#000000',
    )
    
)
trace2 = go.Bar(
    y=dnevi_sum["dan_v_tednu"],
    x=dnevi_sum["st_telesna_poskodba"],
    name='Število nesreč telesnih poškodb',
    orientation = "h",
    marker=dict(
        color='#FF2222',
    )
)
trace3 = go.Bar(
    y=dnevi_sum["dan_v_tednu"],
    x=dnevi_sum["st_materialna_skoda"],
    name='Število nesreč z materialno škodo',
    orientation = "h",
    marker=dict(
        color='#AAAAAA',
    )
)

data = [trace1, trace2, trace3]
layout = go.Layout(
    barmode='stack'
)

fig = go.Figure(data=data, layout=layout)
iplot(fig, filename='stacked-bar')

Izračun števila prometnih nesreč skozi leta in risanje grafa:

In [7]:
# 
smrti_sum = dnevi.groupby(['leto'], as_index = False).agg({'Prometne nesreče s smrtnim izidom': [np.sum],
                                                                  'Prometne nesreče s telesno poškodbo': [np.sum],
                                                                  'Prometne nesreče z materialno škodo': [np.sum],
                                                                  'Prometne nesreče - SKUPAJ': [np.sum]
                                                                 }) 

smrti_sum.columns = ["leto", "st_smrt", "st_telesna_poskodba", "st_materialna_skoda", "skupaj"]    
smrti_sum = smrti_sum.sort_values(by="leto", ascending=[False])
smrti_sum;

In [8]:
# Create a trace
trace = go.Scatter(
    x = smrti_sum["leto"],
    y = smrti_sum["st_smrt"],
    marker=dict(
        color='#000000',
    )
)

data = [trace]
iplot(data, filename='basic-line')

Osnutek po regijah razdeljenega zemljevida, ki ga bomo uporabili v kasnejši fazi:

In [9]:
mapbox_access_token = "pk.eyJ1IjoiaW1pbG9zayIsImEiOiJjamZ2M3c2MmQwcHk5Mndtd3lyMTI2bHJqIn0.FMLgB-WENz3ZSe1gRWRJHg"

data = go.Data([
    go.Scattermapbox(
        lat=['46.1512'],
        lon=['14.9955'],
        mode='markers',
    )
])
layout = go.Layout(
    height=600,
    autosize=True,
    hovermode='closest',
    mapbox=dict(
        layers=[
            dict(
                sourcetype = 'geojson',
                source = 'https://gist.githubusercontent.com/imilosk/47013ab15f8a329b0497853f95d081d5/raw/48d364de4c88b0fc6fbd9e42012b47f87def285d/slovenia.json',
                type = 'fill',
                color = 'rgba(163,22,19,0.8)'
            )
        ],
        accesstoken=mapbox_access_token,
        bearing=0,
        center=dict(
            lat=46.1512,
            lon=14.9955
        ),
        pitch=0,
        zoom=7.0,
        style='light'
    ),
)

fig = dict(data=data, layout=layout)
#iplot(fig, filename='county-level-choropleths-python');

In [10]:
import yaml
with open('data/regije.json', 'r') as f:
    json_data = f.read()
geoJSON = yaml.load(json_data)

In [11]:
pts=[]#list of points defining boundaries of polygons
for  feature in geoJSON['features']:
    if feature['geometry']['type']=='Polygon':
        pts.extend(feature['geometry']['coordinates'][0])    
        pts.append([None, None])#mark the end of a polygon   
        
    elif feature['geometry']['type']=='MultiPolygon':
        for polyg in feature['geometry']['coordinates']:
            pts.extend(polyg[0])
            pts.append([None, None])#end of polygon
    else: raise ValueError("geometry type irrelevant for map")  
        
X, Y=zip(*pts)
data=[dict(type='scatter',
          x=X,
          y=Y,
          mode='lines',
          line=dict(width=0.5, color='blue'),
          )]

In [12]:
axis_style=dict(showline=False, 
                mirror=False, 
                showgrid=False, 
                zeroline=False,
                ticks='',
                showticklabels=False)
layout=dict(title='France regions',
            width=700, height=700, 
            autosize=False,
            xaxis=axis_style,
            yaxis=axis_style,
            hovermode='closest')
fig=dict(data=data, layout=layout)
iplot(fig, filename='France-map2d')

Izračun in izris podatkov o alkoholiziranosti različnih udeležencev prometa:

In [13]:
# 
alko_sum = alkohol.groupby(['Kategorija'], as_index = False).agg({'Stopnje alkoholiziranosti 0,50 in več': [np.sum],
                                                                  'Stopnje alkoholiziranosti 0,80 in več': [np.sum],
                                                                  'Stopnje alkoholiziranosti 1,50 in več': [np.sum],
                                                                  'Število alkoholiziranih udeležencev - SKUPAJ': [np.sum]
                                                                 }) 

alko_sum.columns = ["kategorija","alko_05", "alko_08", "alko_15", "skupaj"]

alko_sum = alko_sum.sort_values(by="skupaj", ascending=[False])
alko_sum = alko_sum.drop([0, 3, 9])
#alko_max = alko_sum["kategorija"][alko_sum["skupaj"].idxmax()]["kategorija"]
alko_max=alko_sum["kategorija"][8]

In [14]:
trace1 = go.Bar(
    x=alko_sum["kategorija"],
    y=alko_sum["alko_05"],
    name='0,50 g/kg in več',
    marker=dict(
        color='#bdbdbd',
    )
)
trace2 = go.Bar(
    x=alko_sum["kategorija"],
    y=alko_sum["alko_08"],
    name='0,80 g/kg in več',
    marker=dict(
        color='#9ecae1',
    )
)
trace3 = go.Bar(
    x=alko_sum["kategorija"],
    y=alko_sum["alko_15"],
    name='1,50 g/kg in več',
    marker=dict(
        color='#2b8cbe',
    )
)

data = [trace1, trace2, trace3]
layout = go.Layout(
    barmode='group'
)

fig = go.Figure(data=data, layout=layout)
iplot(fig, filename='grouped-bar')

Izračun porazdelitve prometnih nesreč skozi dan:

In [15]:
ura_avg = ura.groupby(['Ura v dnevu'], as_index = False).agg({'Prometne nesreče - SKUPAJ': [np.sum]}) 

ura_avg.columns = ["Ura v dnevu","sum"]
ura_max=ura_avg.iloc[ura_avg["sum"].idxmax()]["Ura v dnevu"]

ura_avg["sum"]=ura_avg["sum"]/(365*11+3)

In [16]:
# Create a trace
trace = go.Bar(
    x = ura_avg["Ura v dnevu"],
    y = ura_avg["sum"],
    marker=dict(
        color='#2b8cbe',
    )
)

data = [trace]
iplot(data, filename='basic-bar')

In [17]:
# 
lok_sum = lokacije.groupby(["Lokacija"], as_index = False).agg({'Prometne nesreče - SKUPAJ': [np.sum]}) 

lok_sum.columns = ["kje","skupaj"]

lok_sum
lok_max = lok_sum.iloc[lok_sum["skupaj"].idxmax()+1]["kje"]
lok_max

'V naselju'

In [18]:
mes_sum = meseci.groupby(["Mesec v letu"], as_index = False).agg({'Prometne nesreče - SKUPAJ': [np.sum]}) 

mes_sum.columns = ["mesec","sum"]

mes_sum
mes_max = mes_sum.iloc[mes_sum["sum"].idxmax()]["mesec"]
mes_max

'Oktober'

In [19]:
reg_sum = regije.groupby(["Regija"], as_index = False).agg({'Prometne nesreče - SKUPAJ': [np.sum]}) 

reg_sum.columns = ["regija","sum"]

reg_sum
reg_max = reg_sum.iloc[reg_sum["sum"].idxmax()]["regija"]
reg_max

'Osrednjeslovenska'

In [20]:

udl_sum = udelezenci.groupby(["Udeleženci"], as_index = False).agg({'Število udeležencev - SKUPAJ': [np.sum]}) 

udl_sum.columns = ["udel","sum"]

udl_sum
udl_max = udl_sum.iloc[udl_sum["sum"].idxmax()]["udel"]
udl_max

'Vrste udeležencev - SKUPAJ'

In [21]:
#alkohol, dan, kje, mesec, regija, ura, kdo, cesta
print(alko_max+" , "+dnevi_max+" , "+lok_max+" , "+ mes_max+ " , "+reg_max+" , ",ura_max," , "+udl_max)

Vozniki osebnih avtomobilov , Petek , V naselju , Oktober , Osrednjeslovenska ,  15  , Vrste udeležencev - SKUPAJ
