# Povezava do vira podatkovne zbirke: https://podatki.gov.si/dataset/surs0867636s

## STOPNJA TVEGANJA REVŠČINE, STATISTIČNE REGIJE

In [1]:
import warnings
warnings.simplefilter("ignore", category = FutureWarning)

# Uvozimo vse potrebne knjižnice
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.impute import KNNImputer

# OPOMBE:
# Najprej smo opravili osnovno transformacijo podatkov s pomočjo programa PX-Win
# (izbor podatkov, transformacijo vrstic in stolpcev)
# Datoteko smo shranili kot .csv, ki ima podatke ločene z ';'
# V Excelu smo šumnike nadomestili s sprejemljivimi inačicami (Š - S, Č - C, Ž - Z)

# Uvozimo .csv datoteko, ki za delimiter uporablja ';'
tveganje_revscine = pd.read_csv("../../podatki/stopnja_tveganja_revscine/stopnja_tveganja_revscine.csv", sep = ";")

# Pretvorimo imena stolpcev v velike črke
tveganje_revscine.columns = tveganje_revscine.columns.str.upper()

# Pretvorimo vrstice v velike črke
tveganje_revscine['MERITVE'] = tveganje_revscine['MERITVE'].apply(lambda x: x.upper())

# Zaradi kasnejših pretvorb v 'FLOAT' nadomestimo vse ',' s '.'
tveganje_revscine.iloc[:, 1:] = tveganje_revscine.iloc[:, 1:].applymap(lambda x: x.replace(',', '.') if isinstance(x, str) else x)

# Izberemo 5 najbljižjih sosedov
imputer = KNNImputer(n_neighbors=5)

# Nad vsakim stolpec uporabimo KNNImputer, da nadomestimo manjkajoče vrednosti z napovedjo
tveganje_revscine.iloc[:, 1:] = imputer.fit_transform(tveganje_revscine.iloc[:, 1:])

# Prvi stolpec pretvorimo v 'STRING'
tveganje_revscine.iloc[:, 0] = tveganje_revscine.iloc[:, 0].astype(str)
# Drugi stolpec pretvorimo v 'INTEGER'
tveganje_revscine.iloc[:, 1] = tveganje_revscine.iloc[:, 1].astype(int)
# Preostale stolpce pretvorimo v 'FLOAT'
tveganje_revscine.iloc[:, 1:] = tveganje_revscine.iloc[:, 1:].astype(float)

In [2]:
# Shranimo v .xlsx datoteko
# tveganje_revscine.to_excel('stopnja_tveganja_revscine.xlsx', index=False)

In [3]:
# Pregled vseh stolpcev
print(tveganje_revscine.columns)

Index(['MERITVE', 'LETO', 'SLOVENIJA', 'POMURSKA', 'PODRAVSKA', 'KOROSKA',
       'SAVINJSKA', 'ZASAVSKA', 'POSAVSKA', 'JUGOVZHODNA SLOVENIJA',
       'OSREDNJESLOVENSKA', 'GORENJSKA', 'PRIMORSKO-NOTRANJSKA', 'GORISKA',
       'OBALNO-KRASKA'],
      dtype='object')


![My Image](../../slike/statisticne_regije.png)

---