# P2 (Бюджет та фінанси): 10/10

In [1]:
import pandas as pd
from src.utils import divide, normalize_parameter, save_data
from src.utils import PATH_INTERIM, PATH_PROCESSED

---

## p2_01
### рівень надходжень податку на доходи фізичних осіб на одну особу наявного населення станом на 1 січня звітного року
## p2_02
### рівень виконання доходів загального фонду зведеного бюджету області, мм. Києва та Севастополя (без міжбюджетних трансфертів)
## p2_03
### обсяг доходів зведеного бюджету області, мм. Києва та Севастополя (без міжбюджетних трансфертів) порівняно з аналогічним періодом минулого року
## p2_04
### обсяг капітальних видатків зведеного бюджету області, мм. Києва та Севастополя
## p2_05
### рівень надходження плати за землю (земельного податку та орендної плати) до зведеного бюджету області, мм. Києва та Севастополя

In [2]:
colnames = {
    "Область": "region",
    "Податки на одну особу (p2_01)":'p2_01_raw',
    "Дохід без міжбюдж. трансфертів (p2_02)":'p2_02_raw',
    "Дохід без міжбюдж. трансфертів порівняно з минулим періодом (p2_03)": "p2_03_raw",
    "Капітальні видатки (p2_04)":'p2_04_raw',
    "Плата за землю (p2_05)":'p2_05_raw'
}

df_P02_006 = pd.read_excel(PATH_INTERIM / "P2" / "P02_006.xlsx").rename(columns=colnames)

In [3]:
df_P02_006["p2_01"] = normalize_parameter(df_P02_006["p2_01_raw"])
df_P02_006["p2_02"] = normalize_parameter(df_P02_006["p2_02_raw"])
df_P02_006["p2_03"] = normalize_parameter(df_P02_006["p2_03_raw"])
df_P02_006["p2_04"] = normalize_parameter(df_P02_006["p2_04_raw"])
df_P02_006["p2_05"] = normalize_parameter(df_P02_006["p2_05_raw"])

feature_range=(0, 1); fill_na=True; array_bounds=(333.0926496928134, 1492.398365658319); normalization_bounds=(333.0926496928134, 1492.398365658319), reverse=False
feature_range=(0, 1); fill_na=True; array_bounds=(925604231.4300002, 8009664535.36); normalization_bounds=(925604231.4300002, 8009664535.36), reverse=False
feature_range=(0, 1); fill_na=True; array_bounds=(1.031710164445041, 1.139616301561141); normalization_bounds=(1.031710164445041, 1.139616301561141), reverse=False
feature_range=(0, 1); fill_na=True; array_bounds=(360268335.64, 2904803269.78); normalization_bounds=(360268335.64, 2904803269.78), reverse=False
feature_range=(0, 1); fill_na=True; array_bounds=(119831373.33, 1369062754.09); normalization_bounds=(119831373.33, 1369062754.09), reverse=False


---

## p2_06
### частка вартості закупівль, проведених за процедурою відкритих торгів відносно загальної вартості закупівель, проведених обласними, Київською та Севастопольською міськими держадміністраціями, їх структурними підрозділами та підприємствами, установами, організаціями, які належать до сфери їх управління

In [4]:
df_P02_007 = pd.read_excel(PATH_INTERIM / "P2" / "P02_007.xlsx", dtype={"BudgetCode": str})
df_P02_007["p2_06"] = normalize_parameter(df_P02_007["p2_06_raw"], min_bound=0)

feature_range=(0, 1); fill_na=True; array_bounds=(1.793102153467012e-05, 0.9768929824771456); normalization_bounds=(0, 0.9768929824771456), reverse=False


---

## p2_07
### недоотримано державних фінансових ресурсів за результатами аудиту (грн)
## p2_08
### рівень незаконних витрат державних ресурсів за результатами аудиту (грн)
## p2_09
### рівень нецільових витрат державних ресурсів за результатами аудиту (грн)
## p2_10
### недостача державних ресурсів за результатами аудиту (грн)

In [5]:
colnames = {
    "lost_income":"p2_07_raw",
    "illegal_spending":'p2_08_raw',
    "inappropriate_spending":'p2_09_raw',
    "deficiencies":'p2_10_raw'
}

# p2_08, p2_09, p2_10
df_P02_003 = pd.read_excel(PATH_INTERIM / "P2" / "P02_003.xlsx").rename(columns=colnames)
df_P02_003 = df_P02_003.loc[df_P02_003["region"].ne("м. Київ")].copy()

# p2_07 
df_P02_005 = pd.read_excel(PATH_INTERIM / "P2" / "P02_005.xlsx").rename(columns=colnames)
df_P02_005 = df_P02_005.loc[df_P02_005["region"].ne("м. Київ")].copy()

df_P02_005["p2_07"] = normalize_parameter(df_P02_005["p2_07_raw"], reverse=True)

df_P02_003["p2_08"] = normalize_parameter(df_P02_003["p2_08_raw"], reverse=True)
df_P02_003["p2_09"] = normalize_parameter(df_P02_003["p2_09_raw"], reverse=True)
df_P02_003["p2_10"] = normalize_parameter(df_P02_003["p2_10_raw"], reverse=True)

feature_range=(0, 1); fill_na=True; array_bounds=(222.13, 262959.51); normalization_bounds=(262959.51, 222.13), reverse=True
feature_range=(0, 1); fill_na=True; array_bounds=(7737.52, 225747.19); normalization_bounds=(225747.19, 7737.52), reverse=True
feature_range=(0, 1); fill_na=True; array_bounds=(0.0, 118887.7); normalization_bounds=(118887.7, 0.0), reverse=True
feature_range=(0, 1); fill_na=True; array_bounds=(0.0, 27928.76); normalization_bounds=(27928.76, 0.0), reverse=True


---

In [6]:
dict_weights = {
    'p2_01':0.4,
    'p2_02':0.4,
    'p2_03':0.4,
    'p2_04':0.4,
    'p2_05':0.4,
    'p2_06':1,
    'p2_07':0.25,
    'p2_08':0.25,
    'p2_09':0.25,
    'p2_10':0.25
}

sources = [df_P02_006, df_P02_007, df_P02_005, df_P02_003]
save_data(sources, dict_weights, 'P2', show_results=True)

Unnamed: 0,region,p2_01,p2_02,p2_03,p2_04,p2_05,p2_06,p2_07,p2_08,p2_09,p2_10,P2
0,Вінницька,0.665446,0.250456,0.396274,0.206744,0.158954,0.931224,0.96056,0.915682,0.0,0.992908,5.799153
1,Волинська,0.427766,0.061505,0.572223,0.144557,0.018805,0.543663,0.975949,0.909645,0.989521,0.965193,4.984206
2,Дніпропетровська,0.981591,1.0,0.357024,1.0,1.0,0.545295,0.648681,0.822902,1.0,0.0,7.246592
3,Донецька,0.232921,0.369265,0.048685,0.836695,0.211652,0.908449,0.968986,0.853552,1.0,0.970519,6.341
4,Житомирська,0.569364,0.136291,0.23378,0.205455,0.066769,0.887361,0.992804,0.986575,0.864963,0.996664,5.830689
5,Закарпатська,0.269235,0.055838,0.14132,0.148979,0.014122,0.446889,0.998268,0.93752,0.999683,0.997472,4.204808
6,Запорізька,0.826454,0.360413,0.276784,0.187785,0.31255,1.8e-05,0.997634,0.772195,0.983018,0.751477,4.154234
7,Івано-Франківська,0.37221,0.104601,0.596028,0.145594,0.051687,0.59529,0.994044,0.630803,0.896323,0.994428,4.955594
8,Київська,1.0,0.491515,0.655043,0.731713,0.25121,0.646286,0.909505,0.0,0.973777,0.694426,6.356264
9,Кіровоградська,0.675666,0.114556,0.474531,0.011731,0.161166,0.564819,0.987738,0.842011,0.999029,0.999918,5.242632
