### Human Development Index számitás modszertana 

HDI változó  számítása

#### Fontosabb könyvtárak betöltése

In [1]:
import math
import pandas as pd

  from pandas.core.computation.check import NUMEXPR_INSTALLED
  from pandas.core import (


HDI számítása a megadott paraméterek alapján

- life_expectancy (float): Születéskor várható élettartam (években).
- monthly_income (float): Egy főre jutó havi nettó átlagjövedelem (HUF).
- education_years (float): Iskolai végzettség években.

Forrás adattáblák:
- Jövedelem dimenzió forrása: Fókuszban a megyék – 2019. I–IV. Negyedév Térségi összehasonlítás adataiból nyertem ki. (KSH, 2019)
- Egédszségdimenzió forrása: 22.1.2.6 Születéskor várható átlagos élettartam, átlagéletkor nem, vármegye és régió szerint (KSH, 2019)

In [2]:
def calculate_hdi(life_expectancy, monthly_income, education_years):
   
    # Egészség dimenzió
    life_min, life_max = 20, 85
    life_index = (life_expectancy - life_min) / (life_max - life_min)

    # Jövedelem dimenzió
    income_min, income_max = 50000, 4000000  # Éves minimum és maximum forintban
    annual_income = monthly_income *12
    income_index = (math.log(annual_income) - math.log(income_min)) / (math.log(income_max) - math.log(income_min))

    # Oktatás dimenzió
    education_max = 15  # Maximális iskolázottság évei
    education_index = education_years / education_max

    # HDI kiszámítása számtani átlaggal
    hdi = (life_index + income_index + education_index) / 3  # eredeti számtani átlag
    #hdi = (life_index * income_index * education_index)**(1/3)

    return hdi, life_index, income_index, education_index # Visszaadjuk a HDI-t és az indexeket is

##### Az részindexszek kiiratása

Élettartam index, Jövedelem index, Oktatási index

In [3]:
def calculate_hdi_from_excel_to_dataframe(file_path):
    
    # Excel fájl beolvasása 
    df = pd.read_excel(file_path)

    # Új oszlopok hozzáadása a HDI értékekkel és a részindexekkel
    df[['HDI', 'Life_Index', 'Income_Index', 'Education_Index']] = df.apply(lambda row: calculate_hdi(row['life_expectancy'],
                                                                                                        row['monthly_income'],
                                                                                                        row['education_years']), axis=1, result_type='expand')
    return df

# Excel fájl elérési útja
file_path = 'HDI_szamitas_copy.xlsx' 

# HDI számítása és DataFrame-be írása
hdi_df = calculate_hdi_from_excel_to_dataframe(file_path)

#print(hdi_df)
hdi_df

Unnamed: 0,Megye,monthly_income,2019_Egy_főre _jutó _bruttó hazai termék(eft),Foglalkoztatási ráta(2019.IV.nev),Munkanélüliségi ráta(2019.IV.nev),születéskor várható élettartam(2019)NŐ,life_expectancy,ezer lakosra jutó regisztrált vállalkozás (db),education_years,HDI,Life_Index,Income_Index,Education_Index
0,Vas,222094,4341,64.6,2.0,79.66,73.09,165,16.0,0.930258,0.816769,0.907339,1.066667
1,Szabolcs-Szatmár-Bereg,167766,2824,56.5,7.9,78.71,71.5,210,12.0,0.811876,0.792308,0.843321,0.8
2,Zala,192551,3616,61.4,2.0,79.6,73.57,197,11.42,0.820084,0.824154,0.874765,0.761333
3,Veszprém,222701,3728,62.1,2.2,80.26,73.36,160,13.14,0.868295,0.820923,0.907962,0.876
4,Csongrád-Csanád,205933,3599,59.2,2.5,79.89,73.23,188,14.0,0.880785,0.818923,0.890098,0.933333
5,Bács-Kiskun,208785,3938,60.1,3.7,79.46,72.78,201,14.66,0.89419,0.812,0.893237,0.977333
6,Nógrád,182817,2138,56.4,6.1,77.55,70.54,128,12.0,0.813489,0.777538,0.862927,0.8
7,Borsod-Abaúj-Zemplén,191776,3369,57.3,3.6,77.87,70.11,119,12.8,0.8327,0.770923,0.873845,0.853333
8,Heves,225027,3663,59.2,2.8,78.38,71.74,164,12.0,0.835444,0.796,0.910333,0.8
9,Hajdú-Bihar,198394,3475,58.4,4.0,79.12,70.03,190,12.0,0.817093,0.769692,0.881587,0.8


##### Eredmények mentése új Excel fájlba

In [4]:

output_file = 'HDI_eredmenyek3.xlsx'
hdi_df.to_excel(output_file, index=False)

  hdi_df.to_excel(output_file, index=False)


In [5]:
# HDI oszlop kiíratása
hdi_df["HDI"]

0     0.930258
1     0.811876
2     0.820084
3     0.868295
4     0.880785
5     0.894190
6     0.813489
7     0.832700
8     0.835444
9     0.817093
10    0.849277
11    0.870056
12    0.861109
13    0.903336
14    0.815296
15    0.870413
16    0.836183
17    0.780350
18    0.819827
19    0.751467
Name: HDI, dtype: float64

### Módosított HDI számítások súlyok nélkül

#### HDI_modified változó

Paraméterek:
- life_expectancy (float): Születéskor várható élettartam (években).
- monthly_income (float): Egy főre jutó havi nettó átlagjövedelem (HUF).
- education_years (float): Iskolai végzettség években.
- employment_rate (float): Foglalkoztatottsági ráta százalékban.
- unemployment_rate (float): Munkanélküliségi ráta százalékban.
- registered_enterprises (float): Ezer lakosra jutó regisztrált vállalkozások száma.
- ranges (dict): Normalizációs tartományok.

In [8]:
# függvény, amely normalizálja az értékeket 0 és 1 közé
def normalize(value, min_value, max_value):
   
    return (value - min_value) / (max_value - min_value)

def calculate_hdi_modified(life_expectancy, monthly_income, education_years, employment_rate, unemployment_rate, registered_enterprises, ranges):
   
    # Egészség dimenzió
    life_index = normalize(life_expectancy, *ranges['life'])

    # Jövedelem dimenzió
    annual_income = monthly_income * 12
    income_index = normalize(math.log(annual_income), math.log(ranges['income'][0]), math.log(ranges['income'][1]))

    # Oktatás dimenzió
    education_index = normalize(education_years, 0, ranges['education'][1])

    # Foglalkoztatottság dimenzió
    employment_index = normalize(employment_rate, *ranges['employment'])

    # Munkanélküliség dimenzió
    unemployment_index = 1 - normalize(unemployment_rate, *ranges['unemployment'])

    # Vállalkozások dimenzió
    business_index = normalize(registered_enterprises, *ranges['business'])

    # HDI kiszámítása számtani átlaggal
    hdi_modified = (life_index + income_index + education_index + employment_index + unemployment_index + business_index) / 6
    return hdi_modified



A normalizálás szükségessége:a különböző dimenziók (élettartam, jövedelem, oktatás, foglalkoztatás, munkanélküliség, vállalkozások) eltérő skálán és mértékegységben vannak mérve.
A normalizálás célja:

Összehasonlíthatóság: Az összes változót egy közös, egységes skálára hozza, általában 0 és 1 közé. Ez lehetővé teszi, hogy a különböző mértékegységű és nagyságrendű változókat értelmesen össze tudjuk hasonlítani és kombinálni.
- Egyenlő súlyozás: Biztosítja, hogy a HDI számításakor (itt számtani átlaggal: ... / 6) minden dimenzió nagyjából azonos súllyal legyenek beszámítva.
- Index képzés: A 0-1 közötti értékek indexként funkcionálnak, ahol a 0 a legrosszabb (minimum), az 1 pedig a legjobb (maximum) értéket jelenti az adott dimenzióban (kivéve a munkanélküliségnél, ahol megfordul: 1 - normalize(...)).
Ez egy standard lépés, amikor különböző típusú mutatókat kombinálunk egyetlen összetett indexbe.

kód magyarázat: 
- life_index = normalize(life_expectancy, *ranges['life']) sor:

- ranges['life'] lekéri a 'life' kulcshoz tartozó értéket a ranges szótárból, ami a példa alapján a [20, 85] lista.
- *ranges['life'] kicsomagolja ezt a listát. Ez azt jelenti, hogy a normalize függvénynek a life_expectancy után két külön argumentumként adja át a lista elemeit: 20-at és 85-öt.
- függvényhívása következő lesz: normalize(life_expectancy, 20, 85). Ez pontosan az, amit a normalize függvény vár (value, min_value, max_value).

- A *ranges[...] kifejezés a kódban azt jelenti, hogy a ranges szótárból kinyert lista/tuple (amely a minimum és maximum értékeket tartalmazza az adott dimenzióhoz) elemeit kicsomagolja, és különálló argumentumokként adja át a normalize függvénynek. Ez egy módja annak, hogy a normalizáláshoz szükséges határértékeket dinamikusan kezeljük egy központi ranges szótár segítségével

##### A részindexek kiiratása excel fileba

In [9]:
def calculate_hdi_from_excel_to_dataframe(file_path):
    
    # Excel fájl beolvasása 
    df = pd.read_excel(file_path)

    # Tartományok meghatározása
    ranges = {
        'life': (20, 85),  # szabvány
        'income': (167766, 4000000),
        'education': (0, 15),
        'employment': (53, 65.3),  # megyei #  50, 80  
        'unemployment': (1.1, 7.9),  # megyei # 0, 10
        'business': (119, 233)   # 50, 300 
    }

    # Új oszlop hozzáadása a HDI értékekkel
    df['Modified_HDI'] = df.apply(lambda row: calculate_hdi_modified(
        row['life_expectancy'], 
        row['monthly_income'], 
        row['education_years'], 
        row['Foglalkoztatási ráta(2019.IV.nev)'], 
        row['Munkanélüliségi ráta(2019.IV.nev)'], 
        row['ezer lakosra jutó regisztrált vállalkozás (db)'], 
        ranges
    ), axis=1)

    return df

# Excel fájl elérési útja
file_path = 'HDI_szamitas_copy.xlsx'

# HDI számítása és DataFrame-be írása
hdi_df = calculate_hdi_from_excel_to_dataframe(file_path)

# Eredmények kiíratása a DataFrame-ben
print(hdi_df[['Megye', 'Modified_HDI']])

                     Megye  Modified_HDI
0                      Vas      0.828275
1   Szabolcs-Szatmár-Bereg      0.576437
2                     Zala      0.774539
3                 Veszprém      0.751246
4          Csongrád-Csanád      0.750642
5              Bács-Kiskun      0.759333
6                   Nógrád      0.501370
7     Borsod-Abaúj-Zemplén      0.571982
8                    Heves      0.686818
9              Hajdú-Bihar      0.673574
10    Jász-Nagykun-Szolnok      0.608575
11                 Baranya      0.534138
12                  Somogy      0.623468
13       Győr-Moson-Sopron      0.847588
14                   Fejér      0.706256
15                 főváros      0.888488
16                    Pest      0.778294
17                   Tolna      0.623657
18                   Békés      0.660551
19       Komárom-Esztergom      0.671609


In [17]:
hdi_df['Modified_HDI']

0     0.828275
1     0.576437
2     0.774539
3     0.751246
4     0.750642
5     0.759333
6     0.501370
7     0.571982
8     0.686818
9     0.673574
10    0.608575
11    0.534138
12    0.623468
13    0.847588
14    0.706256
15    0.888488
16    0.778294
17    0.623657
18    0.660551
19    0.671609
Name: Modified_HDI, dtype: float64

#### HDI_weighted változó

Módosított, súlyokkal

In [6]:
import math
import pandas as pd

def calculate_weighted_hdi(life_expectancy, monthly_income, education_years, employment_rate, unemployment_rate, registered_enterprises, weights):
    """
    Súlyozott HDI számítása a különböző dimenziók figyelembevételével.

    Paraméterek:
        life_expectancy (float): Születéskor várható élettartam (években).
        monthly_income (float): Egy főre jutó havi nettó átlagjövedelem (HUF).
        education_years (float): Iskolai végzettség években.
        employment_rate (float): Foglalkoztatási ráta (százalékban).
        unemployment_rate (float): Munkanélküliségi ráta (százalékban).
        registered_enterprises (float): Regisztrált vállalkozások száma ezer lakosra vetítve.
        weights (dict): A dimenziókhoz rendelt súlyok.

    Visszatér:
        float: A régió súlyozott HDI értéke.
    """
    # Egészség dimenzió
    life_min, life_max = 20, 85
    life_index = (life_expectancy - life_min) / (life_max - life_min)

    # Jövedelem dimenzió
    income_min, income_max = 167766, 4000000  # Éves minimum és maximum forintban
    annual_income = monthly_income * 12
    income_index = (math.log(annual_income) - math.log(income_min)) / (math.log(income_max) - math.log(income_min))

    # Oktatás dimenzió
    education_max = 15  # Maximális iskolázottság évei
    education_index = education_years / education_max # átlag az education_years

    # Foglalkoztatottság dimenzió
    employment_min, employment_max = 53, 65.3 #50, 80  # Min. és max. foglalkoztatási ráta
    employment_index = (employment_rate - employment_min) / (employment_max - employment_min)

    # Munkanélküliség dimenzió
    unemployment_min, unemployment_max = (1.1, 7.9)  #3, 15  # Min. és max. munkanélküliségi ráta
    unemployment_index = 1 - (unemployment_rate - unemployment_min) / (unemployment_max - unemployment_min)

    # Vállalkozások dimenzió
    business_min, business_max = 119, 233  #50, 300  # Min. és max. vállalkozások száma ezer lakosra vetítve
    business_index = (registered_enterprises - business_min) / (business_max - business_min)

    # Súlyozott HDI kiszámítása
    weighted_hdi = (
        weights['health'] * life_index +
        weights['income'] * income_index +
        weights['education'] * education_index +
        weights['employment'] * employment_index +
        weights['unemployment'] * unemployment_index +
        weights['business'] * business_index
    )

    return weighted_hdi

def calculate_hdi_from_excel_to_dataframe_with_weights(file_path, weights):
    """
    Beolvassa az Excel fájlt, és kiszámítja a megyék súlyozott HDI értékét.

    Paraméterek:
        file_path (str): Az Excel fájl elérési útja.
        weights (dict): A dimenziókhoz rendelt súlyok.

    Visszatér:
        pd.DataFrame: Egy DataFrame, amely tartalmazza a megyék nevét és súlyozott HDI értékét.
    """
    # Excel fájl beolvasása
    df = pd.read_excel(file_path)

    # Új oszlop hozzáadása a súlyozott HDI értékekkel
    df['Weighted_HDI'] = df.apply(lambda row: calculate_weighted_hdi(
        row['life_expectancy'],
        row['monthly_income'],
        row['education_years'],
        row['Foglalkoztatási ráta(2019.IV.nev)'],
        row['Munkanélüliségi ráta(2019.IV.nev)'],
        row['ezer lakosra jutó regisztrált vállalkozás (db)'],
        weights
    ), axis=1)

    return df

# Súlyok definiálása (a súlyok összege 1)
weights = {
    'health': 0.2,
    'income': 0.2,
    'education': 0.2,
    'employment': 0.15,
    'unemployment': 0.15,
    'business': 0.1
}

# Excel fájl elérési útja
file_path = 'HDI_szamitas_copy.xlsx'

# HDI számítása és DataFrame-be írása
weighted_hdi_df = calculate_hdi_from_excel_to_dataframe_with_weights(file_path, weights)

# Eredmények kiíratása a DataFrame-ben
weighted_hdi_df[['Megye', 'Weighted_HDI']]


Unnamed: 0,Megye,Weighted_HDI
0,Vas,0.863043
1,Szabolcs-Szatmár-Bereg,0.597672
2,Zala,0.783497
3,Veszprém,0.786627
4,Csongrád-Csanád,0.775335
5,Bács-Kiskun,0.779526
6,Nógrád,0.566693
7,Borsod-Abaúj-Zemplén,0.637282
8,Heves,0.722005
9,Hajdú-Bihar,0.69538
