### Kendall tau és Pearson korreláció

##### Fontos könyvtárak betöltése

Forrás: https://hu.wikipedia.org/wiki/Magyarorsz%C3%A1g_r%C3%A9gi%C3%B3i_az_emberi_fejletts%C3%A9gi_index_alapj%C3%A1n

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.stats import kendalltau
from scipy.stats import pearsonr

from sklearn.preprocessing import StandardScaler

  from pandas.core.computation.check import NUMEXPR_INSTALLED
  from pandas.core import (


Forrás alapján szerkesztett táblázat betöltése

In [2]:
data = pd.read_csv("HDI_2.csv")

In [3]:
data

Unnamed: 0,Rang,Regio_kod,Régió,2019 HDI,BMI_median_region,BMI_atlag
0,1,12,Közép-Magyarország,0.93,4,29.15
1,2,30,Nyugat-Dunántúl,0.87,4,29.19
2,3,20,Közép-Dunántúl,0.85,5,30.06
3,4,70,Dél-Alföld,0.85,3,23.12
4,5,40,Dél-Dunántúl,0.84,4,25.37
5,6,60,Észak-Alföld,0.83,4,29.67
6,7,50,Észak-Magyarország,0.82,4,28.64


#### Kendall Tau korreláció a Rang és a BMI_median_region változókra

In [4]:
tau, p_value = kendalltau(data['Rang'], data['BMI_median_region'])
# Eredmények
print(f"Kendall-tau korreláció: {tau}")
print(f"P-érték: {p_value}")

Kendall-tau korreláció: -0.0657951694959769
P-érték: 0.8492172333406262


#### Pearson korreláció a BMI_atlag és a 2019 HDI változókra

In [7]:
# BMI_atlag és 2019 HDI oszlopok kiválasztása
bmi_atlag = data["BMI_atlag"]
hdi_2019 = data["2019 HDI"]

In [8]:
# Pearson korrelációs együttható és p-érték kiszámítása
correlation, p_value = pearsonr(bmi_atlag, hdi_2019)

In [9]:
# Eredmények kiírása
print(f"Pearson korrelációs együttható: {correlation}")
print(f"P-érték: {p_value}")

Pearson korrelációs együttható: 0.16491118783460257
P-érték: 0.7238293723550224


In [10]:
# Korreláció erősségének és irányának értelmezése
if correlation > 0:
    print("A két változó között pozitív korreláció van.")
elif correlation < 0:
    print("A két változó között negatív korreláció van.")
else:
    print("A két változó között nincs lineáris korreláció.")

A két változó között pozitív korreláció van.


In [11]:
# P-érték alapján a szignifikancia megállapítása
alpha = 0.05  # Szignifikancia szint
if p_value < alpha:
    print(f"A korreláció szignifikáns (p < {alpha}).")
else:
    print(f"A korreláció nem szignifikáns (p > {alpha}).")

A korreláció nem szignifikáns (p > 0.05).


#### Skálázott adatokkal

In [12]:
# BMI_atlag és 2019 HDI oszlopok kiválasztása
bmi_atlag = data["BMI_atlag"]
hdi_2019 = data["2019 HDI"]

In [13]:
# Skálázás standardizálással (Z-score normalizálás)
scaler = StandardScaler()
bmi_atlag_scaled = scaler.fit_transform(bmi_atlag.values.reshape(-1, 1)).flatten()
hdi_2019_scaled = scaler.fit_transform(hdi_2019.values.reshape(-1, 1)).flatten()

In [14]:
# Pearson korrelációs együttható és p-érték kiszámítása a skálázott adatokkal
correlation_scaled, p_value_scaled = pearsonr(bmi_atlag_scaled, hdi_2019_scaled)

In [15]:
# Eredmények kiírása
print("Skálázott adatokkal:")
print(f"Pearson korrelációs együttható: {correlation_scaled}")
print(f"P-érték: {p_value_scaled}")

Skálázott adatokkal:
Pearson korrelációs együttható: 0.1649111878346026
P-érték: 0.7238293723550224


In [16]:
# Korreláció erősségének és irányának értelmezése
if correlation_scaled > 0:
    print("A két változó között pozitív korreláció van.")
elif correlation_scaled < 0:
    print("A két változó között negatív korreláció van.")
else:
    print("A két változó között nincs lineáris korreláció.")

A két változó között pozitív korreláció van.


In [17]:
# P-érték alapján a szignifikancia megállapítása
alpha = 0.05  # Szignifikancia szint
if p_value_scaled < alpha:
    print(f"A korreláció szignifikáns (p < {alpha}).")
else:
    print(f"A korreláció nem szignifikáns (p > {alpha}).")

A korreláció nem szignifikáns (p > 0.05).


In [18]:
# Eredeti adatokkal való számítás (összehasonlításképpen)
correlation, p_value = pearsonr(bmi_atlag, hdi_2019)

print("\nEredeti adatokkal:")
print(f"Pearson korrelációs együttható: {correlation}")
print(f"P-érték: {p_value}")

# Korreláció erősségének és irányának értelmezése
if correlation > 0:
    print("A két változó között pozitív korreláció van.")
elif correlation < 0:
    print("A két változó között negatív korreláció van.")
else:
    print("A két változó között nincs lineáris korreláció.")

# P-érték alapján a szignifikancia megállapítása
alpha = 0.05  # Szignifikancia szint
if p_value < alpha:
    print(f"A korreláció szignifikáns (p < {alpha}).")
else:
    print(f"A korreláció nem szignifikáns (p > {alpha}).")


Eredeti adatokkal:
Pearson korrelációs együttható: 0.16491118783460257
P-érték: 0.7238293723550224
A két változó között pozitív korreláció van.
A korreláció nem szignifikáns (p > 0.05).
