In [1]:
# Temel
import pandas as pd
import numpy as np

# G√∂rselle≈ütirme
import matplotlib.pyplot as plt
import seaborn as sns

# ƒ∞statistik
from scipy import stats
import statsmodels.api as sm
import statsmodels.formula.api as smf
from statsmodels.stats.outliers_influence import variance_inflation_factor
from statsmodels.stats.diagnostic import het_breuschpagan, normal_ad
from statsmodels.stats.stattools import jarque_bera

In [6]:
wdi = pd.read_csv("WDI_CSV_2025_07_02/WDICSV.csv")

# Geni≈ü (wide) yapƒ±yƒ± uzun (long) formata d√∂n√º≈üt√ºrme
wdi_long = wdi.melt(
    id_vars=["Country Name", "Country Code", "Indicator Name", "Indicator Code"],
    var_name="Year",
    value_name="Value"
)

# Yƒ±l s√ºtununu sayƒ±ya √ßevirme
wdi_long["Year"] = pd.to_numeric(wdi_long["Year"], errors="coerce")

In [17]:
from functools import reduce


# === Kullanƒ±lacak g√∂stergeler ===
indicators = {
    # Ya≈üam s√ºresi
    "SP.DYN.LE00.IN": "life_expectancy",

    # Ekonomik g√∂stergeler
    "NY.GDP.PCAP.CD": "gdp_per_capita",
    "SI.POV.DDAY": "poverty_rate",
    "SL.UEM.TOTL.ZS": "unemployment_rate",

    # Beslenme ve saƒülƒ±k
    "SH.STA.MMRT": "maternal_mortality",
    "SH.DYN.MORT": "under5_mortality",
    "SH.STA.BRTC.ZS": "birth_rate",
}


# === Her g√∂stergeyi ayrƒ± DataFrame olarak √ßƒ±kar ve yeniden adlandƒ±r ===
dfs = []
for code, name in indicators.items():
    df_i = wdi_long[wdi_long["Indicator Code"] == code][
        ["Country Name", "Country Code", "Year", "Value"]
    ].rename(columns={"Value": name})
    dfs.append(df_i)

# === DataFrame'leri √úlke ve Yƒ±l bazƒ±nda birle≈ütir ===
merged = reduce(
    lambda left, right: pd.merge(left, right, on=["Country Name", "Country Code", "Year"], how="inner"),
    dfs
)

# === Eksik deƒüerleri temizle ===
merged = merged.dropna()

# === Log-transform (√∂rnek) ‚Äî ki≈üi ba≈üƒ± gelir i√ßin ===
merged["log_gdp_per_capita"] = np.log(merged["gdp_per_capita"])

print("‚úÖ Veri hazƒ±r:", merged.shape)
merged

‚úÖ Veri hazƒ±r: (1281, 11)


Unnamed: 0,Country Name,Country Code,Year,life_expectancy,gdp_per_capita,poverty_rate,unemployment_rate,maternal_mortality,under5_mortality,birth_rate,log_gdp_per_capita
8330,Canada,CAN,1991,77.593415,21846.793047,1.2,10.316,8.0,8.0,99.1,9.991809
8382,Hungary,HUN,1991,69.377073,3361.222680,2.2,8.500,24.0,16.5,99.4,8.120060
8442,Norway,NOR,1991,76.980732,28596.933004,0.5,5.407,8.0,7.9,99.3,10.261055
8501,United States,USA,1991,75.365854,24342.258905,0.5,6.800,12.0,10.9,99.2,10.099969
8568,Argentina,ARG,1992,72.096000,6789.996111,2.5,6.360,65.0,27.6,95.8,8.823206
...,...,...,...,...,...,...,...,...,...,...,...
16422,Norway,NOR,2021,83.163415,93072.892512,0.2,4.359,2.0,2.3,99.2,11.441138
16429,Peru,PER,2021,71.596000,6826.202556,5.2,5.097,141.0,16.4,94.9,8.828524
16431,Poland,POL,2021,75.351220,18635.508881,0.1,3.268,2.0,4.4,99.6,9.832824
16448,Slovak Republic,SVK,2021,74.614634,22132.448303,0.3,6.894,12.0,6.0,98.0,10.004800


In [19]:
import statsmodels.formula.api as smf

print("Veri boyutu:", merged.shape)
print("S√ºtunlar:", merged.columns.tolist())

formula = """
life_expectancy ~ log_gdp_per_capita
                 + poverty_rate
                 + unemployment_rate
                 + maternal_mortality
                 + under5_mortality
                 + birth_rate
"""

model_full = smf.ols(formula=formula, data=merged).fit()

print("\n--- √áok deƒüi≈ükenli model ---")
print(model_full.summary())

Veri boyutu: (1281, 11)
S√ºtunlar: ['Country Name', 'Country Code', 'Year', 'life_expectancy', 'gdp_per_capita', 'poverty_rate', 'unemployment_rate', 'maternal_mortality', 'under5_mortality', 'birth_rate', 'log_gdp_per_capita']

--- √áok deƒüi≈ükenli model ---
                            OLS Regression Results                            
Dep. Variable:        life_expectancy   R-squared:                       0.838
Model:                            OLS   Adj. R-squared:                  0.838
Method:                 Least Squares   F-statistic:                     1101.
Date:                Tue, 28 Oct 2025   Prob (F-statistic):               0.00
Time:                        17:10:06   Log-Likelihood:                -2956.2
No. Observations:                1281   AIC:                             5926.
Df Residuals:                    1274   BIC:                             5963.
Df Model:                           6                                         
Covariance Type:            

# üìù Ya≈üam S√ºresi ve Sosyo-Ekonomik Fakt√∂rler: Regresyon Analizi Raporu

## 1. Modelin Amacƒ±
Bu model, √ºlkelerin ya≈üam s√ºresini etkileyen fakt√∂rleri anlamayƒ± ama√ßlamaktadƒ±r. √ñzellikle:

- Ki≈üi ba≈üƒ±na d√º≈üen gelir  
- Yoksulluk oranƒ±  
- ƒ∞≈üsizlik oranƒ±  
- Anne ve 5 ya≈ü altƒ± √ßocuk √∂l√ºm oranlarƒ±  
- Doƒüum hƒ±zƒ±  

gibi sosyal ve ekonomik deƒüi≈ükenlerin **ya≈üam s√ºresine etkisi** incelenmi≈ütir.

---

## 2. Modelin Genel Performansƒ±

- **R¬≤ = 0.838**  
  - Model, ya≈üam s√ºresindeki varyansƒ±n yakla≈üƒ±k **%84‚Äô√ºn√º a√ßƒ±kladƒ±ƒüƒ±nƒ±** g√∂steriyor.  
  - Bu deƒüi≈ükenler birlikte ya≈üam s√ºresinin √ßoƒüunu tahmin edebiliyor.

- **F-statistic = 1101, p < 0.001**  
  - Modelin genel olarak istatistiksel olarak anlamlƒ± olduƒüunu g√∂sterir.  
  - Modeldeki deƒüi≈ükenlerin topluca ya≈üam s√ºresi √ºzerinde etkisi var.

- **Durbin-Watson ‚âà 1.855**  
  - Artƒ±klar (tahmin hatalarƒ±) baƒüƒ±msƒ±z, yani modelde otokorelasyon sorunu yok.

- **Cond. No = 2810**  
  - Bazƒ± deƒüi≈ükenler arasƒ±nda y√ºksek ili≈üki (multicollinearity) olabilir.  
  - Katsayƒ±lar hassas olabilir; k√º√ß√ºk deƒüi≈üiklikler tahminleri etkileyebilir.

---

## 3. Katsayƒ±lar ve Yorumu

| Deƒüi≈üken | Katsayƒ± | P-deƒüeri | Anlamƒ± |
|-----------|---------|----------|--------|
| **Intercept** | 58.14 | <0.001 | T√ºm deƒüi≈ükenler 0 olduƒüunda beklenen ya≈üam s√ºresi (teorik ba≈ülangƒ±√ß deƒüeri). |
| **log_gdp_per_capita** | 2.53 | <0.001 | Ki≈üi ba≈üƒ±na d√º≈üen gelir arttƒ±k√ßa ya≈üam s√ºresi artƒ±yor. Her bir birim artƒ±≈ü ya≈üam s√ºresini yakla≈üƒ±k 2.5 yƒ±l artƒ±rƒ±yor. |
| **poverty_rate** | 0.046 | <0.001 | Yoksulluk oranƒ± arttƒ±ƒüƒ±nda ya≈üam s√ºresi hafif artƒ±yor gibi g√∂r√ºn√ºyor. Veri veya diƒüer deƒüi≈ükenlerle ili≈ükiden kaynaklƒ± olabilir. |
| **unemployment_rate** | 0.003 | 0.799 | Anlamlƒ± deƒüil; i≈üsizlik oranƒ±nƒ±n ya≈üam s√ºresi √ºzerinde etkisi yok gibi. |
| **maternal_mortality** | -0.0098 | <0.001 | Anne √∂l√ºm oranƒ± arttƒ±k√ßa ya≈üam s√ºresi azalƒ±yor (beklenen ili≈üki). |
| **under5_mortality** | -0.108 | <0.001 | 5 ya≈ü altƒ± √∂l√ºm oranƒ± arttƒ±k√ßa ya≈üam s√ºresi ciddi ≈üekilde d√º≈ü√ºyor. En g√º√ßl√º negatif etki burada. |
| **birth_rate** | -0.047 | <0.001 | Doƒüum hƒ±zƒ± arttƒ±k√ßa ya≈üam s√ºresi azalƒ±yor. √áok √ßocuklu toplumlarda saƒülƒ±k ve ya≈üam s√ºresi baskƒ±lanabiliyor. |

---

## 4. Modelin Ana Mesajlarƒ±

1. **Ekonomik refah √∂nemli:** Ki≈üi ba≈üƒ±na gelir arttƒ±k√ßa ya≈üam s√ºresi belirgin ≈üekilde artƒ±yor.  
2. **Saƒülƒ±k g√∂stergeleri kritik:** Anne ve √ßocuk √∂l√ºm oranlarƒ± ya≈üam s√ºresinin en g√º√ßl√º negatif belirleyicileri.  
3. **Bazƒ± beklenmedik sonu√ßlar:** Yoksulluk oranƒ±nƒ±n pozitif etkisi, veri ve model kontrol√ºnden kaynaklƒ± olabilir ve dikkatle yorumlanmalƒ±.  
4. **Sosyal politika i√ßin ipu√ßlarƒ±:** Doƒüum hƒ±zƒ± ve saƒülƒ±k g√∂stergelerindeki iyile≈ümeler, ya≈üam s√ºresini artƒ±rmada etkili.

---

## 5. Modelin G√ºc√º ve Sƒ±nƒ±rlarƒ±

- **G√º√ßl√º y√∂nleri:**  
  - Y√ºksek R¬≤ ile ya≈üam s√ºresini √ßok iyi a√ßƒ±klƒ±yor.  
  - Sosyal ve ekonomik fakt√∂rleri tek modelde birle≈ütiriyor.

- **Sƒ±nƒ±rlamalarƒ±:**  
  - Cond. No y√ºksek ‚Üí bazƒ± katsayƒ±lar hassas, deƒüi≈ükenler birbirine baƒülƒ± olabilir.  
  - Bazƒ± ters sonu√ßlar (poverty_rate) veri ve modelleme sƒ±nƒ±rlamalarƒ±ndan kaynaklanabilir.

---

## 6. √ñzet

> Bu model, ya≈üam s√ºresini belirleyen temel ekonomik ve saƒülƒ±k g√∂stergelerini g√º√ßl√º bir ≈üekilde yakalƒ±yor.  
> Politika yapƒ±cƒ±lar i√ßin en √∂nemli mesaj: **ekonomik refahƒ±n artƒ±rƒ±lmasƒ±, anne ve √ßocuk saƒülƒ±ƒüƒ±nƒ±n iyile≈ütirilmesi ve a≈üƒ±rƒ± doƒüum oranlarƒ±nƒ±n kontrol√º**, ya≈üam s√ºresini artƒ±rmada kritik √∂neme sahip.
