# Test Durbina-Watsona - Prosty Przyk≈Çad

Ten notebook pokazuje praktyczne przyk≈Çady u≈ºycia testu Durbina-Watsona do wykrywania autokorelacji w resztach modelu regresji.

## 1. Import bibliotek

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from statsmodels.stats.stattools import durbin_watson
from statsmodels.graphics.tsaplots import plot_acf

# Ustawienia
np.random.seed(42)
plt.style.use('seaborn-v0_8-darkgrid')
plt.rcParams['figure.figsize'] = (12, 6)

print("Biblioteki za≈Çadowane pomy≈õlnie!")

## 2. Przyk≈Çad 1: Model BEZ autokorelacji (prawid≈Çowy)

Zbudujemy prosty model liniowy z resztami niezale≈ºnymi od siebie.

In [None]:
# Generowanie danych
n = 100
X = np.linspace(0, 10, n).reshape(-1, 1)

# Prawdziwa zale≈ºno≈õƒá: y = 2 + 3*x + szum losowy
y_true = 2 + 3 * X.flatten()
noise = np.random.normal(0, 1, n)  # Szum NIEZALE≈ªNY
y = y_true + noise

# Regresja liniowa
model = LinearRegression()
model.fit(X, y)
y_pred = model.predict(X)
residuals = y - y_pred

print(f"Wsp√≥≈Çczynniki modelu:")
print(f"  a (wyraz wolny) = {model.intercept_:.4f}")
print(f"  b (nachylenie)  = {model.coef_[0]:.4f}")
print(f"\nPrawdziwe warto≈õci: a = 2, b = 3")

### Test Durbina-Watsona

In [None]:
# Obliczanie statystyki Durbina-Watsona
dw_stat = durbin_watson(residuals)

print("=" * 60)
print("TEST DURBINA-WATSONA - PRZYK≈ÅAD 1")
print("=" * 60)
print(f"\nStatystyka DW: {dw_stat:.4f}")
print(f"\nInterpretacja:")

if 1.5 < dw_stat < 2.5:
    print("‚úì BRAK autokorelacji (DW ‚âà 2.0)")
    print("  Model jest poprawnie specyfikowany")
    print("  Reszty sƒÖ niezale≈ºne od siebie")
elif dw_stat <= 1.5:
    print("‚úó DODATNIA autokorelacja (DW < 1.5)")
    print("  Problem: kolejne reszty sƒÖ podobne do siebie")
else:
    print("‚úó UJEMNA autokorelacja (DW > 2.5)")
    print("  Problem: kolejne reszty zmieniajƒÖ znak")

# Przybli≈ºony wsp√≥≈Çczynnik autokorelacji
rho_approx = 1 - dw_stat / 2
print(f"\nPrzybli≈ºony wsp√≥≈Çczynnik autokorelacji œÅ: {rho_approx:.4f}")

### Wizualizacja

In [None]:
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# 1. Dopasowanie modelu
axes[0, 0].scatter(X, y, alpha=0.6, label='Dane obserwowane', s=50)
axes[0, 0].plot(X, y_pred, 'r-', linewidth=2, label='Linia regresji')
axes[0, 0].set_xlabel('X', fontsize=12)
axes[0, 0].set_ylabel('Y', fontsize=12)
axes[0, 0].set_title('Model regresji liniowej', fontsize=14, fontweight='bold')
axes[0, 0].legend(fontsize=10)
axes[0, 0].grid(True, alpha=0.3)

# 2. Reszty w czasie
axes[0, 1].plot(residuals, marker='o', linestyle='-', alpha=0.6, markersize=4)
axes[0, 1].axhline(y=0, color='red', linestyle='--', linewidth=2, label='y=0')
axes[0, 1].set_xlabel('Obserwacja', fontsize=12)
axes[0, 1].set_ylabel('Reszta', fontsize=12)
axes[0, 1].set_title(f'Reszty w czasie (DW = {dw_stat:.4f})', fontsize=14, fontweight='bold')
axes[0, 1].legend(fontsize=10)
axes[0, 1].grid(True, alpha=0.3)

# 3. Lag plot - reszty vs reszty op√≥≈∫nione
axes[1, 0].scatter(residuals[:-1], residuals[1:], alpha=0.6, s=50)
axes[1, 0].axhline(y=0, color='red', linestyle='--', alpha=0.5)
axes[1, 0].axvline(x=0, color='red', linestyle='--', alpha=0.5)
axes[1, 0].set_xlabel('Reszta(t)', fontsize=12)
axes[1, 0].set_ylabel('Reszta(t+1)', fontsize=12)
axes[1, 0].set_title('Lag Plot - sprawdzenie autokorelacji', fontsize=14, fontweight='bold')
axes[1, 0].grid(True, alpha=0.3)

# 4. Funkcja autokorelacji (ACF)
plot_acf(residuals, lags=20, ax=axes[1, 1], alpha=0.05)
axes[1, 1].set_title('Funkcja Autokorelacji (ACF)', fontsize=14, fontweight='bold')
axes[1, 1].set_xlabel('Op√≥≈∫nienie', fontsize=12)

plt.tight_layout()
plt.show()

print("\nüí° INTERPRETACJA WYKRES√ìW:")
print("  ‚Ä¢ Lag plot: Brak wyra≈∫nego wzorca = brak autokorelacji")
print("  ‚Ä¢ ACF: Wszystkie op√≥≈∫nienia w granicach przedzia≈Çu ufno≈õci = OK")

## 3. Przyk≈Çad 2: Model Z dodatniƒÖ autokorelacjƒÖ (problem!)

Teraz stworzymy model, w kt√≥rym reszty sƒÖ skorelowane ze sobƒÖ.

In [None]:
# Generowanie danych z autokorelowanym szumem
X2 = np.linspace(0, 10, n).reshape(-1, 1)
y2_true = 2 + 3 * X2.flatten()

# Szum z autokorelacjƒÖ AR(1): e_t = 0.7 * e_{t-1} + ŒΩ_t
rho = 0.7  # Wsp√≥≈Çczynnik autokorelacji
noise_ar = np.zeros(n)
noise_ar[0] = np.random.normal(0, 1)

for t in range(1, n):
    noise_ar[t] = rho * noise_ar[t-1] + np.random.normal(0, 1)

y2 = y2_true + noise_ar

# Regresja
model2 = LinearRegression()
model2.fit(X2, y2)
y2_pred = model2.predict(X2)
residuals2 = y2 - y2_pred

print(f"Wsp√≥≈Çczynniki modelu 2:")
print(f"  a (wyraz wolny) = {model2.intercept_:.4f}")
print(f"  b (nachylenie)  = {model2.coef_[0]:.4f}")
print(f"\nWprowadzona autokorelacja: œÅ = {rho}")

### Test Durbina-Watsona dla modelu z autokorelacjƒÖ

In [None]:
# Test DW
dw_stat2 = durbin_watson(residuals2)

print("=" * 60)
print("TEST DURBINA-WATSONA - PRZYK≈ÅAD 2 (z autokorelacjƒÖ)")
print("=" * 60)
print(f"\nStatystyka DW: {dw_stat2:.4f}")
print(f"\nInterpretacja:")

if 1.5 < dw_stat2 < 2.5:
    print("‚úì BRAK autokorelacji (DW ‚âà 2.0)")
elif dw_stat2 <= 1.5:
    print("‚úó DODATNIA autokorelacja (DW < 1.5)")
    print("  ‚ö† PROBLEM: Reszty sƒÖ skorelowane!")
    print("\n  Mo≈ºliwe rozwiƒÖzania:")
    print("    1. Dodaj op√≥≈∫nionƒÖ zmiennƒÖ zale≈ºnƒÖ Y_{t-1}")
    print("    2. Dodaj brakujƒÖce zmienne obja≈õniajƒÖce")
    print("    3. U≈ºyj modeli szereg√≥w czasowych (ARIMA)")
    print("    4. Zastosuj estymacjƒô z korektƒÖ (Newey-West)")
else:
    print("‚úó UJEMNA autokorelacja (DW > 2.5)")

# Przybli≈ºony wsp√≥≈Çczynnik autokorelacji
rho_approx2 = 1 - dw_stat2 / 2
print(f"\nPrzybli≈ºony wsp√≥≈Çczynnik autokorelacji œÅ: {rho_approx2:.4f}")
print(f"Prawdziwy wsp√≥≈Çczynnik autokorelacji:     {rho:.4f}")
print(f"\nTeoretyczna warto≈õƒá DW ‚âà 2(1-œÅ) = {2*(1-rho):.4f}")

### Wizualizacja modelu z autokorelacjƒÖ

In [None]:
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# 1. Dopasowanie modelu
axes[0, 0].scatter(X2, y2, alpha=0.6, label='Dane obserwowane', s=50, color='orange')
axes[0, 0].plot(X2, y2_pred, 'r-', linewidth=2, label='Linia regresji')
axes[0, 0].set_xlabel('X', fontsize=12)
axes[0, 0].set_ylabel('Y', fontsize=12)
axes[0, 0].set_title('Model z autokorelowanymi resztami', fontsize=14, fontweight='bold')
axes[0, 0].legend(fontsize=10)
axes[0, 0].grid(True, alpha=0.3)

# 2. Reszty w czasie - widoczny wzorzec!
axes[0, 1].plot(residuals2, marker='o', linestyle='-', alpha=0.7, 
                markersize=4, color='red', linewidth=1.5)
axes[0, 1].axhline(y=0, color='black', linestyle='--', linewidth=2)
axes[0, 1].set_xlabel('Obserwacja', fontsize=12)
axes[0, 1].set_ylabel('Reszta', fontsize=12)
axes[0, 1].set_title(f'Reszty w czasie (DW = {dw_stat2:.4f}) - PROBLEM!', 
                     fontsize=14, fontweight='bold', color='red')
axes[0, 1].grid(True, alpha=0.3)

# 3. Lag plot - wyra≈∫na dodatnia korelacja!
axes[1, 0].scatter(residuals2[:-1], residuals2[1:], alpha=0.6, s=50, color='red')
axes[1, 0].axhline(y=0, color='black', linestyle='--', alpha=0.5)
axes[1, 0].axvline(x=0, color='black', linestyle='--', alpha=0.5)

# Dodaj liniƒô trendu
z = np.polyfit(residuals2[:-1], residuals2[1:], 1)
p = np.poly1d(z)
x_line = np.linspace(residuals2[:-1].min(), residuals2[:-1].max(), 100)
axes[1, 0].plot(x_line, p(x_line), "b--", linewidth=2, label=f'Trend (nachylenie={z[0]:.3f})')

axes[1, 0].set_xlabel('Reszta(t)', fontsize=12)
axes[1, 0].set_ylabel('Reszta(t+1)', fontsize=12)
axes[1, 0].set_title('Lag Plot - Wyra≈∫na dodatnia autokorelacja!', 
                     fontsize=14, fontweight='bold', color='red')
axes[1, 0].legend(fontsize=10)
axes[1, 0].grid(True, alpha=0.3)

# 4. ACF - istotne op√≥≈∫nienia!
plot_acf(residuals2, lags=20, ax=axes[1, 1], alpha=0.05)
axes[1, 1].set_title('ACF - Wiele istotnych op√≥≈∫nie≈Ñ!', 
                     fontsize=14, fontweight='bold', color='red')
axes[1, 1].set_xlabel('Op√≥≈∫nienie', fontsize=12)

plt.tight_layout()
plt.show()

print("\nüí° INTERPRETACJA WYKRES√ìW:")
print("  ‚Ä¢ Reszty w czasie: Widoczny wzorzec - kolejne warto≈õci 'podƒÖ≈ºajƒÖ' za sobƒÖ")
print("  ‚Ä¢ Lag plot: Dodatnie nachylenie = dodatnia autokorelacja")
print("  ‚Ä¢ ACF: Wiele op√≥≈∫nie≈Ñ poza przedzia≈Çem ufno≈õci = autokorelacja")

## 4. Por√≥wnanie r√≥≈ºnych poziom√≥w autokorelacji

Zobaczmy jak zmienia siƒô statystyka DW dla r√≥≈ºnych poziom√≥w autokorelacji.

In [None]:
# R√≥≈ºne poziomy autokorelacji
rho_values = [0.0, 0.3, 0.5, 0.7, 0.9]
results = []

print("=" * 70)
print("POR√ìWNANIE R√ì≈ªNYCH POZIOM√ìW AUTOKORELACJI")
print("=" * 70)
print(f"\n{'œÅ (autok.)':<12} {'DW stat':<12} {'DW teoria':<12} {'Status':<20}")
print("-" * 70)

for rho in rho_values:
    # Generowanie danych
    X_temp = np.linspace(0, 10, n).reshape(-1, 1)
    y_temp_true = 2 + 3 * X_temp.flatten()
    
    # Szum z autokorelacjƒÖ
    noise_temp = np.zeros(n)
    noise_temp[0] = np.random.normal(0, 1)
    for t in range(1, n):
        noise_temp[t] = rho * noise_temp[t-1] + np.random.normal(0, 1)
    
    y_temp = y_temp_true + noise_temp
    
    # Regresja
    model_temp = LinearRegression()
    model_temp.fit(X_temp, y_temp)
    y_temp_pred = model_temp.predict(X_temp)
    residuals_temp = y_temp - y_temp_pred
    
    # Test DW
    dw_temp = durbin_watson(residuals_temp)
    dw_theory = 2 * (1 - rho)  # Teoretyczna warto≈õƒá
    
    # Status
    if 1.5 < dw_temp < 2.5:
        status = "OK ‚úì"
    elif dw_temp <= 1.5:
        status = "Problem (dodatnia) ‚úó"
    else:
        status = "Problem (ujemna) ‚úó"
    
    results.append({'rho': rho, 'DW': dw_temp, 'DW_theory': dw_theory, 'status': status})
    print(f"{rho:<12.1f} {dw_temp:<12.4f} {dw_theory:<12.4f} {status:<20}")

print("\nüí° WNIOSEK: Im wy≈ºsza autokorelacja (œÅ), tym ni≈ºsza statystyka DW")
print("           Formu≈Ça: DW ‚âà 2(1 - œÅ)")

### Wykres zale≈ºno≈õci DW od œÅ

In [None]:
# Wizualizacja zale≈ºno≈õci
rho_arr = np.array([r['rho'] for r in results])
dw_arr = np.array([r['DW'] for r in results])
dw_theory_arr = np.array([r['DW_theory'] for r in results])

plt.figure(figsize=(12, 6))
plt.plot(rho_arr, dw_arr, 'o-', linewidth=2, markersize=10, label='DW empiryczne', color='blue')
plt.plot(rho_arr, dw_theory_arr, 's--', linewidth=2, markersize=8, label='DW teoretyczne: 2(1-œÅ)', color='red')

# Strefy
plt.axhspan(1.5, 2.5, alpha=0.2, color='green', label='Strefa OK')
plt.axhspan(0, 1.5, alpha=0.2, color='red', label='Dodatnia autokorelacja')
plt.axhspan(2.5, 4, alpha=0.2, color='orange', label='Ujemna autokorelacja')

plt.xlabel('Wsp√≥≈Çczynnik autokorelacji (œÅ)', fontsize=12)
plt.ylabel('Statystyka Durbina-Watsona', fontsize=12)
plt.title('Zale≈ºno≈õƒá DW od poziomu autokorelacji', fontsize=14, fontweight='bold')
plt.legend(fontsize=10, loc='best')
plt.grid(True, alpha=0.3)
plt.ylim(0, 4)
plt.tight_layout()
plt.show()

## 5. Funkcja pomocnicza do analizy DW

In [None]:
def analyze_durbin_watson(residuals, model_name="Model"):
    """
    Funkcja do kompleksowej analizy testu Durbina-Watsona
    
    Parameters:
    -----------
    residuals : array-like
        Reszty z modelu regresji
    model_name : str
        Nazwa modelu do wy≈õwietlenia
    """
    dw_stat = durbin_watson(residuals)
    rho_approx = 1 - dw_stat / 2
    
    print("=" * 60)
    print(f"ANALIZA DURBINA-WATSONA: {model_name}")
    print("=" * 60)
    print(f"\nStatystyka DW:        {dw_stat:.4f}")
    print(f"Przybli≈ºone œÅ:        {rho_approx:.4f}")
    print(f"Liczba obserwacji:    {len(residuals)}")
    
    print("\nInterpretacja:")
    if 1.5 < dw_stat < 2.5:
        print("  ‚úì BRAK autokorelacji (OK)")
        print("  Model spe≈Çnia za≈Ço≈ºenie o niezale≈ºno≈õci reszt")
    elif dw_stat <= 1.5:
        print("  ‚úó DODATNIA autokorelacja (PROBLEM)")
        print("  Kolejne reszty sƒÖ podobne do siebie")
        print("\n  Mo≈ºliwe rozwiƒÖzania:")
        print("    ‚Ä¢ Dodaj op√≥≈∫nionƒÖ zmiennƒÖ zale≈ºnƒÖ")
        print("    ‚Ä¢ Dodaj brakujƒÖce zmienne obja≈õniajƒÖce")
        print("    ‚Ä¢ Sprawd≈∫ trend lub sezonowo≈õƒá")
        print("    ‚Ä¢ U≈ºyj modeli szereg√≥w czasowych")
    else:
        print("  ‚úó UJEMNA autokorelacja (PROBLEM)")
        print("  Kolejne reszty zmieniajƒÖ znak")
    
    print("\nGranice interpretacyjne:")
    print("  DW ‚âà 2.0  : Brak autokorelacji (idea≈Ç)")
    print("  1.5 < DW < 2.5 : Akceptowalne")
    print("  DW < 1.5  : Dodatnia autokorelacja")
    print("  DW > 2.5  : Ujemna autokorelacja")
    print("=" * 60)
    
    return {'DW': dw_stat, 'rho': rho_approx}

# Test funkcji na naszych przyk≈Çadach
print("\n\n")
result1 = analyze_durbin_watson(residuals, "Model bez autokorelacji")
print("\n\n")
result2 = analyze_durbin_watson(residuals2, "Model z autokorelacjƒÖ")

## 6. Podsumowanie

### Czego siƒô nauczyli≈õmy:

1. **Test Durbina-Watsona** wykrywa autokorelacjƒô pierwszego rzƒôdu w resztach modelu regresji

2. **Interpretacja warto≈õci DW:**
   - DW ‚âà 2.0 ‚Üí Brak autokorelacji (idea≈Ç)
   - DW < 1.5 ‚Üí Dodatnia autokorelacja (problem)
   - DW > 2.5 ‚Üí Ujemna autokorelacja (problem)

3. **ZwiƒÖzek z wsp√≥≈Çczynnikiem autokorelacji:**
   - DW ‚âà 2(1 - œÅ)
   - Im wy≈ºsza autokorelacja, tym ni≈ºsza statystyka DW

4. **Diagnostyka wizualna:**
   - **Reszty w czasie** - losowy wzorzec = OK
   - **Lag plot** - brak trendu = OK
   - **ACF** - wszystkie w granicach = OK

5. **Konsekwencje autokorelacji:**
   - Niedoszacowane b≈Çƒôdy standardowe
   - Niewiarygodne testy istotno≈õci
   - Nieefektywne prognozy

## 7. Zadania do samodzielnego eksperymentowania

Spr√≥buj:

1. Zmieniƒá wsp√≥≈Çczynnik autokorelacji `rho` i zobaczyƒá jak zmienia siƒô DW
2. Stworzyƒá model z ujemnƒÖ autokorelacjƒÖ (œÅ < 0)
3. U≈ºyƒá rzeczywistych danych i przetestowaƒá autokorelacjƒô
4. Por√≥wnaƒá test DW z testem Breuscha-Godfreya
5. Dodaƒá op√≥≈∫nionƒÖ zmiennƒÖ zale≈ºnƒÖ i zobaczyƒá czy rozwiƒÖzuje problem autokorelacji