# Lineární regrese HDP


In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import statsmodels.api as sm
from sklearn.preprocessing import StandardScaler
from statsmodels.stats.stattools import durbin_watson


## Načtení dat


In [None]:
df = pd.read_excel(
    r"C:\Users\Zdeněk Beránek\Desktop\phytonsoubory\Predikce-HDP\Regrese_data (1).xlsx"
)

df.head(), df.columns


## Definice proměnných


In [None]:
y = df["Hdp"]

X = df[
    ["Zahraniční obchod",
     "Průmysl",
     "Nezaměstnanost",
     "Inflace",
     "Mzda"]
]


## Standardizace proměnných


In [None]:
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

X_scaled = pd.DataFrame(X_scaled, columns=X.columns)
X_scaled = sm.add_constant(X_scaled)


## Lineární regresní model (OLS)


In [None]:
model_main = sm.OLS(y, X_scaled).fit()
model_main.summary()


## Diagnostika reziduí


In [None]:
residuals = model_main.resid
fitted = model_main.fittedvalues

plt.figure()
plt.scatter(fitted, residuals)
plt.axhline(0)
plt.xlabel("Predikované hodnoty HDP")
plt.ylabel("Rezidua")
plt.title("Rezidua vs. predikované hodnoty")
plt.show()

plt.figure()
plt.hist(residuals, bins=10)
plt.xlabel("Rezidua")
plt.ylabel("Četnost")
plt.title("Histogram reziduí")
plt.show()

durbin_watson(residuals)


## Časová regrese s trendem


In [None]:
df["trend"] = range(len(df))

X_ts = df[
    ["Zahraniční obchod",
     "Průmysl",
     "Nezaměstnanost",
     "Inflace",
     "Mzda",
     "trend"]
]

scaler_ts = StandardScaler()
X_ts_scaled = scaler_ts.fit_transform(X_ts)

X_ts_scaled = pd.DataFrame(X_ts_scaled, columns=X_ts.columns)
X_ts_scaled = sm.add_constant(X_ts_scaled)

model_ts = sm.OLS(y, X_ts_scaled).fit()
model_ts.summary()


## Predikce HDP


In [None]:
future_data = pd.DataFrame([{
    "Zahraniční obchod": 5.0,
    "Průmysl": 3.0,
    "Nezaměstnanost": 4.2,
    "Inflace": 2.8,
    "Mzda": 4.2
}])

future_data_scaled = scaler.transform(future_data)
future_data_scaled = pd.DataFrame(
    future_data_scaled,
    columns=future_data.columns
)

future_data_scaled = sm.add_constant(future_data_scaled)

predicted_hdp = model_main.predict(future_data_scaled)

predicted_hdp


## Výsledek


In [None]:
print("Predikované HDP:", round(predicted_hdp.iloc[0], 2))
