# **Time Series Analysis and Forecasting**  
### *Analiza szeregów czasowych i prognozowanie*

---

## **English**

Time series analysis involves studying data points collected at successive time intervals to identify trends, patterns, and relationships. Forecasting extends this analysis to predict future values based on historical patterns. This is crucial in many domains including finance, economics, weather prediction, and business analytics.

### **Key Concepts**

1. **Time Series**: Sequence of data points indexed in time order
2. **Trend**: Long-term movement or direction in the data
3. **Seasonality**: Regular, predictable patterns that repeat over time
4. **Noise**: Random variations that cannot be attributed to trend or seasonality
5. **Stationarity**: Statistical properties remain constant over time
6. **Autocorrelation**: Correlation of a time series with itself at different time lags

### **Components of Time Series**

A time series can be decomposed into several components:

#### **Additive Model**
$$
Y_t = T_t + S_t + E_t
$$

#### **Multiplicative Model**
$$
Y_t = T_t \times S_t \times E_t
$$

Where:
- $Y_t$ = Observed value at time t
- $T_t$ = Trend component
- $S_t$ = Seasonal component
- $E_t$ = Error/noise component

### **Types of Time Series**

1. **Univariate**: Single variable measured over time
2. **Multivariate**: Multiple variables measured simultaneously
3. **Regular**: Equal time intervals between observations
4. **Irregular**: Unequal time intervals between observations

### **Classical Forecasting Methods**

#### **1. Moving Averages**
Simple moving average:
$$
\hat{Y}_{t+1} = \frac{1}{k}\sum_{i=0}^{k-1} Y_{t-i}
$$

Exponential smoothing:
$$
\hat{Y}_{t+1} = \alpha Y_t + (1-\alpha)\hat{Y}_t
$$

#### **2. ARIMA Models**
AutoRegressive Integrated Moving Average:
$$
\phi(B)(1-B)^d X_t = \theta(B)\epsilon_t
$$

Where:
- $\phi(B)$ = Autoregressive polynomial
- $\theta(B)$ = Moving average polynomial
- $d$ = Degree of differencing
- $B$ = Backshift operator

#### **3. Seasonal ARIMA (SARIMA)**
Extends ARIMA to handle seasonal patterns:
$$
\phi(B)\Phi(B^s)(1-B)^d(1-B^s)^D X_t = \theta(B)\Theta(B^s)\epsilon_t
$$

### **Machine Learning Approaches**

#### **1. Linear Regression**
- Simple and interpretable
- Good for trend analysis
- Limited for complex patterns

#### **2. Tree-Based Methods**
- Random Forest, XGBoost
- Handle non-linear relationships
- Feature engineering required

#### **3. Deep Learning**
- **RNNs**: Handle sequential dependencies
- **LSTMs**: Address vanishing gradient problem
- **GRUs**: Simplified version of LSTMs
- **CNNs**: Extract local patterns in time series

### **Feature Engineering**

1. **Lag Features**: Previous values as predictors
2. **Rolling Statistics**: Moving averages, standard deviations
3. **Date/Time Features**: Day of week, month, quarter
4. **Fourier Terms**: Capturing seasonal patterns
5. **Differencing**: Making series stationary

### **Evaluation Metrics**

1. **Mean Absolute Error (MAE)**:
$$
MAE = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y}_i|
$$

2. **Mean Squared Error (MSE)**:
$$
MSE = \frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2
$$

3. **Root Mean Squared Error (RMSE)**:
$$
RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2}
$$

4. **Mean Absolute Percentage Error (MAPE)**:
$$
MAPE = \frac{100\%}{n}\sum_{i=1}^{n}\left|\frac{y_i - \hat{y}_i}{y_i}\right|
$$

### **Applications**

- **Finance**: Stock price prediction, risk management
- **Economics**: GDP forecasting, inflation prediction
- **Weather**: Temperature, precipitation forecasting
- **Business**: Demand planning, inventory management
- **Energy**: Load forecasting, renewable energy prediction
- **Healthcare**: Epidemic modeling, patient monitoring

### **Challenges**

- **Non-stationarity**: Changing statistical properties over time
- **Missing Data**: Gaps in time series observations
- **Multiple Seasonalities**: Different seasonal patterns overlapping
- **Concept Drift**: Underlying relationships change over time
- **External Factors**: Events not captured in historical data

---

## **Polish**

Analiza szeregów czasowych polega na badaniu punktów danych zbieranych w kolejnych odstępach czasu w celu identyfikacji trendów, wzorców i relacji. Prognozowanie rozszerza tę analizę o przewidywanie przyszłych wartości na podstawie wzorców historycznych. Jest to kluczowe w wielu dziedzinach, w tym finansach, ekonomii, prognozowaniu pogody i analityce biznesowej.

### **Kluczowe pojęcia**

1. **Szereg czasowy**: Sekwencja punktów danych indeksowanych w porządku czasowym
2. **Trend**: Długoterminowy ruch lub kierunek w danych
3. **Sezonowość**: Regularne, przewidywalne wzorce powtarzające się w czasie
4. **Szum**: Losowe wariacje, których nie można przypisać trendowi lub sezonowości
5. **Stacjonarność**: Właściwości statystyczne pozostają stałe w czasie
6. **Autokorelacja**: Korelacja szeregu czasowego z samym sobą przy różnych opóźnieniach czasowych

### **Składniki szeregu czasowego**

Szereg czasowy można rozłożyć na kilka składników:

#### **Model addytywny**
$$
Y_t = T_t + S_t + E_t
$$

#### **Model multiplikatywny**
$$
Y_t = T_t \times S_t \times E_t
$$

Gdzie:
- $Y_t$ = Obserwowana wartość w czasie t
- $T_t$ = Składnik trendu
- $S_t$ = Składnik sezonowy
- $E_t$ = Składnik błędu/szumu

### **Typy szeregów czasowych**

1. **Jednowymiarowe**: Pojedyncza zmienna mierzona w czasie
2. **Wielowymiarowe**: Wiele zmiennych mierzonych jednocześnie
3. **Regularne**: Równe odstępy czasu między obserwacjami
4. **Nieregularne**: Nierówne odstępy czasu między obserwacjami

### **Klasyczne metody prognozowania**

#### **1. Średnie ruchome**
Prosta średnia ruchoma:
$$
\hat{Y}_{t+1} = \frac{1}{k}\sum_{i=0}^{k-1} Y_{t-i}
$$

Wygładzanie wykładnicze:
$$
\hat{Y}_{t+1} = \alpha Y_t + (1-\alpha)\hat{Y}_t
$$

#### **2. Modele ARIMA**
Autoregresyjne zintegrowane średnie ruchome:
$$
\phi(B)(1-B)^d X_t = \theta(B)\epsilon_t
$$

Gdzie:
- $\phi(B)$ = Wielomian autoregresyjny
- $\theta(B)$ = Wielomian średniej ruchomej
- $d$ = Stopień różnicowania
- $B$ = Operator przesunięcia

#### **3. Sezonowe ARIMA (SARIMA)**
Rozszerza ARIMA o obsługę wzorców sezonowych:
$$
\phi(B)\Phi(B^s)(1-B)^d(1-B^s)^D X_t = \theta(B)\Theta(B^s)\epsilon_t
$$

### **Podejścia uczenia maszynowego**

#### **1. Regresja liniowa**
- Prosta i interpretowalna
- Dobra do analizy trendów
- Ograniczona dla złożonych wzorców

#### **2. Metody oparte na drzewach**
- Random Forest, XGBoost
- Obsługują relacje nieliniowe
- Wymagają inżynierii cech

#### **3. Uczenie głębokie**
- **RNN**: Obsługują zależności sekwencyjne
- **LSTM**: Rozwiązują problem zanikającego gradientu
- **GRU**: Uproszczona wersja LSTM
- **CNN**: Wyodrębniają lokalne wzorce w szeregach czasowych

### **Inżynieria cech**

1. **Cechy opóźnione**: Poprzednie wartości jako predyktory
2. **Statystyki ruchome**: Średnie ruchome, odchylenia standardowe
3. **Cechy daty/czasu**: Dzień tygodnia, miesiąc, kwartał
4. **Składniki Fouriera**: Wychwytywanie wzorców sezonowych
5. **Różnicowanie**: Czynienie szeregu stacjonarnym

### **Metryki ewaluacji**

1. **Średni błąd bezwzględny (MAE)**:
$$
MAE = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y}_i|
$$

2. **Średni błąd kwadratowy (MSE)**:
$$
MSE = \frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2
$$

3. **Pierwiastek ze średniego błędu kwadratowego (RMSE)**:
$$
RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2}
$$

4. **Średni bezwzględny błąd procentowy (MAPE)**:
$$
MAPE = \frac{100\%}{n}\sum_{i=1}^{n}\left|\frac{y_i - \hat{y}_i}{y_i}\right|
$$

### **Zastosowania**

- **Finanse**: Przewidywanie cen akcji, zarządzanie ryzykiem
- **Ekonomia**: Prognozowanie PKB, przewidywanie inflacji
- **Pogoda**: Prognozowanie temperatury, opadów
- **Biznes**: Planowanie popytu, zarządzanie zapasami
- **Energia**: Prognozowanie obciążenia, przewidywanie energii odnawialnej
- **Ochrona zdrowia**: Modelowanie epidemii, monitorowanie pacjentów

### **Wyzwania**

- **Niestacjonarność**: Zmieniające się właściwości statystyczne w czasie
- **Brakujące dane**: Luki w obserwacjach szeregów czasowych
- **Wielokrotne sezonowości**: Różne wzorce sezonowe nakładające się
- **Dryf koncepcji**: Podstawowe relacje zmieniają się w czasie
- **Czynniki zewnętrzne**: Wydarzenia niezarejestrowane w danych historycznych
