In [1]:
#download price data
import yfinance as yf

#base libs
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

#scaler and split
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split

#models
from sklearn.linear_model import LogisticRegression
from xgboost import XGBClassifier

#to show accuracy
from sklearn.metrics import classification_report

#шоб варнінги убрати ато супер бісить
import warnings
warnings.filterwarnings('ignore')

In [2]:
data = yf.download('EURUSD=X', start='2003-01-01', end='2025-11-04')

[*********************100%***********************]  1 of 1 completed


In [3]:
data.head()

Price,Close,High,Low,Open,Volume
Ticker,EURUSD=X,EURUSD=X,EURUSD=X,EURUSD=X,EURUSD=X
Date,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2
2003-12-01,1.196501,1.204007,1.194401,1.203398,0
2003-12-02,1.208897,1.210903,1.1946,1.196101,0
2003-12-03,1.212298,1.213003,1.2077,1.209,0
2003-12-04,1.208094,1.214403,1.204398,1.212004,0
2003-12-05,1.218695,1.219096,1.206593,1.207802,0


підготовка данних

In [4]:
df = data[['Close']].copy()

In [5]:
df['MA_5'] = df['Close'].rolling(window=5).mean()  # Середня за 5 днів
df['MA_20'] = df['Close'].rolling(window=20).mean()  # Середня за 20 днів
df['MA_50'] = df['Close'].rolling(window=50).mean() # Середня за 50 днів
# Якщо ціна вище MA_20  → купувати (восходящий тренд)
# Якщо ціна нижче MA_20 → продавати (нисходящий тренд)
# Якщо MA_5 перетинає MA_20 вгору → СИГНАЛ ПОКУПКИ
# Якщо MA_5 перетинає MA_20 вниз → СИГНАЛ ПРОДАЖУ

In [6]:
df['Price_Change'] = df['Close'].pct_change()  # Відсоток змін, pct_change() pandas обчислює відсоткову зміну між поточним і попереднім значенням в серії або колонці
df['Volatility'] = df['Price_Change'].rolling(window=10).std()  # коливання ціни, std() стандартне відхилення

In [7]:
rolling_std = df['Close'].rolling(window=20).std()
rolling_std = rolling_std.squeeze()
df['Middle Band'] = df['MA_20']
df['Upper Band'] = df['MA_20'] + (2 * rolling_std)
df['Lower Band'] = df['MA_20'] - (2 * rolling_std)
# Якщо ціна торгується біля нижньої смуги → ПЕРЕПРОДАНО (можна купувати)
# Якщо ціна торгується біля верхної смуги → ПЕРЕКУПЛЕНО (можна продавати)
# Вузькі смуги → низька волатильність (спокій)
# Широкі смуги → висока волатильність (рух)

In [8]:
df['Target'] = (df['Close'].shift(-1) > df['Close']).astype(int)
#функція shift() з параметром -1, зсуває усі значення колонки Close вгору на 1 рядок, для кожного рядка тепер стоїть ціна закриття наступного дня.
#Якщо ціна завтра більша за сьогодні — умова True

In [9]:
df = df.dropna()

In [10]:
df.info()

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 5640 entries, 2004-02-06 to 2025-11-03
Data columns (total 10 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   (Close, EURUSD=X)  5640 non-null   float64
 1   (MA_5, )           5640 non-null   float64
 2   (MA_20, )          5640 non-null   float64
 3   (MA_50, )          5640 non-null   float64
 4   (Price_Change, )   5640 non-null   float64
 5   (Volatility, )     5640 non-null   float64
 6   (Middle Band, )    5640 non-null   float64
 7   (Upper Band, )     5640 non-null   float64
 8   (Lower Band, )     5640 non-null   float64
 9   (Target, )         5640 non-null   int64  
dtypes: float64(9), int64(1)
memory usage: 484.7 KB


In [11]:
features = ['Close', 'MA_5', 'MA_20', 'MA_50', 'Price_Change', 'Middle Band', 'Upper Band', 'Lower Band', 'Volatility']
X = df[features]
y = df['Target']
#ну тут просто розділив на фічі і назначив Х і Y

In [12]:
scaler_features = MinMaxScaler()
X_scaled = scaler_features.fit_transform(X)
#нормалізував значення, +поняв шо круче не перезаписувати данні а робити нью змінні(вроде круче)

In [13]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
#розділив данні на 80% на тренування, 20 на тест

In [14]:
len(X_train)

4512

In [15]:
len(X_test)

1128

In [16]:
model = LogisticRegression(max_iter=1000, random_state=42)
model.fit(X_train, y_train)

0,1,2
,penalty,'l2'
,dual,False
,tol,0.0001
,C,1.0
,fit_intercept,True
,intercept_scaling,1
,class_weight,
,random_state,42
,solver,'lbfgs'
,max_iter,1000


In [17]:
# Передбачення на тренувальному наборі
y_train_pred = model.predict(X_train)

# Передбачення на тестовому наборі
y_test_pred = model.predict(X_test)

In [18]:
# Передбачення на тренувальному наборі
print(classification_report(y_train, y_train_pred, 
    target_names=['Ціна вниз', 'Ціна вгору']))

              precision    recall  f1-score   support

   Ціна вниз       0.51      0.87      0.64      2295
  Ціна вгору       0.50      0.13      0.21      2217

    accuracy                           0.51      4512
   macro avg       0.50      0.50      0.43      4512
weighted avg       0.50      0.51      0.43      4512



In [19]:
# Передбачення на тестовому наборі
print(classification_report(y_test, y_test_pred, 
    target_names=['Ціна вниз', 'Ціна вгору']))
#нова фіча, target_names, просто зручніше бачити що модель норм предіктить а шо не

              precision    recall  f1-score   support

   Ціна вниз       0.48      0.88      0.62       545
  Ціна вгору       0.52      0.13      0.20       583

    accuracy                           0.49      1128
   macro avg       0.50      0.50      0.41      1128
weighted avg       0.50      0.49      0.41      1128



In [20]:
model = XGBClassifier()
model.fit(X_train, y_train)

0,1,2
,objective,'binary:logistic'
,base_score,
,booster,
,callbacks,
,colsample_bylevel,
,colsample_bynode,
,colsample_bytree,
,device,
,early_stopping_rounds,
,enable_categorical,False


In [21]:
# Передбачення на тренувальному наборі
y_train_pred_XGB = model.predict(X_train)

# Передбачення на тестовому наборі
y_test_pred_XGB = model.predict(X_test)

In [22]:
# Передбачення на тренувальному наборі
print(classification_report(y_train, y_train_pred_XGB, 
    target_names=['Ціна вниз', 'Ціна вгору']))

              precision    recall  f1-score   support

   Ціна вниз       0.94      0.95      0.95      2295
  Ціна вгору       0.95      0.94      0.95      2217

    accuracy                           0.95      4512
   macro avg       0.95      0.95      0.95      4512
weighted avg       0.95      0.95      0.95      4512



In [23]:
# Передбачення на тестовому наборі
print(classification_report(y_test, y_test_pred_XGB, 
    target_names=['Ціна вниз', 'Ціна вгору']))

              precision    recall  f1-score   support

   Ціна вниз       0.50      0.54      0.52       545
  Ціна вгору       0.54      0.50      0.52       583

    accuracy                           0.52      1128
   macro avg       0.52      0.52      0.52      1128
weighted avg       0.52      0.52      0.52      1128

