In [9]:
# Importowanie wymaganych bibliotek
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

# Załadowanie danych (upewnij się, że masz swój dataframe `df`)
df = pd.read_csv('final_dataset.csv')  # Załaduj swoje dane, jeśli jeszcze tego nie zrobiłeś

# === 2. Wybór cech i etykiety ===
features = ['Zamkniecie', 'Wolumen', 'MACD_Signal']

# Dodanie kolumny 'Future_Close' (cena zamknięcia w przyszłości)
df['Future_Close'] = df['Zamkniecie'].shift(-5)  # Cena zamknięcia za 5 dni (możesz zmienić wartość -5 na inny próg)

# Określenie etykiety (target)
# '1' dla Buy, '-1' dla Sell, '0' dla Hold
df['Label'] = np.where(df['Future_Close'] > df['Zamkniecie'] * 1.02, 1,  # Buy: cena wzrośnie o >2%
                       np.where(df['Future_Close'] < df['Zamkniecie'] * 0.98, -1, 0))  # Sell: cena spadnie o >2%

# === 3. Podział danych na cechy i etykietę ===
X = df[features]
y = df['Label']

# === 4. Podział na zbiór treningowy i testowy ===
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False)

# === 5. Normalizacja danych ===
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# === 6. Budowa modelu klasyfikacyjnego ===
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train_scaled, y_train)

# === 7. Predykcja ===
y_pred = model.predict(X_test_scaled)

# === 8. Ocena modelu ===
print("Classification Report:\n")
print(classification_report(y_test, y_pred))

# === 9. Dokładność modelu ===
accuracy = model.score(X_test_scaled, y_test)
print(f"\nAccuracy: {accuracy:.4f}")

# === 10. Podsumowanie predykcji ===
df_test = X_test.copy()
df_test['Actual'] = y_test
df_test['Predicted'] = y_pred
df_test['Signal'] = np.where(df_test['Predicted'] == 1, 'Buy', 
                             np.where(df_test['Predicted'] == -1, 'Sell', 'Hold'))

# Wyświetlenie pierwszych kilku wierszy wyników
print("\nPredictions (Actual vs Predicted):")
print(df_test.head())

# Saving dataset with recommendation - v4
df_test.to_csv('dataset_recommendation_v4.csv', index=False)

Classification Report:

              precision    recall  f1-score   support

          -1       0.00      0.00      0.00       251
           0       0.68      1.00      0.81      1184
           1       0.00      0.00      0.00       314

    accuracy                           0.68      1749
   macro avg       0.23      0.33      0.27      1749
weighted avg       0.46      0.68      0.55      1749


Accuracy: 0.6770

Predictions (Actual vs Predicted):
      Zamkniecie       Wolumen  MACD_Signal  Actual  Predicted Signal
6996     2673.61  1.357494e+09    22.244888       1          0   Hold
6997     2695.81  1.870694e+09    21.909070       1          0   Hold
6998     2713.06  1.965922e+09    21.902483       0          0   Hold
6999     2723.99  2.052922e+09    22.227058       0          0   Hold
7000     2743.15  1.798122e+09    22.997212       0          0   Hold


  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
