# <span style="color:yellow">ΚΑΘΟΡΙΣΜΟΣ ΤΟΥ DIRECTORY ΟΠΟΥ ΒΡΙΣΚΕΤΑΙ ΤΟ ΑΡΧΕΙΟ

In [1]:
pwd #Καθορίζει το path file του αρχείου που εκτελείται

'C:\\Users\\Kosta\\Python_Projects\\JupyterProject'

# <span style="color:yellow">ΕΙΣΑΓΩΓΗ ΤΩΝ ΑΠΑΡΑΙΤΡΗΤΩΝ ΒΙΒΛΙΟΘΗΚΩΝ ΓΙΑ ΤΗΝ ΕΚΤΕΛΕΣΗ ΤΟΥ ΚΩΔΙΚΑ

In [2]:
#Βιβλιοθήκες για την εισαγωγή και επεξεργασία των δεδομένων
import warnings
import numpy as np
import pandas as pd

#Βιβλιοθήκες για την εκτύπωση των διαγραμμάτων
import seaborn as sns
import matplotlib.cm as cm
import plotly.express as px
import matplotlib.pyplot as plt
import plotly.graph_objects as go
from plotly.subplots import make_subplots

#Βιβλιοθήκες για εκπαίδευση μοντέλων μηχανικής μάθησης
from arch import arch_model
import statsmodels.api as sm
from scipy.stats import zscore
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# <span style="color:yellow">ΚΑΘΟΡΙΣΜΟΣ ΑΚΡΙΒΕΙΑΣ ΤΟΥ ΜΟΝΤΕΛΟΥ

In [3]:
#Καθορισμός ακριβείας του μοντέλου
pd.set_option("display.precision", 2)

# <span style="color:yellow">ΕΙΣΑΓΩΓΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΤΟΥ ΑΡΧΕΙΟΥ ΠΟΥ ΕΙΝΑΙ ΑΠΑΡΑΙΤΗΤΟ ΓΙΑ ΤΗΝ ΕΚΤΕΛΕΣΗ ΤΟΥ ΑΛΓΟΡΙΘΜΟΥ

In [4]:
#Αναγνώριση του αρχείου και εισαγωγή του στο πρόγραμμα
df = pd.read_excel('../FINAL_DATA/Ireland_Values.xlsx')

#Δημιουργία DataFrame
df.head()

#Δίνει την εκτύπωση των πέντε πρώτων στηλών των δεδομένων
print(df.head())

FileNotFoundError: [Errno 2] No such file or directory: '../FINAL_DATA/Greece_Values.xlsx'

# <span style="color:yellow">ΣΥΝΟΠΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ

In [None]:
#Επιστρέφει το σύνολο των γραμμών του αρχείου στο οποίο βρίσκονται τα δεδομένα
len(df)

In [None]:
#Επιστρέφει τα ονόματα των στηλών του αρχείου στο οποίο βρίσκονται τα δεδομένα
df.columns

In [None]:
# Υποθέτουμε ότι το DataFrame ονομάζεται 'data'
total_values = df.size  # Επιστρέφει το σύνολο όλων των τιμών στο DataFrame
print(f"Σύνολο δεδομένων στο DataFrame: {total_values}")

In [None]:
#Δίνει τον τύπο των δεδομένων που περιέχονται στις στήλες του αρχείου. To dataset αποτελείται από 9 στήλες από τις οποίες οι οκτώ περιέχουν αριθμητικά δεδομένα και η μια ημερομηνία
df.dtypes

In [None]:
# Εκτυπώνει το όνομα των στηλών και τον τύπο των δεδομένων που περιέχουν
df.info()

In [None]:
#Εκτυπώνει το είδος της κάθε μεταβλητής του dataset
print(df.dtypes)

In [None]:
#Δίνει τον πίνακα συσχέτισης των μεταβλητών του dataset
df.corr()

# <span style="color:yellow">ΠΡΟΕΤΟΙΜΑΣΙΑ ΤΩΝ ΔΕΟΔΜΕΝΩΝ

In [None]:
# Έλεγχος για ελλείπουσες τιμές
missing_values = df.isnull().sum()

# Εμφάνιση των αποτελεσμάτων
print("Ελλείπουσες τιμές ανά στήλη:")
print(missing_values)

In [None]:
# Υπολογισμός Z-Scores για αριθμητικές στήλες
z_scores = df.select_dtypes(include=[np.number]).apply(zscore)

# Καθορισμός ακραιών τιμών (π.χ., όριο Z-Score > |3|)
threshold = 3
outliers = (z_scores.abs() > threshold)

# Εμφάνιση ακραίων τιμών
print("Ακραιες τιμές ανά στήλη:")
for column in outliers.columns:
    print(f"\nΣτήλη: {column}")
    print(df.loc[outliers[column], column])

In [None]:
# Φιλτράρισμα δεδομένων για απομάκρυνση γραμμών με ακραίες τιμές
df_without_outliers = df[~(z_scores.abs() > threshold).any(axis=1)]

print("\nDataFrame μετά την αφαίρεση ακραίων τιμών:")
print(df_without_outliers)

In [None]:
# Μετατροπή της στήλης 'Date' σε datetime format
df['Date'] = pd.to_datetime(df['Date'], format='%Y-%m-%d',
                            errors='coerce')  # Προσαρμόστε το format ανάλογα με τη μορφή της ημερομηνίας σας

# Έλεγχος αν η μετατροπή ήταν επιτυχής
print(df['Date'].head())

# Προαιρετικά: Ρύθμιση της στήλης 'Date' ως index
df.set_index('Date', inplace=True)

# Έλεγχος του DataFrame
print(df.head())

In [None]:
df.index # Output: DatetimeIndex([...], dtype='datetime64[ns]', freq=None)

df = df.sort_index()
# Το index ταξινομείται, και το DataFrame είναι έτοιμο για χρήση ταξινομημένο.

print(df.head())

# <span style="color:yellow">Προετοιμασία δεδομένων και κανονικοποίηση

In [None]:
# Επιλογή αριθμητικών στηλών για κανονικοποίηση
numeric_columns = df.select_dtypes(include=[np.number])

# Εφαρμογή κανονικοποίησης Z-Score
df_normalized = numeric_columns.apply(zscore)

# Επιστροφή μη αριθμητικών στηλών στο τελικό DataFrame (αν υπάρχουν)
for col in df.select_dtypes(exclude=[np.number]).columns:
    df_normalized[col] = df[col]

# Επισκόπηση κανονικοποιημένου DataFrame
print("Κανονικοποιημένα δεδομένα (Z-Score):")
print(df_normalized.head())

# <span style="color:yellow">Δημιουργία Χρονικών Υστερήσεων (Lagged Variables)

In [None]:
# Ορισμός των χρονικών υστερήσεων (lags) που θέλουμε
lags = [7, 14, 21]  # Οι υστερήσεις που απαιτούνται

# Επιλογή των αριθμητικών στηλών στο DataFrame
columns_to_lag = df.select_dtypes(include=[np.number]).columns  # Μόνο οι αριθμητικές στήλες

# Δημιουργία νέου DataFrame για τις lagged μεταβλητές
lagged_data = pd.DataFrame(index=df.index)  # Διατηρούμε το ίδιο index

# Δημιουργία lagged μεταβλητών για κάθε επιλεγμένη στήλη
for col in columns_to_lag:
    for lag in lags:
        lagged_data[f"{col}_lag_{lag}"] = df[col].shift(lag)

# Ενοποίηση του αρχικού DataFrame με τις lagged μεταβλητές
df = pd.concat([df, lagged_data], axis=1)

# Αφαίρεση των γραμμών που περιέχουν NaN λόγω των χρονικών υστερήσεων
df.dropna(inplace=True)

# Επισκόπηση του τελικού DataFrame
print("\nDataFrame με υστερήσεις 7, 14, 21 ημερών:")
print(df.head())  # Εκτύπωση των πρώτων γραμμών για έλεγχο

# <span style="color:yellow">Διαχωρισμός 80% για Training, 20% για Test

In [None]:
# Υπολογισμός του ορίου για το διαχωρισμό (80% για Training, 20% για Test)
train_size = int(len(df) * 0.8)  # Στρογγυλοποίηση για τα πρώτα 80%

# Διαχωρισμός δεδομένων
train_data = df.iloc[:train_size]  # Τα παλαιότερα δεδομένα (80%) για εκπαίδευση
test_data = df.iloc[train_size:]  # Τα πιο πρόσφατα δεδομένα (20%) για δοκιμές

# Επισκόπηση μεγεθών
print(f"Μέγεθος Training Set: {train_data.shape}")
print(f"Μέγεθος Test Set: {test_data.shape}")

# Έλεγχος τιμών στο Training και Test Set
print("\nΠρώτες γραμμές του Training Set:")
print(train_data.head())

print("\nΠρώτες γραμμές του Test Set:")
print(test_data.head())

# <span style="color:yellow">Linear Regression

In [None]:
# Βεβαιωθείτε ότι η μεταβλητή "7-Day Standard Deviation of Daily Returns" υπάρχει στο DataFrame
dependent_var = "7- Day Standard Deviation of Daily Returns"

In [None]:
# Δημιουργία της μήτρας των χαρακτηριστικών (X) και της εξαρτημένης μεταβλητής (y)
X = df.drop(columns=[dependent_var])  # Όλα τα υπόλοιπα χαρακτηριστικά εκτός της εξαρτημένης μεταβλητής
y = df[dependent_var]  # Εξαρτημένη μεταβλητή

In [None]:
# Διαχωρισμός δεδομένων σε Training και Test (όπως προηγουμένως)
train_size = int(len(df) * 0.8)
X_train, X_test = X.iloc[:train_size], X.iloc[train_size:]
y_train, y_test = y.iloc[:train_size], y.iloc[train_size:]

In [None]:
# Δημιουργία του μοντέλου γραμμικής παλινδρόμησης
model = LinearRegression()

In [None]:
# Εκπαίδευση του μοντέλου
model.fit(X_train, y_train)

In [None]:
# Πρόβλεψη στο Train Set
y_train_pred = model.predict(X_train)

# Εκτύπωση των αποτελεσμάτων πρόβλεψης
print("Προβλέψεις για το Train Set:")
print(y_train_pred)

In [None]:
# Πρόβλεψη στο Test Set
y_pred = model.predict(X_test)

# Εκτύπωση των αποτελεσμάτων πρόβλεψης
print("Προβλέψεις για το Test Set:")
print(y_pred)

In [None]:
# Εκτύπωση των παραμέτρων του μοντέλου
coefficients = pd.DataFrame({"Feature": X.columns, "Coefficient": model.coef_})
print("\nΣυντελεστές γραμμικής παλινδρόμησης:")
print(coefficients.sort_values(by="Coefficient", ascending=False))

# Save coefficients DataFrame to an Excel file
coefficients.to_excel("linear_regression_coefficients.xlsx", index=False)

# <span style="color:yellow">Μετρικές Αξιολόγησης Linear Regression (y_train)

In [None]:
# Υπολογισμός μετρικών για το Training Dataset
mse_train = mean_squared_error(y_train, y_train_pred)
rmse_train = np.sqrt(mse_train)
r2_train = r2_score(y_train, y_train_pred)

print(f"Training Mean Squared Error (MSE): {mse_train}")
print(f"Training Root Mean Squared Error (RMSE): {rmse_train}")
print(f"Training R² Score: {r2_train}")

# Δημιουργία DataFrame για τις μετρικές
metrics_df = pd.DataFrame({
    "Metric": ["Mean Squared Error (MSE)", "Root Mean Squared Error (RMSE)", "R² Score"],
    "Value": [mse_train, rmse_train, r2_train]
})

# Αποθήκευση των μετρικών σε αρχείο Excel
metrics_df.to_excel("training_metrics-train.xlsx", index=False)

# <span style="color:yellow">Μετρικές Αξιολόγησης Linear Regression (y_test)

In [None]:
# Αξιολόγηση του μοντέλου
mse = mean_squared_error(y_test, y_pred)  # Μέσο Τετραγωνικό Σφάλμα (Mean Squared Error)
r2 = r2_score(y_test, y_pred)  # R^2 score, δείκτης προσαρμογής
rmse = np.sqrt(mse) # Υπολογισμός του Root Mean Squared Error (RMSE)

# Εκτύπωση μετρικών απόδοσης
print(f"Mean Squared Error (MSE): {mse}")
print(f"R^2 Score: {r2}")
print(f"Root Mean Squared Error (RMSE): {rmse}")

# Δημιουργία DataFrame για τις μετρικές
metrics_df = pd.DataFrame({
    "Metric": ["Mean Squared Error (MSE)", "Root Mean Squared Error (RMSE)", "R² Score"],
    "Value": [mse, rmse, r2]
})

# Αποθήκευση των μετρικών σε αρχείο Excel
metrics_df.to_excel("training_metrics-test.xlsx", index=False)

# <span style="color:yellow">Πρόβλεψη για τις επόμενες 7 ημέρες

In [None]:
# Βάση δεδομένων: παίρνουμε τα πιο πρόσφατα δεδομένα από το Test Set για να υπολογίσουμε τις νέες τιμές
new_predictions = []  # Λίστα για να αποθηκεύσουμε τις προβλέψεις

latest_row = df.iloc[-1].copy()  # Παίρνουμε την τελευταία γραμμή δεδομένων του DataFrame ως βάση
latest_row.name = df.index[-1]  # Κρατάμε το index για τις νέες προβλέψεις

# Βρίσκουμε την τελευταία ημερομηνία στο index
last_date = df.index[-1]

# Δημιουργία ημερομηνιών για τις επόμενες 7 ημέρες
future_dates = pd.date_range(start=last_date + pd.Timedelta(days=1), periods=7, freq="D")

# Δημιουργία δεδομένων για τις επόμενες 7 ημέρες
for i in range(7):
    # Προσθήκη των lagged μεταβλητών για κάθε αριθμητική στήλη
    for col in df.select_dtypes(include=[np.number]).columns:
        for lag in [7, 14, 21]:  # Τα lags που χρησιμοποιήθηκαν στο αρχικό μοντέλο
            lagged_value_name = f"{col}_lag_{lag}"

            # Εισαγωγή της τελευταίας προϋπάρχουσας τιμής στο νέο row
            if lagged_value_name in df.columns:
                # Αναμένεται να πάρει τιμή από το τελευταίο observation
                if len(new_predictions) >= lag:  # Αρκεί το lag να έχει υπάρξει στις προηγούμενες προβλέψεις
                    latest_row[lagged_value_name] = new_predictions[-lag]
                else:
                    latest_row[lagged_value_name] = latest_row[col]  # Εναλλακτική: η πιο πρόσφατη τιμή

    # Πρόβλεψη χρησιμοποιώντας το εκπαιδευμένο μοντέλο
    prediction = model.predict(latest_row.drop(dependent_var).to_frame().T)
    # Χρησιμοποιούμε όλα τα χαρακτηριστικά εκτός της εξαρτημένης μεταβλητής
    new_predictions.append(prediction[0])  # Αποθηκεύουμε την πρόβλεψη

    # Προσθήκη της πρόβλεψης στη νέα γραμμή για χρήση στις επόμενες προβλέψεις
    latest_row[dependent_var] = prediction[0]

# Συνδυασμός ημερομηνιών και προβλέψεων σε ένα DataFrame
predictions_df = pd.DataFrame({
    "Date": future_dates,
    "Prediction": new_predictions
})

# Εμφάνιση των προβλέψεων με ημερομηνίες
print("Προβλέψεις για τις επόμενες 7 ημέρες:\n", predictions_df)

# <span style="color:yellow">Οπτικοποίηση Αποτελεσμάτων

In [None]:
# Δημιουργία του διαγράμματος
plt.figure(figsize=(12, 6))

# Προβολή των πραγματικών τιμών (y_train) στο διάγραμμα
plt.plot(y_train.values, label="Πραγματικές Τιμές (Training Set)", color="blue", linestyle="-")

# Προβολή των προβλέψεων του μοντέλου (y_train_pred) στο διάγραμμα
plt.plot(y_train_pred, label="Προβλέψεις (Training Set)", color="green", linestyle="-")

# Προσθήκη τίτλου και ετικετών
plt.title("Σύγκριση Πραγματικών Τιμών και Προβλέψεων (Training Set)", fontsize=14)
plt.xlabel("Αριθμός Παρατήρησης", fontsize=12)
plt.ylabel("Τιμή", fontsize=12)

# Προσθήκη υπομνήματος
plt.legend()

# Εμφάνιση πλέγματος
plt.grid(alpha=0.4)

# Εμφάνιση του διαγράμματος
plt.show()

In [None]:
# Δημιουργία του διαγράμματος
plt.figure(figsize=(12, 6))

# Προβολή των πραγματικών τιμών (y_test) στο διάγραμμα
plt.plot(y_test.values, label="Πραγματικές Τιμές", color="blue", linestyle="-")

# Προβολή των προβλέψεων του μοντέλου (y_pred) στο διάγραμμα
plt.plot(y_pred, label="Προβλέψεις", color="orange", linestyle="-")

# Προσθήκη τίτλου και ετικετών
plt.title("Σύγκριση Πραγματικών Τιμών και Προβλέψεων", fontsize=14)
plt.xlabel("Αριθμός Παρατήρησης", fontsize=12)
plt.ylabel("Τιμή", fontsize=12)

# Προσθήκη υπομνήματος
plt.legend()

# Εμφάνιση πλέγματος
plt.grid(alpha=0.4)

# Εμφάνιση του διαγράμματος
plt.show()

In [None]:
# Υπολογισμός των σφαλμάτων πρόβλεψης (Residuals) για το Training Set
residuals_train = y_train.values - y_train_pred

# Διάγραμμα Διασποράς για τα Σφάλματα Πρόβλεψης (Training Set)
plt.figure(figsize=(12, 6))

# Scatter Plot των Σφαλμάτων
plt.scatter(range(len(residuals_train)), residuals_train, color="purple", alpha=0.6,
            label="Σφάλματα Πρόβλεψης (Residuals - Training Set)")

# Χωριστή γραμμή για το μηδέν (Zero Line)
plt.axhline(y=0, color="red", linestyle="--", label="Μηδενική Γραμμή (Zero Line)")

# Προσθήκη τίτλου και ετικετών
plt.title("Διάγραμμα Σφαλμάτων Πρόβλεψης - Training Set", fontsize=14)
plt.xlabel("Αριθμός Παρατήρησης", fontsize=12)
plt.ylabel("Σφάλμα (Residual)", fontsize=12)

# Προσθήκη Υπομνήματος
plt.legend()

# Εμφάνιση πλέγματος
plt.grid(alpha=0.4)

# Εμφάνιση του Διαγράμματος
plt.show()

# Διάγραμμα Γραμμής για την Εξέλιξη των Σφαλμάτων (Training Set)
plt.figure(figsize=(12, 6))

# Line Plot για την Εξέλιξη των Σφαλμάτων
plt.plot(residuals_train, color="orange", label="Σφάλματα Πρόβλεψης (Residuals - Training Set)", linewidth=2)

# Χωριστή γραμμή για το μηδέν (Zero Line)
plt.axhline(y=0, color="red", linestyle="-", label="Μηδενική Γραμμή (Zero Line)")

# Προσθήκη τίτλου και ετικετών
plt.title("Χρονική Εξέλιξη Σφαλμάτων Πρόβλεψης - Training Set", fontsize=14)
plt.xlabel("Αριθμός Παρατήρησης", fontsize=12)
plt.ylabel("Σφάλμα (Residual)", fontsize=12)

# Προσθήκη Υπομνήματος
plt.legend()

# Εμφάνιση Πλέγματος
plt.grid(alpha=0.4)

# Εμφάνιση του Διαγράμματος
plt.show()

In [None]:
# Υπολογισμός των σφαλμάτων πρόβλεψης (Residuals)
residuals = y_test.values - y_pred

# Διάγραμμα Διασποράς για τα Σφάλματα Πρόβλεψης
plt.figure(figsize=(12, 6))

# Scatter Plot των Σφάλμάτων
plt.scatter(range(len(residuals)), residuals, color="purple", alpha=0.6, label="Σφάλματα Πρόβλεψης (Residuals)")

# Χωριστή γραμμή για το μηδέν (Zero Line)
plt.axhline(y=0, color="red", linestyle="--", label="Μηδενική Γραμμή (Zero Line)")

# Προσθήκη τίτλου και ετικετών
plt.title("Διάγραμμα Σφαλμάτων Πρόβλεψης (Residuals) - AR Model", fontsize=14)
plt.xlabel("Αριθμός Παρατήρησης", fontsize=12)
plt.ylabel("Σφάλμα (Residual)", fontsize=12)

# Προσθήκη Υπομνήματος
plt.legend()

# Εμφάνιση πλέγματος
plt.grid(alpha=0.4)

# Εμφάνιση του Διαγράμματος
plt.show()

# Διάγραμμα Γραμμής για την Εξέλιξη των Σφαλμάτων
plt.figure(figsize=(12, 6))

# Line Plot για την Εξέλιξη των Σφαλμάτων
plt.plot(residuals, color="orange", label="Σφάλματα Πρόβλεψης (Residuals)", linewidth=2)

# Χωριστή γραμμή για το μηδέν (Zero Line)
plt.axhline(y=0, color="red", linestyle="--", label="Μηδενική Γραμμή (Zero Line)")

# Προσθήκη τίτλου και ετικετών
plt.title("Χρονική Εξέλιξη Σφαλμάτων Πρόβλεψης - AR Model", fontsize=14)
plt.xlabel("Αριθμός Παρατήρησης", fontsize=12)
plt.ylabel("Σφάλμα (Residual)", fontsize=12)

# Προσθήκη Υπομνήματος
plt.legend()

# Εμφάνιση Πλέγματος
plt.grid(alpha=0.4)

# Εμφάνιση του Διαγράμματος
plt.show()

In [None]:
# Φιλτράρισμα του Test Set για δεδομένα από το 2023-11-01 και μετά
test_data_filtered = test_data[test_data.index >= "2023-11-01"]

# Φιλτράρισμα των Προβλέψεων για αυτές τις ημερομηνίες
predictions_filtered = predictions_df[predictions_df['Date'] >= "2023-11-01"].set_index('Date')

# Δημιουργία ενιαίου DataFrame για Παρατηρήσεις και Προβλέψεις
# Αντιγραφή δεδομένων Test Set και προσθήκη Προβλέψεων στις κατάλληλες θέσεις
test_data_with_predictions = test_data_filtered.copy()
for date, value in predictions_filtered['Prediction'].items():  # Χρήση της items() αντί για iteritems()
    test_data_with_predictions.loc[date] = value


# Ταξινόμηση δεδομένων με βάση την ημερομηνία
test_data_with_predictions.sort_index(inplace=True)

# Διάγραμμα: Ενιαία μπλε γραμμή και Προβλέψεις με Bullets
plt.figure(figsize=(16, 8))

# Ενιαία Γραμμή για Παρατηρήσεις και Προβλέψεις
plt.plot(test_data_with_predictions.index, test_data_with_predictions[dependent_var],
         linestyle='-', color="blue", linewidth=2, label="Παρατηρήσεις και Προβλέψεις")

# Bullets για τις Προβλέψεις - Τοποθετούνται πάνω στη μπλε γραμμή
plt.scatter(predictions_filtered.index, predictions_filtered['Prediction'],
            color="orange", label="Προβλέψεις (Bullets)", s=80, zorder=3)

# Προσθήκη τίτλων, υπόμνημα και αξόνων
plt.title("Ενιαία Γραμμή Παρατηρήσεων και Προβλέψεων", fontsize=18, fontweight='bold')
plt.xlabel("Ημερομηνία", fontsize=15)
plt.ylabel("Τιμή", fontsize=15)
plt.xticks(rotation=45, fontsize=12)
plt.yticks(fontsize=12)
plt.grid(True, linestyle='--', alpha=0.6)
plt.legend(fontsize=14, loc="upper left")

# Βελτιστοποίηση διάταξης
plt.tight_layout()

# Εμφάνιση διαγράμματος
plt.show()

In [None]:
# Διάγραμμα Προβλέψεων
plt.figure(figsize=(10, 6))
plt.plot(predictions_df['Date'], predictions_df['Prediction'], marker='o', label="Προβλέψεις για τις επόμενες 7 ημέρες",
         linestyle='-')

# Προσθήκη τίτλων, ετικετών και υπόμνημα
plt.title("Προβλέψεις για τις επόμενες 7 ημέρες", fontsize=16)
plt.xlabel("Ημερομηνία", fontsize=14)
plt.ylabel("Πρόβλεψη", fontsize=14)
plt.xticks(rotation=45)
plt.grid(True)
plt.legend()
plt.show()

In [None]:
# Επιλέγουμε τα δεδομένα μόνο για τις τελευταίες 7 παρατηρήσεις
actual_last_7 = y_test.values[-7:]  # Οι πραγματικές τιμές για τις τελευταίες 7 ημέρες
predicted_last_7 = y_pred[-7:]  # Οι προβλέψεις για τις τελευταίες 7 ημέρες

# Δημιουργία διαγράμματος
plt.figure(figsize=(10, 6))

# Οπτικοποίηση των πραγματικών τιμών (τελευταίες 7 ημέρες)
plt.plot(range(1, 8), actual_last_7, label='Πραγματικές Τιμές', color='blue', linestyle='-', marker='o', linewidth=2)

# Οπτικοποίηση των προβλέψεων (τελευταίες 7 ημέρες)
plt.plot(range(1, 8), predicted_last_7, label='Προβλέψεις', color='red', linestyle='--', marker='x', linewidth=2)

# Προσθήκη τίτλου και ετικετών
plt.title('Σύγκριση Προβλέψεων με Πραγματικές Τιμές - Τελευταίες 7 Ημέρες', fontsize=14)
plt.xlabel('Ημέρα', fontsize=12)
plt.xticks(range(1, 8), labels=[f'Ημέρα {i}' for i in range(1, 8)])  # Ονόματα για τις τελευταίες 7 ημέρες
plt.ylabel('Μεταβλητότητα', fontsize=12)

# Προσθήκη πλέγματος
plt.grid(alpha=0.4)

# Προσθήκη υπομνήματος
plt.legend(fontsize=12)

# Εμφάνιση του διαγράμματος
plt.show()