In [5]:
%%writefile main_app.py

import streamlit as st
import streamlit.components.v1 as components
from utils.data_loader import load_data
from models.ar_model import run_ar_model
from models.ma_model import run_ma_model
from models.arima_model import run_arima_model
from models.sarima_model import run_sarima_model
from models.var_model import run_var_model
from models.naive_model import run_naive_forecast
from models.xgboost_model import run_xgboost_model
from models.random_forest_model import run_random_forest_model
# from models.lstm_model import run_LSTM_model




data = load_data()

st.title("📈 Apple Stock Forecasting App")
model_option = st.sidebar.radio("Model Type:", ["Naive Forecasting", "AR", "MA", "ARIMA", "SARIMA", "VAR","XGBoost","Random Forest","LSTM"])

def load_html(file_path):
    with open(file_path, 'r', encoding='utf-8') as f:
        return f.read()

if model_option == "Naive Forecasting":
    tab1, tab2 = st.tabs(["🔮 Prediction", "📘 Method Explanation"])
    with tab1:
        df_forecast = run_naive_forecast(data)
        st.line_chart(df_forecast.tail(100))
    with tab2:
        components.html(load_html("explanations_html/naive.html"), height=600, scrolling=True)

elif model_option == "AR":
    tab1, tab2 = st.tabs(["🔮 Prediction", "📘 Method Explanation"])
    with tab1:
        df_forecast = run_ar_model(data)
        st.line_chart(df_forecast.tail(100))
    with tab2:
        components.html(load_html("explanations_html/ar.html"), height=600, scrolling=True)
        
elif model_option == "MA":
    tab1, tab2 = st.tabs(["🔮 Prediction", "📘 Method Explanation"])
    with tab1:
        df_forecast = run_ma_model(data)
        st.line_chart(df_forecast.tail(100))
    with tab2:
        components.html(load_html("explanations_html/ma.html"), height=600, scrolling=True)


elif model_option == "ARIMA":
    tab1, tab2 = st.tabs(["🔮 Prediction", "📘 Method Explanation"])
    with tab1:
        df_forecast = run_arima_model(data)
        st.line_chart(df_forecast.tail(100))
    with tab2:
        components.html(load_html("explanations_html/arima.html"), height=600, scrolling=True)

elif model_option == "SARIMA":
    tab1, tab2 = st.tabs(["🔮 Prediction", "📘 Method Explanation"])
    with tab1:
        df_forecast = run_sarima_model(data)
        st.line_chart(df_forecast.tail(100))
    with tab2:
        components.html(load_html("explanations_html/sarima.html"), height=600, scrolling=True)

elif model_option == "VAR":
    tab1, tab2 = st.tabs(["🔮 Prediction", "📘 Method Explanation"])
    with tab1:
        df_forecast = run_var_model(data)
        st.line_chart(df_forecast.tail(100))
    with tab2:
        components.html(load_html("explanations_html/var.html"), height=600, scrolling=True)


elif model_option == "XGBoost":
    tab1, tab2, tab3 = st.tabs(["🔮 Prediction", "📊 Model Performance", "📘 Method Explanation"])

    with tab1:
        model, df_forecast, metrics = run_xgboost_model(data)
        st.line_chart(df_forecast[["Close", "XGB_Forecast"]])

    with tab2:
        st.metric("RMSE", f"{metrics['RMSE']:.4f}")
        st.metric("MAE", f"{metrics['MAE']:.4f}")
        st.metric("MAPE (%)", f"{metrics['MAPE']:.2f}%")

    with tab3:
        components.html(load_html("explanations_html/xgboost.html"), height=600, scrolling=True)


elif model_option == "Random Forest":
    tab1, tab2, tab3 = st.tabs(["🔮 Prediction", "📊 Model Performance", "📘 Method Explanation"])
    with tab1:
        model, df_forecast, metrics = run_random_forest_model(data)
        st.line_chart(df_forecast[["Close", "RF_Forecast"]])

    with tab2:
        st.metric("RMSE", f"{metrics['RMSE']:.4f}")
        st.metric("MAE", f"{metrics['MAE']:.4f}")
        st.metric("MAPE (%)", f"{metrics['MAPE']:.2f}%")
        
    with tab3:
        components.html(load_html("explanations_html/random_forest.html"), height=600, scrolling=True)

# elif model_option == "LSTM":
#     tab1, tab2, tab3 = st.tabs(["🔮 Prediction", "📊 Model Performance", "📘 Method Explanation"])
#     with tab1:
#         model, df_forecast, metrics = run_LSTM_model(data)
#         st.line_chart(df_forecast[["Close", "RF_Forecast"]])

#     with tab2:
#         st.metric("RMSE", f"{metrics['RMSE']:.4f}")
#         st.metric("MAE", f"{metrics['MAE']:.4f}")
#         st.metric("MAPE (%)", f"{metrics['MAPE']:.2f}%")
        
#     with tab3:
#         components.html(load_html("explanations_html/lstm.html"), height=600, scrolling=True)




# elif model_option == "XGBoost":
#     tab1, tab2, tab3 = st.tabs(["🔮 Prediction", "📊 Model Performance", "📘 Method Explanation"])

#     with tab1:
#         with st.spinner("Training / predicting XGBoost..."):
#             df_forecast, metrics, model = run_xgboost_model(data, n_lags=8)
#         # show last 100 points: actual Close and predicted price (predictions will appear only for test tail)
#         plot_df = df_forecast[['Close', 'XGB_Pred_Price']].tail(200).reset_index(drop=True)
#         st.line_chart(plot_df)

#     with tab2:
#         st.write("Model performance on test set")
#         st.metric("RMSE", f"{metrics['RMSE']:.4f}")
#         st.metric("MAE", f"{metrics['MAE']:.4f}")
#         st.metric("MAPE (%)", f"{metrics['MAPE']:.2f}%")
#         st.write(f"Train / Val / Test sizes: {metrics['n_train']} / {metrics['n_val']} / {metrics['n_test']}")

#     with tab3:
#         components.html(load_html("explanations_html/xgboost.html"), height=600, scrolling=True)



Overwriting main_app.py


In [7]:
!streamlit run main_app.py

^C


In [7]:
import os
os.mkdir('utils')

In [9]:
%%writefile utils/data_loader.py

import yfinance as yf
import pandas as pd
import streamlit as st

@st.cache_data
def load_data():
    df = yf.download("AAPL", start="2010-01-01", end="2024-12-31", auto_adjust=True)
    df = df[["Close", "Open", "High", "Low"]].dropna()
    df.columns = ["Close", "Open", "High", "Low"]
    return df


Writing utils/data_loader.py


In [11]:
os.mkdir('models')

In [21]:
%%writefile models/naive_model.py

def run_naive_forecast(data):
    data["naive_forecast"] = data["Close"].shift(1)
    return data


Writing models/naive_model.py


In [1]:
%%writefile models/ar_model.py

from statsmodels.tsa.ar_model import AutoReg

def run_ar_model(data):
    model = AutoReg(data['Close'], lags=1).fit()
    prediction = model.predict(start=len(data), end=len(data))
    data['AR Forecast'] = prediction
    return data


Overwriting models/ar_model.py


In [19]:
%%writefile models/ma_model.py
import pandas as pd

def run_ma_model(data, window=3):
    """
    Moving Average Forecast
    window: number of past observations to average
    """
    data["MA Forecast"] = data["Close"].rolling(window=window).mean().shift(1)
    return data


Overwriting models/ma_model.py


In [5]:
%%writefile models/arima_model.py
from statsmodels.tsa.arima.model import ARIMA

def run_arima_model(data, order=(5, 1, 0)):
    """
    ARIMA model forecast
    order: (p, d, q)
    """
    model = ARIMA(data['Close'], order=order)
    model_fit = model.fit()
    prediction = model_fit.predict(start=len(data), end=len(data))
    data["ARIMA Forecast"] = prediction
    return data


Overwriting models/arima_model.py


In [7]:
%%writefile models/sarima_model.py
from statsmodels.tsa.statespace.sarimax import SARIMAX

def run_sarima_model(data, order=(1, 1, 1), seasonal_order=(1, 1, 1, 12)):
    """
    SARIMA model forecast
    order: (p, d, q)
    seasonal_order: (P, D, Q, s) where s is seasonal period
    """
    model = SARIMAX(data['Close'], order=order, seasonal_order=seasonal_order)
    model_fit = model.fit(disp=False)
    prediction = model_fit.predict(start=len(data), end=len(data))
    data["SARIMA Forecast"] = prediction
    return data


Overwriting models/sarima_model.py


In [66]:
%%writefile models/var_model.py
from statsmodels.tsa.api import VAR
import pandas as pd

def run_var_model(data, lags=1):
    """
    VAR model forecast
    Requires multiple time series columns (e.g., Close, Volume, etc.)
    """
    # Fit the model
    model = VAR(data)
    model_fit = model.fit(lags)

    # Get the last 'lags' observations for forecasting
    last_obs = data.values[-lags:]

    # Forecast next step
    prediction = model_fit.forecast(last_obs, steps=1)

    # Create forecast DataFrame
    forecast_df = pd.DataFrame(prediction, columns=[col + "_VAR_Forecast" for col in data.columns])

    # Append forecast row to original data
    result_df = pd.concat([data, forecast_df], ignore_index=True)

    return result_df


Overwriting models/var_model.py


In [7]:
%%writefile models/xgboost_model.py
import pandas as pd
import numpy as np
from xgboost import XGBRegressor
from sklearn.metrics import mean_squared_error, mean_absolute_error
import yfinance as yf
import streamlit as st
import plotly.express as px


def create_lag_features(df, target_col="Close", n_lags=5):
    """
    Create lag features for time series forecasting.
    """
    for lag in range(1, n_lags + 1):
        df[f"lag_{lag}"] = df[target_col].shift(lag)
    return df.dropna()


def run_xgboost_model(df, target_col="Close", n_lags=5, train_ratio=0.8):
    """
    Train XGBoost model on lag features.
    """
    # Create lag features
    df = create_lag_features(df, target_col, n_lags)

    # Split train/test
    train_size = int(len(df) * train_ratio)
    train_df, test_df = df.iloc[:train_size], df.iloc[train_size:]

    X_train, y_train = train_df.drop(columns=[target_col]), train_df[target_col]
    X_test, y_test = test_df.drop(columns=[target_col]), test_df[target_col]

    # Train model
    model = XGBRegressor(n_estimators=100, learning_rate=0.1, random_state=42)
    model.fit(X_train, y_train)

    # Predictions
    test_df = X_test.copy()
    test_df["XGB_Forecast"] = model.predict(X_test)
    test_df[target_col] = y_test

    # Metrics
    rmse = np.sqrt(mean_squared_error(test_df[target_col], test_df["XGB_Forecast"]))
    mae = mean_absolute_error(test_df[target_col], test_df["XGB_Forecast"])
    mape = np.mean(np.abs((test_df[target_col] - test_df["XGB_Forecast"]) / test_df[target_col])) * 100

    metrics = {"RMSE": rmse, "MAE": mae, "MAPE": mape}

    return model, test_df, metrics


def plot_forecast(test_df, target_col="Close"):
    """
    Plot actual vs forecasted values.
    """
    fig = px.line(test_df[[target_col, "XGB_Forecast"]], 
                  labels={"value": "Price", "index": "Time"}, 
                  title="XGBoost Time Series Forecast")
    return fig

Overwriting models/xgboost_model.py


In [132]:
# %%writefile models/xgboost_model.py
# import pandas as pd
# import numpy as np
# from xgboost import XGBRegressor
# from sklearn.metrics import mean_squared_error, mean_absolute_error

# def run_xgboost_model(data, n_lags=5):
#     """
#     توقع سعر السهم باستخدام XGBoost وحساب مقاييس الأداء.
#     n_lags: عدد الأيام السابقة لاستخدامها كـ features.
#     """
#     df = data.copy()

#     # إنشاء الـ lag features
#     for lag in range(1, n_lags+1):
#         df[f"lag_{lag}"] = df["Close"].shift(lag)

#     df = df.dropna().reset_index(drop=True)

#     # تقسيم بيانات التدريب والاختبار
#     train_size = int(len(df) * 0.8)
#     train_df, test_df = df.iloc[:train_size], df.iloc[train_size:]

#     X_train, y_train = train_df.drop(columns=["Close"]), train_df["Close"]
#     X_test, y_test = test_df.drop(columns=["Close"]), test_df["Close"]

#     # تدريب الموديل
#     model = XGBRegressor(n_estimators=100, learning_rate=0.1, random_state=42)
#     model.fit(X_train, y_train)

#     # التنبؤ بالقيم
#     df["XGB_Forecast"] = np.nan
#     df.loc[test_df.index, "XGB_Forecast"] = model.predict(X_test)

#     # حساب المقاييس
#     rmse = np.sqrt(mean_squared_error(y_test, df.loc[test_df.index, "XGB_Forecast"]))
#     mae = mean_absolute_error(y_test, df.loc[test_df.index, "XGB_Forecast"])
#     mape = np.mean(np.abs((y_test - df.loc[test_df.index, "XGB_Forecast"]) / y_test)) * 100

#     metrics = {
#         "RMSE": rmse,
#         "MAE": mae,
#         "MAPE": mape
#     }

#     return df, metrics


Overwriting models/xgboost_model.py


In [106]:
# %%writefile models/xgboost_model.py
# """
# Improved XGBoost pipeline for time-series (stock) forecasting.

# - Creates lag features, moving averages, RSI, MACD, time features.
# - Targets the daily return (pct change) instead of raw price.
# - Uses a time-ordered train/validation/test split.
# - Trains XGBoost with early stopping on a validation slice.
# - Converts predicted returns back to price using previous close.
# - Returns an extended DataFrame (with predictions) and metrics dict and trained model.

# Usage:
#     df_out, metrics, model = run_xgboost_model(df, n_lags=5)
#     # df must contain a 'Close' column and be ordered by time (oldest -> newest)
# """
# import numpy as np
# import pandas as pd
# from xgboost import XGBRegressor
# from sklearn.metrics import mean_squared_error, mean_absolute_error

# def _rsi(series: pd.Series, period: int = 14) -> pd.Series:
#     delta = series.diff()
#     gain = delta.clip(lower=0).fillna(0)
#     loss = -delta.clip(upper=0).fillna(0)
#     avg_gain = gain.rolling(window=period, min_periods=period).mean()
#     avg_loss = loss.rolling(window=period, min_periods=period).mean()
#     rs = avg_gain / (avg_loss + 1e-12)
#     rsi = 100 - (100 / (1 + rs))
#     return rsi

# def _macd(series: pd.Series, fast: int = 12, slow: int = 26, signal: int = 9):
#     ema_fast = series.ewm(span=fast, adjust=False).mean()
#     ema_slow = series.ewm(span=slow, adjust=False).mean()
#     macd_line = ema_fast - ema_slow
#     signal_line = macd_line.ewm(span=signal, adjust=False).mean()
#     hist = macd_line - signal_line
#     return macd_line, signal_line, hist

# def run_xgboost_model(data: pd.DataFrame,
#                       n_lags: int = 5,
#                       test_size_ratio: float = 0.2,
#                       val_size_ratio_within_train: float = 0.1,
#                       random_state: int = 42):
#     """
#     Parameters
#     ----------
#     data : pd.DataFrame
#         Input dataframe with at least a 'Close' column, ordered oldest -> newest.
#     n_lags : int
#         Number of lag features to create (lag_1 ... lag_n).
#     test_size_ratio : float
#         Fraction of total data reserved for test (time-ordered).
#     val_size_ratio_within_train : float
#         Fraction of the train-part reserved for early-stopping validation.
#     Returns
#     -------
#     df_result : pd.DataFrame
#         Original dataframe plus columns:
#           - return (target)
#           - close_prev (previous day's close)
#           - feature columns...
#           - XGB_Return_Pred (predicted return for test rows)
#           - XGB_Pred_Price (predicted price for test rows)
#     metrics : dict
#         RMSE, MAE, MAPE computed on the test set comparing predicted price vs actual Close.
#     model : trained XGBRegressor
#         The fitted model (useful if you want feature importances).
#     """
#     df = data.copy().reset_index(drop=True)  # keep integer positions
#     if 'Close' not in df.columns:
#         raise ValueError("Input DataFrame must contain a 'Close' column.")

#     # 1) Target: return (pct change)
#     df['return'] = df['Close'].pct_change()

#     # 2) previous close for reconstructing price later
#     df['close_prev'] = df['Close'].shift(1)

#     # 3) Lag features of Close (these are absolute price lags)
#     for lag in range(1, n_lags + 1):
#         df[f'lag_close_{lag}'] = df['Close'].shift(lag)

#     # 4) Moving averages
#     df['MA_7'] = df['Close'].rolling(window=7).mean()
#     df['MA_14'] = df['Close'].rolling(window=14).mean()
#     df['MA_30'] = df['Close'].rolling(window=30).mean()

#     # 5) RSI (14)
#     df['RSI_14'] = _rsi(df['Close'], period=14)

#     # 6) MACD
#     macd_line, signal_line, macd_hist = _macd(df['Close'])
#     df['MACD'] = macd_line
#     df['MACD_signal'] = signal_line
#     df['MACD_hist'] = macd_hist

#     # 7) Time features
#     if np.issubdtype(df.index.dtype, np.datetime64) or 'Date' in data.columns:
#         # try to use datetime index or Date column if present
#         try:
#             if 'Date' in data.columns:
#                 df['__dt'] = pd.to_datetime(data['Date']).reset_index(drop=True)
#             else:
#                 df['__dt'] = pd.to_datetime(data.index)
#             df['dayofweek'] = df['__dt'].dt.dayofweek
#             df['month'] = df['__dt'].dt.month
#             df.drop(columns=['__dt'], inplace=True)
#         except Exception:
#             # fallback numeric index features
#             df['dayofweek'] = 0
#             df['month'] = 0
#     else:
#         df['dayofweek'] = 0
#         df['month'] = 0

#     # 8) Keep order, drop rows with NaNs introduced by shifting/rolling
#     df_features = df.dropna().reset_index(drop=True)

#     # If dataset becomes too small, raise
#     if len(df_features) < 10:
#         raise ValueError("Not enough rows after feature engineering. Provide more data or reduce feature windows.")

#     # Feature columns (exclude 'Close', 'return', 'close_prev' which are special)
#     feature_cols = [c for c in df_features.columns
#                     if c not in ('Close', 'return', 'close_prev')]

#     # 9) Train/Validation/Test split (time-series safe)
#     n_total = len(df_features)
#     n_test = int(np.ceil(n_total * test_size_ratio))
#     n_train_total = n_total - n_test

#     # within the train_total, reserve a small tail for validation for early stopping
#     n_val = int(np.ceil(n_train_total * val_size_ratio_within_train))
#     n_train = n_train_total - n_val

#     train_df = df_features.iloc[:n_train]
#     val_df = df_features.iloc[n_train:n_train + n_val]
#     test_df = df_features.iloc[n_train + n_val:]

#     X_train = train_df[feature_cols]
#     y_train = train_df['return']
#     X_val = val_df[feature_cols]
#     y_val = val_df['return']
#     X_test = test_df[feature_cols]
#     y_test = test_df['return']

#     # 10) Model: XGBoost with early stopping
#     model = XGBRegressor(
#         n_estimators=1000,
#         learning_rate=0.05,
#         max_depth=4,
#         subsample=0.8,
#         colsample_bytree=0.8,
#         random_state=random_state,
#         verbosity=0
#     )

#     model.fit(
#         X_train, y_train,
#         eval_set=[(X_val, y_val)],
#         early_stopping_rounds=50,
#         verbose=False
#     )

#     # 11) Predict returns on test set
#     y_pred_return = model.predict(X_test)

#     # 12) Convert predicted return -> predicted price using close_prev column
#     # close_prev exists in test_df
#     test_df = test_df.copy().reset_index(drop=True)
#     test_df['XGB_Return_Pred'] = y_pred_return
#     # predicted price = close_prev * (1 + pred_return)
#     test_df['XGB_Pred_Price'] = test_df['close_prev'] * (1 + test_df['XGB_Return_Pred'])

#     # 13) For convenience, create an output DataFrame aligned with original df_features
#     df_out = df_features.copy().reset_index(drop=True)
#     # initialize prediction columns with NaN
#     df_out['XGB_Return_Pred'] = np.nan
#     df_out['XGB_Pred_Price'] = np.nan
#     # put predictions back in the df_out tail (matching test_df positions)
#     test_pos_start = n_train + n_val
#     df_out.loc[test_pos_start:test_pos_start + len(test_df) - 1, 'XGB_Return_Pred'] = test_df['XGB_Return_Pred'].values
#     df_out.loc[test_pos_start:test_pos_start + len(test_df) - 1, 'XGB_Pred_Price'] = test_df['XGB_Pred_Price'].values

#     # 14) Compute metrics on price level (compare predicted prices vs actual Close in test_df)
#     actual_prices = test_df['Close'].values
#     pred_prices = test_df['XGB_Pred_Price'].values

#     # guard against degenerate cases
#     if len(actual_prices) == 0:
#         raise ValueError("No test observations to evaluate. Check your split ratios and data length.")

#     rmse = np.sqrt(mean_squared_error(actual_prices, pred_prices))
#     mae = mean_absolute_error(actual_prices, pred_prices)
#     # MAPE: avoid division by zero
#     mape = np.mean(np.abs((actual_prices - pred_prices) / (actual_prices + 1e-12))) * 100

#     metrics = {
#         'RMSE': float(rmse),
#         'MAE': float(mae),
#         'MAPE': float(mape),
#         'n_test': int(len(test_df)),
#         'n_train': int(len(train_df)),
#         'n_val': int(len(val_df))
#     }

#     return df_out, metrics, model


Overwriting models/xgboost_model.py


In [19]:
%%writefile models/random_forest_model.py
import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, mean_absolute_error
import yfinance as yf
import streamlit as st
import plotly.express as px


def create_lag_features(df, target_col="Close", n_lags=5):
    """
    Create lag features for time series forecasting.
    """
    for lag in range(1, n_lags + 1):
        df[f"lag_{lag}"] = df[target_col].shift(lag)
    return df.dropna()


def run_random_forest_model(df, target_col="Close", n_lags=5, train_ratio=0.8):
    """
    Train Random Forest model on lag features.
    """
    # Create lag features
    df = create_lag_features(df, target_col, n_lags)

    # Split train/test
    train_size = int(len(df) * train_ratio)
    train_df, test_df = df.iloc[:train_size], df.iloc[train_size:]

    X_train, y_train = train_df.drop(columns=[target_col]), train_df[target_col]
    X_test, y_test = test_df.drop(columns=[target_col]), test_df[target_col]

    # Train model
    model = RandomForestRegressor(
        n_estimators=200, 
        max_depth=10, 
        random_state=42, 
        n_jobs=-1
    )
    model.fit(X_train, y_train)

    # Predictions
    test_df = X_test.copy()
    test_df["RF_Forecast"] = model.predict(X_test)
    test_df[target_col] = y_test

    # Metrics
    rmse = np.sqrt(mean_squared_error(test_df[target_col], test_df["RF_Forecast"]))
    mae = mean_absolute_error(test_df[target_col], test_df["RF_Forecast"])
    mape = np.mean(np.abs((test_df[target_col] - test_df["RF_Forecast"]) / test_df[target_col])) * 100

    metrics = {"RMSE": rmse, "MAE": mae, "MAPE": mape}

    return model, test_df, metrics


def plot_forecast(test_df, target_col="Close"):
    """
    Plot actual vs forecasted values.
    """
    fig = px.line(
        test_df[[target_col, "RF_Forecast"]], 
        labels={"value": "Price", "index": "Time"}, 
        title="Random Forest Time Series Forecast"
    )
    return fig


# # ========== Streamlit App ========== #
# def run_app():
#     st.title("🌲 Random Forest Time Series Forecasting")

#     ticker = st.text_input("Enter Stock Ticker:", "AAPL")
#     period = st.selectbox("Select Period", ["1y", "2y", "5y"], index=0)
#     n_lags = st.slider("Number of Lag Features", 1, 20, 5)

#     if st.button("Run Forecast"):
#         # Download Data
#         df = yf.download(ticker, period=period)
#         df = df[["Close"]]

#         # Train model
#         model, test_df, metrics = run_random_forest_model(df, target_col="Close", n_lags=n_lags)

#         # Show Metrics
#         st.subheader("📊 Model Evaluation Metrics")
#         st.write(f"**RMSE:** {metrics['RMSE']:.4f}")
#         st.write(f"**MAE:** {metrics['MAE']:.4f}")
#         st.write(f"**MAPE:** {metrics['MAPE']:.2f}%")

#         # Plot Forecast
#         fig = plot_forecast(test_df, target_col="Close")
#         st.plotly_chart(fig)


# if __name__ == "__main__":
#     run_app()


Overwriting models/random_forest_model.py


In [162]:
# %%writefile models/random_forest_model.py

# from sklearn.ensemble import RandomForestRegressor
# from sklearn.metrics import mean_squared_error, mean_absolute_error
# import pandas as pd
# import numpy as np

# def run_random_forest_model(data, n_lags=5):
#     df = data.copy()

#     # إنشاء الأعمدة المتأخرة (Lags)
#     for lag in range(1, n_lags + 1):
#         df[f"lag_{lag}"] = df["Close"].shift(lag)

#     # حذف الصفوف التي تحتوي NaN بسبب الـ lags
#     df = df.dropna()

#     # تقسيم البيانات إلى ميزات وهدف
#     X = df[[f"lag_{lag}" for lag in range(1, n_lags + 1)]]
#     y = df["Close"]

#     # تقسيم Train/Test مع الحفاظ على الترتيب الزمني
#     split = int(len(df) * 0.8)
#     X_train, X_test = X[:split], X[split:]
#     y_train, y_test = y[:split], y[split:]

#     # تدريب النموذج
#     model = RandomForestRegressor(
#         n_estimators=200,
#         random_state=42
#     )
#     model.fit(X_train, y_train)

#     # التنبؤ
#     predictions = model.predict(X)

#     # حساب المقاييس على Test فقط
#     y_pred_test = model.predict(X_test)
#     rmse = np.sqrt(mean_squared_error(y_test, y_pred_test))
#     mae = mean_absolute_error(y_test, y_pred_test)
#     mape = np.mean(np.abs((y_test - y_pred_test) / y_test)) * 100

#     # إضافة التوقعات للـ DataFrame الأصلي
#     data["RF Forecast"] = np.nan
#     data.loc[df.index, "RF Forecast"] = predictions

#     return data, {"RMSE": rmse, "MAE": mae, "MAPE": mape}


Overwriting models/random_forest_model.py


In [5]:
%%writefile models/lstm_model.py

import numpy as np
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout
from sklearn.metrics import mean_squared_error, mean_absolute_error
import yfinance as yf

# ------------------------------
# LSTM Module
# ------------------------------
class LSTMModel:
    def __init__(self, look_back=10, epochs=50, batch_size=32):
        self.look_back = look_back
        self.epochs = epochs
        self.batch_size = batch_size
        self.scaler = MinMaxScaler()
        self.model = None

    def create_sequences(self, data):
        """ تحويل البيانات إلى تسلسلات مناسبة للـ LSTM """
        X, y = [], []
        for i in range(len(data) - self.look_back):
            X.append(data[i:(i + self.look_back)])
            y.append(data[i + self.look_back])
        return np.array(X), np.array(y)

    def fit(self, df, target_col="Close"):
        """ تدريب الموديل على البيانات """
        values = df[target_col].values.reshape(-1, 1)
        scaled = self.scaler.fit_transform(values)

        X, y = self.create_sequences(scaled)

        # reshape [samples, timesteps, features]
        X = X.reshape((X.shape[0], X.shape[1], 1))

        # بناء الموديل
        self.model = Sequential()
        self.model.add(LSTM(50, return_sequences=True, input_shape=(self.look_back, 1)))
        self.model.add(Dropout(0.2))
        self.model.add(LSTM(50))
        self.model.add(Dropout(0.2))
        self.model.add(Dense(1))

        self.model.compile(optimizer="adam", loss="mse")

        self.model.fit(X, y, epochs=self.epochs, batch_size=self.batch_size, verbose=1)

    def predict(self, df, target_col="Close"):
        """ التنبؤ بالقيم القادمة """
        values = df[target_col].values.reshape(-1, 1)
        scaled = self.scaler.transform(values)

        X, y = self.create_sequences(scaled)
        X = X.reshape((X.shape[0], X.shape[1], 1))

        predictions = self.model.predict(X)
        predictions = self.scaler.inverse_transform(predictions)

        # حساب المقاييس
        y_true = self.scaler.inverse_transform(y.reshape(-1, 1))

        rmse = np.sqrt(mean_squared_error(y_true, predictions))
        mae = mean_absolute_error(y_true, predictions)
        mape = np.mean(np.abs((y_true - predictions) / y_true)) * 100

        metrics = {
            "RMSE": rmse,
            "MAE": mae,
            "MAPE": mape
        }

        # تجهيز test dataset
        test_df = df.iloc[self.look_back:].copy()
        test_df["LSTM_Prediction"] = predictions

        return test_df, metrics



# ------------------------------
# دالة التشغيل الرئيسية لاستخدامها في Streamlit
# ------------------------------
def run_LSTM_model(df):
    lstm = LSTMModel(look_back=20, epochs=30, batch_size=16)
    lstm.fit(df, target_col="Close")
    test_df, metrics = lstm.predict(df, target_col="Close")
    return test_df, metrics


Overwriting models/lstm_model.py


In [25]:
os.mkdir('explanations_html')

In [35]:
%%writefile explanations_html/ar.html
<!DOCTYPE html>
<html lang="ar" dir="rtl">
<head>
  <meta charset="UTF-8" />
  <meta name="viewport" content="width=device-width, initial-scale=1" />
  <title>النموذج الانحداري الذاتي AR(p)</title>

  <!-- Optional: MathJax for nice equations (requires internet) -->
  <script>
    window.MathJax = {
      tex: { inlineMath: [['$', '$'], ['\\(', '\\)']] },
      svg: { fontCache: 'global' }
    };
  </script>
  <script defer src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-svg.js"></script>

  <style>
    :root {
      --bg: #0f172a;       /* slate-900 */
      --card: #111827;     /* gray-900 */
      --muted: #94a3b8;    /* slate-400 */
      --text: #e5e7eb;     /* gray-200 */
      --accent: #38bdf8;   /* sky-400 */
      --chip: #1f2937;     /* gray-800 */
      --border: #1f2937;
    }
    html, body {
      margin: 0; padding: 0; background: var(--bg); color: var(--text);
      font-family: system-ui, -apple-system, "Segoe UI", Roboto, "Noto Kufi Arabic", "Noto Sans Arabic", Tahoma, Arial, sans-serif;
      line-height: 1.8;
    }
    .container {
      max-width: 920px; margin: 24px auto; padding: 16px;
    }
    .card {
      background: var(--card); border: 1px solid var(--border);
      border-radius: 16px; padding: 22px; box-shadow: 0 10px 20px rgba(0,0,0,.25);
    }
    h1, h2 {
      margin: 0 0 12px; line-height: 1.3;
    }
    h1 { font-size: 28px; }
    h2 { font-size: 20px; color: var(--accent); }
    p { margin: 0 0 10px; color: var(--text); }
    .muted { color: var(--muted); }
    .badge {
      display: inline-block; background: var(--chip); border: 1px solid var(--border);
      padding: 6px 10px; border-radius: 999px; font-size: 12px; margin-left: 6px;
    }
    .grid {
      display: grid; gap: 16px;
      grid-template-columns: repeat(auto-fit, minmax(260px, 1fr));
      margin-top: 10px;
    }
    .box {
      background: #0b1220; border: 1px dashed var(--border); border-radius: 14px; padding: 14px;
    }
    .eq {
      background: #0b1220; border: 1px solid var(--border); border-radius: 12px;
      padding: 12px; margin: 8px 0; overflow-x: auto;
      direction: ltr; text-align: center; color: #f8fafc;
    }
    code, pre {
      background: #0b1220; color: #f8fafc; border-radius: 10px;
      border: 1px solid var(--border);
    }
    pre { padding: 12px; overflow-x: auto; }
    ul { margin: 8px 0 0 0; padding-right: 18px; }
    li { margin: 6px 0; }
    .tip {
      border-right: 4px solid var(--accent);
      background: #07101c; padding: 12px; border-radius: 12px; margin-top: 12px;
    }
  </style>
</head>
<body>
  <div class="container">
    <div class="card">
      <h1>AR (Autoregressive) — الانحدار الذاتي <span class="badge">AR(p)</span></h1>
      <p class="muted">يعتمد على أن القيمة الحالية للسلسلة الزمنية يمكن تفسيرها (أو توقعها) باستخدام قيمها السابقة.</p>

      <h2>الفكرة</h2>
      <p>
        يعتمد نموذج الانحدار الذاتي على الارتباط الذاتي للسلسلة: كل قيمة جديدة هي مزيج خطي من عدد من القيم السابقة
        بالإضافة إلى ثابت وضوضاء عشوائية.
      </p>

      <h2>الصيغة الرياضية</h2>
      <div class="eq">
        <!-- MathJax render -->
        $$ y_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \cdots + \phi_p y_{t-p} + \varepsilon_t $$
      </div>
      <div class="grid">
        <div class="box">
          <strong>المكونات:</strong>
          <ul>
            <li><strong>\(y_t\)</strong>: القيمة الحالية.</li>
            <li><strong>\(c\)</strong>: ثابت (intercept).</li>
            <li><strong>\(\phi_i\)</strong>: معاملات الانحدار الذاتي (تأثير القيمة السابقة رقم \(i\) على الحالية).</li>
            <li><strong>\(p\)</strong>: رتبة النموذج (عدد القيم السابقة المستخدمة).</li>
            <li><strong>\(\varepsilon_t\)</strong>: الضوضاء/الخطأ العشوائي.</li>
          </ul>
        </div>
        <div class="box">
          <strong>مثال مبسط (AR(1)):</strong>
          <p>إذا كان \( \phi_1 = 0.8 \)، و \( c = 2 \)، والقيمة السابقة \( y_{t-1} = 10 \):</p>
          <div class="eq">$$ y_t = 2 + 0.8 \times 10 = 10 $$</div>
        </div>
      </div>

      <h2>المميزات</h2>
      <ul>
        <li>بسيط وسهل التفسير.</li>
        <li>فعّال عندما تعتمد السلسلة على نفسها بدرجة كبيرة (ارتباط ذاتي قوي).</li>
      </ul>

      <h2>العيوب</h2>
      <ul>
        <li>لا يتعامل جيدًا مع الاتجاهات طويلة الأجل أو الموسمية بشكل مباشر.</li>
        <li>يتطلب غالبًا سلاسلاً مستقرة (Stationary) أو إجراء التفاضل/التحويل للوصول إلى الاستقرار.</li>
      </ul>

      <div class="tip">
        <strong>متى أستخدم AR؟</strong>
        <p class="muted">
          عندما تُظهر السلسلة الزمنية علاقة قوية بين القيم الحالية والسابقة، ولا توجد موسمية واضحة تحتاج لنموذج موسمي.
          في الممارسة العملية، يتم اختيار \(p\) باستخدام معايير مثل AIC/BIC وفحص مخططات ACF/PACF.
        </p>
      </div>
    </div>
  </div>
</body>
</html>


Overwriting explanations_html/ar.html


In [45]:
%%writefile explanations_html/naive.html
<!DOCTYPE html>
<html lang="ar" dir="rtl">
<head>
  <meta charset="UTF-8" />
  <meta name="viewport" content="width=device-width, initial-scale=1" />
  <title>Naïve Forecasting — التنبؤ البسيط</title>

  <script>
    window.MathJax = {
      tex: { inlineMath: [['$', '$'], ['\\(', '\\)']] },
      svg: { fontCache: 'global' }
    };
  </script>
  <script defer src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-svg.js"></script>

  <style>
    :root {
      --bg: #0f172a;
      --card: #111827;
      --muted: #94a3b8;
      --text: #e5e7eb;
      --accent: #38bdf8;
      --chip: #1f2937;
      --border: #1f2937;
    }
    html, body {
      margin: 0; padding: 0; background: var(--bg); color: var(--text);
      font-family: system-ui, -apple-system, "Segoe UI", Roboto, "Noto Kufi Arabic", "Noto Sans Arabic", Tahoma, Arial, sans-serif;
      line-height: 1.8;
    }
    .container {
      max-width: 920px; margin: 24px auto; padding: 16px;
    }
    .card {
      background: var(--card); border: 1px solid var(--border);
      border-radius: 16px; padding: 22px; box-shadow: 0 10px 20px rgba(0,0,0,.25);
    }
    h1, h2 {
      margin: 0 0 12px; line-height: 1.3;
    }
    h1 { font-size: 28px; }
    h2 { font-size: 20px; color: var(--accent); }
    p { margin: 0 0 10px; color: var(--text); }
    .muted { color: var(--muted); }
    .badge {
      display: inline-block; background: var(--chip); border: 1px solid var(--border);
      padding: 6px 10px; border-radius: 999px; font-size: 12px; margin-left: 6px;
    }
    .grid {
      display: grid; gap: 16px;
      grid-template-columns: repeat(auto-fit, minmax(260px, 1fr));
      margin-top: 10px;
    }
    .box {
      background: #0b1220; border: 1px dashed var(--border); border-radius: 14px; padding: 14px;
    }
    .eq {
      background: #0b1220; border: 1px solid var(--border); border-radius: 12px;
      padding: 12px; margin: 8px 0; overflow-x: auto;
      direction: ltr; text-align: center; color: #f8fafc;
    }
    ul { margin: 8px 0 0 0; padding-right: 18px; }
    li { margin: 6px 0; }
    .tip {
      border-right: 4px solid var(--accent);
      background: #07101c; padding: 12px; border-radius: 12px; margin-top: 12px;
    }
  </style>
</head>
<body>
  <div class="container">
    <div class="card">
      <h1>Naïve Forecasting — التنبؤ البسيط <span class="badge">Baseline</span></h1>
      <p class="muted">أبسط أسلوب للتنبؤ في السلاسل الزمنية، يعتمد على أن أفضل تقدير للمستقبل هو آخر قيمة تم رصدها.</p>

      <h2>الفكرة</h2>
      <p>
        في التنبؤ البسيط، نأخذ القيمة الأخيرة في السلسلة الزمنية ونستخدمها كتوقع لجميع الفترات المستقبلية.
        هذه الطريقة لا تفترض أي نمط أو اتجاه أو موسمية — هي فقط امتداد للقيمة الأخيرة.
      </p>

      <h2>الصيغة الرياضية</h2>
      <div class="eq">
        $$ \hat{y}_{t+1} = y_t $$
      </div>

      <div class="grid">
        <div class="box">
          <strong>المكونات:</strong>
          <ul>
            <li><strong>\(y_t\)</strong>: القيمة الفعلية في الزمن \(t\).</li>
            <li><strong>\(\hat{y}_{t+1}\)</strong>: التوقع للفترة القادمة.</li>
          </ul>
        </div>
        <div class="box">
          <strong>مثال:</strong>
          <p>إذا كانت آخر قيمة مسجلة للسهم = 150 دولار، فإن التوقع لليوم التالي سيكون أيضًا 150 دولار.</p>
          <div class="eq">$$ \hat{y}_{t+1} = 150 $$</div>
        </div>
      </div>

      <h2>المميزات</h2>
      <ul>
        <li>سهل جدًا في الفهم والتطبيق.</li>
        <li>يعمل كخط أساس لمقارنة النماذج الأكثر تعقيدًا.</li>
      </ul>

      <h2>العيوب</h2>
      <ul>
        <li>لا يأخذ في الاعتبار أي اتجاه أو موسمية.</li>
        <li>قد يكون ضعيف الدقة في السلاسل ذات التغيرات السريعة.</li>
      </ul>

      <div class="tip">
        <strong>متى أستخدمه؟</strong>
        <p class="muted">
          يُستخدم غالبًا كنموذج مرجعي (Benchmark). إذا كان نموذجك المتقدم لا يتفوق عليه، فربما لا يستحق التعقيد الإضافي.
        </p>
      </div>
    </div>
  </div>
</body>
</html>


Overwriting explanations_html/naive.html


In [55]:
%%writefile explanations_html/ma.html
<!DOCTYPE html>
<html lang="ar" dir="rtl">
<head>
  <meta charset="UTF-8" />
  <meta name="viewport" content="width=device-width, initial-scale=1" />
  <title>MA — المتوسط المتحرك</title>
  <script>
    window.MathJax = { tex: { inlineMath: [['$', '$'], ['\\(', '\\)']] }, svg: { fontCache: 'global' } };
  </script>
  <script defer src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-svg.js"></script>
  <style>
    :root { --bg: #0f172a; --card: #111827; --muted: #94a3b8; --text: #e5e7eb; --accent: #38bdf8; --chip: #1f2937; --border: #1f2937; }
    html, body { margin: 0; padding: 0; background: var(--bg); color: var(--text); font-family: system-ui, "Noto Kufi Arabic", sans-serif; line-height: 1.8; }
    .container { max-width: 920px; margin: 24px auto; padding: 16px; }
    .card { background: var(--card); border: 1px solid var(--border); border-radius: 16px; padding: 22px; box-shadow: 0 10px 20px rgba(0,0,0,.25); }
    h1, h2 { margin: 0 0 12px; line-height: 1.3; }
    h1 { font-size: 28px; }
    h2 { font-size: 20px; color: var(--accent); }
    p { margin: 0 0 10px; color: var(--text); }
    .muted { color: var(--muted); }
    .badge { display: inline-block; background: var(--chip); border: 1px solid var(--border); padding: 6px 10px; border-radius: 999px; font-size: 12px; margin-left: 6px; }
    .eq { background: #0b1220; border: 1px solid var(--border); border-radius: 12px; padding: 12px; margin: 8px 0; overflow-x: auto; direction: ltr; text-align: center; color: #f8fafc; }
    ul { margin: 8px 0 0 0; padding-right: 18px; }
    li { margin: 6px 0; }
    .tip { border-right: 4px solid var(--accent); background: #07101c; padding: 12px; border-radius: 12px; margin-top: 12px; }
  </style>
</head>
<body>
  <div class="container">
    <div class="card">
      <h1>MA — المتوسط المتحرك <span class="badge">Moving Average</span></h1>
      <p class="muted">يعتمد على أخذ متوسط القيم السابقة للتنبؤ بالقيمة الحالية أو المستقبلية.</p>

      <h2>الفكرة</h2>
      <p>المتوسط المتحرك يأخذ عدد معين من القيم السابقة \( q \) ويحسب متوسطها ليكون التوقع.</p>

      <h2>الصيغة الرياضية</h2>
      <div class="eq">
        $$ \hat{y}_t = \mu + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2} + \dots + \theta_q \varepsilon_{t-q} $$
      </div>

      <h2>المكونات</h2>
      <ul>
        <li><strong>\(\mu\)</strong>: المتوسط العام.</li>
        <li><strong>\(\theta_i\)</strong>: معاملات المتوسط المتحرك.</li>
        <li><strong>\(\varepsilon\)</strong>: الخطأ العشوائي.</li>
        <li><strong>q</strong>: رتبة النموذج (عدد التأخيرات).</li>
      </ul>

      <h2>المميزات</h2>
      <ul>
        <li>يبسّط الضوضاء العشوائية.</li>
        <li>سهل الفهم والتطبيق.</li>
      </ul>

      <h2>العيوب</h2>
      <ul>
        <li>لا يلتقط الاتجاهات طويلة المدى.</li>
        <li>يتأخر في الاستجابة للتغيرات المفاجئة.</li>
      </ul>

      <div class="tip">
        <strong>متى أستخدمه؟</strong>
        <p class="muted">عند الرغبة في إزالة الضوضاء والتركيز على النمط العام للسلسلة.</p>
      </div>
    </div>
  </div>
</body>
</html>


Overwriting explanations_html/ma.html


In [57]:
%%writefile explanations_html/arima.html
<!DOCTYPE html>
<html lang="ar" dir="rtl">
<head>
  <meta charset="UTF-8" />
  <meta name="viewport" content="width=device-width, initial-scale=1" />
  <title>ARIMA — الانحدار الذاتي المتكامل مع المتوسط المتحرك</title>
  <script>
    window.MathJax = { tex: { inlineMath: [['$', '$'], ['\\(', '\\)']] }, svg: { fontCache: 'global' } };
  </script>
  <script defer src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-svg.js"></script>
  <style>
    :root { --bg: #0f172a; --card: #111827; --muted: #94a3b8; --text: #e5e7eb; --accent: #38bdf8; --chip: #1f2937; --border: #1f2937; }
    html, body { margin: 0; padding: 0; background: var(--bg); color: var(--text); font-family: system-ui, "Noto Kufi Arabic", sans-serif; line-height: 1.8; }
    .container { max-width: 920px; margin: 24px auto; padding: 16px; }
    .card { background: var(--card); border: 1px solid var(--border); border-radius: 16px; padding: 22px; box-shadow: 0 10px 20px rgba(0,0,0,.25); }
    h1, h2 { margin: 0 0 12px; line-height: 1.3; }
    h1 { font-size: 28px; }
    h2 { font-size: 20px; color: var(--accent); }
    p { margin: 0 0 10px; color: var(--text); }
    .muted { color: var(--muted); }
    .badge { display: inline-block; background: var(--chip); border: 1px solid var(--border); padding: 6px 10px; border-radius: 999px; font-size: 12px; margin-left: 6px; }
    .eq { background: #0b1220; border: 1px solid var(--border); border-radius: 12px; padding: 12px; margin: 8px 0; overflow-x: auto; direction: ltr; text-align: center; color: #f8fafc; }
    ul { margin: 8px 0 0 0; padding-right: 18px; }
    li { margin: 6px 0; }
    .tip { border-right: 4px solid var(--accent); background: #07101c; padding: 12px; border-radius: 12px; margin-top: 12px; }
  </style>
</head>
<body>
  <div class="container">
    <div class="card">
      <h1>ARIMA <span class="badge">AutoRegressive Integrated Moving Average</span></h1>
      <p class="muted">يجمع بين الانحدار الذاتي والتكامل (الفرق) والمتوسط المتحرك.</p>

      <h2>الفكرة</h2>
      <p>ARIMA هو نموذج إحصائي قوي للسلاسل الزمنية، حيث:</p>
      <ul>
        <li><strong>AR</strong>: يعتمد على القيم السابقة.</li>
        <li><strong>I</strong>: يستخدم الفرق لجعل السلسلة مستقرة.</li>
        <li><strong>MA</strong>: يعتمد على متوسط أخطاء النماذج السابقة.</li>
      </ul>

      <h2>الصيغة</h2>
      <div class="eq">
        $$ \hat{y}_t = c + \sum_{i=1}^p \phi_i y_{t-i} + \sum_{j=1}^q \theta_j \varepsilon_{t-j} $$
      </div>

      <h2>المعلمات</h2>
      <ul>
        <li><strong>p</strong>: رتبة الانحدار الذاتي.</li>
        <li><strong>d</strong>: عدد مرات الفرق لجعل السلسلة مستقرة.</li>
        <li><strong>q</strong>: رتبة المتوسط المتحرك.</li>
      </ul>

      <h2>المميزات</h2>
      <ul>
        <li>مرن ويعمل مع أنواع مختلفة من البيانات.</li>
        <li>يدمج أكثر من أسلوب في نموذج واحد.</li>
      </ul>

      <h2>العيوب</h2>
      <ul>
        <li>معقد أكثر من النماذج البسيطة.</li>
        <li>حسّاس لاختيار القيم p و d و q.</li>
      </ul>

      <div class="tip">
        <strong>متى أستخدمه؟</strong>
        <p class="muted">عندما تكون البيانات مستقرة أو يمكن جعلها مستقرة عبر الفرق، وتحتاج إلى دمج AR و MA.</p>
      </div>
    </div>
  </div>
</body>
</html>


Writing explanations_html/arima.html


In [59]:
%%writefile explanations_html/sarima.html
<!DOCTYPE html>
<html lang="ar" dir="rtl">
<head>
  <meta charset="UTF-8" />
  <meta name="viewport" content="width=device-width, initial-scale=1" />
  <title>SARIMA — الانحدار الذاتي المتكامل مع المتوسط المتحرك الموسمي</title>
  <script>
    window.MathJax = { tex: { inlineMath: [['$', '$'], ['\\(', '\\)']] }, svg: { fontCache: 'global' } };
  </script>
  <script defer src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-svg.js"></script>
  <style>
    :root { --bg: #0f172a; --card: #111827; --muted: #94a3b8; --text: #e5e7eb; --accent: #38bdf8; --chip: #1f2937; --border: #1f2937; }
    html, body { margin: 0; padding: 0; background: var(--bg); color: var(--text); font-family: system-ui, "Noto Kufi Arabic", sans-serif; line-height: 1.8; }
    .container { max-width: 920px; margin: 24px auto; padding: 16px; }
    .card { background: var(--card); border: 1px solid var(--border); border-radius: 16px; padding: 22px; box-shadow: 0 10px 20px rgba(0,0,0,.25); }
    h1, h2 { margin: 0 0 12px; line-height: 1.3; }
    h1 { font-size: 28px; }
    h2 { font-size: 20px; color: var(--accent); }
    p { margin: 0 0 10px; color: var(--text); }
    .muted { color: var(--muted); }
    .badge { display: inline-block; background: var(--chip); border: 1px solid var(--border); padding: 6px 10px; border-radius: 999px; font-size: 12px; margin-left: 6px; }
    .eq { background: #0b1220; border: 1px solid var(--border); border-radius: 12px; padding: 12px; margin: 8px 0; overflow-x: auto; direction: ltr; text-align: center; color: #f8fafc; }
    ul { margin: 8px 0 0 0; padding-right: 18px; }
    li { margin: 6px 0; }
    .tip { border-right: 4px solid var(--accent); background: #07101c; padding: 12px; border-radius: 12px; margin-top: 12px; }
  </style>
</head>
<body>
  <div class="container">
    <div class="card">
      <h1>SARIMA <span class="badge">Seasonal ARIMA</span></h1>
      <p class="muted">يضيف المكوّن الموسمي إلى نموذج ARIMA للتعامل مع البيانات التي تحتوي على دورية.</p>

      <h2>الفكرة</h2>
      <p>يجمع SARIMA بين مكوّنات ARIMA التقليدية ومكوّنات موسمية AR و I و MA.</p>

      <h2>الصيغة</h2>
      <div class="eq">
        SARIMA(p, d, q) × (P, D, Q, s)
      </div>

      <h2>المعلمات الموسمية</h2>
      <ul>
        <li><strong>P</strong>: رتبة الانحدار الذاتي الموسمي.</li>
        <li><strong>D</strong>: عدد مرات الفرق الموسمي.</li>
        <li><strong>Q</strong>: رتبة المتوسط المتحرك الموسمي.</li>
        <li><strong>s</strong>: طول الدورة (مثل 12 للشهور، 7 للأيام).</li>
      </ul>

      <h2>المميزات</h2>
      <ul>
        <li>يعالج البيانات ذات الاتجاهات والموسمية.</li>
        <li>مرن ويغطي حالات متعددة.</li>
      </ul>

      <h2>العيوب</h2>
      <ul>
        <li>تحديد المعلمات قد يكون معقدًا.</li>
        <li>أكثر تكلفة حسابيًا من ARIMA العادي.</li>
      </ul>

      <div class="tip">
        <strong>متى أستخدمه؟</strong>
        <p class="muted">عندما يكون هناك نمط موسمي واضح ومتكرر في السلسلة الزمنية.</p>
      </div>
    </div>
  </div>
</body>
</html>


Writing explanations_html/sarima.html


In [61]:
%%writefile explanations_html/var.html
<!DOCTYPE html>
<html lang="ar" dir="rtl">
<head>
  <meta charset="UTF-8" />
  <meta name="viewport" content="width=device-width, initial-scale=1" />
  <title>VAR — الانحدار الذاتي المتجهي</title>
  <script>
    window.MathJax = { tex: { inlineMath: [['$', '$'], ['\\(', '\\)']] }, svg: { fontCache: 'global' } };
  </script>
  <script defer src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-svg.js"></script>
  <style>
    :root { --bg: #0f172a; --card: #111827; --muted: #94a3b8; --text: #e5e7eb; --accent: #38bdf8; --chip: #1f2937; --border: #1f2937; }
    html, body { margin: 0; padding: 0; background: var(--bg); color: var(--text); font-family: system-ui, "Noto Kufi Arabic", sans-serif; line-height: 1.8; }
    .container { max-width: 920px; margin: 24px auto; padding: 16px; }
    .card { background: var(--card); border: 1px solid var(--border); border-radius: 16px; padding: 22px; box-shadow: 0 10px 20px rgba(0,0,0,.25); }
    h1, h2 { margin: 0 0 12px; line-height: 1.3; }
    h1 { font-size: 28px; }
    h2 { font-size: 20px; color: var(--accent); }
    p { margin: 0 0 10px; color: var(--text); }
    .muted { color: var(--muted); }
    .badge { display: inline-block; background: var(--chip); border: 1px solid var(--border); padding: 6px 10px; border-radius: 999px; font-size: 12px; margin-left: 6px; }
    .eq { background: #0b1220; border: 1px solid var(--border); border-radius: 12px; padding: 12px; margin: 8px 0; overflow-x: auto; direction: ltr; text-align: center; color: #f8fafc; }
    ul { margin: 8px 0 0 0; padding-right: 18px; }
    li { margin: 6px 0; }
    .tip { border-right: 4px solid var(--accent); background: #07101c; padding: 12px; border-radius: 12px; margin-top: 12px; }
  </style>
</head>
<body>
  <div class="container">
    <div class="card">
      <h1>VAR <span class="badge">Vector AutoRegression</span></h1>
      <p class="muted">يستخدم للتنبؤ بسلاسل زمنية متعددة تعتمد على بعضها البعض.</p>

      <h2>الفكرة</h2>
      <p>يقوم بتوسيع فكرة الانحدار الذاتي لتشمل أكثر من متغير واحد، بحيث يمكن لكل متغير أن يعتمد على القيم السابقة لجميع المتغيرات الأخرى.</p>

      <h2>الصيغة</h2>
      <div class="eq">
        $$ y_t = c + A_1 y_{t-1} + A_2 y_{t-2} + \dots + A_p y_{t-p} + \varepsilon_t $$
      </div>

      <h2>المكونات</h2>
      <ul>
        <li><strong>$y_t$</strong>: متجه القيم الحالية لكل المتغيرات.</li>
        <li><strong>$A_i$</strong>: مصفوفات المعاملات.</li>
        <li><strong>$p$</strong>: رتبة النموذج.</li>
        <li><strong>$\varepsilon_t$</strong>: متجه الأخطاء العشوائية.</li>
      </ul>

      <h2>المميزات</h2>
      <ul>
        <li>يمكنه التقاط العلاقات المتبادلة بين المتغيرات.</li>
        <li>مفيد في النماذج الاقتصادية والمالية متعددة المؤشرات.</li>
      </ul>

      <h2>العيوب</h2>
      <ul>
        <li>عدد كبير من المعلمات إذا كانت المتغيرات كثيرة.</li>
        <li>يحتاج بيانات كثيرة لتقدير جيد.</li>
      </ul>

      <div class="tip">
        <strong>متى أستخدمه؟</strong>
        <p class="muted">عندما تكون لديك أكثر من سلسلة زمنية تتفاعل مع بعضها، مثل أسعار أسهم متعددة أو مؤشرات اقتصادية.</p>
      </div>
    </div>
  </div>
</body>
</html>


Writing explanations_html/var.html


In [72]:
%%writefile explanations_html/xgboost.html
<!DOCTYPE html>
<html lang="ar" dir="rtl">
<head>
  <meta charset="UTF-8" />
  <meta name="viewport" content="width=device-width, initial-scale=1" />
  <title>XGBoost — التعلّم المعزّز بالتدرّج للأشجار</title>

  <script>
    window.MathJax = { tex: { inlineMath: [['$', '$'], ['\\(', '\\)']] }, svg: { fontCache: 'global' } };
  </script>
  <script defer src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-svg.js"></script>

  <style>
    :root { --bg:#0f172a; --card:#111827; --muted:#94a3b8; --text:#e5e7eb; --accent:#38bdf8; --chip:#1f2937; --border:#1f2937; }
    html,body{margin:0;padding:0;background:var(--bg);color:var(--text);font-family:system-ui,"Noto Kufi Arabic",sans-serif;line-height:1.8;}
    .container{max-width:920px;margin:24px auto;padding:16px;}
    .card{background:var(--card);border:1px solid var(--border);border-radius:16px;padding:22px;box-shadow:0 10px 20px rgba(0,0,0,.25);}
    h1,h2{margin:0 0 12px;line-height:1.3;}
    h1{font-size:28px;} h2{font-size:20px;color:var(--accent);}
    p{margin:0 0 10px;} .muted{color:var(--muted);}
    .badge{display:inline-block;background:var(--chip);border:1px solid var(--border);padding:6px 10px;border-radius:999px;font-size:12px;margin-left:6px;}
    .eq{background:#0b1220;border:1px solid var(--border);border-radius:12px;padding:12px;margin:8px 0;overflow-x:auto;direction:ltr;text-align:center;color:#f8fafc;}
    ul{margin:8px 0 0 0;padding-right:18px;} li{margin:6px 0;}
    .grid{display:grid;gap:16px;grid-template-columns:repeat(auto-fit,minmax(260px,1fr));margin-top:10px;}
    .box{background:#0b1220;border:1px dashed var(--border);border-radius:14px;padding:14px;}
    .tip{border-right:4px solid var(--accent);background:#07101c;padding:12px;border-radius:12px;margin-top:12px;}
    code,pre{background:#0b1220;color:#f8fafc;border-radius:10px;border:1px solid var(--border);}
    pre{padding:12px;overflow-x:auto;}
  </style>
</head>
<body>
  <div class="container">
    <div class="card">
      <h1>XGBoost <span class="badge">Extreme Gradient Boosting</span></h1>
      <p class="muted">
        خوارزمية تعلّم آلي قوية تعتمد على تجميع أشجار قرار ضعيفة على التوالي (Boosting) لتقليل الخطأ تدريجيًا، مع تنظيم (Regularization) للحد من فرط التعلّم.
      </p>

      <h2>الفكرة</h2>
      <p>
        يتم بناء نموذج على شكل مجموع أشجار قرار متتابعة. كل شجرة جديدة تتعلم من أخطاء النموذج السابق (البواقي).
      </p>

      <h2>الدالة الهدفية (مبسّطة)</h2>
      <div class="eq">
        $$ \mathcal{L} = \sum_{t=1}^{n} \ell\!\left(y_t,\ \hat{y}_t\right) \;+\; \sum_{k=1}^{K} \Omega(f_k), \quad \text{حيث } \hat{y}_t = \sum_{k=1}^{K} f_k(x_t) $$
      </div>
      <p class="muted">
        \(\ell\): دالة الخسارة (مثل MSE)، و\(\Omega\): حدّ التنظيم على تعقيد الشجرة.
      </p>

      <h2>استخدامه في السلاسل الزمنية</h2>
      <ul>
        <li>إنشاء ميزات زمنية يدويًا مثل: <strong>Lag features</strong> (قِيَم الأيام السابقة)، <strong>المتوسطات المتحركة</strong>، <strong>اليوم/الشهر</strong>، إلخ.</li>
        <li>التقسيم يكون زمنيًا (عدم خلط الماضي بالمستقبل) لتجنّب <strong>تسرّب المعلومات</strong>.</li>
      </ul>

      <div class="grid">
        <div class="box">
          <strong>أهم الهايبر باراميترز:</strong>
          <ul>
            <li><code>n_estimators</code>: عدد الأشجار.</li>
            <li><code>learning_rate</code>: سرعة التعلّم (أصغر = دقة أعلى غالبًا + أشجار أكثر).</li>
            <li><code>max_depth</code>, <code>min_child_weight</code>: تتحكم في تعقيد الشجرة.</li>
            <li><code>subsample</code>, <code>colsample_bytree</code>: أخذ عينات لتقليل التباين.</li>
            <li><code>reg_alpha</code>, <code>reg_lambda</code>: تنظيم L1/L2 للحد من فرط التعلّم.</li>
          </ul>
        </div>
        <div class="box">
          <strong>مقاييس التقييم الشائعة:</strong>
          <ul>
            <li>RMSE — الجذر التربيعي لمتوسط مربع الأخطاء.</li>
            <li>MAE — متوسط الخطأ المطلق.</li>
            <li>MAPE — متوسط نسبة الخطأ المئوية (تجنّبه عند وجود قيم فعلية = 0).</li>
            <li>R² — نسبة التباين المفسّر (اختياري).</li>
          </ul>
        </div>
      </div>

      <h2>المميزات</h2>
      <ul>
        <li>دقيق وسريع نسبيًا ومهيّأ للأداء.</li>
        <li>يتعامل جيدًا مع الميزات غير الخطية والتفاعلات بينها.</li>
      </ul>

      <h2>العيوب</h2>
      <ul>
        <li>يحتاج تجهيز ميزات زمنية بعناية (ليس نموذجًا احتماليًا زمنيًا بحتًا).</li>
        <li>عرضة لفرط التعلّم إذا لم يتم تنظيمه وملاءمته بشكل صحيح.</li>
      </ul>

      <div class="tip">
        <strong>نصائح عملية:</strong>
        <ul class="muted">
          <li>استخدم <em>Time Series CV</em> (مثل expanding window) بدل K-Fold العشوائي.</li>
          <li>احرص على عدم تسريب المستقبل: أنشئ الميزات من الماضي فقط.</li>
          <li>جرّب موازنة <code>learning_rate</code> مع <code>n_estimators</code> (قيم صغيرة + أشجار أكثر غالبًا أفضل).</li>
          <li>افحص أهمية الميزات لمعرفة أكثر الـ lags إفادة.</li>
        </ul>
      </div>

      <h2>مثال بسيط (Features من تأخيرات)</h2>
      <pre><code># X = [lag_1, lag_2, ..., lag_p]  →  y = Close
# تنبؤ القيم المستقبلية يتم تدريجيًا باستخدام أحدث lags متاحة.</code></pre>
    </div>
  </div>
</body>
</html>


Writing explanations_html/xgboost.html


In [33]:
%%writefile explanations_html/random_forest.html
<!DOCTYPE html>
<html lang="ar" dir="rtl">
<head>
  <meta charset="utf-8" />
  <meta name="viewport" content="width=device-width, initial-scale=1" />
  <title>شرح Random Forest للتنبؤ بالسلاسل الزمنية</title>
  <style>
    :root {
      --bg: #0b1020;
      --card: #121a2b;
      --muted: #94a3b8;
      --text: #e2e8f0;
      --accent: #7c3aed;
      --accent-2: #22d3ee;
      --success: #10b981;
      --danger: #ef4444;
      --shadow: 0 10px 30px rgba(0,0,0,0.25);
    }
    * { box-sizing: border-box; }
    body {
      margin: 0;
      font-family: "Inter", system-ui, -apple-system, Segoe UI, Roboto, Helvetica, Arial, "Apple Color Emoji", "Segoe UI Emoji";
      background: radial-gradient(1200px 600px at 100% -10%, rgba(124,58,237,0.15), transparent 60%),
                  radial-gradient(800px 400px at -10% 110%, rgba(34,211,238,0.12), transparent 60%),
                  var(--bg);
      color: var(--text);
    }
    header {
      position: sticky; top: 0; z-index: 10;
      backdrop-filter: blur(8px);
      background: rgba(11,16,32,0.7);
      border-bottom: 1px solid rgba(148,163,184,0.1);
    }
    .container { max-width: 1100px; margin: 0 auto; padding: 20px; }
    .nav { display: flex; gap: 16px; flex-wrap: wrap; align-items: center; justify-content: space-between; }
    .brand { font-weight: 800; letter-spacing: .5px; }
    .tag { padding: 6px 10px; border-radius: 999px; background: rgba(124,58,237,0.15); color: #e9d5ff; border: 1px solid rgba(124,58,237,0.35); }
    .toc { display: flex; gap: 10px; flex-wrap: wrap; }
    .toc a { text-decoration: none; color: var(--muted); padding: 8px 12px; border-radius: 999px; border: 1px solid rgba(148,163,184,0.2); transition: 200ms; }
    .toc a:hover { color: var(--text); border-color: rgba(124,58,237,0.5); box-shadow: var(--shadow); }
    main { padding: 32px 0 60px; }

    .hero { background: linear-gradient(180deg, rgba(255,255,255,0.02), rgba(255,255,255,0)); border: 1px solid rgba(148,163,184,0.15); border-radius: 24px; padding: 28px; box-shadow: var(--shadow); }
    .hero h1 { margin: 0 0 8px; font-size: 28px; }
    .hero p { margin: 0; color: var(--muted); }

    section { margin-top: 28px; background: rgba(18,26,43,0.75); border: 1px solid rgba(148,163,184,0.15); border-radius: 20px; padding: 22px; box-shadow: var(--shadow); }
    section h2 { margin-top: 0; font-size: 22px; }
    .kpi { display: inline-flex; gap: 10px; align-items: center; padding: 8px 12px; border-radius: 12px; background: rgba(16,185,129,0.12); color: #d1fae5; border: 1px solid rgba(16,185,129,0.35); }

    .formula { direction: ltr; background: #0a0f1b; padding: 14px; border-radius: 14px; overflow-x: auto; border: 1px solid rgba(148,163,184,0.18); }

    .list { line-height: 1.9; }

    pre { margin: 0; }
    .codeblock { position: relative; background: #0a0f1b; border: 1px solid rgba(148,163,184,0.18); border-radius: 16px; padding: 14px; overflow: auto; }
    .copy {
      position: absolute; inset-inline-start: 10px; inset-block-start: 10px; background: rgba(124,58,237,0.2);
      border: 1px solid rgba(124,58,237,0.5); color: #f5f3ff; padding: 6px 10px; border-radius: 10px; cursor: pointer;
    }
    code { font-family: ui-monospace, SFMono-Regular, Menlo, Monaco, Consolas, "Liberation Mono", "Courier New", monospace; font-size: 13px; color: #d6e1ff; }
    .example-card { display: grid; gap: 8px; grid-template-columns: 1fr 1fr; }
    .pill { display:inline-block; padding: 4px 10px; border-radius: 999px; border:1px solid rgba(148,163,184,0.25); color: var(--muted); }

    footer { color: var(--muted); text-align: center; padding: 30px 0 50px; }
    @media (max-width: 720px){ .example-card { grid-template-columns: 1fr; } }
  </style>
  <!-- MathJax for LaTeX rendering -->
  <script>
    window.MathJax = { tex: { inlineMath: [['$', '$'], ['\\(', '\\)']] } };
  </script>
  <script defer src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
</head>
<body>
  <header>
    <div class="container nav">
      <div class="brand">🌲 Random Forest — السلاسل الزمنية</div>
      <span class="tag">دليل عملي بالعربية</span>
      <nav class="toc">
        <a href="#idea">الفكرة</a>
        <a href="#formula">الصيغة</a>
        <a href="#components">مكوّنات الصيغة</a>
        <a href="#example">مثال تطبيقي</a>
        <a href="#pros">المميزات</a>
        <a href="#cons">العيوب</a>
        <a href="#code">الكود</a>
      </nav>
    </div>
  </header>

  <main class="container">
    <div class="hero">
      <h1>شرح Random Forest للتنبؤ بالسلاسل الزمنية (Time Series)</h1>
      <p>نحوّل السلسلة الزمنية إلى مشكلة تعلم مُراقَب باستخدام <span class="pill">Lag Features</span> ثم ندرّب غابة من أشجار القرار وناخذ متوسط تنبؤاتها للحصول على توقع مستقر ودقيق نسبيًا.</p>
    </div>

    <section id="idea">
      <h2>1) الفكرة</h2>
      <p>
        <strong>Random Forest</strong> هي خوارزمية <em>Ensemble</em> تعتمد على بناء عدد كبير من أشجار القرار على عينات وخصائص مختلفة (Bagging + Feature Subsampling)، ثم تجميع نتائجها:
        في الانحدار نأخذ <strong>المتوسط</strong> وفي التصنيف نأخذ <strong>التصويت</strong>.
        في السلاسل الزمنية نُنشئ ميزات إزاحة <span class="pill">lags</span> وميزات متحركة (مثل المتوسط المتحرك) لتعليم النموذج العلاقة بين الماضي والحاضر.
      </p>
    </section>

    <section id="formula">
      <h2>2) الصيغة الرياضية</h2>
      <div class="formula">
        $$\hat{y}(x) = \frac{1}{N} \sum_{i=1}^{N} T_i(x)$$
      </div>
      <p>حيث \(N\) عدد الأشجار، و \(T_i(x)\) هو تنبؤ الشجرة رقم \(i\) على المثال \(x\).</p>
    </section>

    <section id="components">
      <h2>3) شرح لمكوّنات الصيغة</h2>
      <ul class="list">
        <li><strong>\(T_i(x)\):</strong> شجرة قرار تتكون من انقسامات شرطية على الميزات (مثل: إذا <code>lag_1</code> &gt; حد معيّن).</li>
        <li><strong>\(N\):</strong> كلما زاد عدد الأشجار تحسّن الثبات وقلّ التباين (حتى حد معيّن قبل بطء الحساب).</li>
        <li><strong>\(\hat{y}\):</strong> متوسط تنبؤات الأشجار؛ يقلل الضوضاء والأخطاء الفردية لكل شجرة.</li>
      </ul>
    </section>

    <section id="example">
      <h2>4) مثال مبسّط للتطبيق</h2>
      <div class="example-card">
        <div>
          <p>لنفترض لدينا ميزات: <code>lag_1=100</code>، <code>lag_2=102</code>، <code>lag_3=105</code>;</p>
          <ul class="list">
            <li>تنبؤ الشجرة الأولى: \(T_1(x)=104\)</li>
            <li>تنبؤ الشجرة الثانية: \(T_2(x)=107\)</li>
            <li>تنبؤ الشجرة الثالثة: \(T_3(x)=103\)</li>
          </ul>
          <p>إذن المتوسط:</p>
          <div class="formula">$$\hat{y} = \frac{104+107+103}{3} = 104.67$$</div>
        </div>
        <div>
          <p class="kpi">🎯 التنبؤ النهائي ≈ 104.67</p>
          <p style="color: var(--muted);">هذا التوسيط يقلّل حساسية التنبؤ للأخطاء المحتملة من أي شجرة منفردة.</p>
        </div>
      </div>
    </section>

    <section id="pros">
      <h2>5) المميزات</h2>
      <ul class="list">
        <li>يتعامل جيدًا مع العلاقات غير الخطية ويقاوم <em>overfitting</em>.</li>
        <li>لا يحتاج لعمل <em>scaling</em> لمعظم الميزات.</li>
        <li>يدعم عددًا كبيرًا من الميزات ويُظهر أهمية الميزات.</li>
        <li>مناسب للتنبؤ قصير المدى عند بناء ميزات زمنية قوية.</li>
      </ul>
    </section>

    <section id="cons">
      <h2>6) العيوب</h2>
      <ul class="list">
        <li>لا يفهم الزمن تلقائيًا؛ يجب إنشاء <strong>Lag/Rolling</strong> يدويًا.</li>
        <li>التنبؤ بعيد المدى قد يتدهور إلا إذا استخدمنا استراتيجيات خاصة (Recursive/Direct).</li>
        <li>تكلفة حسابية أعلى مع عدد كبير من الأشجار وعمق كبير.</li>
        <li>أقل تفسيرًا من النماذج الخطية و ARIMA.</li>
      </ul>
    </section>

    <section id="code">
      <h2>7) الكود المستخدم (Python)</h2>
      <div class="codeblock">
        <button class="copy" onclick="copyCode()">نسخ الكود</button>
<pre><code>import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, mean_absolute_error
import yfinance as yf
import plotly.express as px

# تحميل البيانات
df = yf.download("AAPL", period="1y")
df = df[["Close"]]

# إنشاء lag features
n_lags = 5
for lag in range(1, n_lags + 1):
    df[f"lag_{lag}"] = df["Close"].shift(lag)
df = df.dropna()

# تقسيم Train/Test
train_size = int(len(df) * 0.8)
train_df, test_df = df.iloc[:train_size], df.iloc[train_size:]
X_train, y_train = train_df.drop(columns=["Close"]), train_df["Close"]
X_test, y_test = test_df.drop(columns=["Close"]), test_df["Close"]

# تدريب Random Forest
model = RandomForestRegressor(n_estimators=200, max_depth=10, random_state=42, n_jobs=-1)
model.fit(X_train, y_train)

# التنبؤ
test_df["RF_Forecast"] = model.predict(X_test)
test_df["Close"] = y_test

# المقاييس
rmse = np.sqrt(mean_squared_error(test_df["Close"], test_df["RF_Forecast"]))
mae = mean_absolute_error(test_df["Close"], test_df["RF_Forecast"])
mape = np.mean(np.abs((test_df["Close"] - test_df["RF_Forecast"]) / test_df["Close"])) * 100

print(f"RMSE: {rmse:.4f}")
print(f"MAE: {mae:.4f}")
print(f"MAPE: {mape:.2f}%")

# الرسم البياني
fig = px.line(test_df[["Close", "RF_Forecast"]], title="Random Forest Forecast vs Actual")
fig.show()</code></pre>
      </div>
      <p style="color: var(--muted); margin-top:12px;">يمكنك استبدال <code>ticker</code> وفترة التحميل، وزيادة <code>n_lags</code> أو إضافة ميزات متحركة لتحسين الأداء.</p>
    </section>

  </main>

  <footer>
    صُمم بواسطة مساعد البيانات — يناسب الطباعة أو التضمين كصفحة وثائق للمشروع.
  </footer>

  <script>
    function copyCode(){
      const code = document.querySelector('.codeblock pre').innerText;
      navigator.clipboard.writeText(code).then(()=>{
        const btn = document.querySelector('.copy');
        const old = btn.textContent;
        btn.textContent = '✓ تم النسخ';
        setTimeout(()=> btn.textContent = old, 1500);
      });
    }
  </script>
</body>
</html>


Overwriting explanations_html/random_forest.html


In [47]:
%%writefile explanations_html/lstm.html
<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <title>LSTM Module</title>
  <style>
    body {
      font-family: Arial, sans-serif;
      background: #f4f6f8;
      margin: 0;
      padding: 0;
    }
    header {
      background: #2c3e50;
      color: white;
      padding: 15px;
      text-align: center;
    }
    .container {
      max-width: 800px;
      margin: 30px auto;
      background: white;
      padding: 20px;
      border-radius: 12px;
      box-shadow: 0px 4px 10px rgba(0,0,0,0.1);
    }
    h2 {
      color: #2c3e50;
      margin-bottom: 20px;
    }
    .form-group {
      margin-bottom: 15px;
    }
    label {
      display: block;
      font-weight: bold;
      margin-bottom: 6px;
    }
    input[type="file"], input[type="number"], button {
      width: 100%;
      padding: 10px;
      margin-top: 4px;
      border: 1px solid #ccc;
      border-radius: 8px;
      font-size: 14px;
    }
    button {
      background: #27ae60;
      color: white;
      border: none;
      cursor: pointer;
      transition: 0.3s;
    }
    button:hover {
      background: #219150;
    }
    .output {
      margin-top: 20px;
      padding: 15px;
      background: #ecf0f1;
      border-left: 5px solid #27ae60;
      border-radius: 8px;
    }
  </style>
</head>
<body>

  <header>
    <h1>LSTM Prediction Module</h1>
  </header>

  <div class="container">
    <h2>Upload Data & Run Model</h2>
    <form id="lstmForm">
      <div class="form-group">
        <label for="fileInput">Upload CSV File:</label>
        <input type="file" id="fileInput" accept=".csv">
      </div>

      <div class="form-group">
        <label for="epochs">Number of Epochs:</label>
        <input type="number" id="epochs" value="50" min="1">
      </div>

      <div class="form-group">
        <label for="timesteps">Time Steps:</label>
        <input type="number" id="timesteps" value="10" min="1">
      </div>

      <button type="button" onclick="runLSTM()">Run LSTM Model</button>
    </form>

    <div class="output" id="outputBox" style="display: none;">
      <h3>Model Output:</h3>
      <p id="result">Processing...</p>
    </div>
  </div>

  <script>
    function runLSTM() {
      let epochs = document.getElementById("epochs").value;
      let timesteps = document.getElementById("timesteps").value;

      // هنا ممكن توصل ببايثون/سيرفر لتشغيل الموديل الحقيقي
      document.getElementById("outputBox").style.display = "block";
      document.getElementById("result").innerText = 
        "✅ LSTM Model is running with " + epochs + " epochs and " + timesteps + " time steps...\n\n[Predicted values will appear here]";
    }
  </script>

</body>
</html>


Writing explanations_html/lstm.html


In [35]:
!streamlit run main_app.py

^C
