In [406]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.subplots as sp
import plotly.graph_objects as go
import numpy as np
import joblib
import torch
import random

from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import MinMaxScaler


# <h1>Load dữ liệu file</h1>

In [407]:
df = pd.read_excel('data/Electrical_2021_2024.xlsx', sheet_name="Data tổng" , header = 0)
df.head(10)

Unnamed: 0,Ngày,Thứ,Value,Miss Value
0,2021-01-01,Friday,136237245.0,
1,2021-01-02,Saturday,160602211.0,
2,2021-01-03,Sunday,163564033.0,
3,2021-01-04,Monday,207504875.0,
4,2021-01-05,Tuesday,219632846.0,
5,2021-01-06,Wednesday,220423431.0,
6,2021-01-07,Thursday,219802350.0,
7,2021-01-08,Friday,220488686.0,
8,2021-01-09,Saturday,209284611.0,
9,2021-01-10,Sunday,173704316.0,


# <h1>Tiền xử lý dữ liệu</h1>

In [408]:
def label_encode_columns(df, columns_to_encode):
    label_encoders = {}
    for column in columns_to_encode:
        # Chuyển đổi cột thành chuỗi nếu cần
        df[column] = df[column].astype(str)
        
        # Áp dụng LabelEncoder
        label_encoder = LabelEncoder()
        df[column] = label_encoder.fit_transform(df[column])
        
        # Lưu lại đối tượng LabelEncoder để sử dụng sau này
        label_encoders[column] = label_encoder
        
        # Lưu model encoder vào file
        joblib.dump(label_encoder, f'label_encoder/{column}_labelencoder.pkl')
    
    return df, label_encoders

In [409]:
# Các cột cần Label Encode
columns_to_encode = ['Thứ']
# Thực hiện Label Encoding
df, label_encoders = label_encode_columns(df, columns_to_encode)

In [410]:
# Chuyển cột "Ngày" thành kiểu datetime
df['Ngày'] = pd.to_datetime(df['Ngày'], format='%d/%m/%Y')

In [411]:
# Tạo biểu đồ
fig = go.Figure()

fig.add_trace(go.Scatter(x=df['Ngày'], y=df['Value'], mode='lines', name='Giá trị'))

# Cài đặt tiêu đề và nhãn
fig.update_layout(
    title='Biểu đồ Time Series',
    xaxis_title='Ngày',
    yaxis_title='Giá trị',
    xaxis_rangeslider_visible=True
)

# Hiển thị biểu đồ
fig.show()

In [412]:
df = df.drop(columns=['Miss Value'], errors='ignore')

In [413]:
def show_infor_dataframe(df):
    for column in df.columns:
        unique_values = df[column].unique()
        print(f"Column '{column}' has {len(unique_values)} unique values:")
        print(unique_values)
        print("\n")

In [414]:
show_infor_dataframe(df)

Column 'Ngày' has 1369 unique values:
<DatetimeArray>
['2021-01-01 00:00:00', '2021-01-02 00:00:00', '2021-01-03 00:00:00',
 '2021-01-04 00:00:00', '2021-01-05 00:00:00', '2021-01-06 00:00:00',
 '2021-01-07 00:00:00', '2021-01-08 00:00:00', '2021-01-09 00:00:00',
 '2021-01-10 00:00:00',
 ...
 '2024-09-21 00:00:00', '2024-09-22 00:00:00', '2024-09-23 00:00:00',
 '2024-09-24 00:00:00', '2024-09-25 00:00:00', '2024-09-26 00:00:00',
 '2024-09-27 00:00:00', '2024-09-28 00:00:00', '2024-09-29 00:00:00',
 '2024-09-30 00:00:00']
Length: 1369, dtype: datetime64[ns]


Column 'Thứ' has 7 unique values:
[0 2 3 1 5 6 4]


Column 'Value' has 1226 unique values:
[1.36237245e+08 1.60602211e+08 1.63564033e+08 ... 2.51964447e+08
 2.11545848e+08 2.47501424e+08]




In [415]:
print(df.isnull().sum())

Ngày      0
Thứ       0
Value    23
dtype: int64


In [416]:
# Tính giá trị trung bình cho từng ngày trong tuần
avg_by_weekday = df.groupby('Thứ')['Value'].transform('mean')

# Điền giá trị thiếu bằng trung bình của ngày trong tuần
df['Value'] = df['Value'].fillna(avg_by_weekday)
df['Value'] = df['Value'].round().astype(int)


*Thêm dữ liệu ngày nghỉ lễ*

In [417]:

# Danh sách ngày nghỉ lễ (từ năm 2021 đến năm 2024)
public_holidays = [
    # Năm 2021
    '2021-01-01',  # Tết Dương lịch
    '2021-02-10', '2021-02-11', '2021-02-12', '2021-02-13', '2021-02-14',  # Tết Nguyên Đán
    '2021-04-21',  # Giỗ Tổ Hùng Vương
    '2021-04-30',  # Ngày Giải phóng miền Nam
    '2021-05-01',  # Quốc tế Lao động
    '2021-09-02',  # Quốc Khánh
    # Năm 2022
    '2022-01-01',  # Tết Dương lịch
    '2022-01-29', '2022-01-30', '2022-01-31', '2022-02-01', '2022-02-02', '2022-02-03', '2022-02-04',  # Tết Nguyên Đán
    '2022-04-10',  # Giỗ Tổ Hùng Vương
    '2022-04-30',  # Ngày Giải phóng miền Nam
    '2022-05-01',  # Quốc tế Lao động
    '2022-09-02',  # Quốc Khánh
    # Năm 2023
    '2023-01-01',  # Tết Dương lịch
    '2023-01-20', '2023-01-21', '2023-01-22', '2023-01-23', '2023-01-24', '2023-01-25', '2023-01-26',  # Tết Nguyên Đán
    '2023-04-29',  # Giỗ Tổ Hùng Vương
    '2023-04-30',  # Ngày Giải phóng miền Nam
    '2023-05-01',  # Quốc tế Lao động
    '2023-09-02',  # Quốc Khánh
    # Năm 2024
    '2024-01-01',  # Tết Dương lịch
    '2024-02-08', '2024-02-09', '2024-02-10', '2024-02-11', '2024-02-12',  # Tết Nguyên Đán
    '2024-04-10',  # Giỗ Tổ Hùng Vương
    '2024-04-30',  # Ngày Giải phóng miền Nam
    '2024-05-01',  # Quốc tế Lao động
    '2024-09-02'   # Quốc Khánh
]

# Chuyển đổi chuỗi thành định dạng datetime
public_holidays = pd.to_datetime(public_holidays)

# Thêm cột 'day off': 1 nếu là ngày nghỉ, 0 nếu không phải
df['day off'] = np.where((df['Ngày'].isin(public_holidays)) | (df['Thứ'].isin([2, 3])), 1, 0)


*Thêm dữ liệu nhiệt độ*

In [418]:
df_temp = pd.read_csv('data/temperature.csv', header = 0)
df_temp.head(10)

Unnamed: 0,date,tavg,tmin,tmax,prcp,snow,wdir,wspd,wpgt,pres,tsun
0,2021-01-01,25.1,23.0,30.0,,,28,11.8,,1011.3,
1,2021-01-02,26.2,22.0,31.0,,,3,10.2,,1010.5,
2,2021-01-03,27.3,22.0,32.0,,,357,6.8,,1009.8,
3,2021-01-04,27.8,24.0,33.0,,,39,7.7,,1009.4,
4,2021-01-05,27.6,24.0,32.0,,,31,6.4,,1009.8,
5,2021-01-06,28.1,24.0,32.0,,,71,7.3,,1008.8,
6,2021-01-07,28.1,24.0,34.0,,,57,7.1,,1008.3,
7,2021-01-08,27.6,24.0,33.0,,,355,5.9,,1008.2,
8,2021-01-09,26.9,23.0,32.0,,,37,7.1,,1009.3,
9,2021-01-10,26.1,22.0,30.0,,,351,6.4,,1010.0,


In [419]:
df_temp['date'] = pd.to_datetime(df_temp['date'], format='%Y-%m-%d')
df_final = pd.merge(df, df_temp[['date','tavg', 'tmin', 'tmax']], left_on='Ngày', right_on='date', how='left')

df_final.drop(columns=['date'], inplace=True)
df_final.rename(columns={'Ngày': 'date', 'Thứ': 'day_of_week', 'Value' : 'value'}, inplace=True)

In [420]:
# Chuẩn hóa dữ liệu với MinMaxScaler
scaler = MinMaxScaler()
df_final[['tavg', 'tmin', 'tmax', 'value']] = scaler.fit_transform(df_final[['tavg', 'tmin', 'tmax', 'value']])

# Lưu scaler để sử dụng sau này
joblib.dump(scaler, 'model/minmax_scaler.pkl')

['model/minmax_scaler.pkl']

In [421]:
df_final.to_csv('data/data_clean_v0.csv')

# Đào tạo mô hình Long Short Term Memory

In [422]:
data = pd.read_csv('data/data_clean_v0.csv', index_col='date', parse_dates=True)
data.drop(columns=['Unnamed: 0'], inplace=True)
data.head(10)

Unnamed: 0_level_0,day_of_week,value,day off,tavg,tmin,tmax
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2021-01-01,0,0.205042,1,0.21,0.416667,0.25
2021-01-02,2,0.332894,1,0.32,0.333333,0.333333
2021-01-03,3,0.348436,1,0.43,0.333333,0.416667
2021-01-04,1,0.57901,0,0.48,0.5,0.5
2021-01-05,5,0.64265,0,0.46,0.5,0.416667
2021-01-06,6,0.646798,0,0.51,0.5,0.416667
2021-01-07,4,0.643539,0,0.51,0.5,0.583333
2021-01-08,0,0.647141,0,0.46,0.5,0.5
2021-01-09,2,0.588349,1,0.39,0.416667,0.416667
2021-01-10,3,0.401646,1,0.31,0.333333,0.25


In [423]:
data.info()

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 1369 entries, 2021-01-01 to 2024-09-30
Data columns (total 6 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   day_of_week  1369 non-null   int64  
 1   value        1369 non-null   float64
 2   day off      1369 non-null   int64  
 3   tavg         1369 non-null   float64
 4   tmin         1369 non-null   float64
 5   tmax         1369 non-null   float64
dtypes: float64(4), int64(2)
memory usage: 74.9 KB


In [424]:
data.describe()

Unnamed: 0,day_of_week,value,day off,tavg,tmin,tmax
count,1369.0,1369.0,1369.0,1369.0,1369.0,1369.0
mean,2.995617,0.649714,0.306063,0.560044,0.607859,0.518523
std,2.000361,0.170376,0.461025,0.146351,0.135373,0.152928
min,0.0,0.0,0.0,0.0,0.0,0.0
25%,1.0,0.571889,0.0,0.46,0.5,0.416667
50%,3.0,0.686307,0.0,0.56,0.583333,0.5
75%,5.0,0.758537,1.0,0.66,0.666667,0.666667
max,6.0,1.0,1.0,1.0,1.0,1.0


In [425]:
from tensorflow.keras.models import Sequential # type: ignore
from tensorflow.keras.layers import LSTM, Dense, Dropout # type: ignore
from sklearn.model_selection import train_test_split # type: ignore
import tensorflow as tf # type: ignore 
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint # type: ignore
from fsspec import Callback # type: ignore 
from sklearn.metrics import mean_squared_error
from tensorflow.keras.regularizers import l2 # type: ignore
import math

In [426]:
# Lưu lại cột 'date' và 'day_of_week' trước khi chuyển đổi sang numpy
date_column = data.index
day_of_week_column = data['day_of_week']

# Chuyển đổi thành numpy array sau khi lưu cột cần thiết
data_np = data.drop(columns=['value', 'day_of_week']).values

In [427]:
# Định nghĩa hàm tạo chuỗi dữ liệu cho LSTM
def create_dataset(data, time_step=1):
    X, y = [], []
    for i in range(len(data) - time_step):
        X.append(data[i:(i + time_step), :])
        y.append(data[i + time_step, -1])  # Giả sử giá trị cần dự đoán nằm ở cột cuối
    return np.array(X), np.array(y)

In [428]:
# Tạo mảng dữ liệu cho LSTM
data_values = data[['day_of_week','day off','tavg', 'tmin', 'tmax', 'value']].values
time_step = 7  # Bạn có thể thay đổi giá trị này
X, y = create_dataset(data_values, time_step)

# Chia dữ liệu thành tập huấn luyện và tập kiểm tra
train_size = int(len(X) * 0.93)
X_train, X_test = X[:train_size], X[train_size:]
y_train, y_test = y[:train_size], y[train_size:]

# Chuyển dữ liệu thành dạng 3D cho LSTM
X_train_lstm = np.reshape(X_train, (X_train.shape[0], X_train.shape[1], X_train.shape[2]))
X_test_lstm = np.reshape(X_test, (X_test.shape[0], X_test.shape[1], X_test.shape[2]))

In [429]:
def create_model(units=128, optimizer='adam', dropout_rate=0.2):
    model = Sequential()
    model.add(LSTM(units=units, return_sequences=True, input_shape=(X_train_lstm.shape[1], X_train_lstm.shape[2])))
    model.add(Dropout(dropout_rate))
    model.add(LSTM(units=units, return_sequences=False))
    model.add(Dropout(dropout_rate))
    model.add(Dense(64, activation='relu'))
    model.add(Dense(1))
    model.compile(optimizer=optimizer, loss='mean_squared_error')
    return model

In [430]:
# Xây dựng mô hình LSTM
import tensorflow as tf

def create_improved_model(units=128, optimizer='adam', dropout_rate=0.3, l2_rate=0.01):
    model = Sequential()

    # Thêm Bidirectional LSTM
    model.add(Bidirectional(LSTM(units=units, return_sequences=True, input_shape=(X_train_lstm.shape[1], X_train_lstm.shape[2]), 
                                 kernel_regularizer=l2(l2_rate))))
    model.add(Dropout(dropout_rate))

    model.add(Bidirectional(LSTM(units=units, return_sequences=False, 
                                 kernel_regularizer=l2(l2_rate))))
    model.add(Dropout(dropout_rate))

    # Thay đổi hàm kích hoạt
    model.add(Dense(64))
    model.add(LeakyReLU(alpha=0.1))

    model.add(Dense(1))  # Tầng đầu ra
    model.compile(optimizer=optimizer, loss='mean_squared_error')

    return model

# Compile mô hình
model = create_improved_model(units=256, optimizer=tf.keras.optimizers.Adam(learning_rate=0.0001), dropout_rate=0.2)


Do not pass an `input_shape`/`input_dim` argument to a layer. When using Sequential models, prefer using an `Input(shape)` object as the first layer in the model instead.


Argument `alpha` is deprecated. Use `negative_slope` instead.



In [431]:
import numpy as np
from tensorflow.keras.callbacks import Callback # type: ignore
from sklearn.metrics import mean_squared_error

# Custom callback để tính và in RMSE sau mỗi epoch
class RMSECallback(Callback):
    def __init__(self, X_test, y_test):
        super(RMSECallback, self).__init__()
        self.X_test = X_test
        self.y_test = y_test

    def on_epoch_end(self, epoch, logs=None):
        # Dự đoán trên tập kiểm tra
        y_pred = self.model.predict(self.X_test)

        # Tính RMSE cho tập kiểm tra
        test_rmse = np.sqrt(mean_squared_error(self.y_test, y_pred))

        # In ra màn hình
        print(f'Epoch {epoch + 1} - Test RMSE: {test_rmse:.4f}')


In [432]:
early_stop = EarlyStopping(monitor='val_loss', patience=20, restore_best_weights=True)
checkpoint = ModelCheckpoint('model/best_model.keras', monitor='val_loss', save_best_only=True, mode='min')


In [433]:
# Callback tính RMSE
rmse_callback = RMSECallback(X_test_lstm, y_test)

# Đào tạo mô hình với callback tính RMSE
history = model.fit(X_train_lstm, y_train, validation_data=(X_test_lstm, y_test), 
                    epochs=10, batch_size=64, callbacks=[early_stop, checkpoint])


Epoch 1/10
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 99ms/step - loss: 13.8788 - val_loss: 12.8318
Epoch 2/10
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 55ms/step - loss: 12.5670 - val_loss: 11.7652
Epoch 3/10
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 55ms/step - loss: 11.5083 - val_loss: 10.7730
Epoch 4/10
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 56ms/step - loss: 10.5215 - val_loss: 9.8320
Epoch 5/10
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 58ms/step - loss: 9.6073 - val_loss: 8.9702
Epoch 6/10
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 57ms/step - loss: 8.7617 - val_loss: 8.1764
Epoch 7/10
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 57ms/step - loss: 7.9840 - val_loss: 7.4416
Epoch 8/10
[1m20/20[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 56ms/step - loss: 7.2646 - val_loss: 6.7690
Epoch 9/10
[1m20/20[0m [32m━━━━━━━━━━

In [434]:
# Dự đoán trên tập kiểm tra
y_pred = model.predict(X_test_lstm)

# Tải lại scaler để inverse_transform
scaler = joblib.load('model/minmax_scaler.pkl')

# Sử dụng inverse_transform cho cả giá trị thực và giá trị dự đoán
y_test_inverse = scaler.inverse_transform(np.concatenate((np.zeros((y_test.shape[0], 3)), y_test.reshape(-1, 1)), axis=1))[:, -1]
y_pred_inverse = scaler.inverse_transform(np.concatenate((np.zeros((y_pred.shape[0], 3)), y_pred), axis=1))[:, -1]

# Làm tròn kết quả thành số nguyên
y_test_inverse = np.round(y_test_inverse).astype(int)
y_pred_inverse = np.round(y_pred_inverse).astype(int)


# Tính toán RMSE
rmse = math.sqrt(mean_squared_error(y_test_inverse, y_pred_inverse))
print(f"RMSE: {rmse}")


[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 8ms/step  
RMSE: 9192.028221961316


In [435]:
# Tải lại scaler đã lưu
scaler = joblib.load('model/minmax_scaler.pkl')

# Nghịch đảo chuẩn hóa cho các cột 'tavg', 'tmin', 'tmax', 'value'
X_test_lstm_2d = X_test_lstm.reshape((X_test_lstm.shape[0], X_test_lstm.shape[1] * X_test_lstm.shape[2]))

label_encoder = joblib.load('label_encoder/Thứ_labelencoder.pkl')
df['Thứ'] = label_encoder.inverse_transform(df['Thứ'])

# Xây dựng DataFrame kết quả cho các giá trị thực và dự đoán
date_test = data.index[-len(X_test):]
results_df = pd.DataFrame({
    'date': date_test,
    'day_of_week': df['Thứ'][-len(y_test):].values,
    'actual': y_test_inverse,  # Giá trị thực đã được inverse_transform
    'predicted': y_pred_inverse  # Giá trị dự đoán đã được inverse_transform
})

# Lưu kết quả ra file CSV
results_df.to_csv('model/predicted_results.csv', index=False)

In [436]:


# Vẽ biểu đồ so sánh giá trị thực và dự đoán
fig = go.Figure()

# Thêm dữ liệu thực
fig.add_trace(go.Scatter(
    x=results_df['date'],
    y=results_df['actual'],
    mode='lines',
    name='Giá trị thực',
    line=dict(color='blue')
))

# Thêm dữ liệu dự đoán
fig.add_trace(go.Scatter(
    x=results_df['date'],
    y=results_df['predicted'],
    mode='lines',
    name='Giá trị dự đoán',
    line=dict(color='red')
))

# Cài đặt tiêu đề và nhãn
fig.update_layout(
    title='So sánh giữa giá trị thực và giá trị dự đoán',
    xaxis_title='Ngày',
    yaxis_title='Giá trị',
    legend=dict(x=0, y=1),
    xaxis_rangeslider_visible=True
)

# Hiển thị biểu đồ
fig.show()

In [437]:
results_df.to_csv('data/predict_data.csv')

# Tranfomer

In [438]:
import numpy as np
import pandas as pd
import tensorflow as tf
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
import joblib

# Chuẩn bị dữ liệu như trong ví dụ LSTM
data = pd.read_csv('data/data_clean_v0.csv')

# Chuẩn hóa dữ liệu
scaler = MinMaxScaler()
data[['tavg', 'tmin', 'tmax', 'value']] = scaler.fit_transform(data[['tavg', 'tmin', 'tmax', 'value']])
joblib.dump(scaler, 'model/minmax_scaler.pkl')

# Tạo dataset cho Transformer
def create_dataset(data, time_step=7):
    X, y = [], []
    for i in range(len(data) - time_step):
        X.append(data[i:(i + time_step), :])  # Tất cả các đặc trưng
        y.append(data[i + time_step, -1])  # Cột 'value'
    return np.array(X), np.array(y)

data_np = data.drop(columns=['value', 'date', 'day_of_week']).values
X, y = create_dataset(data_np, time_step=7)

# Chia dữ liệu thành tập huấn luyện và kiểm tra
train_size = int(len(X) * 0.93)
X_train, X_test = X[:train_size], X[train_size:]
y_train, y_test = y[:train_size], y[train_size:]

# Xây dựng Transformer Encoder
class TransformerBlock(tf.keras.layers.Layer):
    def __init__(self, embed_dim, num_heads, ff_dim, rate=0.1):
        super(TransformerBlock, self).__init__()
        self.att = tf.keras.layers.MultiHeadAttention(num_heads=num_heads, key_dim=embed_dim)
        self.ffn = tf.keras.Sequential(
            [tf.keras.layers.Dense(ff_dim, activation="relu"), tf.keras.layers.Dense(embed_dim)]
        )
        self.layernorm1 = tf.keras.layers.LayerNormalization(epsilon=1e-6)
        self.layernorm2 = tf.keras.layers.LayerNormalization(epsilon=1e-6)
        self.dropout1 = tf.keras.layers.Dropout(rate)
        self.dropout2 = tf.keras.layers.Dropout(rate)

    def call(self, inputs, training):
        attn_output = self.att(inputs, inputs)
        attn_output = self.dropout1(attn_output, training=training)
        out1 = self.layernorm1(inputs + attn_output)
        ffn_output = self.ffn(out1)
        ffn_output = self.dropout2(ffn_output, training=training)
        return self.layernorm2(out1 + ffn_output)

# Xây dựng mô hình dự báo Transformer
def create_transformer_model(time_steps, num_features, embed_dim=64, num_heads=2, ff_dim=128, dropout_rate=0.1):
    inputs = tf.keras.layers.Input(shape=(time_steps, num_features))
    transformer_block = TransformerBlock(embed_dim, num_heads, ff_dim, dropout_rate)
    # Gọi transformer_block với tham số training
    x = transformer_block(inputs, training=True)  # Cập nhật ở đây
    x = tf.keras.layers.GlobalAveragePooling1D()(x)
    x = tf.keras.layers.Dense(64, activation="relu")(x)
    x = tf.keras.layers.Dropout(0.1)(x)
    outputs = tf.keras.layers.Dense(1)(x)
    
    model = tf.keras.Model(inputs=inputs, outputs=outputs)
    model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001), loss="mean_squared_error")
    return model

# Tạo mô hình Transformer
time_steps = X_train.shape[1]
num_features = X_train.shape[2]
model = create_transformer_model(time_steps, num_features)

# Huấn luyện mô hình
early_stop = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=20, restore_best_weights=True)
checkpoint = tf.keras.callbacks.ModelCheckpoint('model/best_transformer_model.keras', monitor='val_loss', save_best_only=True)

history = model.fit(X_train, y_train, validation_data=(X_test, y_test), 
                    epochs=200, batch_size=64, callbacks=[early_stop, checkpoint])

# Dự đoán và đánh giá kết quả
y_pred = model.predict(X_test)

# Tải lại scaler đã lưu
scaler = joblib.load('model/minmax_scaler.pkl')

# Sử dụng inverse_transform cho cả giá trị thực và giá trị dự đoán
y_test_inverse = scaler.inverse_transform(np.concatenate((np.zeros((y_test.shape[0], 3)), y_test.reshape(-1, 1)), axis=1))[:, -1]
y_pred_inverse = scaler.inverse_transform(np.concatenate((np.zeros((y_pred.shape[0], 3)), y_pred), axis=1))[:, -1]

# Hiển thị kết quả
import plotly.graph_objects as go

results_df = pd.DataFrame({
    'actual': y_test_inverse,
    'predicted': y_pred_inverse
})

fig = go.Figure()

fig.add_trace(go.Scatter(y=results_df['actual'], mode='lines', name='Giá trị thực', line=dict(color='blue')))
fig.add_trace(go.Scatter(y=results_df['predicted'], mode='lines', name='Giá trị dự đoán', line=dict(color='red')))

fig.update_layout(title='So sánh giá trị thực và giá trị dự đoán', xaxis_title='Index', yaxis_title='Giá trị')
fig.show()



Layer 'transformer_block_3' looks like it has unbuilt state, but Keras is not able to trace the layer `call()` in order to build it automatically. Possible causes:
1. The `call()` method of your layer may be crashing. Try to `__call__()` the layer eagerly on some test input first to see if it works. E.g. `x = np.random.random((3, 4)); y = layer(x)`
2. If the `call()` method is correct, then you may need to implement the `def build(self, input_shape)` method on your layer. It should create all variables used by the layer (e.g. by calling `layer.build()` on all its children layers).
Exception encountered: ''Dimensions must be equal, but are 5 and 64 for '{{node add_1}} = AddV2[T=DT_FLOAT](layer_normalization_6_1/add_2, dropout_28_1/stateless_dropout/SelectV2)' with input shapes: [?,7,5], [?,7,64].''


`build()` was called on layer 'transformer_block_3', however the layer does not have a `build()` method implemented and it looks like it has unbuilt state. This will cause the layer to be 

ValueError: Exception encountered when calling TransformerBlock.call().

[1mCould not automatically infer the output shape / dtype of 'transformer_block_3' (of type TransformerBlock). Either the `TransformerBlock.call()` method is incorrect, or you need to implement the `TransformerBlock.compute_output_spec() / compute_output_shape()` method. Error encountered:

Dimensions must be equal, but are 5 and 64 for '{{node add_1}} = AddV2[T=DT_FLOAT](layer_normalization_6_1/add_2, dropout_28_1/stateless_dropout/SelectV2)' with input shapes: [?,7,5], [?,7,64].[0m

Arguments received by TransformerBlock.call():
  • args=('<KerasTensor shape=(None, 7, 5), dtype=float32, sparse=None, name=keras_tensor_76>',)
  • kwargs={'training': 'True'}

# Temporal Convolutional Network

In [273]:
data = pd.read_csv('data/data_clean_v0.csv')
data.drop(columns=['Unnamed: 0'], inplace=True)

In [274]:
from sklearn.preprocessing import MinMaxScaler
import numpy as np

# Chuẩn bị dữ liệu chuỗi thời gian như trước đó
date_column = data['date']
day_of_week_column = data['day_of_week']
data_np = data.drop(columns=['value', 'date', 'day_of_week']).values

# Hàm tạo dataset cho TCN
def create_dataset(data, time_step=1):
    X, y = [], []
    for i in range(len(data) - time_step):
        X.append(data[i:(i + time_step), :-1])
        y.append(data[i + time_step - 1, -1])
    return np.array(X), np.array(y)

# Chia dữ liệu thành đầu vào (X) và đầu ra (y)
X, y = create_dataset(data_np, time_step=7)

# Chia dữ liệu thành tập huấn luyện và kiểm tra
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False)

# Thêm một chiều cho dữ liệu để phù hợp với Transformer (batch_size, sequence_length, num_features)
X_train = np.expand_dims(X_train, axis=0)
X_test = np.expand_dims(X_test, axis=0)

In [275]:
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense, Dropout, LayerNormalization, MultiHeadAttention

# Hàm xây dựng mô hình Transformer
def create_transformer_model(input_shape, num_heads=8, ff_dim=128, dropout_rate=0.1):
    inputs = Input(shape=input_shape)

    # Lớp MultiHeadAttention
    attention = MultiHeadAttention(num_heads=num_heads, key_dim=input_shape[-1])(inputs, inputs)
    attention = Dropout(dropout_rate)(attention)
    attention = LayerNormalization(epsilon=1e-6)(attention)
    
    # Lớp Feed-Forward
    ff_output = Dense(ff_dim, activation='relu')(attention)
    ff_output = Dense(input_shape[-1])(ff_output)
    ff_output = Dropout(dropout_rate)(ff_output)
    ff_output = LayerNormalization(epsilon=1e-6)(ff_output + attention)  # Residual connection
    
    # Dự đoán
    outputs = Dense(1)(ff_output)
    
    # Tạo mô hình
    model = Model(inputs=inputs, outputs=outputs)
    model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001), loss='mse')
    
    return model

# Khởi tạo mô hình Transformer
input_shape = (X_train.shape[1], X_train.shape[2])
model = create_transformer_model(input_shape)

# Kiểm tra kiến trúc của mô hình
model.summary()


In [276]:
# Thiết lập EarlyStopping và ModelCheckpoint
early_stop = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True)
checkpoint = tf.keras.callbacks.ModelCheckpoint('model/best_transformer_model.keras', save_best_only=True)

# Huấn luyện mô hình
history = model.fit(
    X_train, y_train,
    epochs=50,
    batch_size=64,
    validation_data=(X_test, y_test),
    callbacks=[early_stop, checkpoint]
)


ValueError: Data cardinality is ambiguous. Make sure all arrays contain the same number of samples.'x' sizes: 1
'y' sizes: 1089


In [None]:
# Dự đoán trên tập kiểm tra
y_pred = model.predict(X_test)

# Biến đổi ngược scaler
y_test_inverse = scaler.inverse_transform(np.concatenate((np.zeros((y_test.shape[0], 3)), y_test.reshape(-1, 1)), axis=1))[:, -1]
y_pred_inverse = scaler.inverse_transform(np.concatenate((np.zeros((y_pred.shape[0], 3)), y_pred), axis=1))[:, -1]

# So sánh giá trị thực và dự đoán
results_df = pd.DataFrame({
    'date': date_column.iloc[len(data) - len(X_test):].values,
    'day_of_week': day_of_week_column.iloc[len(data) - len(X_test):].values,
    'actual': y_test_inverse,
    'predicted': y_pred_inverse
})

# Hiển thị kết quả dự đoán
import plotly.graph_objects as go

fig = go.Figure()

fig.add_trace(go.Scatter(
    x=results_df['date'],
    y=results_df['actual'],
    mode='lines',
    name='Giá trị thực',
    line=dict(color='blue')
))

fig.add_trace(go.Scatter(
    x=results_df['date'],
    y=results_df['predicted'],
    mode='lines',
    name='Giá trị dự đoán',
    line=dict(color='red')
))

fig.update_layout(
    title='So sánh giá trị thực và giá trị dự đoán',
    xaxis_title='Ngày',
    yaxis_title='Giá trị',
    legend=dict(x=0, y=1),
    xaxis_rangeslider_visible=True
)

fig.show()
