In [2]:
pip install torch

Collecting torch
  Obtaining dependency information for torch from https://files.pythonhosted.org/packages/59/1f/4975d1ab3ed2244053876321ef65bc02935daed67da76c6e7d65900772a3/torch-2.2.1-cp311-cp311-win_amd64.whl.metadata
  Downloading torch-2.2.1-cp311-cp311-win_amd64.whl.metadata (26 kB)
Collecting typing-extensions>=4.8.0 (from torch)
  Obtaining dependency information for typing-extensions>=4.8.0 from https://files.pythonhosted.org/packages/f9/de/dc04a3ea60b22624b51c703a84bbe0184abcd1d0b9bc8074b5d6b7ab90bb/typing_extensions-4.10.0-py3-none-any.whl.metadata
  Downloading typing_extensions-4.10.0-py3-none-any.whl.metadata (3.0 kB)
Downloading torch-2.2.1-cp311-cp311-win_amd64.whl (198.6 MB)
   ---------------------------------------- 0.0/198.6 MB ? eta -:--:--
   ---------------------------------------- 0.1/198.6 MB 1.7 MB/s eta 0:02:01
   ---------------------------------------- 0.2/198.6 MB 2.1 MB/s eta 0:01:35
   ---------------------------------------- 0.5/198.6 MB 3.2 MB/s eta 0:

In [16]:
import pandas as pd
import numpy as np
import torch
import torch.nn as nn
from sklearn.preprocessing import MinMaxScaler
from torch.autograd import Variable

# Định nghĩa mô hình LSTM
import torch
import torch.nn as nn

class ImprovedLSTMModel(nn.Module):
    def __init__(self, input_dim, hidden_dim, num_layers, output_dim, dropout_rate):
        super(ImprovedLSTMModel, self).__init__()
        self.hidden_dim = hidden_dim
        self.num_layers = num_layers
        
        # Định nghĩa một mô hình LSTM đa tầng với dropout
        self.lstm = nn.LSTM(input_dim, hidden_dim, num_layers, batch_first=True, dropout=dropout_rate)
        
        # Định nghĩa lớp đầu ra
        self.fc = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_dim).requires_grad_()
        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_dim).requires_grad_()
        
        out, (hn, cn) = self.lstm(x, (h0.detach(), c0.detach()))
        
        out = self.fc(out[:, -1, :])  # Chỉ lấy thông tin từ tế bào trạng thái ẩn cuối cùng
        return out


def create_dataset(dataset, time_step=60):
    dataX, dataY = [], []
    for i in range(len(dataset) - time_step - 1):
        a = dataset[i:(i + time_step), :]
        dataX.append(a)
        dataY.append(dataset[i + time_step, :])
    return np.array(dataX), np.array(dataY)

# Đọc dữ liệu
data_path = './dulieu.xlsx'  # Thay đổi đường dẫn đến tập dữ liệu của bạn
df = pd.read_excel(data_path)
data = df[['open', 'close']].values.astype(float)

# Chuẩn hóa dữ liệu
scaler = MinMaxScaler(feature_range=(0, 1))
data_scaled = scaler.fit_transform(data)

# Chia dữ liệu
train_size = int(len(data_scaled) * 0.67)
test_size = len(data_scaled) - train_size
train_data, test_data = data_scaled[0:train_size,:], data_scaled[train_size:len(data_scaled),:]

# Tạo dữ liệu cho mô hình
time_step = 60
X_train, y_train = create_dataset(train_data, time_step)
X_test, y_test = create_dataset(test_data, time_step)

# Chuyển dữ liệu thành Tensor
X_train = torch.tensor(X_train).float()
y_train = torch.tensor(y_train).float()
X_test = torch.tensor(X_test).float()
y_test = torch.tensor(y_test).float()

# Khởi tạo mô hình
model = ImprovedLSTMModel(input_dim=2, hidden_dim=64, num_layers=2, output_dim=2, dropout_rate=0.2)

# Loss function và optimizer
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# Huấn luyện mô hình
num_epochs = 100
for epoch in range(num_epochs):
    model.train()
    optimizer.zero_grad()
    
    # Chuyển dữ liệu sang tensor và đưa vào mô hình
    X_train_tensor = torch.tensor(X_train, dtype=torch.float32)
    y_train_tensor = torch.tensor(y_train, dtype=torch.float32)
    
    y_pred = model(X_train_tensor)
    
    loss = criterion(y_pred, y_train_tensor)
    loss.backward()
    optimizer.step()
    
    if (epoch+1) % 10 == 0:
        print(f'Epoch {epoch+1}, Loss: {loss.item()}')


# Đánh giá mô hình
model.eval()
train_predict = model(X_test)

# Chuyển dự đoán về dạng ban đầu
data_predict = train_predict.data.numpy()
dataY_plot = y_test.data.numpy()

data_predict = scaler.inverse_transform(data_predict)
dataY_plot = scaler.inverse_transform(dataY_plot)

# Bạn có thể vẽ biểu đồ dự đoán và thực tế ở đây
# ví dụ: sử dụng matplotlib để vẽ biểu đồ giữa data_predict và dataY_plot


  X_train_tensor = torch.tensor(X_train, dtype=torch.float32)
  y_train_tensor = torch.tensor(y_train, dtype=torch.float32)


Epoch 10, Loss: 0.08349481225013733
Epoch 20, Loss: 0.031070854514837265
Epoch 30, Loss: 0.028052285313606262
Epoch 40, Loss: 0.02019505575299263
Epoch 50, Loss: 0.010146825574338436
Epoch 60, Loss: 0.00326708797365427
Epoch 70, Loss: 0.0028715250082314014
Epoch 80, Loss: 0.0020336618181318045
Epoch 90, Loss: 0.001785204280167818
Epoch 100, Loss: 0.001629269914701581


In [17]:

# Chuyển đổi `predictions_inverse` thành DataFrame pandas
predictions_df = pd.DataFrame(predictions_inverse, columns=['Predicted_Open', 'Predicted_Close'])

# Đọc lại DataFrame gốc để đảm bảo nó không bị thay đổi trong quá trình xử lý trước
data_full = pd.read_excel(data_path)

# Tính chỉ số bắt đầu của dữ liệu kiểm tra trong DataFrame gốc
test_start_idx = train_size + time_step

# Trích xuất dữ liệu kiểm tra từ DataFrame gốc
# Chú ý rằng bạn cần điều chỉnh `len(predictions_df)` nếu số lượng dự đoán không khớp với dữ liệu kiểm tra
data_test_with_predictions = data_full.iloc[test_start_idx:test_start_idx + len(predictions_df)].copy()

# Thêm cột dự đoán vào DataFrame
data_test_with_predictions['Predicted_Open'] = predictions_df['Predicted_Open'].values
data_test_with_predictions['Predicted_Close'] = predictions_df['Predicted_Close'].values

# Hiển thị DataFrame với dữ liệu dự đoán đã được thêm vào
data_test_with_predictions # Thay đổi .head() nếu bạn muốn xem nhiều hàng hơn


Unnamed: 0.1,Unnamed: 0,time,open,high,low,close,volume,MA50,MA200,sup,Buy_signal,Sell_signal,Predicted_Open,Predicted_Close
1936,1936,2020-10-09,56920,56920,56230,56380,438960,54685.0,54640.945,57119.133509,0,0,55507.531250,55369.949219
1937,1937,2020-10-12,56380,58130,56160,56920,1917010,54829.2,54578.995,57119.133509,0,0,55879.062500,55731.019531
1938,1938,2020-10-13,57000,57450,56690,56920,596720,54947.6,54515.245,57119.133509,0,0,56178.585938,56036.210938
1939,1939,2020-10-14,57300,57830,56840,57070,1263470,55055.4,54450.045,57119.133509,0,0,56461.203125,56322.496094
1940,1940,2020-10-15,57680,58370,56920,56920,1377170,55152.6,54386.645,57119.133509,0,0,56731.394531,56594.652344
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2794,2794,2024-03-18,82300,82900,79900,80200,2494200,77036.0,79483.400,76936.704616,0,0,77615.117188,77976.328125
2795,2795,2024-03-19,81000,81000,79700,79700,950400,77118.0,79511.950,76936.704616,0,0,77910.671875,78285.320312
2796,2796,2024-03-20,80000,81200,79600,81000,1462300,77218.0,79547.000,76936.704616,0,0,78015.218750,78406.593750
2797,2797,2024-03-21,81900,81900,80500,81000,938700,77304.0,79574.000,76936.704616,0,0,78080.265625,78485.078125


In [20]:

# Sai số tuyệt đối
absolute_error = abs(open - Predicted_Open)

# Sai số tương đối
relative_error = (absolute_error / open) * 100

absolute_error, relative_error

NameError: name 'Predicted_Open' is not defined

In [18]:

# Sai số tuyệt đối
absolute_error = abs(Open - Predicted_Open)

# Sai số tương đối
relative_error = (absolute_error / Open) * 100

absolute_error, relative_error

NameError: name 'Open' is not defined