In [None]:
# Import các thư viện cần thiết
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Đọc dữ liệu từ các file CSV
fpt_data = pd.read_csv('FPT.csv')
pnj_data = pd.read_csv('PNJ.csv')
msn_data = pd.read_csv('MSN.csv')
vic_data = pd.read_csv('VIC.csv')

# Chuyển đổi cột 'Date/Time' thành định dạng datetime
fpt_data['Date/Time'] = pd.to_datetime(fpt_data['Date/Time'])
pnj_data['Date/Time'] = pd.to_datetime(pnj_data['Date/Time'])
msn_data['Date/Time'] = pd.to_datetime(msn_data['Date/Time'])
vic_data['Date/Time'] = pd.to_datetime(vic_data['Date/Time'])

# Đặt 'Date/Time' làm index
fpt_data.set_index('Date/Time', inplace=True)
pnj_data.set_index('Date/Time', inplace=True)
msn_data.set_index('Date/Time', inplace=True)
vic_data.set_index('Date/Time', inplace=True)

# Vẽ biểu đồ giá cổ phiếu theo thời gian
plt.figure(figsize=(10, 5))
plt.plot(fpt_data['Close'], label='FPT')
plt.plot(pnj_data['Close'], label='PNJ')
plt.plot(msn_data['Close'], label='MSN')
plt.plot(vic_data['Close'], label='VIC')
plt.legend()
plt.title('Giá đóng cửa của các cổ phiếu theo thời gian')
plt.xlabel('Thời gian')
plt.ylabel('Giá đóng cửa')
plt.show()

# Tạo biến mục tiêu (y) là biến động giá cổ phiếu
fpt_data['Price Change'] = fpt_data['Close'].shift(-1) - fpt_data['Close']

# Xóa các giá trị NaN
fpt_data.dropna(inplace=True)

# Chọn các biến đầu vào (X) và biến mục tiêu (y)
X = fpt_data[['Open', 'High', 'Low', 'Close', 'Volume']]
y = fpt_data['Price Change']

# Chia dữ liệu thành tập huấn luyện và tập kiểm tra
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Xây dựng mô hình Linear Regression
model = LinearRegression()
model.fit(X_train, y_train)

# Dự đoán và đánh giá mô hình
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
print('Mean Squared Error:', mse)


: 