In [1]:
from sklearn.datasets import load_iris
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
import numpy as np

# Load bộ dữ liệu Iris
iris = load_iris()
X, y = iris.data, iris.target

In [2]:
class ContinualLearningModel:
    def __init__(self):
        self.model = LinearRegression()
        self.previous_data = None

    def train(self, X_train, y_train):
        # Áp dụng continual learning
        if self.previous_data is not None:
            X_train = np.concatenate([self.previous_data['X'], X_train])
            y_train = np.concatenate([self.previous_data['y'], y_train])

        self.model.fit(X_train, y_train)

    def test_production(self, X_test, y_test):
        # Kiểm thử sản xuất
        y_pred = self.model.predict(X_test)
        mse = mean_squared_error(y_test, y_pred)
        print(f"Mean Squared Error on production data: {mse}")

    def update_previous_data(self, X, y):
        # Cập nhật dữ liệu trước đó sau mỗi lần huấn luyện
        self.previous_data = {'X': X, 'y': y}


In [3]:
# Chia dữ liệu thành tập huấn luyện và tập kiểm thử
X_train_1, X_test_1, y_train_1, y_test_1 = train_test_split(X, y, test_size=0.2, random_state=42)


In [4]:
# Tạo và huấn luyện mô hình
model = ContinualLearningModel()
model.train(X_train_1, y_train_1)
model.test_production(X_test_1, y_test_1)


Mean Squared Error on production data: 0.03711379440797686


In [5]:
# Cập nhật dữ liệu và tiếp tục huấn luyện
X_train_2, X_test_2, y_train_2, y_test_2 = train_test_split(X, y, test_size=0.2, random_state=123)
model.update_previous_data(X_train_1, y_train_1)
model.train(X_train_2, y_train_2)
model.test_production(X_test_2, y_test_2)

Mean Squared Error on production data: 0.04789760484101265
