In [2]:
import numpy as np

In [3]:
# Bài toán XOR: Có 4 mẫu đầu vào và đầu ra tương ứng
# Tạo mảng X chứa 4 mẫu đầu vào: [0,0], [0,1], [1,0], [1,1]
X = np.array([[0,0], [0,1], [1,0], [1,1]]) # Đầu vào
# Tạo mảng y chứa kết quả đầu ra tương ứng với 4 mẫu đầu vào theo phép XOR: 0, 1, 1, 0
y = np.array([[0], [1], [1], [0]])

In [4]:
def sigmoid(x):
  # Hàm sigmoid: f(x) = 1/(1+e^(-x)) , giới hạn đầu trong khoảng (0, 1)
  return 1/(1+np.exp(-x));

In [5]:
def sigmoid_derivative(x):
  # Đạo hàm của hàm sigmoid: f'(x) = f(x)*(1-f(x))
  # lưu ý: x ở đây là giá trị của hàm sigmoid
  return x*(1-x);

In [6]:
# Định nghĩa lớp mạng nơ-ron:
class NeuralNetwork:
  def __init__(self, x, y):
    # Khởi tạo mạng với dữ liệu đầu vào là x và đầu ra mong muốn là y
    self.input = x
    # Khởi tạo ngẫu nhiên trọng số kết nối từ lớp đầu vào (2 node)
    # đến lớp ẩn (4 node)
    self.weigths1 = np.random.rand(self.input.shape[1], 4) # Trọng số lớp đầu vào -> lớp ẩn
    # Khởi tạo ngẫu nhiên trọng số kết nối từ lớp ẩn (4 node) đến lớp đầu ra (1 node)
    self.weigths2 = np.random.rand(4, 1)
    # Lưu trữ đầu ra mong muốn
    self.y = y
    # Khởi tạo mảng đầu ra với kích thước giống y và giá trị ban đầu bằng 0
    self.output = np.zeros(self.y.shape)

  def feedforward(self):
    # Lan truyền thuận - tính đầu ra của mạng với trọng số hiện tại
    # Tính đầu ra của lớp ẩn: input * weights1 qua hàm sigmoid
    self.layer1 = sigmoid(np.dot(self.input, self.weigths1)) # đầu ra của lớp ẩn
    # Tính đầu ra của lớp đầu ra: layer1 * weights2 qua hàm sigmoid
    self.output = sigmoid(np.dot(self.layer1, self.weigths2)) # đầu ra của lớp đầu ra

  def backprop(self):
    # Lan truyền ngược - cập nhật trọng số dựa trên lỗi
    # Tính gradient
    # Tính đạo hàm của lỗi theo weights2:
    # (layer1.T là chuyển vị của layer1) nhân với (2*lỗi*đạo hàm sigmoid tại output)
    # Hệ số 2 từ đạo hàm của hàm lỗi bình phương
    d_weights2 = np.dot(self.layer1.T, (2*(self.y - self.output) * sigmoid_derivative(self.output)))
    # Tính đạo hàm của lỗi theo weights1:
    # (input.T nhân với đạo hàm lỗi theo layer1 * sigmoid tại layer1)
    # Đạo hàm lỗi theo layer1 = đạo hàm lỗi theo output nhân với weights2.T
    d_weights1 = np.dot(self.input.T, np.dot(2*(self.y - self.output) * sigmoid_derivative(self.output), self.weigths2.T) * sigmoid_derivative(self.layer1))

    # Cập nhật trọng số bằng cách công với gradient (learning rate mặc định bằng 1)
    self.weigths1 += d_weights1
    self.weigths2 += d_weights2

In [None]:
# KHỞI TẠO ĐỐI TƯỢNG MẠNG NEURAL VỚI DỮ LIỆU X, y

In [7]:
nn = NeuralNetwork(X, y)

In [8]:
# Huấn luyện mạng neural qua 10000 vòng lặp (epochs)
for i in range(100000):
  # Tính đầu ra với trọng số hiện tại
  nn.feedforward()
  # Cập nhật trọng số dựa trên lỗi
  nn.backprop()
  # in ra lỗi sau mỗi 1000 epochs để theo dõi quá trình huấn luyện
  if i % 1000 == 0:
    print("Lỗi sau", i, "epochs:", np.mean(np.square(y - nn.output)))

Lỗi sau 0 epochs: 0.33670120430697037
Lỗi sau 1000 epochs: 0.0023321526867997903
Lỗi sau 2000 epochs: 0.0009570587948889826
Lỗi sau 3000 epochs: 0.0005664616753446061
Lỗi sau 4000 epochs: 0.00038433760230197766
Lỗi sau 5000 epochs: 0.00028190553706419075
Lỗi sau 6000 epochs: 0.0002185864165392997
Lỗi sau 7000 epochs: 0.00017686657749637044
Lỗi sau 8000 epochs: 0.00014790146720300245
Lỗi sau 9000 epochs: 0.00012687523346233582
Lỗi sau 10000 epochs: 0.00011102821549974075
Lỗi sau 11000 epochs: 9.870500064730572e-05
Lỗi sau 12000 epochs: 8.886918147183686e-05
Lỗi sau 13000 epochs: 8.084601154243208e-05
Lỗi sau 14000 epochs: 7.418054457965024e-05
Lỗi sau 15000 epochs: 6.855637884331475e-05
Lỗi sau 16000 epochs: 6.374737728469617e-05
Lỗi sau 17000 epochs: 5.9587985516364185e-05
Lỗi sau 18000 epochs: 5.595440476431277e-05
Lỗi sau 19000 epochs: 5.275230679671522e-05
Lỗi sau 20000 epochs: 4.990860959978989e-05
Lỗi sau 21000 epochs: 4.7365842625999254e-05
Lỗi sau 22000 epochs: 4.50782045982304e

In [9]:
# Tính đầu ra cuối cùng với trọng số đã huấn luyện
nn.feedforward()
# In ra đầu ra dự đoán
print(nn.output)

[[0.00292764]
 [0.99680545]
 [0.99674882]
 [0.0032348 ]]
