In [24]:
import numpy as np

# Đặt seed để đảm bảo tái lập được kết quả random
np.random.seed(42)

class NeuralNetwork:
    def __init__(self, input_size, hidden_layers, output_size):
        # Khởi tạo các trọng số ngẫu nhiên
        self.weights = [
            np.random.randn(input_size, hidden_layers[0]),
            np.random.randn(hidden_layers[0], hidden_layers[1]),
            np.random.randn(hidden_layers[1], output_size)
        ]
        self.biases = [
            np.zeros((1, hidden_layers[0])),
            np.zeros((1, hidden_layers[1])),
            np.zeros((1, output_size))
        ]
    
    def relu(self, x):
        return np.maximum(0, x)
    
    def relu_derivative(self, x):
        return (x > 0).astype(float)
    
    def forward(self, X):
        # Lan truyền xuôi
        self.layer1_input = np.dot(X, self.weights[0]) + self.biases[0]
        self.layer1_output = self.relu(self.layer1_input)
        
        self.layer2_input = np.dot(self.layer1_output, self.weights[1]) + self.biases[1]
        self.layer2_output = self.relu(self.layer2_input)
        
        output = np.dot(self.layer2_output, self.weights[2]) + self.biases[2]
        return output
    
    def train(self, X, Y, learning_rate=0.1, epochs=1000):
        for _ in range(epochs):
            # Lan truyền xuôi
            output = self.forward(X)
            
            # Lan truyền ngược
            error = output - Y
            
            # Đạo hàm của lớp đầu ra
            output_delta = error
            
            # Đạo hàm của lớp thứ 2
            layer2_error = np.dot(output_delta, self.weights[2].T)
            layer2_delta = layer2_error * self.relu_derivative(self.layer2_input)
            
            # Đạo hàm của lớp thứ 1
            layer1_error = np.dot(layer2_delta, self.weights[1].T)
            layer1_delta = layer1_error * self.relu_derivative(self.layer1_input)
            
            # Cập nhật trọng số và độ chệch
            self.weights[2] -= learning_rate * np.dot(self.layer2_output.T, output_delta)
            self.biases[2] -= learning_rate * np.sum(output_delta, axis=0, keepdims=True)
            
            self.weights[1] -= learning_rate * np.dot(self.layer1_output.T, layer2_delta)
            self.biases[1] -= learning_rate * np.sum(layer2_delta, axis=0, keepdims=True)
            
            self.weights[0] -= learning_rate * np.dot(X.T, layer1_delta)
            self.biases[0] -= learning_rate * np.sum(layer1_delta, axis=0, keepdims=True)
        
        # print("weights1:", self.weights[0])
        # print("weights2:", self.weights[1])
        # print("weights3:", self.weights[2])
        # print("biases1:", self.biases[0])
        # print("biases2:", self.biases[1])
        # print("biases3:", self.biases[2])
        return self

# Dữ liệu đầu vào
X = np.array([[-2], [1], [2], [3], [4]])
Y = np.array([[4], [5], [2], [2], [8]])

# Khởi tạo và huấn luyện mạng nơ-ron
nn = NeuralNetwork(input_size=1, hidden_layers=[3, 4], output_size=1)
nn.train(X, Y)

# Dự đoán
predictions = nn.forward(X)
print("Dự đoán:", predictions)
print("Thực tế:", Y)

Dự đoán: [[4.2]
 [4.2]
 [4.2]
 [4.2]
 [4.2]]
Thực tế: [[4]
 [5]
 [2]
 [2]
 [8]]


In [None]:
import numpy as np
np.random.seed(42)

# Dữ liệu đầu vào
X = np.array([[-2], [1], [2], [3], [4]])
Y = np.array([[4], [5], [2], [2], [8]])

# Khởi tạo trọng số và độ chệch
weights1 = np.random.randn(1, 3)
biases1 = np.zeros((1, 3))
weights2 = np.random.randn(3, 4)
biases2 = np.zeros((1, 4))
weights3 = np.random.randn(4, 1)
biases3 = np.zeros((1, 1))

learning_rate = 0.1

def relu(x):
    return np.maximum(0, x)

def relu_derivative(x):
    return (x > 0).astype(float)

# Lan truyền xuôi
Z1 = np.dot(X, weights1) + biases1
H1 = relu(Z1)

Z2 = np.dot(H1, weights2) + biases2
H2 = relu(Z2)

output = np.dot(H2, weights3) + biases3


# Lan truyền ngược
error = output - Y


output_delta = error
layer2_error = np.dot(output_delta, weights3.T)
layer2_delta = layer2_error * relu_derivative(layer2_input)


layer1_error = np.dot(layer2_delta, weights2.T)
layer1_delta = layer1_error * relu_derivative(layer1_input)


# Cập nhật tham số
weights3 -= learning_rate * np.dot(layer2_output.T, output_delta)
biases3 -= learning_rate * np.sum(output_delta, axis=0, keepdims=True)

weights2 -= learning_rate * np.dot(layer1_output.T, layer2_delta)
biases2 -= learning_rate * np.sum(layer2_delta, axis=0, keepdims=True)

weights1 -= learning_rate * np.dot(X.T, layer1_delta)
biases1 -= learning_rate * np.sum(layer1_delta, axis=0, keepdims=True)

print("Trọng số W3 sau cập nhật:", weights3)
print("Độ chệch b3 sau cập nhật:", biases3)

# Dự đoán
predictions = output
print("Dự đoán:", predictions)


Trọng số W3 sau cập nhật: [[ 2.06684678]
 [-0.78694245]
 [ 0.37534362]
 [-0.90802408]]
Độ chệch b3 sau cập nhật: [[2.40390896]]
Dự đoán: [[-0.07217975]
 [-0.29669099]
 [-0.59338198]
 [-0.89007297]
 [-1.18676395]]
