In [1]:
import numpy as np

In [2]:
class SimpleNeuralNetwork:
    def __init__(self, input_size, hidden_size, output_size, learning_rate=0.01):
        # Khởi tạo trọng số
        self.W1 = np.random.randn(input_size, hidden_size) * 0.01  # Trọng số từ đầu vào đến lớp ẩn
        self.b1 = np.zeros((1, hidden_size))  # Độ chệch cho lớp ẩn
        self.W2 = np.random.randn(hidden_size, output_size) * 0.01  # Trọng số từ lớp ẩn đến đầu ra
        self.b2 = np.zeros((1, output_size))  # Độ chệch cho lớp đầu ra
        self.learning_rate = learning_rate

    def relu(self, x):
        return np.maximum(0, x)

    def softmax(self, x):
        exp_x = np.exp(x - np.max(x, axis=1, keepdims=True))  # Để ổn định số học
        return exp_x / np.sum(exp_x, axis=1, keepdims=True)

    def compute_loss(self, y_true, y_pred):
        # Hàm mất mát Sparse Categorical Cross Entropy
        loss = -np.log(y_pred[range(len(y_true)), y_true])
        return np.mean(loss)

    def forward(self, X):
        # Lan truyền xuôi
        self.z1 = np.dot(X, self.W1) + self.b1
        self.a1 = self.relu(self.z1)
        self.z2 = np.dot(self.a1, self.W2) + self.b2
        self.a2 = self.softmax(self.z2)
        return self.a2

    def backward(self, X, y_true, y_pred):
        # Lan truyền ngược
        m = y_true.shape[0]  # Số mẫu
        grad_z2 = y_pred
        grad_z2[range(m), y_true] -= 1  # Đạo hàm hàm mất mát
        grad_z2 /= m

        # Tính toán đạo hàm cho W2 và b2
        grad_W2 = np.dot(self.a1.T, grad_z2)
        grad_b2 = np.sum(grad_z2, axis=0, keepdims=True)

        # Tính toán đạo hàm cho lớp ẩn
        grad_a1 = np.dot(grad_z2, self.W2.T)
        grad_z1 = grad_a1 * (self.z1 > 0)  # Đạo hàm của ReLU

        # Tính toán đạo hàm cho W1 và b1
        grad_W1 = np.dot(X.T, grad_z1)
        grad_b1 = np.sum(grad_z1, axis=0, keepdims=True)

        # Cập nhật trọng số
        self.W1 -= self.learning_rate * grad_W1
        self.b1 -= self.learning_rate * grad_b1
        self.W2 -= self.learning_rate * grad_W2
        self.b2 -= self.learning_rate * grad_b2

    def fit(self, X, y, epochs):
        for epoch in range(epochs):
            # Lan truyền xuôi
            y_pred = self.forward(X)

            # Tính hàm mất mát
            loss = self.compute_loss(y, y_pred)

            # Lan truyền ngược
            self.backward(X, y, y_pred)

            # In thông tin huấn luyện
            if epoch % 100 == 0:
                print(f"Epoch {epoch}, Loss: {loss}")

In [17]:
class SimpleNeuralNetwork2:
    def __init__(self, input_size, hidden_size, output_size, learning_rate=0.01):
        # Khởi tạo trọng số
        self.W1 = np.random.randn(input_size, hidden_size) * 0.01
        self.b1 = np.zeros((1, hidden_size))  # bias cho lớp ẩn
        self.W2 = np.random.randn(hidden_size, output_size) * 0.01
        self.b2 = np.zeros((1, output_size))  # bias cho lớp đầu ra
        self.learning_rate = learning_rate

    def relu(self, x):
        return np.maximum(0, x)

    def softmax(self, x):
        exp_x = np.exp(x - np.max(x, axis=1, keepdims=True))
        return exp_x / np.sum(exp_x, axis=1, keepdims=True)

    def compute_loss(self, y_true, y_pred):
        # Hàm mất mát Sparse Categorical Cross Entropy
        loss = -np.log(y_pred[range(len(y_true)), y_true])
        return np.mean(loss)

    def forward(self, X):
        # Lan truyền xuôi
        self.z1 = np.dot(X, self.W1) + self.b1
        self.a1 = self.relu(self.z1)
        self.z2 = np.dot(self.a1, self.W2) + self.b2
        self.a2 = self.softmax(self.z2)
        return self.a2

    def backward(self, X, y_true, y_pred):
        # Lan truyền ngược
        m = y_true.shape[0]  # Số mẫu
        # y_true: (4,)
        # y_pred: (4, 2)
        grad_z2 = y_pred
        grad_z2[range(m), y_true] -= 1  # Đạo hàm hàm mất mát
        grad_z2 /= m

        # Tính toán đạo hàm cho W2 và b2
        grad_W2 = np.dot(self.a1.T, grad_z2)
        grad_b2 = np.sum(grad_z2, axis=0, keepdims=True)

        # Tính toán đạo hàm cho lớp ẩn
        grad_a1 = np.dot(grad_z2, self.W2.T)
        grad_z1 = grad_a1 * (self.z1 > 0)  # Đạo hàm của ReLU

        # Tính toán đạo hàm cho W1 và b1
        grad_W1 = np.dot(X.T, grad_z1)
        grad_b1 = np.sum(grad_z1, axis=0, keepdims=True)

        # Cập nhật trọng số
        self.W1 -= self.learning_rate * grad_W1
        self.b1 -= self.learning_rate * grad_b1
        self.W2 -= self.learning_rate * grad_W2
        self.b2 -= self.learning_rate * grad_b2

    def fit(self, X, y, epochs):
        for epoch in range(epochs):
            # Lan truyền xuôi
            y_pred = self.forward(X)

            # Tính hàm mất mát
            loss = self.compute_loss(y, y_pred)

            # Lan truyền ngược
            self.backward(X, y, y_pred)

            # In thông tin huấn luyện
            if epoch % 100 == 0:
                print(f"Epoch {epoch}, Loss: {loss}")

In [16]:
# Ví dụ sử dụng
if __name__ == "__main__":
    # Dữ liệu giả lập (2 lớp với 4 điểm dữ liệu)
    X = np.array([[0.1, 0.2],
                  [0.2, 0.1],
                  [0.9, 0.8],
                  [0.8, 0.9]])
    y = np.array([0, 0, 1, 1])  # Nhãn thực tế

    # Khởi tạo và huấn luyện mạng nơ-ron
    # nn = SimpleNeuralNetwork(input_size=2, hidden_size=3, output_size=2, learning_rate=0.01)
    # nn.fit(X, y, epochs=1000)
    nn = SimpleNeuralNetwork2(input_size=2, hidden_size=3, output_size=2, learning_rate=0.01)
    nn.fit(X, y, epochs=1000)

y_true: (4,), y_pred: [[0.50000137 0.49999863]
 [0.50000085 0.49999915]
 [0.50001664 0.49998336]
 [0.50001398 0.49998602]]
Epoch 0, Loss: 0.693161383930232
y_true: (4,), y_pred: [[0.50000126 0.49999874]
 [0.5000016  0.4999984 ]
 [0.50001615 0.49998385]
 [0.5000135  0.4999865 ]]
y_true: (4,), y_pred: [[0.50000114 0.49999886]
 [0.50000235 0.49999765]
 [0.50001565 0.49998435]
 [0.50001301 0.49998699]]
y_true: (4,), y_pred: [[0.50000103 0.49999897]
 [0.5000031  0.4999969 ]
 [0.50001515 0.49998485]
 [0.50001253 0.49998747]]
y_true: (4,), y_pred: [[0.50000092 0.49999908]
 [0.50000353 0.49999647]
 [0.50001466 0.49998534]
 [0.50001205 0.49998795]]
y_true: (4,), y_pred: [[0.50000081 0.49999919]
 [0.50000341 0.49999659]
 [0.50001417 0.49998583]
 [0.50001157 0.49998843]]
y_true: (4,), y_pred: [[0.50000069 0.49999931]
 [0.50000328 0.49999672]
 [0.50001368 0.49998632]
 [0.50001109 0.49998891]]
y_true: (4,), y_pred: [[0.50000059 0.49999941]
 [0.50000316 0.49999684]
 [0.50001319 0.49998681]
 [0.50001

In [20]:
Z = np.array([[1.0, 2.0, 3.0],
              [1.0, 2.0, 4.0],
              [1.0, 2.0, 5.0]])
Z_max = np.max(Z, axis=1, keepdims=True)
Z_max

array([[3.],
       [4.],
       [5.]])

In [None]:
import tensorflow as tf
from tensorflow.keras import layers, models

# Load và chuẩn hóa dữ liệu MNIST
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

# Thêm kênh chiều cho hình ảnh (28, 28) -> (28, 28, 1)
x_train = x_train[..., tf.newaxis]
x_test = x_test[..., tf.newaxis]

# Xây dựng mô hình neural network đơn giản
model = models.Sequential([
    layers.InputLayer(input_shape=(28, 28, 1)),      # Lớp đầu vào cho ảnh kích thước 28x28x1
    layers.Conv2D(32, (3, 3), activation='relu'),    # Lớp convolutional với 32 filters, kernel size 3x3
    layers.MaxPooling2D((2, 2)),                     # Lớp max pooling
    layers.Conv2D(64, (3, 3), activation='relu'),    # Lớp convolutional thứ hai
    layers.MaxPooling2D((2, 2)),                     # Lớp max pooling thứ hai
    layers.Flatten(),                                # Flatten để chuyển đổi thành vector
    layers.Dense(64, activation='relu'),             # Lớp fully connected với 64 node
    layers.Dense(10)                                 # Lớp đầu ra với 10 đơn vị (chưa áp dụng softmax)
])

# Compile mô hình
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),  # from_logits=True vì đầu ra chưa có softmax
              metrics=['accuracy'])

# Huấn luyện mô hình
model.fit(x_train, y_train, epochs=5, validation_data=(x_test, y_test))

# Đánh giá mô hình
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(f'Test accuracy: {test_acc:.2f}')
