## 1 library

In [1]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
import matplotlib.pyplot as plt
from sklearn.model_selection import StratifiedShuffleSplit


## 2 load data

In [2]:
X = np.load("data/X.npy")
y = np.load("data/y.npy")


### 2.1 Chia data

In [3]:
# Khởi tạo StratifiedShuffleSplit với số lần chia (n_splits) là 1
splitter = StratifiedShuffleSplit(n_splits=1, test_size=0.4, random_state=42)

for train_index, remaining_index in splitter.split(X, y):
    X_train = X[train_index]
    y_train = y[train_index]

# Tiếp tục chia tập còn lại thành tập validation và tập test
splitter = StratifiedShuffleSplit(n_splits=1, test_size=0.5, random_state=42)

for dev_index, test_index in splitter.split(X[remaining_index], y[remaining_index]):
    X_dev = X[remaining_index][dev_index]
    y_dev = y[remaining_index][dev_index]
    X_test = X[remaining_index][test_index]
    y_test = y[remaining_index][test_index]

### 2.2 kiểm tra kích thước của tập dữ liệu

In [4]:
print("Kích thước của X_train là : " + str(X_train.shape))
print("kích thước của y_train là : " + str(y_train.shape))
print("Kích thước của X_dev là : " + str(X_dev.shape))
print("kích thước của y_dev là : " + str(y_dev.shape))
print("Kích thước của X_test là : " + str(X_test.shape))
print("kích thước của y_test là : " + str(y_test.shape))

Kích thước của X_train là : (3000, 400)
kích thước của y_train là : (3000, 1)
Kích thước của X_dev là : (1000, 400)
kích thước của y_dev là : (1000, 1)
Kích thước của X_test là : (1000, 400)
kích thước của y_test là : (1000, 1)


### 2.3 Kiểm tra một số mẫu trong data

In [5]:
print(y_dev)

[[7]
 [6]
 [8]
 [6]
 [6]
 [9]
 [7]
 [3]
 [7]
 [0]
 [6]
 [2]
 [9]
 [3]
 [0]
 [1]
 [5]
 [8]
 [7]
 [2]
 [5]
 [6]
 [1]
 [1]
 [1]
 [6]
 [7]
 [4]
 [6]
 [1]
 [5]
 [7]
 [2]
 [3]
 [4]
 [9]
 [8]
 [6]
 [9]
 [7]
 [2]
 [0]
 [5]
 [9]
 [9]
 [7]
 [7]
 [0]
 [4]
 [0]
 [9]
 [6]
 [5]
 [7]
 [2]
 [6]
 [2]
 [1]
 [1]
 [4]
 [3]
 [4]
 [5]
 [9]
 [0]
 [7]
 [9]
 [0]
 [6]
 [2]
 [6]
 [3]
 [9]
 [6]
 [7]
 [1]
 [3]
 [6]
 [1]
 [7]
 [8]
 [0]
 [2]
 [0]
 [6]
 [5]
 [8]
 [3]
 [7]
 [5]
 [5]
 [5]
 [6]
 [1]
 [6]
 [0]
 [5]
 [6]
 [1]
 [5]
 [6]
 [0]
 [1]
 [0]
 [8]
 [3]
 [7]
 [5]
 [7]
 [2]
 [1]
 [6]
 [2]
 [5]
 [3]
 [0]
 [9]
 [3]
 [0]
 [3]
 [3]
 [2]
 [4]
 [3]
 [2]
 [9]
 [0]
 [5]
 [5]
 [3]
 [1]
 [7]
 [3]
 [8]
 [7]
 [5]
 [3]
 [8]
 [4]
 [1]
 [5]
 [4]
 [6]
 [7]
 [0]
 [2]
 [3]
 [2]
 [0]
 [2]
 [3]
 [1]
 [5]
 [9]
 [5]
 [9]
 [9]
 [1]
 [2]
 [6]
 [5]
 [1]
 [6]
 [7]
 [4]
 [7]
 [7]
 [2]
 [1]
 [3]
 [1]
 [3]
 [5]
 [5]
 [2]
 [8]
 [4]
 [6]
 [1]
 [1]
 [6]
 [2]
 [1]
 [5]
 [2]
 [2]
 [4]
 [6]
 [8]
 [0]
 [6]
 [3]
 [8]
 [6]
 [4]
 [6]
 [5]
 [2]
 [5]
 [3]


### 3 Xây dựng mô hình tensorflow

In [6]:
model = Sequential([
    tf.keras.Input(shape=(400,)),
    tf.keras.layers.Dense(units=25, activation="relu", name="layer1"),
    tf.keras.layers.Dense(units=15, activation="relu", name="layer2"),
    tf.keras.layers.Dense(units=10, name="layer3")
], name = "my_model"
)

In [7]:
# tên model số lớp, số lượng tham số cần học, đầu ra mỗi lớp
model.summary()

Model: "my_model"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 layer1 (Dense)              (None, 25)                10025     
                                                                 
 layer2 (Dense)              (None, 15)                390       
                                                                 
 layer3 (Dense)              (None, 10)                160       
                                                                 
Total params: 10575 (41.31 KB)
Trainable params: 10575 (41.31 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [8]:
[layer1, layer2, layer3] = model.layers
print(model.layers[2].weights)

[<tf.Variable 'layer3/kernel:0' shape=(15, 10) dtype=float32, numpy=
array([[ 0.32149282, -0.24850217, -0.2715314 , -0.26729107,  0.3950931 ,
        -0.25758716, -0.48669887, -0.48514053,  0.31756982,  0.41643992],
       [ 0.34537497,  0.11232004, -0.26368043,  0.16175398,  0.40145394,
        -0.38473064, -0.0728128 ,  0.48281315, -0.25364935,  0.4768835 ],
       [ 0.07379147, -0.266222  , -0.39204866,  0.39712343, -0.4843027 ,
        -0.47684288, -0.15505525,  0.27218023, -0.38485703, -0.31218803],
       [ 0.21077105,  0.05081275,  0.30569294,  0.40391538,  0.2966644 ,
        -0.11808148, -0.3120857 ,  0.00187057,  0.09469542, -0.18987799],
       [ 0.08500645,  0.3510621 , -0.44903392, -0.32525966, -0.34919447,
        -0.1424084 , -0.16017053,  0.04413375, -0.10970488,  0.3999658 ],
       [ 0.1676431 , -0.05175418,  0.3062494 , -0.29735047, -0.25344658,
        -0.4412615 , -0.35741398, -0.12253979, -0.04645738,  0.3782421 ],
       [-0.12896487,  0.05827329, -0.07151851, -0

xác định hàm mất mát và giảm độ dốc cho mô hình với dữ liệu huấn luyện

In [9]:
model.compile(
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    optimizer=tf.keras.optimizers.Adam(0.001),
)

model.fit(
    X,y,
    epochs=60
)

Epoch 1/60
Epoch 2/60
Epoch 3/60
Epoch 4/60
Epoch 5/60
Epoch 6/60
Epoch 7/60
Epoch 8/60
Epoch 9/60
Epoch 10/60
Epoch 11/60
Epoch 12/60
Epoch 13/60
Epoch 14/60
Epoch 15/60
Epoch 16/60
Epoch 17/60
Epoch 18/60
Epoch 19/60
Epoch 20/60
Epoch 21/60
Epoch 22/60
Epoch 23/60
Epoch 24/60
Epoch 25/60
Epoch 26/60
Epoch 27/60
Epoch 28/60
Epoch 29/60
Epoch 30/60
Epoch 31/60
Epoch 32/60
Epoch 33/60
Epoch 34/60
Epoch 35/60
Epoch 36/60
Epoch 37/60
Epoch 38/60
Epoch 39/60
Epoch 40/60
Epoch 41/60
Epoch 42/60
Epoch 43/60
Epoch 44/60
Epoch 45/60
Epoch 46/60
Epoch 47/60
Epoch 48/60
Epoch 49/60
Epoch 50/60
Epoch 51/60
Epoch 52/60
Epoch 53/60
Epoch 54/60
Epoch 55/60
Epoch 56/60
Epoch 57/60
Epoch 58/60
Epoch 59/60
Epoch 60/60


<keras.src.callbacks.History at 0x22091ad0410>

Dùng data_dev để xem lại mô hình

In [13]:
prediction = model.predict(X_test)
predicted_lable = np.argmax(prediction, axis=1)
num_errors = np.sum(predicted_lable != y_test[:,0])
print("error = ", num_errors)

 1/32 [..............................] - ETA: 0s

error =  3
