# 1. Positional Embedding trong Transformer
Postional Embedding là một phương pháp để mã hóa thông tin về vị trí của các từ trong câu. Transformer không có cấu trúc tuần tự, do đó cần có cách để cung cấp thông tin về vị trí của từ trong câu trong mô hình

### 1.1 Công thức tính Positional Embedding 

Với một từ tại vị trí Pos trong cu và chiều của embedding vector là d_model, postional embedding được tính như sau:

$$
PE_{(pos, 2i)} = \sin \left( \frac{pos}{10000^{\frac{2i}{d_{model}}}} \right)
$$

$$
PE_{(pos, 2i+1)} = \cos \left( \frac{pos}{10000^{\frac{2i}{d_{model}}}} \right)
$$
 
Trong đó:
- pos là vị trí của từ trong câu (bắt đầu từ 0)
- i là chỉ số của chiều trong vector embedding
- d_model là độ dài của vector embedding

In [6]:
import numpy as np

def get_angle(pos, i, d_model):
    """
    Hàm tính góc cho một vị trí và chiều cụ thể.
    
    Args:
    pos (int): Vị trí hiện tại trong chuỗi.
    i (int): Chỉ số chiều hiện tại.
    d_model (int): Kích thước của embedding.
    
    Returns:
    float: Giá trị góc được tính toán.
    """
    return pos / np.power(10000, i / np.float32(d_model))

def create_position_matrix(seq_length, embed_size):
    """
    Hàm tạo ma trận vị trí embedding cho chuỗi có độ dài seq_length và kích thước embedding embed_size.
    
    Args:
    seq_length (int): Độ dài của chuỗi.
    embed_size (int): Kích thước của embedding.
    
    Returns:
    numpy.ndarray: Ma trận vị trí embedding.
    """
    # Khởi tạo ma trận vị trí với kích thước (seq_length, embed_size)
    position_matrix = np.zeros((seq_length, embed_size))
    
    # Duyệt qua từng vị trí trong chuỗi
    for pos in range(seq_length):
        # Duyệt qua từng chiều của embedding
        for i in range(embed_size):
            if i % 2 == 0:
                # Với các chỉ số chẵn, sử dụng hàm sin
                position_matrix[pos, i] = np.sin(get_angle(pos, i, embed_size))
            else:
                # Với các chỉ số lẻ, sử dụng hàm cos
                position_matrix[pos, i] = np.cos(get_angle(pos, i, embed_size))

    return position_matrix

# Kiểm tra hàm với độ dài chuỗi là 10 và kích thước embedding là 16
seq_length = 10
embed_size = 16
position_matrix = create_position_matrix(seq_length, embed_size)
print(position_matrix)


[[ 0.00000000e+00  1.00000000e+00  0.00000000e+00  1.00000000e+00
   0.00000000e+00  1.00000000e+00  0.00000000e+00  1.00000000e+00
   0.00000000e+00  1.00000000e+00  0.00000000e+00  1.00000000e+00
   0.00000000e+00  1.00000000e+00  0.00000000e+00  1.00000000e+00]
 [ 8.41470985e-01  8.46009110e-01  3.10983593e-01  9.84230234e-01
   9.98334166e-02  9.98419278e-01  3.16175064e-02  9.99841890e-01
   9.99983333e-03  9.99984189e-01  3.16227239e-03  9.99998419e-01
   9.99999833e-04  9.99999842e-01  3.16227761e-04  9.99999984e-01]
 [ 9.09297427e-01  4.31462829e-01  5.91127117e-01  9.37418309e-01
   1.98669331e-01  9.93682109e-01  6.32033979e-02  9.99367611e-01
   1.99986667e-02  9.99936755e-01  6.32451316e-03  9.99993675e-01
   1.99999867e-03  9.99999368e-01  6.32455490e-04  9.99999937e-01]
 [ 1.41120008e-01 -1.15966142e-01  8.12648897e-01  8.61040649e-01
   2.95520207e-01  9.85803469e-01  9.47260913e-02  9.98577313e-01
   2.99955002e-02  9.99857701e-01  9.48669068e-03  9.99985770e-01
   2.99