## Mật mã và an toàn dữ liệu
### Bài thu hoạch: các hệ mật mã cổ điển  
**Họ và tên**: Đặng Quang Vinh  
**Mã sinh viên**: 18001218

Xét bảng chữ cái $\mathbb{A} = \{A, B, C,...,Z\}$ và tập số nguyên modulo 26 $\mathbb{Z}_{26} = \{0, 1, 2,..., 25\}$, ta định nghĩa một song ánh $f: \mathbb{A} \rightarrow \mathbb{Z}_{26}$ sao cho $f(A) = 0,\;f(B) = 1,...,\;f(Z) = 25$. Khi đó, mỗi chữ cái trong $\mathbb{A}$ đều có thể được biểu diễn bằng một số nguyên. Ta sẽ thực hiện thao tác tính toán trên số nguyên đại diện của các chữ cái rồi đổi kết quả ngược về chữ cái.

#### 1. Mã hóa dịch vòng

Mã hóa dịch vòng được định nghĩa bằng cách dịch chữ cái đi $k(0 \leq k \leq 25)$ vị trí trong bảng chữ cái, $k$ ở đây có vai trò là khóa bí mật. Với khóa bí mật $k$, một kí tự bản rõ $p \in \mathbb{A}$ thì kí tự bản mã tương ứng $c \in \mathbb{A}$ được định nghĩa qua ánh xạ mã hóa: $c = e_k(p) = p + k\;(mod\;26)$. Ngược lại, với khóa bí mật $k$, kí tự bản mã $c$ thì kí tự bản rõ $p$ được định nghĩa qua ánh xạ giải mã: $p = d_k(c) = c - k\;(mod\;26)$. Các phép tính được thực hiện trên số nguyên đại diện của chữ cái. Đặc biệt với khóa $k = 3$ thì mã dịch vòng có tên gọi khác là mã Caesar theo tên của Julius Caesar - người đầu tiên sử dụng mã hóa này.

**Ví dụ với Sagemath:**

* Với $k$ = 3, $p$ = "Toi yeu Viet Nam!"

In [1]:
S = ShiftCryptosystem(AlphabeticStrings())
P = "Toi yeu Viet Nam!"
P = S.encoding(P);P

TOIYEUVIETNAM

In [2]:
K = 3
C = S.enciphering(K,P);C

WRLBHXYLHWQDP

In [3]:
S.deciphering(K,C)

TOIYEUVIETNAM

In [4]:
P == S.deciphering(K,C)

True

* Với $k$, $p$ bất kì từ bàn phím

In [5]:
@interact
def _(k = "10",p = "Quyet thang dai dich!"):
    S = ShiftCryptosystem(AlphabeticStrings())
    P = S.encoding(p)
    print("Bản rõ: %s" % P)
    
    K = int(k)
    C = S.enciphering(K,P)
    print("Bản mã: %s" % C)
    
    print("Giải mã: %s" % (S.deciphering(K, C)))

Interactive function <function _ at 0x6fcfd052f80> with 2 widgets
  k: Text(value='10', description='k')
  p: …

#### 2. Mã hóa thay thế

Mã hóa thay thế dựa trên không gian khóa $\mathbb{K}$ là tập hợp tất cả các hoán vị của 26 chữ cái. Với mỗi $k \in \mathbb{K}$ là một hoán vị bất kì của 26 chữ cái, $k= a_0a_1a_2...a_{25}\;(a_i \in \mathbb{A})$, ta định nghĩa ánh xạ mã hóa một kí tự $x$ là $e_k(x): e_k(A) = a_0,...,e_k(Z)=a_{25}$ và ánh xạ giải mã kí tự $x$ là $d_k(x): d_k(a_0) = A,...,d_k(a_{25}) = Z$. Không gian khóa của mã hóa thay thế có lực lượng là $26!$, khá lớn nếu muốn thực hiện tấn công vét cạn khóa.

**Ví dụ với Sagemath:**

* Với $k$ = XNYAHPOGZQWBTSFLRCVMUEKJDI, $p$ = "Toi yeu Viet Nam!"

In [6]:
S = SubstitutionCryptosystem(AlphabeticStrings())
P = "Toi yeu Viet Nam!"
P = S.encoding(P);P

TOIYEUVIETNAM

In [7]:
K = 'XNYAHPOGZQWBTSFLRCVMUEKJDI'
K = S.encoding(K)
C = S.enciphering(K,P);C

MFZDHUEZHMSXT

In [8]:
S.deciphering(K,C)

TOIYEUVIETNAM

In [9]:
P == S.deciphering(K,C)

True

* Với $k$, $p$ bất kì từ bàn phím

In [10]:
S = SubstitutionCryptosystem(AlphabeticStrings())

@interact
def _(k = str(S.random_key()),p = "Viet Nam vo dich!"):
    P = S.encoding(p)
    print("Bản rõ: %s" % P)
    
    K = S.encoding(k)
    C = S.enciphering(K,P)
    print("Bản mã: %s" % C)
    
    print("Giải mã: %s" % (S.deciphering(K, C)))

Interactive function <function _ at 0x6fcfce13dd0> with 2 widgets
  k: Text(value='WICPVTBZYQEXKLUHOFSGRNJAMD'…

#### 3. Mã hóa hoán vị

Trong mã hóa hoán vị, với mỗi khóa $k$ có độ dài $m$ là một hoán vị của $m$ phần tử $1,2,...,m$ ta sẽ mã hóa bản rõ $P$ bằng cách chia $P$ thành các chuỗi con $P_i$ độ dài $m$, mỗi chuỗi con $P_i$ được hoán vị theo khóa $k$ một cách độc lập và cho ra các chuỗi mã hóa con $C_i$. Ghép các chuỗi mã hóa con $C_i$ lại với nhau ta thu được bản mã $C$. Tương ứng khi giải mã ta sẽ chia bản mã $C$ thành các chuỗi con $C_i$ độ dài $m$, sử dụng phép hoán vị ngược theo khóa $k$ thu được các chuỗi con $P_i$, bản rõ $P$ nhận được bằng cách ghép các chuỗi con $P_i$ lại. Giả sử với một khối bản rõ $P_i = p_1p_2...p_m$, khóa là một hoán vị của $1,2,...,m$ $k = k_1k_2...k_m$ thì ánh xạ mã hóa khối bản rõ $P_i$ là $e_k(p_1p_2...p_m) = p_{k_1}p_{k_2}...p_{k_m}=C_i$. Để giải mã khối bản mã $C_i$ ta làm tương tự như mã hóa nhưng sử dụng khóa hoán vị ngược $k^{-1}$.

**Ví dụ với Sagemath:**

* Với $k$ = [7, 6, 5, 4, 3, 2, 1], $m$ = 7, $p$ = "Toi yeu Viet Nam!Z"


In [11]:
T = TranspositionCryptosystem(AlphabeticStrings(), 7)
P = "Toi yeu Viet Nam!Z"
P = T.encoding(P);P

TOIYEUVIETNAMZ

In [12]:
K = [7, 6, 5, 4, 3, 2, 1]
e = T(K)
C = e(P);C

VUEYIOTZMANTEI

In [13]:
d = T(T.inverse_key(e.key()))
d(C)

TOIYEUVIETNAMZ

In [14]:
d(C) == P

True

#### 4. Mã hóa Affine

Trong mã hóa Affine ta chỉ xét các hàm mã hóa thay thế có dạng $e_k(x) = ax + b\; (mod\;26)$ với $k = (a,b); a,b \in \mathbb{Z}_{26}$ là khóa bí mật, $a$ phải thỏa mãn $UCLN(a,26) = 1$. Hàm giải mã sẽ là $d_k(y) = a^{-1}(y - b)\;(mod\;26)$ với $a^{-1} \in \mathbb{Z}_{26}$ thỏa mãn $a^{-1}a \equiv 1 \;(mod\;26)$. Trong $\mathbb{Z}_{26}$ thì các khả năng có thể của a là $1,
3, 5, 7, 9, 11, 15, 17, 19, 21, 23, 25$.

**Ví dụ với Sagemath:**

* Với $k = (5,7)$, $p$ = "Viet Nam chien thang!"

In [15]:
A = AffineCryptosystem(AlphabeticStrings())
P = "Viet Nam chien thang!"
P = A.encoding(P);P

VIETNAMCHIENTHANG

In [16]:
a,b = 5,7
C = A.enciphering(a,b,P);C

IVBYUHPRQVBUYQHUL

In [17]:
A.deciphering(a,b,C)

VIETNAMCHIENTHANG

In [18]:
P == A.deciphering(a,b,C)

True

* Với khóa $(a,b)$ và bản rõ $p$ từ bàn phím

In [19]:
@interact
def _(a=[1,3,5,7,9,11,15,17,19,21,23,25],b="11",p="Co len Viet Nam!"):
    A = AffineCryptosystem(AlphabeticStrings())
    P = A.encoding(p)
    print("Bản rõ: %s" % P)
    
    C = A.enciphering(a,int(b) % 26,P)
    print("Bản mã: %s" % C)
    
    print("Giải mã: %s" % (A.deciphering(a,int(b) % 26, C)))
    

Interactive function <function _ at 0x6fcfcd9ca70> with 3 widgets
  a: Dropdown(description='a', options=(1, 3…

#### 5. Mã hóa Hill

Ý tưởng của mã hóa Hill là ta sẽ chia bản rõ $P$ thành các đoạn $P_i$ độ dài $m$ kí tự, mỗi đoạn $C_i$ độ dài $m$ trong bản mã sẽ là tổ hợp tuyến tính của $m$ kí tự trong $P_i$. Khi biểu diễn quan hệ này bằng ma trận thì với khóa $k$ là ma trận vuông khả nghịch cấp $m$, bản rõ dưới dạng ma trận cỡ $1\times m$ là $P = (p_1\;p_2\;...\;p_m)$ thì bản mã $C = (c_1\;c_2\;...\;c_m)$ sẽ được tính qua công thức:  
<center>$C = e_k(P) =  Pk$</center>

Do ma trận khóa $k$ là khả nghịch nên tồn tại $k^{-1}$ sao cho $kk^{-1} = I_m$ và ánh xạ giải mã bản mã $C$ sẽ là:  
<center>$P = d_k(C) = Ck^{-1}$</center>

Các phép toán cộng và nhân 2 số được thực hiện modulo 26. Tính chất khả nghịch và ma trận nghịch đảo cũng được xét trong ngữ cảnh modulo 26.

**Ví dụ với Sagemath:**

* Với $k = [[1,0,1],[0,1,1],[2,2,3]]$, $p$ = "Chien thang dai dichz!"

In [20]:
H = HillCryptosystem(AlphabeticStrings(),3)
P = "Chien thang dai dichz!"
P = H.encoding(P);P

CHIENTHANGDAIDICHZ

In [21]:
M = MatrixSpace(IntegerModRing(26),3,3)
K = M([[1,0,1],[0,1,1],[2,2,3]])
C = H.enciphering(K,P);C

SXHQZWHAUGDJYTJAFG

In [22]:
H.deciphering(K,C)

CHIENTHANGDAIDICHZ

In [23]:
P == H.deciphering(K,C)

True

* Với $k$ ngẫu nhiên và $p,m$ nhập từ bàn phím

In [24]:
@interact
def _(m="3",p="Toi yeu HUS!"):
    H = HillCryptosystem(AlphabeticStrings(),int(m))
    K = H.random_key()
    print("Ma trận khóa ngẫu nhiên cấp %d:" % int(m))
    print(K)
    
    while len(H.encoding(p)) % int(m) != 0:
        p += "Z"

    P = H.encoding(p)
    print("Bản rõ: %s" % P)
    C = H.enciphering(K,P)
    print("Bản mã: %s" % C)
    print("Giải mã: %s" % (H.deciphering(K,C)))

Interactive function <function _ at 0x6fcfc89c680> with 2 widgets
  m: Text(value='3', description='m')
  p: T…

#### 6. Mã hóa Vigenere

Trong mã hóa Vigenere, với khóa $k = k_1k_2,...k_m\;(k_i \in \mathbb{A})$, ta xác định ánh xạ mã hóa và giải mã như sau:  
<center>$e_k(x_1,x_2,...,x_m) = (x_1 + k_1,x_2 + k_2,...,x_m + k_m)$</center>  
<center>$d_k(y_1,y_2,...,y_m) = (y_1 - k_1,y_2 - k_2,...,y_m - k_m)$</center>  

Các phép tính cộng trừ được thực hiện modulo 26. Bản rõ $P$ sẽ được chia làm nhiều khối độ dài $m$, cho từng khối qua hàm mã hóa nhận được các khối của bản mã $C$ tương ứng. Việc giải mã cũng tương tự thực hiện chia khối và giải mã từng khối.

**Ví dụ với Sagemath:**

* Với $m$ = 3, $k$ = "AFD", $p$ = "Toi yeu HUS!"

In [25]:
V = VigenereCryptosystem(AlphabeticStrings(),3)
P = "Toi yeu HUS!"
P = V.encoding(P);P

TOIYEUHUS

In [26]:
K = V.encoding("AFD")
C = V.enciphering(K,P);C

TTLYJXHZV

In [27]:
V.deciphering(K,C)

TOIYEUHUS

In [28]:
P == V.deciphering(K,C)

True

* Với $k$, $p$ nhập từ bàn phím

In [29]:
@interact
def _(k = "hus",p="Toi yeu HUS!"):
    V = VigenereCryptosystem(AlphabeticStrings(),len(k))
    K = V.encoding(k)
    
    while len(V.encoding(p)) % len(k) != 0:
        p += "Z"
    
    P = V.encoding(p)
    print("Bản rõ: %s" % P)
    C = V.enciphering(K,P)
    print("Bản mã: %s" % C)
    print("Giải mã: %s" % (V.deciphering(K,C)))
    

Interactive function <function _ at 0x6fcfc89ccb0> with 2 widgets
  k: Text(value='hus', description='k')
  p:…