# Đại số tuyến tính

## 1.1 Số vô hướng
Trong cuộc sống hàng ngày của chúng ta sẽ gặp rất nhiều số vô hướng (scalar). Giá trị của tiền thuê nhà mà bạn phải trả là một số vô hướng. Bạn vừa thực hiện một bài kiểm tra, bạn được 9 điểm thì điểm số này cũng là một số vô hướng...

=> Tóm lại số vô hướng là một con số cụ thể. Số vô hướng sẽ khác với biến số vì biến số có thể nhận nhiều giá trị trong khi số vô hướng chỉ nhận một giá trị duy nhất. VD: khi giá nhà y theo diện tích x theo phương trình: y = 20x + 200 thì các số vô hướng là *20, 200*, và các biến là *x, y*

Số vô hướng có thể được coi như hằng số trong một phương trình. Chúng ta có thể thực hiện các phép toán cộng/trừ/nhân/chia với số vô hướng như với hằng số

In [1]:
import numpy as np

a = np.array(20)
b = np.array(200)
print("diện tích x = 50 --> giá nhà y = a*50+b = ", a*50+b)

diện tích x = 50 --> giá nhà y = a*50+b =  1200


## 1.2. Vector
Vector là một khái niệm cơ bản nhất của toán học. Chúng ta có thể coi vector là một tập hợp nhiều giá trị của số vô hướng. 

Vector là một đại lượng biểu diễn cho cả độ lớn và hướng. Ví dụ như để biểu diễn một lực nào đó tác dụng lên vật, ta có một vector gồm có 2 thành phần – độ lớn lực tác động lên vật đó và hướng tác động. Hay ta có thể dùng vector để biểu diễn vận tốc – tốc độ và hướng. Ngoài ra, ta còn có dạng vector thuần chỉ hướng

Trong khoa học máy tính và dữ liệu, chúng ta khái quát ý tưởng đó để coi vector như là một danh sách các thuộc tính của một đối tượng. Ví dụ một ngôi nhà có một số các thuộc tính như diện tích mặt sàn (100m2), số lượng phòng ngủ(3 pn), số lượng phòng tắm(2pt), và giá của nó(3tỷ)... từ đó ta có thể dùng vector để biểu diễn chúng:
[100, 3, 2, 3]. Ngoài ra vector cũng có thể được sử dụng để thể hiện cho sự thay đổi của một thuộc tính riêng.

$$\begin{split}\mathbf{x}=\begin{bmatrix} 
100\\ 
3\\ 
2\\ 
3\\ 
\end{bmatrix}.\end{split}$$

In [19]:
x = np.array([100, 3, 2, 3])
x

array([100,   3,   2,   3])

### 1.2.1 Các thuộc tính của vector
Một vector sẽ có độ dài và định dạng dữ liệu xác định. Ngoài ra nếu coi một biến số là một vector thì trong thông kê mô tả chúng sẽ quan tâm tới tổng, trung bình, phương sai, giá trị lớn nhất, nhỏ nhất...

In [20]:
# Độ dài
print("length of vector: ", x.shape) # or len(x)

# Định dạng của véc tơ
print("vector type: ", x.dtype)

# Tổng của các phần tử 
print("sum of vector: ", x.sum())

# Trung bình các phần tử
print("mean of vector: ", x.mean())

# Giá trị nhỏ nhất
print("min of vector: ", x.min())

# Giá trị lớn nhất
print("max of vector: ", x.max())

length of vector:  (4,)
vector type:  int64
sum of vector:  108
mean of vector:  27.0
min of vector:  2
max of vector:  100


### 1.2.2 các phép tính trên vector
Chúng ta có thể thực hiện các phép tính trên vector như phép cộng, trừ, tích vô hướng, tích có hướng giữa hai vector... Lưu ý là chúng phải có cùng độ dài và chúng có tính chất giao hoán.

In [21]:
import numpy as np
x = np.array([100, 3, 2, 3])
y = np.array([60, 2, 1, 2])
print("x + y: ", x + y)
print("x - y: ", x - y)
print("x * y: ", x * y)

x + y:  [160   5   3   5]
x - y:  [40  1  1  1]
x * y:  [6000    6    2    6]


Véc tơ có thể thực hiện các phép cộng, trừ, nhân, chia với một số vô hướng. Giá trị thu được là một véc tơ cùng kích thước mà mỗi phần tử của nó là kết quả được thực hiện trên từng phần tử của véc tơ với số vô hướng đó.

In [22]:
x = np.array([1, 2, 1.5, 1.8, 1.9])
print("x + 5: ", x + 5)
print("x - 5: ", x - 5)
print("x * 5: ", x * 5)

x + 5:  [6.  7.  6.5 6.8 6.9]
x - 5:  [-4.  -3.  -3.5 -3.2 -3.1]
x * 5:  [ 5.  10.   7.5  9.   9.5]


# 1.2.3. Các phép tính nâng cao
* **Module** của một vector là giá trị chiều dài của vector đó. Nó có thể được tính bằng công thức sau:

$$||\vec{v}|| = \sqrt{\sum_{i=1}^{n} v_i^2}$$

Trong đó, $||\vec{v}||$ là module của vector $\vec{v}$ = $(v_1, v_2, ..., v_n)$ và n là số chiều của vector.
Công thức trên là tính khoảng cách của vector v từ gốc tọa độ về điểm trên vector tương đương với độ dài của vector.

In [25]:
x = np.array([3, 4])
module = np.linalg.norm(x)
print(module)

5.0


Nhân vô hướng (scalar product) của hai vector A và B, được tính bằng cách nhân giá trị chiều dài của hai vector và góc giữa chúng. Kết quả của nhân vô hướng là một số thực.

Có hai cách chính để tính nhân vô hướng:

sử dụng công thức cộng sảnh: $\vec{A} \cdot \vec{B} = |\vec{A}|\ |\vec{B}| \cos(\theta)$

sử dụng dot product: $\vec{A} \cdot \vec{B} = \sum_{i=1}^n A_i B_i =A_1B_1 + A_2B_2 +....+ A_nB_n$

Trong đó, $|\vec{A}|$ và $|\vec{B}|$ là module của vector A và B tương ứng, $\theta$ là góc giữa hai vector, $A_i$ và $B_i$ là các phần tử của vector A và B tương ứng, và n là số chiều của hai vector.

Chúng ta có thể bắt gặp tích vô hướng rất nhiều trong machine learning. Bên dưới là một số tình huống thường gặp:

- Tích vô hướng có thể được sử dụng để tính giá trị ước lượng của phương trình hồi qui tuyến tính. Ví dụ nếu bạn biết giá nhà được biểu diễn theo diện tích $x_1$ và số phòng ngủ $x_2$ theo công thức: 

$$y=20x_1 + 10x_2+ 200$$

Thì một cách khái quát bạn có thể ước lượng $y$ theo tích vô hướng giữa véc tơ đầu vào $\mathbf{x}^{\top} = (x_1, x_2, 1)$ và véc tơ hệ số $\mathbf{w} = (20, 10, 200)$ như sau:
 
$$\hat{y} = \mathbf{x}^{\top}\mathbf{w}$$

- Tích vô hướng cũng được sử dụng để tính trung bình có trọng số của $\mathbf{x}$:

$$\bar{\mathbf{x}} = \sum_{i=1}^{n} x_i q_i= \mathbf{x}^{\top}\mathbf{q}$$
với $\sum_{i=1}^{n} q_i= 1$

- Ngoài ra, chắc hẳn bạn còn nhớ cách tính cos giữa hai véc tơ $\mathbf{x}$ và $\mathbf{y}$ sẽ bằng tích vô hướng giữa hai véc tơ.

$$\cos({\mathbf{x}, \mathbf{y}}) = \frac{\sum_{i=1}^{d} x_i y_i}{ \sqrt{\sum_{i=1}^{d} x_i^2} \sqrt{\sum_{i=1}^d y_i^2}}= \frac{\langle \mathbf{x}, \mathbf{y} \rangle}{\mathbf{||x||_2}\mathbf{||y||_2}}
$$


Hàm dot trong numpy có thể sử dụng để tính nhân vô hướng với cú pháp : `numpy.dot(A, B)` hoặc `A.dot(B)`


In [29]:
x = np.array([1, 2, 3])
y = np.array([2, 3, 4])
print("x.dot(y) = ", x.dot(y))
print("np.dot(x, y) = ", np.dot(x, y))

x.dot(y) =  20
np.dot(x, y) 20


## 1.3. Ma trận

Vector là đại lượng một chiều nên nó chỉ có thể biểu diễn cho một biến. Trong trường hợp chúng ta cần biểu diễn cho nhiều biến và

$$\begin{split}\mathbf{A}=\begin{bmatrix} 
a_{11} & a_{12} & \cdots & a_{1n} \\ 
a_{21} & a_{22} & \cdots & a_{2n} \\ 
\vdots & \vdots & \ddots & \vdots \\ 
a_{m1} & a_{m2} & \cdots & a_{mn} \\ 
\end{bmatrix}.\end{split}$$