In [None]:
import numpy as np

### Tạo một mảng `numpy`
Mảng `numpy` có thể là mảng một chiều (vector), ma trận (mảng hai chiều, matrix), và mảng đa chiều (từ 3 chiều trở lên). Một mảng có thể được hình thành từ một danh sách, một hàm, hoặc đọc từ file (phần tự tìm hiểu).
#### Sử dụng danh sách

In [None]:
v = np.array([2, 0, 1, 7])
m = np.array([[2, 0], [1, 7]])

_Yêu cầu:_ Hãy thử in ra các giá trị của `v`, `m`, `type` của chúng, kiểu dữ liệu của các phần tử được lưu trong đó (thuộc tính `dtype`)

In [None]:
# Code

Mỗi một numpy array có _attribute_ là:
- `shape` (hình dạng) mô tả kích thước mỗi chiều của array
- `size` (kích thước) mô tả số phần tử của array
- `dtype` kiểu dữ liệu của mỗi phần tử trong array

Trong ví dụ trên chúng ta thử tạo một matrix `m` bằng một nested list `2 x 2`. Tuy nhiên sẽ như thế nào nếu chúng ta "nhập thiếu" một phần tử, khiến matrix có một "lỗ hổng"? Xem ví dụ sau:

In [None]:
m = np.array([[1], [2,3]])

_Yêu cầu:_ Thử in ra `m` và kiểu phần tử của `m`. `numpy` đã làm gì để hợp thức hóa dữ liệu đưa vào luôn là một mảng đầy đủ?

In [None]:
# Code

Chúng ta có thể cố ý gán kiểu dữ liệu cho các phần tử của một array **từ lệnh khởi tạo**. Chẳng hạn như danh sách truyền vào gồm các số nguyên (int), nhưng bạn muốn array nhận dạng nó như là số thực (float):

In [None]:
m = np.array([[2, 0], [1, 7]], dtype=float)
print(m)

Sau bước khởi tạo, mọi thay đổi lên array gây ra mâu thuẫn với kiểu dữ liệu hiện tại sẽ gặp lỗi.

In [None]:
m[0, 0] = 1 + 2j # Số phức gán vào phần tử số thực

#### Sử dụng hàm
Một array có thể được tạo nhanh bằng hàm có sẵn như:
- `np.arange(begin, end, step)`: khá giống với hàm `range` đã giới thiệu.
- `np.rand(shape)` và `np.randn(shape)`: sinh ngẫu nhiên các số thực. Về `randn` xem thêm tại https://docs.scipy.org/doc/numpy/reference/generated/numpy.random.randn.html
- `np.diag(list, offset)`: tạo ma trận vuông với đường chéo cho trước bởi `list` sao cho đường chéo này lệnh với đường chéo chính một số bằng `offset`.
- `np.zeros(shape)` và `np.ones(shape)`: array toàn 0 hoặc 1.
- `np.linspace(begin, final, count)`: Sinh ra `count` phần tử trải dài từ `begin` đến `final` (bao gồm cả `final`).

_Yêu cầu:_ Sử dụng các hàm nêu trên, hãy thử tạo ra các mảng sau:

1. $\begin{bmatrix}1 & 3 & 5 & 7 & 9\end{bmatrix}$

2. $\begin{bmatrix}0 & 0 & 0 & 0\\1 & 0 & 0 & 0\\0 & 2 & 0 & 0\\0 & 0 & 3 & 0\end{bmatrix}$

In [None]:
# Code

_Yêu cầu:_ Tạo ra một mảng gồm 10 phần tử trải đều từ số 0 đến số 5.

In [None]:
# Code

_Yêu cầu:_ Dùng một dòng lệnh để tạo ra một mảng `arr` $5\times 5$ gồm các số $1,2,\dots,25$ viết lần lượt từ trái sang phải, từ trên xuống dưới.

$\begin{bmatrix}1 & 2 & 3 & 4 & 5\\6 & 7 & 8 & 9 & 10\\11 & 12 & 13 & 14 & 15\\\dots\\\dots\end{bmatrix}$

In [None]:
# Code

### Thêm cột hoặc hàng vào `numpy` array
Bạn đọc tự nghiên cứu thêm tại https://stackoverflow.com/a/8505658/6543459.

### Truy xuất phần tử trong `numpy` array
Trong list từ 2 chiều trở lên (nested list), để gọi một phần tử chúng ta phải cung cấp từng chỉ số theo kiểu `list[1][2]...`, nhưng đối với `numpy` array, công việc trở nên gọn hơn một tí: `array[1, 2, ...]`.

Ngoài ra, thay vì đưa vào các chỉ số như 1 hoặc 2, `numpy` array còn nhận chỉ số dạng 1 list và ghép kết quả lại với nhau. Ví dụ sau lần lượt chọn ra các phần tử `arr[2, 1], arr[0, 2], arr[4, 0]`:

In [None]:
row_indices = [2, 0, 4]
col_indices = [1, 2, 0]
arr[row_indices, col_indices]

Hoặc có thể chọn ra các dòng/cột rời rạc rồi ghép lại với nhau thành một array mới:

In [None]:
arr[row_indices]

_Câu hỏi:_ Nối tiếp đoạn code trên, dự đoán kết quả của `arr[row_indices][col_indices]`

In [None]:
# Code



### Cắt mảng (slice)
Cách cắt `numpy` vector không quá khác biệt so với `list`. Nhưng cần chú ý về mảng đa chiều. Giả sử muốn lấy một hình vuông `3x3` từ mảng `arr` có ô trái trên là ô `[1,2]` (số 7).

In [None]:
arr[1:4, 2:5]

In [None]:
nested_list[1:4][2:5]

_Câu hỏi:_ Giải thích vì sao cắt `nested_list` không cho ra một mảng vuông như mong đợi?

### Đại số tuyến tính

#### Cộng, trừ, nhân, chia một mảng với một số
Khi đó mỗi phần tử của mảng sẽ bị cộng, trừ, nhân, chia với số đó.

#### Cộng, trừ, nhân, chia một mảng với một mảng thích hợp (Element-wise operations)
Nếu `shape` của hai mảng như nhau thì phép toán được áp dụng giữa hai phần tử cùng vị trí. Còn nhiều cách khác để `numpy` nhận dạng độ thích hợp giữa hai mảng và thực hiện phép toán. Hãy thử chạy các đoạn code sau và xem kết quả.

In [None]:
arr

In [None]:
arr * arr

Trên mỗi hàng, từ trái sang các phần tử lần lượt nhân với 1, 2, 3, 4, 5.

In [None]:
arr * np.array([1, 2, 3, 4, 5])

Trên mỗi cột, từ trên xuống các phần tử lần lượt nhân với 1, 2, 3, 4, 5.

In [None]:
arr * np.array([[1], [2], [3], [4], [5]])

### Ma trận

Mặc dù đã thảo luận nhiều về ma trận qua các array hai chiều, chúng ta vẫn chưa sử dụng đến lớp `matrix` trong thư viện `numpy` mạnh mẽ này. Khi đã có sẵn array hai chiều, chỉ cần truyền nó vào hàm khởi tạo ma trận là được. Hoặc cũng có thể truyền list / nested-list vào cũng được

Khi đang ở kiểu dữ liệu `matrix`, các phép toán cộng, trừ, nhân, chia được thay đổi để phù hợp các phép toán ma trận mà bạn được học.

In [None]:
M = np.matrix(arr) # Dùng np.array để khởi tạo
M*M

Ma trận `M` được tạo từ np.array `arr` nhưng kết quả của `M*M` khác so với `arr*arr` ở phần trước. Đó là vì `M*M` là nhân ma trận, còn `arr*arr` là nhân theo kiểu element-wise.

Tất nhiên nếu hai ma trận nhân với nhau mà không có số cột và dòng tương thích thì sẽ sinh ra lỗi.

Ngoài ra, thư viện `numpy` giúp chúng ta tính ma trận chuyển vị và ma trận nghịch đảo thông qua thuộc tính `T` (hoặc hàm `np.matrix.transpose(Matrix)`) và thuộc tính `I` (hoặc hàm `np.matrix.inverse(Matrix)`).

In [None]:
M2 = M[0:3, 1:3]
M2

In [None]:
M2.T

In [None]:
M2.I

Tính định thức ma trận:

In [None]:
print(M[0:2, 0:2])
np.linalg.det(M[0:2, 0:2])

### Ma trận số phức

`numpy` hỗ trợ thêm các hàm nhận một ma trận số phức như `np.matrix.conjugate` (lấy số phức liên hợp), `np.real` (lấy phần thực), `np.imag` (lấy phần ảo), `np.angle` (lấy argument). Các bạn tự tìm hiểu thêm.

### Thống kê

In [None]:
data = np.random.randn(20)
data

- `np.var`: Phương sai (variance)
- `np.std`: Độ lệch chuẩn (standard deviation)
- `np.min`: Giá trị nhỏ nhất
- `np.max`: Giá trị lớn nhất
- `np.mean`: Giá trị trung bình

In [None]:
print(np.var(data))
print(np.std(data))
print(np.min(data))
print(np.max(data))
print(np.mean(data))

- Kiểm tra có ít nhất một (any) hoặc tất cả (all) các phần tử trong array có thỏa điều kiện cho trước hay không

In [None]:
print((data > 2).any())
print((data < 5).all())

- Chọn ra một vài phần tử thỏa mãn điều kiện bằng cách dùng "mặt nạ" theo cú pháp: `data[bool_array]`. Ví dụ cần chọn ra các số lớn hơn 0 và nhỏ hơn 1 trong `data`:

In [None]:
mask = (data > 0) * (data < 1)
data[mask]

_Câu hỏi:_ Giải thích cách làm trên.

### Pass by reference

Khi "sao chép" một biến B sang một biến A khác, để tiếp kiệm bộ nhớ, Python không hoàn toàn cấp cho A một khoảng bộ nhớ cần thiết cho dữ liệu mà chỉ đưa cho A địa chỉ tham chiếu (reference) của B. Do đó việc thay đổi biến A sẽ thay đổi biến B và ngược lại.

In [None]:
v = np.array([1,2,3,4,5])
print(v)
copy_v = v
copy_v[0] = 7
print(v)