# **Phần 1: LẬP TRÌNH VỚI NUMPY**

### 0. Giới thiệu

Numpy là một thư viện tính toán khoa học, hiệu năng cao và rất phổ biến cho ngôn ngữ lập trình Python. Thư viện thực hiện trên các đối tượng toán học đa chiều như vector, ma trận, tensor,...

Để sử dụng, ta cần phải khai báo thư viện `numpy`. Theo quy ước, thư viện này thường được viết tắt bằng `np`. Do đó, khi ta muốn sử dụng các module hay hàm nào đó của thư viện, ta chỉ việc thực hiện `np`.

In [2]:
import numpy as np

### 1. Array & khởi tạo array

Numpy array là một cấu trúc các giá trị có cùng kiểu dữ liệu, được đánh chỉ mục bởi các số nguyên không âm.

Mỗi array sẽ có số chiều `(dimension)`, tương ứng là hạng `(rank)` của array. Với mỗi chiều có kích thước `(shape)` từng chiều.

Để tạo numpy array, ta truyền một list vào `np.array()`. Ví dụ:

In [3]:
a = np.array([1, 2, 3])  # Tạo array 1 chiều
print(a)

[1 2 3]


![image-2.png](attachment:image-2.png)

In [4]:
print('Kiểu dữ liệu của a là: ', type(a))

print('Kích thước theo từng chiều (dimension) của "a": ', a.shape)

print('Truy xuất đến 3 phần tử đầu tiên: ', a[0], a[1], a[2])
a[0] = 5            # Thay đổi giá trị một phần tử trong array
print('Array "a" sau khi đã cập nhật phần tử đầu tiên: ', a)

Kiểu dữ liệu của a là:  <class 'numpy.ndarray'>
Kích thước theo từng chiều (dimension) của "a":  (3,)
Truy xuất đến 3 phần tử đầu tiên:  1 2 3
Array "a" sau khi đã cập nhật phần tử đầu tiên:  [5 2 3]


Để tạo `numpy` array với nhiều hơn 1 chiều, ta truyền vào một list lồng nhau giống như sau:

![image-3.png](attachment:image-3.png)
![image-2.png](attachment:image-2.png)

In [5]:
b = np.array([[1, 2], [3, 4]])  # Tạo array 2 chiều
print(b)

[[1 2]
 [3 4]]


In [6]:
print(b.shape)

(2, 2)


In [7]:
c = np.array([[[1, 2], [3, 4]], 
              [[5, 6], [7, 8]]])   # Tạo array 3 chiều (c có 2 hàng, 2 cột và có độ sâu là 2)
print(c)

[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]


In [8]:
c.shape

(2, 2, 2)

Trong một số trường hợp, ta muốn tạo array với giá trị khởi tạo sẵn. `numpy` cung cấp các phương thức như `ones()`, `zeros()`, và `random.random()` cho những tình huống này. Ta chỉ việc truyền vào số phần tử của array muốn khởi tạo:

![image-2.png](attachment:image-2.png)

Trường hợp muốn khởi tạo array nhiều chiều, ta cũng truyền vào một `tuple` mô tả kích thước từng chiều:

![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)

In [9]:
a = np.zeros((2, 2))  # tạo array gồm toàn số 0
print(a) 

[[0. 0.]
 [0. 0.]]


In [10]:
b = np.ones((1, 2))  # tạo array gồm toàn số 1
print(b)

[[1. 1.]]


In [11]:
c = np.full((2, 2), 7)  # tạo array gồm toàn số 7
print(c)

[[7 7]
 [7 7]]


In [12]:
c = np.ones((2, 2)) * 7  # tạo array gồm toàn số 1
print(c)

[[7. 7.]
 [7. 7.]]


In [13]:
d = np.eye(4)  # tạo ma trận đơn vị 4x4
print(d)

[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]


In [14]:
e = np.random.random((2, 2))  # Tạo ma trận ngẫu nhiên
print(e)

[[0.76675451 0.36722204]
 [0.44711929 0.59840969]]


Cuối cùng là 2 hàm rất hiệu quả và dùng phổ biến khác để khởi tạo giá trị theo dạng chuỗi số / dãy số là: `arange` và `linspace`.

Hàm `arange` của `numpy` có cùng cú pháp với hàm `range` của Python: giá trị bắt đầu `(start)`, giá trị kết thúc `(stop)`, bước nhảy `(step_size tuỳ chọn, mặc định là 1)`:

Hàm `linspace` cũng tương tự, nhưng thay vì dùng bước nhảy, hàm này tạo chuỗi dựa trên số lượng lấy mẫu ở giữa.

In [15]:
f = np.arange(10, 50, 5)  # Tạo array của một chuỗi bắt đầu từ 10 đến DƯỚI 50, bước nhảy 5
print(f)

[10 15 20 25 30 35 40 45]


**LƯU Ý**: Array ở trên kết thúc tại 45, không phải 50

In [16]:
g = np.linspace(0., 1., num=11)
print(g)

[0.  0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1. ]


Nếu ta muốn khởi tạo array bằng cách "chồng" ("stacking") các array cho trước, theo chiều ngang / dọc. Ta có thể sử dụng các phương thức `vstack()` (hoặc `row_stack`) và `hstack()` (hoặc `column_stack`).

In [17]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
np.vstack((a, b))

array([[1, 2, 3],
       [4, 5, 6]])

In [18]:
a = np.array([[7], [8], [9]])
b = np.array([[4], [5], [6]])
print(a)
print(b)
np.hstack((a, b))

[[7]
 [8]
 [9]]
[[4]
 [5]
 [6]]


array([[7, 4],
       [8, 5],
       [9, 6]])

### 2. Array indexing

Numpy hỗ trợ một số cách chỉ mục để truy cập các phần tử trong array.

Ta có thể chỉ mục (index) hoặc cắt lát (slide) numpy array giống như kiểu `list` trong Python:

![image-2.png](attachment:image-2.png)

Ta có thể thực hiện chỉ mục hoặc cắt lát trên nhiều chiều khác nhau của array:

![image-2.png](attachment:image-2.png)

In [19]:
# Tạo ma trận 2 chiều với kích thước (3, 4)
# [[1  2  3  4]
#  [5  6  7  8]
#  [9 10 11 12]]
a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print('Array a gốc:')
print(a)
# Cắt lát mảng con từ 2 dòng đầu tiên
# và cột với chỉ mục 1 và 2;
# array 'b' sau khi cắt lát có kích thước (2, 2):
# [[2 3]
#  [6 7]]

b = a[:2, 1:3]
print('Array của b sau khi cắt lát:')
print(b)

Array a gốc:
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
Array của b sau khi cắt lát:
[[2 3]
 [6 7]]


Lát cắt của một array bản chất vẫn tham chiếu lên cùng dữ liệu gốc, do đó  ***chỉnh sửa trên cắt lát cũng sẽ thay đổi nội dung của dữ liệu gốc***.

In [20]:
print(a[0, 1])
b[0, 0] = 77   # b[0, 0] cùng tham chiếu đến từ dữ liệu của a[0, 1]
print(a[0, 1])

2
77


In [21]:
print('"a" sau khi được thay đổi giá trị bởi tham chiếu b: ')
print(a)

"a" sau khi được thay đổi giá trị bởi tham chiếu b: 
[[ 1 77  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]


Chú ý, trong một số trường hợp có thể **làm giảm chiều của array** khi tạo cắt lát:

In [22]:
#  Khởi tạo array 2 chiều kích thước (3, 4)
a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(a)

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]


Nếu sử dụng *chỉ mục là một số nguyên*, chiều của lát cắt **bị giảm**.

Nếu sử dụng *chỉ mục là lát cắt*, chiều của lát cắt **giữ nguyên** so với dữ liệu gốc.

In [23]:
row_r1 = a[1, :]  # Cùng nội dụng là dòng thứ 2, chiều của array chỉ còn 1
row_r2 = a[1:2, :]  # Cùng nội dung là dòng thứ 2, chiều của array vẫn là 2
row_r3 = a[[1], :] # Cùng nội dung là dòng thứ 2, chiều của array vẫn là 2
print(row_r1, row_r1.shape)
print(row_r2, row_r2.shape)
print(row_r3, row_r3.shape)

[5 6 7 8] (4,)
[[5 6 7 8]] (1, 4)
[[5 6 7 8]] (1, 4)


In [24]:
# Tương tự như vậy, khi thực hiện trên cột
col_r1 = a[:, 1]
col_r2 = a[:, 1:2]
print(col_r1, col_r1.shape)
print()
print(col_r2, col_r2.shape)

[ 2  6 10] (3,)

[[ 2]
 [ 6]
 [10]] (3, 1)


*Chỉ mục là mảng số nguyên* (Integer array indexing): thay vì sử dụng chỉ mục dạng lát cắt, ta có thể tạo array từ các phần tử bất kỳ trong array gốc:

In [25]:
a = np.array([[1, 2], [3, 4], [5, 6]])
print('"a" gốc: ')
print(a)
print("\n")
# Ví dụ về chỉ mục dạng số nguyên.
# Kết quả trả về là array 1 chiều với 3 phần tử: shape=(3,)
print(a[[0, 1, 2], [0, 1, 0]])

# Kết quả trên tương tự với:
print(np.array([a[0, 0], a[1, 1], a[2, 0]]))

"a" gốc: 
[[1 2]
 [3 4]
 [5 6]]


[1 4 5]
[1 4 5]


*Bài tập*: Bản thử đoán xem kết quả in ra màn hình sau khi thực hiện cắt lát array

In [26]:
# Khởi tạo array 2 chiều kích thước (4, 3)
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
a

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

In [27]:
# Tạo array chỉ mục
b = np.array([0, 2, 0, 1])

# Mỗi dòng lấy một phần tử, tại các cột có chỉ mục 'b'
print(a[np.arange(4), b])  # [0  1  2  3] [0  2  0  1]

[ 1  6  7 11]


In [28]:
# Cùng tăng 10 đơn vị cho mỗi phần tử của mỗi dòng, tại các cột có chỉ mục 'b'
a[np.arange(4), b] += 10
print(a)

[[11  2  3]
 [ 4  5 16]
 [17  8  9]
 [10 21 12]]


*Chỉ mục là mảng Boolean* (Boolean array indexing): Cho phép lấy ra các phần tử bất kỳ trong array gốc. Thông thường, phương pháp này thường để lấy các phần tử thoả mãn tính chất nào đó:

In [29]:
import numpy as np

a = np.array([[1, 2], [3, 4], [5, 6]])

bool_idx = (a > 2)  # Tìm các phần tử lớn hơn 2;
                    # lệnh này trả về boolean array có kích thước giống với 'a'
                    # trong đó, tại mỗi vị trí của bool_idx cho biết có thoả mãn
                    # tính chất phần tử của a đó lớn hơn 2 không.

print(bool_idx)

[[False False]
 [ True  True]
 [ True  True]]


In [30]:
# Sử dụng chỉ mục với boolean array để tạo array 1 chiều
# chứa các phần tử tương ứng với các phần tử nhận giá trị True trên bool_idx
print(a[bool_idx])

# Ta có thể viết gọn lại:
print(a[a > 2])

[3 4 5 6]
[3 4 5 6]


Khi làm việc với các numpy array, ta có thể cần phải trả về chỉ mục *indices* (không chỉ giá trị) của các phần tử trong array thoả mãn một tính chất nào đó. Có một số hàm phổ biến như sau:
* <a href="https://numpy.org/doc/stable/reference/generated/numpy.argmax.html" target="_blank">argmax</a> (lấy chỉ số của phần tử lớn nhất)
* <a href="https://numpy.org/doc/stable/reference/generated/numpy.argmin.html" target="_blank">argmin</a> (lấy chỉ số của phần tử nhỏ nhất)
* <a href="https://numpy.org/doc/stable/reference/generated/numpy.argsort.html" target="_blank">argsort</a> (lấy chỉ số của các phần tử sau khi đã sắp xếp, theo thứ tự tăng dần)
* <a href="https://numpy.org/doc/stable/reference/generated/numpy.where.html" target="_blank">where</a> (lấy chỉ số của các phần tử thoả một điều kiện nào đó)

In [31]:
a = np.array([1, 8, 9, -3, 2, 4, 7, 9])

# Lấy chỉ số của phần tử lớn nhất trong 'a'
print(np.argmax(a))

# Lấy chỉ số của phần tử nhỏ nhất trong 'a'
# chỉ trả về một chỉ số, nếu có nhiều hơn 1 giá trị nhỏ nhất
print(np.argmin(a))

# Lấy chỉ số của các phần tử sau khi sắp xếp tăng dần theo giá trị
print(np.argsort(a))

# Lấy chỉ số của các phần tử sau khi sắp xếp giảm dần theo giá trị
# [::-1] là cách lấy chỉ mục lát cắt theo thứ tự nghịch đảo
print(np.argsort(a)[::-1])

# Lấy chỉ mục của các phần tử thoả mãn tính chất nào đó
# Trả về một tuple, với danh sách chỉ mục là phần tử đầu tiên
# sử dụng [0] để lấy danh sách chỉ mục này
print(np.where(a > 5)[0])

# Lấy chỉ mục của các phần tử thoả mãn tính chất nào đó
# Lấy chỉ mục của TẤT CẢ phần tử lớn nhất trong mảng
print(np.where(a >= a[np.argmax(a)])[0])

2
3
[3 0 4 5 6 1 2 7]
[7 2 1 6 5 4 0 3]
[1 2 6 7]
[2 7]


### 3. Các kiệu dữ liệu của array (Datatype)

Numpy array là một cấu trúc các phần tử có cùng kiểu dữ liệu. Numpy array hỗ trợ nhiều KDL khác nhau. Numpy cố gắng đoán KDL khi ta khởi tạo array mà không khai báo tường minh KDL của array là gì.

In [32]:
x = np.array([1, 2]) # Để numpy tự chọn KDL
y = np.array([1.0, 2.0]) # Để numpy tự chọn KDL
z = np.array([1, 2], dtype=np.int64) # Chỉ định một KDL cho trước

print(x.dtype, y.dtype, z.dtype)

int64 float64 int64


### 4. Array math

Điều khiến `numpy` trở nên nổi tiếng chính là: sự tiện lợi & hiệu năng cao. Tiện lợi do có thể thực hiện được các hàm toán học vector hoá (vectorized) để tính toán trên các phần tử của một array. Các hàm được tối hưu hoá & có tốc độ thực thi nhanh hơn vòng lặp `for` rất nhiều lần.

Ví dụ, ta có thể thực hiện phép cộng hai array ngẫu nhiên, sử dụng `%%time` để đo thời gian thực thi.

In [33]:
import numpy as np
a = np.random.random(100000000)

In [34]:
%%time
x = np.sum(a)

CPU times: user 54.8 ms, sys: 20.5 ms, total: 75.3 ms
Wall time: 74.9 ms


In [35]:
%%time
x = 0
for element in a:
    x = x + element

CPU times: user 8.1 s, sys: 66.2 ms, total: 8.16 s
Wall time: 8.31 s


Việc tối ưu tốc độ như vậy rất phù hợp với các thuật toán máy học, vốn sử dụng rất nhiều các phép tính toán.

Bất cứ khi nào có thể, **cố gắng sử dụng các phép toán vector hoá.**

Một số hàm toán học có ở cả dạng toán tử & hàm trong numpy.

Ví dụ, ta có thể thực hiện phép tổng theo từng phần tử của hai array bằng cách sử dụng operator + hoặc hàm `add()`.

![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)

In [36]:
x = np.array([[1, 2], [3, 4]], dtype=np.float64)
y = np.array([[5, 6], [7, 8]], dtype=np.float64)

# Tổng theo từng phần tử, thực hiện bằng 2 cách:
print(x + y)
print(np.add(x, y))

[[ 6.  8.]
 [10. 12.]]
[[ 6.  8.]
 [10. 12.]]


Không chỉ phép cộng, điều này cũng tương tự cho các toán tử khác:

![image-2.png](attachment:image-2.png)

In [37]:
# Hiệu theo từng phần tử, thực hiện bằng 2 cách:
print(x - y)
print(np.subtract(x, y))

[[-4. -4.]
 [-4. -4.]]
[[-4. -4.]
 [-4. -4.]]


In [38]:
# Tích theo từng phần tử (element wise product), thực hiện bằng 2 cách:
print(x * y)
print(np.multiply(x, y))

[[ 5. 12.]
 [21. 32.]]
[[ 5. 12.]
 [21. 32.]]


In [39]:
# Chia theo từng phần tử, thực hiện bằng 2 cách:
# [[0.2        0.33333333]
#  [0.42857143 0.5       ]]
print(x / y)
print(np.divide(x, y))

[[0.2        0.33333333]
 [0.42857143 0.5       ]]
[[0.2        0.33333333]
 [0.42857143 0.5       ]]


In [40]:
# Lấy căn theo từng phần tử, thực hiện bằng 2 cách:
# [[1.         1.41421356]
#  [1.73205081 2.        ]]
print(np.sqrt(x))

[[1.         1.41421356]
 [1.73205081 2.        ]]


Chú ý, `*` là tích theo từng phần tử, không phải nhân 2 ma trận. Do đó, ta sử dụng hàm `dot()` để tính tích của các vector, vector - ma trận, ma trận - ma trận. `dot()` vừa ở dạng hàm của numpy, vừa là một phương thức của array:

![image-2.png](attachment:image-2.png)

In [41]:
x = np.array([[1, 2], [3, 4]])
y = np.array([[5, 6], [7, 8]])

v = np.array([9, 10])
w = np.array([11, 12])

# Inner product of vectors; both produce 219
print(v.dot(w))
print(np.dot(v, w))

219
219


Ta có thể sử dụng toán tử `@` tương đương với toán tử `dot`.

In [42]:
print(v @ w)

219


In [43]:
# Hai cách để nhân ma trận - vector,
# cả hai đều tạo array 1 chiều là [29 67]
print(x.dot(v))
print(np.dot(x, v))
print(x @ v)

[29 67]
[29 67]
[29 67]


In [44]:
# Hai cách để nhân ma trận - vector,
# cả hai đều tạo array 2 chiều:
# [[19 22]
#  [43 50]]
print(x.dot(y))
print(np.dot(x, y))
print(x @ y)

[[19 22]
 [43 50]]
[[19 22]
 [43 50]]
[[19 22]
 [43 50]]


Bên cạnh các toán tử, `numpy` còn hỗ trợ các hàm tính toán trên array như: `min()`, `max()`, `sum()`,...

![image-2.png](attachment:image-2.png)

In [45]:
x = np.array([[1, 2], [3, 4], [5, 6]])

print(np.max(x))  # Tính giá trị lớn nhất của các phần tử trong array 'x';
print(np.min(x))  # Tính giá trị nhỏ nhất của các phần tử trong array 'x';
print(np.sum(x))  # Tính tổng tất cả các phần tử trong array 'x'.

6
1
21


Không chỉ có thể tính toán trên toàn bộ phần tử của ma trận, các hàm trên còn có thể thực hiện theo từng hàng hoặc từng cột bằng cách sử dụng tham số `axis`:

![image-2.png](attachment:image-2.png)

In [46]:
x = np.array([[1, 2], [3, 4], [5, 6]])
print("x gốc: ")
print(x)
print(np.max(x, axis=0))  # Tìm max trên mỗi cột
print(np.max(x, axis=1))  # Tìm max trên mỗi hàng

x gốc: 
[[1 2]
 [3 4]
 [5 6]]
[5 6]
[2 4 6]


Danh sách các hàm được numpy hỗ trợ có thể tham khảo ở đây: <a href="https://numpy.org/doc/stable/reference/routines.math.html" target="_blank">documentation</a>

Bên cạnh các hàm toán học trên array, ta còn thường có nhu cầu thay đổi kích thước trên array. Thao tác đơn giản nhất chính là chuyển vị. Để chuyển vị ma trận, ta sử dụng thuộc tính `.T` của một đối tượng array.

![image-2.png](attachment:image-2.png)

In [47]:
x = np.array([[1, 2], [3, 4], [5, 6]])

print(x)
print("transpose\n", x.T)

[[1 2]
 [3 4]
 [5 6]]
transpose
 [[1 3 5]
 [2 4 6]]


In [48]:
v = np.array([[1, 2, 3]])
print(v)
print("transpose\n", v.T)

[[1 2 3]]
transpose
 [[1]
 [2]
 [3]]


Trong nhiều tình huống, ta cần phải thay đổi chiều của một ma trận. Đặc biệt là trong lĩnh vực máy học, đây là thao tác rất phổ biến. Phương thức `reshape()` của numpy giúp chúng ta giải quyết vấn đề này.

![image-2.png](attachment:image-2.png)

Ví dụ: ta có thể chuyển array 1 chiều thành 2 chiều, và ngược lại với phương thức `reshape()`. Trong thực tế, ta có thể chuyển đổi ảnh 2D array thành một dạng vector đặc trưng 1D array.

In [49]:
import numpy as np

w = np.array([[1], [2], [3]])
print(w)
w.shape

[[1]
 [2]
 [3]]


(3, 1)

Ta có thể loại bỏ các tham số "không cần thiết" để đưa về dạng array 1 chiều với tham số -1. Khi đó phương thức sẽ tự tính toán kích thước của ma trận nguồn để chuyển sang array 1 chiều (vector đích).

In [50]:
y = w.reshape(-1, )
print(y)
y.shape

[1 2 3]


(3,)

Tương tự như vậy cho hàm `squeeze()`:

In [51]:
z = w.squeeze()
print(z)
z.shape

[1 2 3]


(3,)

Để chuyển từ dạng 1D sang 2D array, ta có thể thêm vào một chiều nữa với kích thước là 1 (bên cạnh một chiều kích thước -1, hàm ý numpy tự tính kích thước cho chiều này).

In [52]:
y.reshape((-1, 1))

array([[1],
       [2],
       [3]])

### Broadcasting

Broadcasting: là cơ chế hiệu quả cho phép numpy có thể làm việc với các array với các kích thước khác nhau khi thực hiện các phép toán.

Ví dụ: trong đstt, ta chỉ có thể thực hiện phép cộng (tương tự cho các toán tử thực hiện theo từng phần tử - element-wise) hai ma trận có cùng số chiều và kích thước. Trong numpy, nếu ta muốn cộng hai ma trận có số chiều khác nhau, numpy sẽ **ngầm mở rộng** số chiều của một ma trận để cả hai ma trận có thể thực hiện tính toán được. Khi đó phép toán sẽ thực hiện được mà không báo lỗi.

![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)

Broadcasting hai array với nhau tuân theo các quy tắc sau:

**Quy tắc 1**: Nếu **hai array khác số chiều**, kích thước của array với số chiều (dimension) ít hơn sẽ chèn thêm 1 về phía đầu bên trái.

Ví dụ sau, array `a` sẽ được ngầm mở rộng shape từ (3, ) thành shape (1, 3):

In [53]:
a = np.array([1, 2, 3])        # shape (3, ): 1 chiều, sẽ ngầm mở rộng -> 2 chiều, shape (1, 3)
b = np.array([[4], [5], [6]])  # shape (3, 1): 2 chiều
c = a + b                      # kết quả sẽ là shape (3, 3) (2 chiều).
                               # Lưu ý, kết quả này còn phải vận dụng thêm Quy tắc 2
print(c)

[[5 6 7]
 [6 7 8]
 [7 8 9]]


**Quy tắc 2**: Nếu shape của hai array không khớp nhau ở một chiều nào đó, array nào có kích thước chiều bằng 1 sẽ được **kéo dài** ở chiều đó để khớp với array còn lại.

Ví dụ sau, array `a` sẽ được ngầm mở rộng từ shape (3, 1) thành shape (3, 2):

In [54]:
a = np.array([[1], [2], [3]])          # shape (3, 1), sẽ ngầm kéo dài thành (3, 2) để khớp với b
# --> [[1, 1], 
#      [2, 2], 
#      [3, 3]]
b = np.array([[4, 5], [6, 7], [8, 9]]) # shape (3, 2)
c = a + b                              # kích thước (3, 2)

print(c)

[[ 5  6]
 [ 8  9]
 [11 12]]


**Quy tắc 3**: Nếu hai array không có chiều nào bằng nhau và không có chiều nào kích thước bằng 1 thì báo lỗi.

In [55]:
a = np.array([[1], [2], [3], [4]])     # shape (4, 1)
b = np.array([[4, 5], [6, 7], [8, 9]]) # shape (3, 2)
c = a + b                              # valueError: operands could not be broadcast

ValueError: operands could not be broadcast together with shapes (4,1) (3,2) 

Chi tiết có thể xem thêm ở đây [documentation](http://docs.scipy.org/doc/numpy/user/basics.broadcasting.html).

Sau đây là một số ví dụ về broadcasting.

![image.png](attachment:image.png)

Chú ý rằng, các array tương thích theo từng chiều nếu kích thước giống nhau cho từng chiều hoặc có một array nào đó có kích thước một chiều nào đó bằng 1.

![image.png](attachment:image.png)