Quy tắc Broadcasting

Việc Broadcasting trong NumPy tuân theo một bộ quy tắc nghiêm ngặt để xác định sự tương tác giữa hai mảng:

* Quy tắc 1: Nếu hai mảng khác nhau về số kích thước của chúng, hình dạng của mảng có ít kích thước hơn sẽ được đệm bằng những mảng ở phía trước (bên trái) của nó.

* Quy tắc 2: Nếu hình dạng của hai mảng không trùng nhau về chiều nào thì mảng có hình dạng bằng 1 ở chiều đó được kéo dài để khớp với hình còn lại.

* Quy tắc 3: Nếu trong bất kỳ thứ nguyên nào mà kích thước không bằng nhau và không bằng 1, thì lỗi sẽ xảy ra.

Để làm rõ những quy tắc này, chúng ta hãy xem xét một vài ví dụ chi tiết.

![image.png](attachment:image.png)

In [11]:
import numpy as np
awesome = np.array([
    [1, 2, 3, 4, 5, 6, 7],
    [8, 9, 4, 5, 8, 9, 0],
    [2, 9, 7, 8, 0, 4, 5],
    [9, 6, 4, 9, 3, 7, 2],
])
awesome[1:3, 2:4]

array([[4, 5],
       [7, 8]])

![image.png](attachment:image.png)

# Working with Boolean Arrays

In [12]:
rng = np.random.RandomState(0)
x = rng.randint(10, size=(3, 4))
x

array([[5, 0, 3, 3],
       [7, 9, 3, 5],
       [2, 4, 7, 6]])

In [13]:
x < 6

array([[ True,  True,  True,  True],
       [False, False,  True,  True],
       [ True,  True, False, False]])

In [14]:
print(x)

[[5 0 3 3]
 [7 9 3 5]
 [2 4 7 6]]


## Counting entries

* Để đếm số mục nhập True trong một mảng Boolean, np.count_nonzero rất hữu ích:

In [22]:
# how many values less than 6?
np.count_nonzero(x < 6)

8

In [24]:
# Có bao nhiêu giá trị nhỏ hơn 6 trong mỗi hàng?
np.count_nonzero(x < 6, axis=1)

array([4, 2, 2], dtype=int64)

* Chúng tôi thấy rằng có tám mục nhập mảng nhỏ hơn 6. Một cách khác để lấy thông tin này là sử dụng np.sum; trong trường hợp này, False được hiểu là 0 và True được hiểu là 1:

In [17]:
np.sum(x < 6)

8

* Lợi ích của sum () là giống như với các hàm tổng hợp NumPy khác, việc tổng kết này cũng có thể được thực hiện dọc theo các hàng hoặc cột:

In [19]:
# Có bao nhiêu giá trị nhỏ hơn 6 trong mỗi hàng?
np.sum(x < 6, axis=1)

array([4, 2, 2])

* Điều này đếm số lượng giá trị nhỏ hơn 6 trong mỗi hàng của ma trận.

* Nếu chúng tôi muốn nhanh chóng kiểm tra xem có bất kỳ hoặc tất cả các giá trị là đúng hay không, chúng tôi có thể sử dụng (bạn đoán vậy) np.any hoặc np.all:

In [27]:
# có giá trị nào lớn hơn 8 không?
np.any(x > 8)

True

In [28]:
# có tất cả các giá trị nhỏ hơn 6 không?
np.all(x < 6)

False

* np.all và np.any cũng có thể được sử dụng dọc theo các trục cụ thể. Ví dụ:

In [29]:
np.all(x < 8, axis=1)

array([ True, False,  True])

## Boolean operators

![image.png](attachment:image.png)

![image.png](attachment:image.png)

## Boolean Arrays as Masks

In [42]:
x

array([[5, 0, 3, 3],
       [7, 9, 3, 5],
       [2, 4, 7, 6]])

In [44]:
x[2, [2, 0, 1]]

array([7, 2, 4])

In [46]:
x[1:, [2, 0, 1]]

array([[3, 7, 9],
       [7, 2, 4]])

In [49]:
row = np.array([0, 1, 2])
mask = np.array([1, 0, 1, 0], dtype=bool)
x[row[:, np.newaxis], mask]

array([[5, 3],
       [7, 3],
       [2, 7]])

In [32]:
x[x < 5]

array([0, 3, 3, 3, 2, 4])

* Những gì được trả về là một mảng một chiều được lấp đầy với tất cả các giá trị đáp ứng điều kiện này; nói cách khác, tất cả các giá trị ở các vị trí mà tại đó mảng mặt nạ là True.

In [37]:
cities = ["Ha Noi", "Ho Chi Minh City", "Da Nang"]

In [38]:
cities[::-1]

['Da Nang', 'Ho Chi Minh City', 'Ha Noi']

In [41]:
cities.count("Ha Noi")

1