Filtering Arrays
Getting some elements out of an existing array and creating a new array out of them is called filtering.
In NumPy, you filter an array using a boolean index list.
Lọc mảng
Lấy một số phần tử ra khỏi mảng hiện có và tạo một mảng mới từ chúng được gọi là lọc.
Trong NumPy, bạn lọc một mảng bằng danh sách chỉ mục boolean.

A boolean index list is a list of booleans corresponding to indexes in the array.
Danh sách chỉ mục boolean là danh sách các boolean tương ứng với các chỉ mục trong mảng.

If the value at an index is True that element is contained in the filtered array, if the value at that index is False that element is excluded from the filtered array
Nếu giá trị tại một chỉ mục là True phần tử đó được chứa trong mảng được lọc, nếu giá trị tại chỉ mục đó là False phần tử đó sẽ bị loại khỏi mảng được lọc

In [1]:
# Create an array from the elements on index 0 and 2:
# Tạo một mảng từ các phần tử ở chỉ mục 0 và 2:
import numpy as np

arr = np.array([41, 42, 43, 44])

x = [True, False, True, False]

newarr = arr[x]

print(newarr)

[41 43]


The example above will return [41, 43], why?
Because the new array contains only the values where the filter array had the value True, in this case, index 0 and 2.
Ví dụ trên sẽ trả về [41, 43], tại sao?
Bởi vì mảng mới chỉ chứa các giá trị mà mảng bộ lọc có giá trị True, trong trường hợp này là chỉ mục 0 và 2.

Creating the Filter Array
In the example above we hard-coded the True and False values, but the common use is to create a filter array based on conditions.
Tạo mảng lọc
Trong ví dụ trên, chúng tôi đã mã hóa cứng các giá trị True và False, nhưng cách sử dụng phổ biến là tạo một mảng bộ lọc dựa trên các điều kiện.

In [2]:
# Create a filter array that will return only values higher than 42:
# Tạo một mảng bộ lọc sẽ chỉ trả về các giá trị cao hơn 42:
import numpy as np

arr = np.array([41, 42, 43, 44])

# Create an empty list
filter_arr = []

# go through each element in arr
for element in arr:
  # if the element is higher than 42, set the value to True, otherwise False:
  if element > 42:
    filter_arr.append(True)
  else:
    filter_arr.append(False)

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

[False, False, True, True]
[43 44]


In [1]:
# Create a filter array that will return only even elements from the original array:
# Tạo một mảng lọc sẽ chỉ trả về các phần tử chẵn từ mảng ban đầu:
import numpy as np

arr = np.array([1, 2, 3, 4, 5, 6, 7])

# Create an empty list
filter_arr = []

# go through each element in arr
for element in arr:
  # if the element is completely divisble by 2, set the value to True, otherwise False
  if element % 2 == 0:
    filter_arr.append(True)
  else:
    filter_arr.append(False)

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

[False, True, False, True, False, True, False]
[2 4 6]


Creating Filter Directly From Array
The above example is quite a common task in NumPy and NumPy provides a nice way to tackle it.
We can directly substitute the array instead of the iterable variable in our condition and it will work just as we expect it to.
Tạo bộ lọc trực tiếp từ mảng
Ví dụ trên là một nhiệm vụ khá phổ biến trong NumPy và NumPy cung cấp một cách hay để giải quyết nó.
Chúng ta có thể thay thế trực tiếp mảng thay vì biến lặp trong điều kiện của chúng ta và nó sẽ hoạt động đúng như chúng ta mong đợi.

In [3]:
# Create a filter array that will return only values higher than 42:
# Tạo một mảng bộ lọc sẽ chỉ trả về các giá trị cao hơn 42:
import numpy as np

arr = np.array([41, 42, 43, 44])

filter_arr = arr > 42

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

[False False  True  True]
[43 44]


In [4]:
# Create a filter array that will return only even elements from the original array:
# Tạo một mảng lọc sẽ chỉ trả về các phần tử chẵn từ mảng ban đầu:
import numpy as np

arr = np.array([1, 2, 3, 4, 5, 6, 7])

filter_arr = arr % 2 == 0

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

[False  True False  True False  True False]
[2 4 6]
