# NumPy Indexing dan Selection

NumPy memiliki kemampuan untuk melakukan indexing dan penyeleksian data dalam array dengan sangat cepat. Notebook ini akan membahas beberapa method utama dalam melakukan indexing dan penyeleksian.

In [12]:
import numpy as np

In [13]:
arr = np.arange(0,11)

In [14]:
arr

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

## Indexing dan Penyeleksian menggunakan Bracket

Ini merupakan cara paling dasar. Caranya serupa dengan Python list.

In [15]:
arr[8]

8

In [18]:
arr[1:5]

array([1, 2, 3, 4])

In [19]:
arr[0:5]

array([0, 1, 2, 3, 4])

## Broadcasting

Yang membedakan Numpy array dengan Python List normal adalah kemampuannya untuk melakukan broadcast.

In [20]:
arr[0:5]=100
arr

array([100, 100, 100, 100, 100,   5,   6,   7,   8,   9,  10])

In [21]:
arr = np.arange(0,11)
arr

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [22]:
#Slice array, dan dimasukkan kedalam variable baru
slice_of_arr = arr[0:6]

#Tunjukkan slice nya
slice_of_arr

array([0, 1, 2, 3, 4, 5])

In [23]:
#Kita ubah-ubah slicenya
slice_of_arr[:]=99

#Tunjukkin slice yang sudah kita ubah-ubah
slice_of_arr

array([99, 99, 99, 99, 99, 99])

Perubahan yang kita lakukan pada slice juga berubah pada array aslinya!

In [24]:
arr

array([99, 99, 99, 99, 99, 99,  6,  7,  8,  9, 10])

Data tidak di-copy, itu merupakan 'view' dari array aslinya! Mekanisme ini dilakukan numpy untuk menghindari masalah memori!

In [25]:
#Kalau ingin memasukkannya ke variable lain, kita harus pakai method copy secara explicit
arr_copy = arr.copy()

#Tunjukkan hasil copy-an kita
arr_copy

array([99, 99, 99, 99, 99, 99,  6,  7,  8,  9, 10])

In [26]:
#Kita ubah-ubah data dalam copy-an kita
arr_copy[:] = 100

#Tunjukkan copy-an yang sudah kita ubah-ubah
arr_copy

array([100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100])

In [27]:
#Tunjukkan array aslinya
arr

array([99, 99, 99, 99, 99, 99,  6,  7,  8,  9, 10])

## Indexing a 2D array (matrices)

Bagian ini membahas tentang cara melakukan indexing untuk array 2D.

### Native Indexing

Native indexing serupa dengan Python List

In [28]:
#Buat array
arr_2d = np.array(([5,10,15],[20,25,30],[35,40,45]))

#Tunjukkan
arr_2d

array([[ 5, 10, 15],
       [20, 25, 30],
       [35, 40, 45]])

In [29]:
#ambil data pada baris 1 mengembalikan sebuah vector 1D
arr_2d[1]

array([20, 25, 30])

In [30]:
#ambil data pada baris 1 kolom 0 mengembalikan sebuah nilai tunggal
arr_2d[1][0]

20

In [None]:
#Indexing bisa juga dilakukan dengan menggunakan format koma
arr_2d[1,0]

### Slicing

Slicing digunakan untuk mengambil subset dari sebuah nilai dalam array atau matrix

In [10]:
# 2D array slicing

#Shape (2,2) from top right corner
arr_2d[:1,1:]

array([[10, 15]])

In [None]:
#Shape bottom row
arr_2d[2]

In [None]:
#Shape bottom row
arr_2d[2,:]

### Fancy Indexing

Fancy indexing mengijinkan kita untuk menyeleksi seluruh baris atau kolom tanpa memperhatikan urutan. Untuk memahami ini mari kita buat numpy array kemudian melakukan fancy indexing.

In [31]:
#Set up matrix
arr2d = np.zeros((10,10))

arr2d

array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]])

In [32]:
#Length of array
arr_length = arr2d.shape[1]

arr_length

10

In [33]:
#Set up array

for i in range(arr_length):
    arr2d[i] = i
    
arr2d

array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [3., 3., 3., 3., 3., 3., 3., 3., 3., 3.],
       [4., 4., 4., 4., 4., 4., 4., 4., 4., 4.],
       [5., 5., 5., 5., 5., 5., 5., 5., 5., 5.],
       [6., 6., 6., 6., 6., 6., 6., 6., 6., 6.],
       [7., 7., 7., 7., 7., 7., 7., 7., 7., 7.],
       [8., 8., 8., 8., 8., 8., 8., 8., 8., 8.],
       [9., 9., 9., 9., 9., 9., 9., 9., 9., 9.]])

Fancy indexing allows the following

In [36]:
arr2d[[2,5]]

array([[2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [5., 5., 5., 5., 5., 5., 5., 5., 5., 5.]])

In [37]:
#Allows in any order
arr2d[[6,4,2,7]]

array([[6., 6., 6., 6., 6., 6., 6., 6., 6., 6.],
       [4., 4., 4., 4., 4., 4., 4., 4., 4., 4.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [7., 7., 7., 7., 7., 7., 7., 7., 7., 7.]])

## Selection

Seleksi berbasis operator. Teknik ini sering digunakan bagi para data scientist guna memperpendek baris program dan mempercepat performa aplikasi yang dibangunnya.

In [38]:
arr = np.arange(1,11)
arr

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [39]:
arr > 4

array([False, False, False, False,  True,  True,  True,  True,  True,
        True])

In [40]:
bool_arr = arr>4

In [41]:
bool_arr

array([False, False, False, False,  True,  True,  True,  True,  True,
        True])

In [42]:
arr[bool_arr]

array([ 5,  6,  7,  8,  9, 10])

In [43]:
arr[arr>2]

array([ 3,  4,  5,  6,  7,  8,  9, 10])

In [44]:
x = 2
arr[arr>x]

array([ 3,  4,  5,  6,  7,  8,  9, 10])