| <h1><b>Pengenalan Numpy</b></h1> |  ![](files/piksel-logo-small.png) |
|:---------|----------:|

* **Prasyarat**:  Pengguna notebook ini harus memiliki pemahaman dasar tentang:
    * Cara menjalankan [Jupyter notebook](01_jupyter_notebooks.ipynb)

## 🔙 Pendahuluan
Numpy adalah Python library yang menambahkan dukungan untuk array dan metrik multidimensi yang besar, beserta sekumpulan besar fungsi matematika tingkat tinggi untuk beroperasi pada array ini. Informasi selengkapnya tentang array Numpy dapat ditemukan di sini [here](https://en.wikipedia.org/wiki/NumPy).

Notebook ini dirancang untuk memperkenalkan pengguna pada array Numpy atau penggunaan Python code di Jupyter Notebooks melalui JupyterLab.

Topik yang dibahas meliputi:

* Cara menggunakan fungsi Numpy di Jupyter Notebook cell
* Penggunaan indeks untuk menjelajahi data array Numpy multidimensi
* Tipe data Numpy, penyiaran dan booleans
* Penggunaan Matplotlib untuk memplot data Numpy

## 🏃‍♂️‍➡️ Memulai
Untuk menjalankan notebook ini, jalankan semua cells di notebook yang dimulai dengan "Load packages" cell. Untuk bantuan dalam menjalankan notebook cells, refer kembali [Jupyter Notebooks notebook](01_Jupyter_notebooks.ipynb).

### Memuat packages

Agar dapat menggunakan numpy, kita perlu mengimpor pustaka menggunakan kata khusus `import`. Selain itu, untuk menghindari mengetik `numpy` setiap kali kita ingin menggunakan salah satu fungsinya, kita dapat memberikan alias menggunakan kata khusus `as`:

In [None]:
import numpy as np

### Pengantar Numpy

Sekarang, kita memiliki akses ke semua fungsi yang tersedia di `numpy` dengan mengetik `np.name_of_function`. Misalnya, padanan dari `1 + 1` di Python dapat dilakukan di `numpy`:

In [None]:
np.add(1,1)

Meskipun ini mungkin awalnya tampak tidak terlalu berguna, bahkan operasi sederhana seperti ini dapat dilakukan jauh lebih cepat di `numpy` daripada di Python standar saat menggunakan banyak angka (array besar).

Untuk mengakses dokumentasi yang menjelaskan cara penggunaan fungsi, parameter input, dan format output, kita dapat menekan `Shift+Tab` setelah nama fungsi. Coba ini di cell di bawah ini

In [None]:
np.add

Secara default, hasil fungsi atau operasi ditampilkan di bawah cell yang berisi code. Jika kita ingin menggunakan kembali hasil ini untuk operasi selanjutnya, kita dapat menetapkannya ke variabel:

In [None]:
a = np.add(2,3)

Isi variabel ini dapat ditampilkan kapan saja dengan mengetikkan nama variabel di cell baru:

In [None]:
a

### Array Numpy
Konsep inti dalam numpy adalah array yang setara dengan daftar angka tetapi dapat multidimensi. Untuk mendeklarasikan array numpy, kita lakukan:

In [None]:
np.array([1,2,3,4,5,6,7,8,9])

 Sebagian besar fungsi dan operasi yang didefinisikan dalam numpy dapat diterapkan ke array. Misalnya, dengan operasi sebelumnya:

In [None]:
arr1 = np.array([1,2,3,4])
arr2 = np.array([3,4,5,6])

np.add(arr1, arr2)

Namun notasi yang lebih sederhana dan mudah juga dapat digunakan:

In [None]:
arr1 + arr2

#### Pengindeksan
Array dapat dibagi dan dipecah. Kita dapat memperoleh subset dari array menggunakan notasi pengindeksan yaitu `[start:end:stride]`. Mari kita lihat apa artinya ini:

In [None]:
arr = np.array([0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15])

print('elemen ke-6 di array:', arr[5])
print('elemen ke-6 terakhir di array', arr[5:])
print('mulai dari awal sampai elemen ke 5 di array ', arr[:5])
print('setiap elemen ke-2', arr[::2])

Cobalah bereksperimen dengan indeks untuk memahami arti dari `start`, `end` and `stride`. Apa yang terjadi jika Anda tidak menentukan awalan? Nilai apa yang digunakan numpy sebagai gantinya? Perhatikan bahwa indeks numpy dimulai pada `0`, konvensi yang sama yang digunakan dalam daftar Python. 

Indeks juga bisa negatif, artinya Anda mulai menghitung dari akhir. Misalnya, untuk memilih 2 elemen terakhir dalam array, kita dapat melakukan: 

In [None]:
arr[-2:]

### Array multidimensi
Array Numpy dapat memiliki beberapa dimensi. Misalnya, kita mendefinisikan array 2 dimensi `(1,9)` menggunakan tanda kurung siku: 
![](files/numpy_array.png)

In [None]:
np.array([[1,2,3,4,5,6,7,8,9]])

Untuk memvisualisasikan bentuk atau dimensi array numpy, kita dapat menambahkan sufiks `.shape`

In [None]:
print(np.array([1,2,3,4,5,6,7,8,9]).shape)
print(np.array([[1,2,3,4,5,6,7,8,9]]).shape)
print(np.array([[1],[2],[3],[4],[5],[6],[7],[8],[9]]).shape)

Setiap array dapat dibentuk ulang menjadi bentuk yang berbeda menggunakan fungsi `reshape`:

In [None]:
np.array([1,2,3,4,5,6,7,8]).reshape((2,4))

Jika Anda khawatir harus mengetik begitu banyak tanda kurung, ada cara yang lebih sederhana untuk melakukannya:

In [None]:
print(np.array([1,2,3,4,5,6,7,8,9]).reshape(1,9).shape)
print(np.array([1,2,3,4,5,6,7,8,9]).reshape(9,1).shape)
print(np.array([1,2,3,4,5,6,7,8,9]).reshape(3,3).shape)

Ada juga cara lain tanpa harus mengetikkan semua elemennya:

In [None]:
print(np.arange(9))
print(np.ones((3,3)))
print(np.zeros((2,2,2)))

### Operasi aritmatika

Numpy memiliki banyak fungsi aritmatika yang berguna. Di bawah ini kami akan menunjukkan beberapa di antaranya, seperti mean, standar deviasi dan jumlah semua elemen di array. Operasi ini dapat dilakukan di seluruh array, atau di dimensi tertentu.

In [None]:
arr = np.arange(9).reshape((3,3))
print(arr)

In [None]:
print('Rerata semua elemen di array:', np.mean(arr))
print('Standar deviasi dari semua element di array:', np.std(arr))
print('Jumlah semua elemen di array:', np.sum(arr))

In [None]:
print('Rerata element di array axis 0:', np.mean(arr, axis=0))
print('Rerata element di array axis 1:', np.mean(arr, axis=1))

### Tipe Data Numpy
Array Numpy dapat berisi nilai numerik dari berbagai jenis. Jenis-jenis ini dapat dibagi dalam kelompok-kelompok berikut:

 * Integers
    * Unsigned
        * 8 bits: `uint8`
        * 16 bits: `uint16`
        * 32 bits: `uint32`
        * 64 bits: `uint64`
    * Signed
        * 8 bits: `int8`
        * 16 bits: `int16`
        * 32 bits: `int32`
        * 64 bits: `int64`

* Floats
    * 32 bits: `float32`
    * 64 bits: `float64`
    
Kita dapat menentukan tipe array atau mengubah tipe data array yang sudah ada dengan cara berikut:

In [None]:
#set datatype dwhen declaring array
arr = np.arange(5, dtype=np.uint8)
print('Integer datatype:', arr)

arr = arr.astype(np.float32)
print('Float datatype:', arr)

### Broadcasting

Istilah braodcasting menjelaskan bagaimana numpy memperlakukan array dengan bentuk yang berbeda selama operasi aritmatika. Ada batasan tertentu, array yang lebih kecil akan di"broadcast" ke array yang lebih besar sehingga bentuknya kompatibel. Broadcasting menyediakan cara untuk memvektorisasi operasi array sehingga perulangan terjadi dalam C, bukan Python. Hal ini dapat membuat operasi menjadi sangat cepat.

In [None]:
a = np.zeros((3,3))
print(a)

a = a + 1

print(a)

In [None]:
a = np.arange(9).reshape((3,3))

b = np.arange(3)

a + b

### Booleans
Ada tipe biner di numpy yang disebut boolean yang mengodekan nilai `True` and `False`. Misalnya:

In [None]:
arr = (arr > 0)

print(arr)

arr.dtype

Tipe Boolean cukup berguna untuk mengindeks dan memilih bagian gambar seperti yang akan kita lihat nanti. Banyak fungsi numpy juga bekerja dengan tipe Boolean.

In [None]:
print("Jumlah 'Trues' di array:", np.count_nonzero(arr))

#create two boolean arrays
a = np.array([1,1,0,0], dtype=np.bool_)
b = np.array([1,0,0,1], dtype=np.bool_)

#compare where they match
np.logical_and(a, b)

### Pengantar Matplotlib
Bagian kedua ini memperkenalkan matplotlib, sebuah Python library untuk memplot array numpy sebagai gambar. Untuk keperluan tutorial ini, kita akan menggunakan bagian matplotlib yang disebut pyplot. Kita mengimpornya dengan melakukan:

In [None]:
%matplotlib inline

import numpy as np
from matplotlib import pyplot as plt

Suatu gambar dapat dilihat sebagai array 2 dimensi. Untuk memvisualisasikan isi array numpy:

In [None]:
arr = np.arange(100).reshape(10,10)

print(arr)

plt.imshow(arr)

Kita dapat menggunakan Pyplot library untuk memuat gambar menggunakan fungsi `imread`:

In [None]:
im = np.copy(plt.imread('img/kuta.png'))

#### Mari tampilkan gambar ini menggunakan fungsi `imshow`.

In [None]:
plt.imshow(im)

Ini adalah [free stock photo](https://depositphotos.com/42725091/stock-photo-kilimanjaro.html) Gunung Kilimanjaro, Tanzania. Gambar berwarna biasanya terdiri dari tiga lapisan yang berisi nilai piksel merah, hijau, dan biru. Saat kita menampilkan gambar, kita melihat ketiga warna tersebut digabungkan.

Mari kita gunakan fungsi pengindeksan numpy untuk memilih sepotong gambar ini. Misalnya untuk memilih matahari terbenam:

In [None]:
# plt.imshow(im[:100,-200:,:])
plt.imshow(im[300:400,600:750,:])

---

## ℹ️ Info

Jika ada pertanyaan atau komentar bisa mengirimkan email ke piksel@big.go.id

**Lisensi:** Skrip dalam notebook ini dilisensikan berdasarkan [Apache License, Version 2.0](https://www.apache.org/licenses/LICENSE-2.0). 
Data Piksel dilisensikan berdasarkan lisensi [Creative Commons by Attribution 4.0](https://creativecommons.org/licenses/by/4.0/).

In [None]:
from datetime import datetime
print(f"Tanggal update: {datetime.now().strftime('%d %B %Y')}")