## Numpy
NumPy (Python Numerik) adalah ekstensi open source dari Python Numerical komputasi. Alat ini dapat digunakan untuk menyimpan dan memproses matriks besar. Numpy jauh lebih efisien daripada struktur nested list Python sendiri. Ini mendukung operasi array dan matriks beberapa dimensi. Selain itu juga menyediakan sejumlah besar perpustakaan matematika untuk operasi array dan digunakan di hampir setiap bidang sains dan teknik. 
    
NumPy dari tahun 2005 dan membentuk semacam kode sumber terbuka dan dipelihara dan dikembangkan oleh banyak kolaborator bersama-sama. NumPy API digunakan secara luas di Pandas, SciPy, Matplotlib, scikit-learn, scikit-image dan sebagian besar paket ilmu data dan Python ilmiah lainnya.

Pustaka NumPy berisi array multidimensi dan struktur data matriks (Anda akan menemukan informasi lebih lanjut tentang ini di bagian selanjutnya). Ini menyediakan ndarray, objek array n-dimensi homogen, dengan metode untuk beroperasi secara efisien di atasnya. NumPy dapat digunakan untuk melakukan berbagai macam operasi matematika pada array. Itu menambahkan struktur data yang kuat ke Python yang menjamin perhitungan yang efisien dengan array dan matriks dan itu memasok perpustakaan besar fungsi matematika tingkat tinggi yang beroperasi pada array dan matriks ini.

In [2]:
pip install numpy

Note: you may need to restart the kernel to use updated packages.


In [3]:
import numpy as np
np.__version__ 

'1.21.5'

Membandingkan kecepatan antara numpy dengan list core python

In [4]:
# code 
b = list(range(10))
print(b)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [5]:
# code function sum menggunakan list 
# menambahkan list a dan list b dari jumlah range sebagai inputan
# a akan di pangkat 2 dan b akan dipangkatkan dengan 3 
# hasil akhir akan menjumlahkan a dan b 
def python_listsum(n):
    a = b = list(range(n)) # menginisialisasi a dan b dari list range 
    output = []
    for idx in range(len(a)):
        x = a[idx] ** 2 
        y = b[idx] ** 3
        output.append(x+y)
    
    return output


In [6]:
output_listsum = python_listsum(10)
print(output_listsum)

[0, 2, 12, 36, 80, 150, 252, 392, 576, 810]


In [7]:
def numpy_sum(n):
    x = np.arange(n) ** 2 
    y = np.arange(n) ** 3  
    return x+y 

In [8]:
output = numpy_sum(10)
print(output)

[  0   2  12  36  80 150 252 392 576 810]


In [9]:
# kita bandingkan dengan waktu menggunakan lib datetime 
from datetime import datetime
size = 1000000
awal = datetime.now()
## call func 
output = python_listsum(100)
end = datetime.now() - awal 
print(f"Waktu yang dibutuhkan : {end.microseconds}")
print(f"Data 2 akhir dari list : {output[-2:]}")

Waktu yang dibutuhkan : 0
Data 2 akhir dari list : [950796, 980100]


In [10]:
from datetime import datetime
size = 1000000
awal = datetime.now()
## call func 
output = numpy_sum(100)
end = datetime.now() - awal 
print(f"Waktu yang dibutuhkan : {end.microseconds}")
print(f"Data 2 akhir dari list : {output[-2:]}")

Waktu yang dibutuhkan : 999
Data 2 akhir dari list : [950796 980100]


In [11]:
print(np.__doc__)


NumPy
=====

Provides
  1. An array object of arbitrary homogeneous items
  2. Fast mathematical operations over arrays
  3. Linear Algebra, Fourier Transforms, Random Number Generation

How to use the documentation
----------------------------
Documentation is available in two forms: docstrings provided
with the code, and a loose standing reference guide, available from
`the NumPy homepage <https://www.scipy.org>`_.

We recommend exploring the docstrings using
`IPython <https://ipython.org>`_, an advanced Python shell with
TAB-completion and introspection capabilities.  See below for further
instructions.

The docstring examples assume that `numpy` has been imported as `np`::

  >>> import numpy as np

Code snippets are indicated by three greater-than signs::

  >>> x = 42
  >>> x = x + 1

Use the built-in ``help`` function to view a function's docstring::

  >>> help(np.sort)
  ... # doctest: +SKIP

For some objects, ``np.info(obj)`` may provide additional help.  This is
particularl

### Membuat sebuah Ndarrays

In [12]:
import numpy as np

listrange = list(range(5))
print(listrange)
print(type(listrange))

[0, 1, 2, 3, 4]
<class 'list'>


In [13]:
nparr = np.array(listrange)
print(nparr)
print(type(nparr))

[0 1 2 3 4]
<class 'numpy.ndarray'>


In [14]:
print(np.arange(5)) # (start  default = 0  , stop , step default = 1)

print(np.arange(1,9)) # start  = 1 , stop = 9 , step default =1 

print(np.arange(1,15,2)) # start  = 1 , stop = 15 , step = 2 

[0 1 2 3 4]
[1 2 3 4 5 6 7 8]
[ 1  3  5  7  9 11 13]


____________

### Add, Remove, and Sort
- np.append() 
- np.delete()
- np.sort()
  np.sort(a, axis=1, kind=None, order=None)

In [15]:
#code 
nparr  = np.arange(1,11)
print(nparr)
print(type(nparr))

[ 1  2  3  4  5  6  7  8  9 10]
<class 'numpy.ndarray'>


In [16]:
#code
new_np = np.append(nparr, [12,14])
print(new_np)

[ 1  2  3  4  5  6  7  8  9 10 12 14]


In [17]:
np.delete(new_np, 4)

array([ 1,  2,  3,  4,  6,  7,  8,  9, 10, 12, 14])

In [18]:
np.sort?

In [19]:
arr_acak = np.array([4,2,1,10,6,8,5,7,3, 9])
arr_sort = np.sort(arr_acak)
print(arr_sort)

[ 1  2  3  4  5  6  7  8  9 10]


### Multi Dimensional Array
NumPy array memudahkan kita untuk membuat array multi-dimensi.

![01_array.png](attachment:01_array.png)

### ndim, shape, and size

In [20]:
#code
multiplelist= [[0,1,2,3], [10,11,12,13]]
print(multiplelist)

np_arr = np.array(multiplelist)
print(f"{np_arr}")
print(f" ndim : {np_arr.ndim}, shape : {np_arr.shape}, size : {np_arr.size}")

[[0, 1, 2, 3], [10, 11, 12, 13]]
[[ 0  1  2  3]
 [10 11 12 13]]
 ndim : 2, shape : (2, 4), size : 8


ndarray.ndim akan memberi tahu Anda jumlah sumbu, atau dimensi, dari array.

ndarray.size akan memberi tahu Anda jumlah total elemen array. Ini adalah produk dari elemen bentuk array.

ndarray.shape akan menampilkan tupel bilangan bulat yang menunjukkan jumlah elemen yang disimpan di sepanjang setiap dimensi array. Jika, misalnya, Anda memiliki array 2D dengan 2 baris dan 4 kolom, bentuk array Anda adalah (2,4).

![02_ndim.png](attachment:02_ndim.png)

### size

![03_size.png](attachment:03_size.png)

### Contoh 3 Dimensi

In [21]:
#code
np_arr3 = np.array (  [
             [[0,1,2,3],[4,5,6,7]],
             [[8,9,10,11],[12,13,14,15]],
             [[20,21,22,23],[24,25,26,27]]
              ])
print(np_arr3)
print(np_arr3.shape)
print(np_arr3.size)
print(np_arr3.ndim)

[[[ 0  1  2  3]
  [ 4  5  6  7]]

 [[ 8  9 10 11]
  [12 13 14 15]]

 [[20 21 22 23]
  [24 25 26 27]]]
(3, 2, 4)
24
3


Pada array multi-dimensi kita dapat mengakses nilai elemen berdasarkan indeks dengan pemisah tanda koma [,]. Misalkan kita ingin mendapatkan data pada baris ke-1 dan kolom ke-3 dari array a, maka dilakukan perintah a[1, 3].

Misalkan, kita akan mengganti data pada baris ke-1 dan kolom ke-3 pada array a dengan nilai -1, kita dapat langsung assign nilai baru tersebut pada indeks.

![04_3%20dimensi.png](attachment:04_3%20dimensi.png)

In [22]:
#code
arra_d = [[0,1,2,3], [10,11,12,13]]
np_arr2d = np.array(arra_d)
print(np_arr2d)

[[ 0  1  2  3]
 [10 11 12 13]]


In [23]:
print(np_arr2d[1,3])
np_arr2d[1,3] = -1
print(np_arr2d)

13
[[ 0  1  2  3]
 [10 11 12 -1]]


 #### Sorting Array
 
 np.sort?  ## Signature: np.sort(a, axis=-1, kind=None, order=None)

|   kind    |  speed  |    stable |
|:--------|:-------|:--------| 
|'quicksort' |   1    |          no |
|'heapsort'  |   3   |          no |
|'mergesort' |   2   |       yes |
|'timsort'   |   2  |          yes |

### Sorting

In [24]:
field_mhs  = [('name','S10'), ('ipk',float), ('age',int)]
print(field_mhs)  

[('name', 'S10'), ('ipk', <class 'float'>), ('age', <class 'int'>)]


In [25]:
value_mhs = [('Sule',3.5, 25), ('Azis',3.9, 24), ('Parto',3.2, 30), ('Andre',3.2, 24) ]
print(value_mhs)

[('Sule', 3.5, 25), ('Azis', 3.9, 24), ('Parto', 3.2, 30), ('Andre', 3.2, 24)]


In [26]:
data_mhs = np.array(value_mhs, dtype = field_mhs)
print(data_mhs)

[(b'Sule', 3.5, 25) (b'Azis', 3.9, 24) (b'Parto', 3.2, 30)
 (b'Andre', 3.2, 24)]


In [27]:
data_sortby_name = np.sort(data_mhs, order='name')
print(data_sortby_name)

[(b'Andre', 3.2, 24) (b'Azis', 3.9, 24) (b'Parto', 3.2, 30)
 (b'Sule', 3.5, 25)]


In [28]:
data_sortby_ageipk = np.sort(data_mhs, order=['age','ipk'])
print(data_sortby_ageipk)

[(b'Andre', 3.2, 24) (b'Azis', 3.9, 24) (b'Sule', 3.5, 25)
 (b'Parto', 3.2, 30)]


### Sorting dengan Structure

#### zeroes 

  Sering ada kasus ketika kita ingin NumPy menginisialisasi nilai array untuk kita. NumPy menyediakan metode seperti one(), zeros(), dan lain-lain untuk kasus ini. Kami hanya memberikan mereka jumlah elemen yang kami ingin hasilkan: 

In [29]:
#code 
np.zeros(10) 

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [30]:
np.ones(14)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [31]:
np.zeros((2,2,2))

array([[[0., 0.],
        [0., 0.]],

       [[0., 0.],
        [0., 0.]]])

### Reshape
Menggunakan np.reshape() akan memberikan bentuk baru ke array tanpa mengubah data. Ingatlah bahwa ketika Anda menggunakan metode reshape, output dari array memiliki jumlah elemen yang sama dengan array aslinya. 
     12 element :  4x3 , 3x4 , 12 x 1 , 6x2
    
Dengan np.reshape, Anda dapat menentukan beberapa parameter opsional:

numpy.reshape(a, newshape, order)

--> a adalah array yang akan dibentuk kembali.

--> newshape : int atau tuple dari ints

--> newshape : bentuk baru yang Anda inginkan. Anda dapat menentukan bilangan bulat atau tupel bilangan bulat. Jika Anda menentukan bilangan bulat, hasilnya akan berupa array dengan panjang tersebut. Bentuknya harus sesuai dengan bentuk aslinya.

--> order    : 
- 'C' berarti membaca/menulis elemen menggunakan urutan indeks seperti C
- 'F' berarti membaca/menulis elemen menggunakan urutan indeks seperti Fortran
- 'A' berarti membaca/menulis elemen dalam seperti Fortran urutan indeks 
- jika a adalah Fortran bersebelahan dalam memori, urutan seperti C sebaliknya. (Ini adalah parameter opsional dan tidak perlu ditentukan.)
                Default = C 


In [32]:
#Code
datax  = np.arange(6)
print(datax)
print(datax.shape)

[0 1 2 3 4 5]
(6,)


In [33]:
reshape_a = datax.reshape(2,3)
print(reshape_a)
print(reshape_a.shape)

[[0 1 2]
 [3 4 5]]
(2, 3)


In [34]:
reshape_b = datax.reshape(3,2)
print(reshape_b)
print(reshape_b.shape)

[[0 1]
 [2 3]
 [4 5]]
(3, 2)


In [35]:
datay = np.arange(5)
print(datay)
res_y = datay.reshape(2,2)
print(res_y)

[0 1 2 3 4]


ValueError: cannot reshape array of size 5 into shape (2,2)

### Convert 1D to 2D
    np.newaxis
    np.expand_dims
    
Anda dapat menggunakan np.newaxis dan np.expand_dims untuk meningkatkan dimensi array yang ada.

Menggunakan np.newaxis akan meningkatkan dimensi array Anda satu dimensi saat digunakan sekali. 
     Artinya array 1D akan menjadi array 2D, 
     Array 2D akan menjadi Array 3D, dan seterusnya.

In [36]:
#Code
datad = np.arange(2,8) 
print(datad)
print(datad.shape)
print(datad.ndim)

[2 3 4 5 6 7]
(6,)
1


In [37]:
new_datad = datad[np.newaxis]
print(new_datad)
print(new_datad.shape)
print(new_datad.ndim)

[[2 3 4 5 6 7]]
(1, 6)
2


In [38]:
vector = datad[np.newaxis, : ]
print(vector)
print(vector.shape)

[[2 3 4 5 6 7]]
(1, 6)


In [39]:
vector_column = datad[ : ,np.newaxis]
print(vector_column)
print(vector_column.shape)
print(vector_column.ndim)

[[2]
 [3]
 [4]
 [5]
 [6]
 [7]]
(6, 1)
2


### Indexing and Slicing
Kalian dapat mengindeks dan slice array NumPy dengan cara yang sama seperti kalian slice lists Python.

Array NumPy juga mendukung slice, seperti kalian slice lists Python, dengan menggunakan operator titik dua (yaitu arr[:]) untuk mengiris. Kita juga dapat menggunakan pengindeksan negatif untuk mengiris ke arah belakang.

Kode di bawah ini menunjukkan potongan contoh array NumPy 1-D.

In [40]:
#Code
datanp = np.array([0,1,2,3,4,5,6,7,8,9])
print(datanp)

[0 1 2 3 4 5 6 7 8 9]


In [41]:
print(datanp[1])
print(datanp[-1])

1
9


In [42]:
print(datanp[1:5])

[1 2 3 4]


In [43]:
print(datanp[-2:])

[8 9]


#### Membuat Subset atau mengiris dari Array dengan menggunakan kondisi tertentu

In [44]:
#Code
list2d = [[0,1,2,3],[4,5,6,7],[8,9,10,11]]

### Creating Array from Existing Data
    slicing indexing
    np.vstack()
    np.hstack()
    np.hsplit()
    .view()
    .copy()

Anda dapat dengan mudah menggunakan buat array baru dari bagian array yang ada. Katakanlah Anda memiliki array ini:

array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

Anda dapat membuat array baru dari bagian array Anda kapan saja dengan menentukan di mana Anda ingin mengiris array Anda.

In [45]:
np_arr1 = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print(np_arr1[4:9])

[5 6 7 8 9]


In [46]:
np_a2d = np.array([[1,1],[2,2]])
np_b2d = np.array([[3,3],[4,4]])
print(np_a2d)
print(np_b2d)

[[1 1]
 [2 2]]
[[3 3]
 [4 4]]


In [47]:
npv = np.vstack((np_a2d, np_b2d))
print(npv)

[[1 1]
 [2 2]
 [3 3]
 [4 4]]


In [48]:
nph = np.hstack((np_a2d, np_b2d))
print(nph)

[[1 1 3 3]
 [2 2 4 4]]


In [49]:
arr_s = np.array([[1,2,3,4,5,6,7,8,9,10],[11,12,13,14,15,16,17,18,19,20]])
print(arr_s)

[[ 1  2  3  4  5  6  7  8  9 10]
 [11 12 13 14 15 16 17 18 19 20]]


In [50]:
res_split = np.hsplit(arr_s,5)
print(res_split)
print(type(res_split))

[array([[ 1,  2],
       [11, 12]]), array([[ 3,  4],
       [13, 14]]), array([[ 5,  6],
       [15, 16]]), array([[ 7,  8],
       [17, 18]]), array([[ 9, 10],
       [19, 20]])]
<class 'list'>


### Copying 

Serupa dengan List Python, pada saat membuat referensi ke array NumPy, itu tidak membuat array yang berbeda. Oleh karena itu, jika kita mengubah nilai menggunakan variabel referensi, itu juga mengubah array asli. 

Jika tidak ingin merubah nilai asli menggunakan fungsi copy(). Fungsi tidak memiliki argumen yang diperlukan, dan mengembalikan array yang disalin.

Dalam contoh kode di bawah ini, c adalah referensi ke while d adalah salinannya. Oleh karena itu, perubahan c menyebabkan perubahan yang sama pada a, sedangkan perubahan d tidak mengubah nilai b.

In [51]:
x = [0,1]
y = [2,4]
z = x
print(x)
print("##"*10)
z[0] = 10
print(z)

[0, 1]
####################
[10, 1]


In [52]:
newy = y.copy()
newy[0] = 100
print(newy)
print(y)

[100, 4]
[2, 4]


### Basic array operations
Addition, subtraction, multiplication, division, and more

In [53]:
np1d = np.array([1,2,3,4,5,6,7,8])
print(np1d.sum())

36


In [54]:
np2da = np.array([[10,20],[30,40]])
print(np2da)
print("#"*10)
print(np2da.sum(axis=0)) #menjumlahkan baris
print("#"*10)
print(np2da.sum(axis=1)) #menjumlahkan kolom

[[10 20]
 [30 40]]
##########
[40 60]
##########
[30 70]


### Broadcasting

![05_broadcasting.png](attachment:05_broadcasting.png)

In [55]:
data_b = np.array([1,2])
new_datab = data_b * 1.6
print(new_datab)

[1.6 3.2]


![06_broadcasting.png](attachment:06_broadcasting.png)

### Function

In [56]:
#nilai random berubah ubah
print(np.random.randint(30))

7


In [57]:
#membuat angka randomnya tetap
np.random.seed(0)
print(np.random.randint(30))

12


In [58]:
#print 5 nilai random dengan rentang 10-30
print(np.random.randint(10,30,5))

[25 10 13 13 17]


In [59]:
np.random.seed(2)
print(np.random.randint(5,high=20,size=(2,3)))

[[13 18 13]
 [11 16  7]]


### More Array Operations 
    Maximum, minimum, sum, mean, product, standard deviation, and more

NumPy juga melakukan fungsi agregasi. Selain min, max, dan sum, Anda dapat dengan mudah menjalankan mean untuk mendapatkan rata-rata, prod untuk mendapatkan hasil perkalian elemen, std untuk mendapatkan standar deviasi, dan banyak lagi.
    
    data.max()
    data.min()
    data.sum()

In [60]:
print(np1d)

[1 2 3 4 5 6 7 8]


In [61]:
np1d.max()
np1d.sum()

36

In [62]:
print(np2da)

[[10 20]
 [30 40]]


In [63]:
np2da.max()
np2da.sum()

100

### Matrix Arithmetic

In [64]:
m_data = np.array([[1,2],[4,5]])
print(m_data)

[[1 2]
 [4 5]]


In [65]:
np.one = np.ones([2,2])
print(np.one)

[[1. 1.]
 [1. 1.]]


In [66]:
print(m_data + np.one)

[[2. 3.]
 [5. 6.]]


### Dot Product

In [68]:
np.dot?

In [69]:
np.dot(3,4)

12

### Matrix Indexing

![07_indexing.png](attachment:07_indexing.png)

In [73]:
data_m = np.array([[1, 2], [3, 4], [5, 6]])
print(data_m)
print("*"*10)
print(data_m[0,1]) #baris ke 0 dan kolom ke 1
print("*"*10)
print(data_m[1:3]) #baris ke 1 sampai ke 3 (3 tidak include) dan untuk semua kolom
print("*"*10)
print(data_m[0:2,0]) #baris ke 0 sampai ke 2 (2 tidak include) dan kolom ke 0

[[1 2]
 [3 4]
 [5 6]]
**********
2
**********
[[3 4]
 [5 6]]
**********
[1 3]


### Indexing (View)

![08_indexing%28view%29.png](attachment:08_indexing%28view%29.png)

In [75]:
vkotak = np.arange(1,17,1)
print(vkotak)

kotak4x4 = vkotak.reshape(4,4)
print(kotak4x4)

[ 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16]
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]
 [13 14 15 16]]


In [76]:
print(kotak4x4)

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]
 [13 14 15 16]]


In [77]:
# mengambil baris ke 1 dan kolom ke 2 sampai 4 (4 tidak include)
print(kotak4x4[1,2:4])

[7 8]


In [78]:
# mengambil seluruh baris dan kolom ke 1
print(kotak4x4[:,1])

[ 2  6 10 14]


In [80]:
# mengambil 2 baris terakhir
print(kotak4x4[2:, 2:])

[[11 12]
 [15 16]]


In [81]:
# mengambil baris ke 1 dan 3, kolom ke 1 dan 3
print(kotak4x4[1::2, ::2])

[[ 5  7]
 [13 15]]


### Matrix Aggregation

In [83]:
np2da = np.array([[1,2],[4,6],[8,10]])

In [84]:
print(np2da)
print(np2da.max())
print(np2da.min())
print(np2da.sum())

[[ 1  2]
 [ 4  6]
 [ 8 10]]
10
1
31


### Transposing and Reshaping

In [86]:
datat = np.array([[1,2],[3,4],[5,6]])
print(datat)

[[1 2]
 [3 4]
 [5 6]]


In [87]:
print(datat.transpose())

[[1 3 5]
 [2 4 6]]


In [91]:
print(datat.T)

[[1 3 5]
 [2 4 6]]


In [97]:
dataT = np.array([[1,2,3,4,5,6]]).T
print(dataT)

[[1]
 [2]
 [3]
 [4]
 [5]
 [6]]


In [98]:
print(dataT.reshape(2,3))
print(dataT.reshape(3,2))

[[1 2 3]
 [4 5 6]]
[[1 2]
 [3 4]
 [5 6]]


### Flatten N-Dimensional Array

In [100]:
datat = np.array([[1,2],[3,4],[5,6]])
datat_flat = datat.flatten()
print(datat_flat)

[1 2 3 4 5 6]


### Optional

![09_data%20structure.png](attachment:09_data%20structure.png)

In [101]:
np_ds = np.arange(12)
print(np_ds)

[ 0  1  2  3  4  5  6  7  8  9 10 11]


In [104]:
print(np_ds.dtype)
print(np_ds.shape)
print(np_ds.strides)

int32
(12,)
(4,)


In [105]:
np_ds_2d = np_ds.reshape(4,3)
print(np_ds_2d)

[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]


In [106]:
print(np_ds_2d.dtype)
print(np_ds_2d.shape)
print(np_ds_2d.strides)

int32
(4, 3)
(12, 4)


In [107]:
np_ds_int16 = np_ds_2d.astype('int16')
np_ds_int16.strides

(6, 2)

![10_indexing%28copy%29.png](attachment:10_indexing%28copy%29.png)

![11_vectorization.png](attachment:11_vectorization.png)

## Np Read csv

In [108]:
import csv

In [111]:
data = []
filename = 'data/MER_T07_02A.csv'
with open(filename,'r') as csv_file:
    csv_reader = csv.reader(csv_file, delimiter=',')
    for row in csv_reader:
        data.append(row)
data = np.array(data)   
print(data.shape)
print(data.size)
print(data[-1:,0:1])

(8542, 6)
51252
[['ELETPUS']]


In [112]:
np.save(open('datamert.npy','wb'), data)