# LINEAR ALGEBRA FOR DATA SCIENCE INTRODUCTION (PART 1)

## Motivasi Belajar Linear Algebra Untuk Data Science

Linear Algebra adalah ilmu tentang pengopreasian linear terhadap objek objek dalam matematika seperti vektor, matriks, dan tensor. dimana data biasanya di representasikan dalam objek-objek tersebut. seperti contohnya data struktur yang biasanya di representasikan dalam tabel matriks. dimana kolom dalam matriks tersebut adalah sebuah vektor.

Beberapa skill yang harus di miliki oleh data science adalah pemahaman, abstraksi atau intuisi dalam mengaplikasikan Matematika. Terutama Statistik dan Linear Algebra. jadi disini saya tidak akan menjelaskan detail tentang konsepnya seperti pembuktian dan sebagainya.

Machine Learning, Deep Learning, dsb bukanlah suatu alat yang menghasilkan sesuatu tanpa proses. didalamnya terdapat konsep-konsep algoritma yang didasari oleh berbagai disiplin ilmu yang salah satunya matematika dan lebih khususnya statisik dan linear algebra.

Apabila kita memahami bahan-bahan dasar pembangun teknologi ini, maka kita akan lebih cepat memahami dan menguasai teknologi tersebut. kita akan mendapatkan intuisi bagaimana mesin itu bekerja, kenapa mesin itu bekerja, dan dapat mengdianosis kenapa mesin learning itu gagal dalam kasus-kasus tertentu. dan dapat memberikan hipotesis algortima ML mana yang sekiranya akan bekerja dengan lebih baik.

## Liblary Linear Algebra di Python

1. SciPy
2. Numpy

In [4]:
import numpy as np
import scipy

## Vektor

Vektor dalam data science bisa di definisikan sebagai attribut atau feature. yang terdapat dalam kolomn suatu matriks.

In [7]:
vector_height = [90, 
                 170, 
                 180,
                130]

vector_temperature = [1,
                     5, 
                     20,
                     25]
print(vector_height, vector_temperature)

[90, 170, 180, 130] [1, 5, 20, 25]


Mengapa saya menuliskan vektor vektor di atas dalam arah vertikal karena vektor dalam data terstruktur biasa di representasikan dalam kolom.

In [8]:
# Input Vektor secara otomatis

vektor1 = np.linspace(1, 10, 5)
vektor2 = np.arange(1, 10, 5)

Perbedaan diantara yang keduanya adalah :
1. linspace menyatakan bahwa kita ingin membuat vektor dengan nilai minimum 1 dan maksimum 10 sebanyak 5 input nilai. dimana setiap nilai mempunyai jarak yang sama.
2. arange menyatakan kita membuat vektor dengan nilai minimum 1 dan maksimum 10 dengan jarak dari input tersebut 5. yang artinya akan menghasilkan 10/5=2 nilai input.

In [11]:
print(vektor1)

print(vektor2)

[ 1.    3.25  5.5   7.75 10.  ]
[1 6]


Matriks adalah koleksi informasi dalam 2 dimensi. dalam python matriks dapat di representasikan sebagai list dalam list. dimana setiap list yang ada dalam list mempunyai panjang yang sama dan merepresantikan sebuah baris atau objek observasi. matriks[i][j]
adalah sebuah informasi yang terdapat dalam kolom ke i dan baris ke j.

In [12]:
A = [[1, 2, 3],  # Matriks A mempunyai 3 kolom dan 2 baris
     [4, 5, 6]]

B = [[1, 2],     # Matriks B mempunyai 2 baris dan 3 kolom
     [3, 4],
     [5, 6]]

### Operasi Matriks-Vektor

The rule of Thumb : Matriks (m x n) bisa di operasikan terhadap vektor yang memiliki panjang n dan menghasilkan m vektor. m = baris, n = kolom

![image.png](attachment:image.png)

In [13]:
print(vector_height)

[90, 170, 180, 130]


In [15]:
print(A)

[[1, 2, 3], [4, 5, 6]]


In [27]:
# Disini saya akan mengubah tipe list menjadi numpy agar dapat dilakukan pengoperasian matriks dengan numpy

vektor_A = np.array(vector_height[:3]) # ambil 3 nilai pertama dalam vector_height

A = np.array(A)

#Cara-cara mengkalikan matriks dengan vektor

print("By Dot")
print(A.dot(vektor_A))
print("By Matmul")
print(np.matmul(A, vektor_A))
print("By Inner")
print(np.inner(A, vektor_A))
print("By @ operator")
print(A@vektor_A)

By Dot
[ 970 2290]
By Matmul
[ 970 2290]
By Inner
[ 970 2290]
By @ operator
[ 970 2290]


### Operasi Matrik-Matrik

Rule of thumb : 
1. Matrik dengan M row dan M kolom hanya bisa di multipikasi dengan matrik dengan M row dan M kolom menghasilkan matriks M row dan M kolom.

![image.png](attachment:image.png)

In [43]:
matriks_A = np.array([[3, 2, 2], 
                     [3, 2, 4],
                     [1, 3, 6]])

matriks_B = np.array([[9, 2, 5],
                    [2, 6, 4], 
                     [2, 3, 5]])


print(matriks_A.dot(matriks_B))

[[35 24 33]
 [39 30 43]
 [27 38 47]]


2. Multipikasi dari matriks A dengan matriks B, berbeda dengan matriks B dengan A

In [44]:
matriks_A.dot(matriks_B) == matriks_B.dot(matriks_A)

array([[False, False, False],
       [False, False, False],
       [False, False, False]])

### Identitas Matrik

Defini Matrik Identitas : https://id.wikipedia.org/wiki/Matriks_identitas

In [50]:
# cara membuat matriks identitas

identity_3 = np.identity(3) # 3 = jumlah dimensi
print(identity_3)

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


perkalian matrik dengan idenitas menhasilkan nilai matrik itu sendiri

In [51]:
print(matriks_A)

[[3 2 2]
 [3 2 4]
 [1 3 6]]


In [53]:
matriks_A.dot(identity_3)

array([[3., 2., 2.],
       [3., 2., 4.],
       [1., 3., 6.]])

In [55]:
identity_3.dot(matriks_A)

array([[3., 2., 2.],
       [3., 2., 4.],
       [1., 3., 6.]])