# Aljabar Linear dengan NumPy

Aljabar linear merupakan *jantung* dari machine learning, yaitu "bahasa utama" untuk menjelaskan machine learning secara matematis, sekaligus jembatan untuk mengimplementasikannya dalam kode program.

Bagian ini membahas beberapa konsep dasar aljabar linear beserta implementasinya dengan menggunakan NumPy.

1. Vektor
    - Penjumlahan / pengurangan
    - Perkalian skalar-vektor
    - Perkalian vektor-vektor: outer product, inner product

2. Fungsi linear
    - Definisi dan sifat fungsi linear
    - Model regresi

3. Norm dan jarak

4. Matriks

5. Metode Least squares

## Vektor

Vektor merupakan sebuah objek yang terdiri dari bilangan-bilangan skalar terurut. Berikut ini contoh vektor dengan anggota bilangan berjumlah 4.

$$
\mathbf{v} = 
\begin{bmatrix}
-1.1 \\
0.0 \\
3.6 \\
-7.2
\end{bmatrix}
\text{atau}
\begin{pmatrix}
-1.1 \\
0.0 \\
3.6 \\
-7.2
\end{pmatrix}
$$

Jumlah anggota dari vektor biasa diistilahkan dengan *size* atau *dimension*.


Jika bilangan-bilangan skalar tersebut berjenis bilangan riil, maka sebuah vektor dapat dinyatakan sebagai anggota di ruang bilangan riil/Euclidean: $\mathbf{v} \in \mathbb{R}^n$, dimana $n$ merupakan jumlah elemen atau dimensi dari vektor.

### Pembentukan Vektor
Pada NumPy, vektor direpresentasikan dalam array 1 dimensi.

In [1]:
import numpy as np

arr = np.array([-1.1, 0.0, 3.6, -7.2])
print(f"arr: {arr}") # print array values
print(f"shape: {arr.shape}") # print array dimension
print(f"dimension: {arr.ndim}") # print number of dimensions


arr: [-1.1  0.   3.6 -7.2]
shape: (4,)
dimension: 1


Pembentukan vektor di atas menggunakan fungsi `array()` dengan menuliskan nilai elemen-elemen secara eksplisit. 
Adapun cara-cara lain untuk membentuk vektor:

**Membuat array dengan elemen terurut**

In [2]:
print(f"np.arange(<start>, <stop>, <step>)")
# Create a vector with elements of 0-9
arr = np.arange(10)
print(f"arr: {arr}")

# Create a vector with elements of 2.0 - 9.0
arr = np.arange(2, 10, dtype=float)
print(f"arr: {arr}")

# Create a vector with elements between 4 - 25 with a step of 2
arr = np.arange(4, 25, 2)
print(f"arr: {arr}")

# Reverse the array
print(f"arr: {arr[::-1]}")

np.arange(<start>, <stop>, <step>)
arr: [0 1 2 3 4 5 6 7 8 9]
arr: [2. 3. 4. 5. 6. 7. 8. 9.]
arr: [ 4  6  8 10 12 14 16 18 20 22 24]
arr: [24 22 20 18 16 14 12 10  8  6  4]


In [3]:
print(f"np.linspace(<start>, <stop>, <num>)")
# Create a vector with <num> elements that spaced evenly on a interval of <start> to <stop>
arr = np.linspace(1.2, 10.5, 5)
print(f"arr: {arr}")

np.linspace(<start>, <stop>, <num>)
arr: [ 1.2    3.525  5.85   8.175 10.5  ]


**Membuat array dengan seluruh elemen bernilai 0 atau 1**

In [4]:
zeros = np.zeros(5)
print(f"zeros: {zeros}")

ones = np.ones(5)
print(f"ones: {ones}")

# Create a unit vector
unit = np.copy(zeros)
unit[0] = 1
print(f"unit: {unit}")


zeros: [0. 0. 0. 0. 0.]
ones: [1. 1. 1. 1. 1.]
unit: [1. 0. 0. 0. 0.]


**Membuat array dengan elemen secara acak**

In [5]:
print(f"Random Vector")
# Create a random vector with 5 elements
arr = np.random.rand(5) # samples from uniform distribution
print(f"arr (uniform dist): {arr}")

arr = np.random.randn(5) # samples from normal distribution (mean=0, std=1)
print(f"arr (normal dist): {arr}")


Random Vector
arr (uniform dist): [0.07691189 0.53627801 0.33144508 0.30315722 0.97508745]
arr (normal dist): [ 1.46986782 -0.85331969 -1.2684305   0.77220813  1.15507744]


### Penggabungan Vektor
Di beberapa kasus tertentu, akan bermanfaat untuk kita dapat menuliskan vektor yang dibentuk dari penggabungan (*concatenation* atau *stacking*).
Misal terdapat 3 vektor $\mathbf{a} \in \mathbb{R}^2$, $\mathbf{b} \in \mathbb{R}^3$, dan $\mathbf{c} \in \mathbb{R}^4$, penggabungan 3 vektor tersebut secara berurutan dapat ditulis menjadi:

$$
\mathbf{d} = 
\begin{bmatrix}
\mathbf{a} \\
\mathbf{b} \\ 
\mathbf{c} 
\end{bmatrix} \in \mathbb{R}^9
$$

Kita dapat menggunakan fungsi `np.concatenate()` untuk melakukan hal tersebut.

In [6]:
a = np.arange(0, 2)
b = np.arange(0, 3)
c = np.arange(0, 4)

d = np.concatenate((a, b, c))
print(f"d ({d.shape}): {d}")

d ((9,)): [0 1 0 1 2 0 1 2 3]


### Subvektor
Pada persamaan di atas, kita dapat mengatakan bahwa $\mathbf{a}$, $\mathbf{b}$, atau $\mathbf{c}$ merupakan subvektor dari $\mathbf{d}$.

Kita dapat menggunakan metode *slicing* untuk mendapatkan subvektor.

In [7]:
a = d[:2]
b = d[2:5]
c = d[5:]

print(f"a: {a}, b: {b}, c: {c}")

a: [0 1], b: [0 1 2], c: [0 1 2 3]


### Operasi Aljabar pada Vektor

**Penjumlahan dan pengurangan**

In [8]:
a = np.random.randn(6)
b = np.random.randn(6)
c = a + b
d = a - b
print(f"a + b = {c}")
print(f"a - b = {d}")

a + b = [-2.00455229  0.08161666 -0.79521099 -0.73412186  0.02499802  0.75881921]
a - b = [-4.00134198  0.73282932 -0.37366298 -1.75550463  0.22256894  1.33516388]


### Perkalian dan Pembagian

In [12]:

print(f"a : {a}")
c = 3 * a # scalar * vector
print(f"scalar * vector: {c}")

c = a / 3 # vector / scalar
print(f"vector / scalar: {c}")

a : [-3.00294714  0.40722299 -0.58443698 -1.24481325  0.12378348  1.04699155]
scalar * vector: [-9.00884141  1.22166897 -1.75331095 -3.73443974  0.37135043  3.14097464]
vector / scalar: [-1.00098238  0.135741   -0.19481233 -0.41493775  0.04126116  0.34899718]


### Inner Product

Diketahui 2 buah vektor $\mathbf{a}, \mathbf{b} \in \mathbb{R}^m$, *inner product* dari kedua vektor tersebut adalah

$$
c = \langle \mathbf{a}, \mathbf{b} \rangle = \mathbf{a}^\top \mathbf{b} = \sum_{i=1}^m a_i b_i \in \mathbb{R}
$$

Berikut beberapa cara untuk menghitung inner product dengan NumPy.

In [10]:
# Some ways to calculate the inner product of two vectors
c1 = np.inner(a, b)
c2 = np.dot(a, b)
c3 = a @ b

print(f"c1: {c1}, c2: {c2}, c3: {c3}")

c1: -3.95719461029908, c2: -3.95719461029908, c3: -3.95719461029908


#

**Net Present Value (NPV)**. Sebagai contoh, berikut penggunaan inner product untuk menghitung angka NPV dari suatu vektor *cash flow* $c$ dengan *interest rate* $r$.

In [11]:
c = np.array([0.1, 0.1, 0.1, 1.1])
n = len(c)
r = 0.05 # 5% per-period interest rate
d = np.array([(1+r)**-i for i in range(n)])
print(f"c: {c}")
print(f"d: {d}")
NPV = c @ d
print(f"NPV: {NPV}")

c: [0.1 0.1 0.1 1.1]
d: [1.         0.95238095 0.90702948 0.8638376 ]
NPV: 1.236162401468524


## Fungsi Linear

Fungsi merupakan cara untuk memetakan suatu nilai atau objek tertentu ke nilai yang lain. Notasi fungsi $f: \mathbb{R}^m \rightarrow \mathbb{R}$ berarti pemetaan nilai dari vektor berdimensi $m$ menjadi suatu nilai skalar.

Sebagai contoh, misalkan terdapat vektor $\mathbf{x} = (x_1, \ldots, x_4)$, berikut salah satu bentuk fungsi yang mungkin untuk memetakan ke nilai skalar:

$$
y = f(\mathbf{x}) = x_1 + x_2 - x^2_4
$$

Python menyediakan beberapa cara untuk mendefinisikan fungsi.

**Lambda function**: fungsi yang didefinisikan tanpa nama.

In [13]:
f = lambda x: x[0] + x[1] - x[3] ** 2
f([-1.0, 0.0, 1.0, 2.0])

-5.0

**def function**: pendefinisian fungsi untuk kebutuhan yang lebih kompleks, dapat mengakomodasi multi-input dan multi-output.

In [14]:
def simple_function(x):
    """
    Args:
        x (ndarray): a vector of length 4
    
    Returns:
        y (float): a scalar value
    """
    y = x[0] + x[1] - x[3] ** 2
    return y

simple_function([-1.0, 0.0, 1.0, 2.0])

-5.0

### Superposisi

Superposisi merupakan sebuah sifat yang dapat memvalidasi apakah suatu fungsi merupakan fungsi linear. Misal terdapat vektor $\mathbf{x}, \mathbf{y} \in \mathbb{R}^m$, skalar $\alpha, \beta \in \mathbb{R}$, dan fungsi $f: \mathbb{R}^m \rightarrow \mathbb{R}$, persamaan superposisi dapat ditulis sbb:

$$
f(\alpha \mathbf{x} + \beta \mathbf{y}) = \alpha f(\mathbf{x}) + \beta f(\mathbf{y}).
$$

*Penting*: fungsi $f: \mathbb{R}^m \rightarrow \mathbb{R}$ merupakan fungsi linear jika memenuhi sifat pada persamaan di atas!

Contoh: cek linearitas fungsi inner product $f(\mathbf{x}) = \mathbf{a}^\top \mathbf{x} $.

In [24]:
f = lambda a, x: a @ x

a = np.array([1.0, 2.0, 3.0, 4.0, 5.0])
x = np.random.random(5)
y = np.random.random(5)

alpha = 3.0
beta = 5.0

print(f"a: {a}")
print(f"x: {x}")

lhs = f(a, alpha * x + beta * y)
print(f"lhs: {lhs}")

rhs = alpha * f(a, x) + beta * f(a, y)
print(f"rhs: {rhs}")

print(lhs == rhs)

a: [1. 2. 3. 4. 5.]
x: [0.92892014 0.42410445 0.97988857 0.27123336 0.01533908]
lhs: 53.17965615340909
rhs: 53.179656153409084
False


### Aproksimasi Taylor

Dalam banyak kasus, fungsi skalar $f: \mathbb{R}^m \rightarrow \mathbb{R}$ dapat dan perlu diaproksimasi dengan fungsi linear atau *affine*, dengan syarat fungsi $f$ dapat diturunkan (*differentiable*). Aproksimasi Taylor menggunakan turunan untuk membentuk suatu fungsi linear $g(\mathbf{x})$ yang mendekati fungsi $f(\mathbf{x})$ (yang tidak harus bersifat linear).

(First-order) aproksimasi Taylor dari fungsi $f$ pada titik ($\mathbf{z} \in \mathbb{R}^m$) atau yang dekat dengan itu didefinisikan sbb:

$$
f^\prime(\mathbf{x}) = f(\mathbf{z}) + \frac{\partial f}{\partial x_1} (z_1) + \frac{\partial f}{\partial x_2} (z_2) + \cdots + \frac{\partial f}{\partial x_m} (z_m)
$$

Dalam format vektor dapat dituliskan menjadi:
$$
f^\prime(\mathbf{x}) = f(\mathbf{z}) + \nabla_x f(\mathbf{z})^\top (\mathbf{x} - \mathbf{z})
$$

dimana 
$
\nabla_x f(\mathbf{z})= 
(
\frac{\partial f}{\partial x_1 (z_1)},
\frac{\partial f}{\partial x_1 (z_2)},
\cdots,
 \frac{\partial f}{\partial x_m (z_m)}
)
$ merupakan vektor gradien.

**Contoh**. Terdapat sebuah fungsi non-linear $f: \mathbb{R}^2 \rightarrow \mathbb{R}$,
$$f(\mathbf{x}) = x_1 + \exp(x_2 - x_1)$$

Fungsi linear hasil aproksimasi Taylor (first-order) pada titik atau yang dekat dengan $\mathbf{z} = (1, 2)$ adalah sbb:
$$
f^\prime(\mathbf{x}) = f((1, 2)) + \nabla_x f((1, 2))^\top (\mathbf{x} - (1, 2)) = 3.7183 + (-1.7183, 2.7183)^\top (\mathbf{x} - (1,2))
$$.

Dapat dicek bahwa:
- $\mathbf{x} = (1,2) \rightarrow$  $f(\mathbf{x}) = 3.7183$ dan $f^\prime(\mathbf{x}) = 3.7183$ 
- $\mathbf{x} = (0.96,1.98) \rightarrow$  $f(\mathbf{x}) = 3.7332$ dan $f^\prime(\mathbf{x}) = 3.7326$ 
- $\mathbf{x} = (1.10,2.11) \rightarrow$  $f(\mathbf{x}) = 3.8456$ dan $f^\prime(\mathbf{x}) = 3.8455$ 

In [33]:
# Define f function
f = lambda x: x[0] + np.exp(x[1] - x[0])

# Define the first-order gradient of f
grad_f = lambda z: np.array([1 - np.exp(z[1] - z[0]), np.exp(z[1] - z[0])])

# Taylor approximation
z = np.array([1.0, 2.0])
f_prime = lambda x: f(z) + grad_f(z) @ (x - z)

In [35]:
x = np.array([1.0, 2.0])
print(f"{x} -> {f(x)} and {f_prime(x)}")

x = np.array([0.96, 1.98])
print(f"{x} -> {f(x)} and {f_prime(x)}")

x = np.array([1.10, 2.11])
print(f"{x} -> {f(x)} and {f_prime(x)}")

[1. 2.] -> 3.718281828459045 and 3.718281828459045
[0.96 1.98] -> 3.7331947639642977 and 3.732647465028226
[1.1  2.11] -> 3.845601015016916 and 3.845464646743635


## Norm dan Jarak

## Matriks

## Metode Least Squares