# Day 1 PM - VECTOR

## Pendefinisian Vektor

Dalam fisika, vektor didefinisikan sebagai besaran yang memiliki nilai (value) dan arah. 

Namun dalam ilmu data, vektor didefinisikan sebagai nilai-nilai yang mewakili pengamatan/prediksi. Sederhananya, vektor disebut juga list angka. Angka-angka disusun secara berurutan agar bisa diindetifikasi nilai dan indeksnya.

Contoh:

video = [10.5, 5.2, 3.25, 7.0]

Video berdurasi 10,5 menit, tetapi hanya 5,2% yang menonton lebih dari satu menit, mendapat rata-rata 3,25 tampilan per hari dan ditandai 7 kali sebagai spam.

### Pendefinisian Vektor pada Code

In [2]:
# Pendefinisian vektor menggunakan list

a = [1, 2, 3, 4, 5]
b = [6, 7, 8, 9, 10]

In [3]:
# Efek pendefinisian vector dengan list : tidak dapat dilakukan operasi matematika

a + b

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [4]:
# Pendefinisian vektor dengan menggunakan NumPy

import numpy as np
vect_a = np.array(a)
vect_b = np.array(b)

In [5]:
# Vektor hasil NumPy dapat dilakukan operasi aritmatika

vect_a + vect_b

array([ 7,  9, 11, 13, 15])

## Vector Norm

Vector norm dapat didefinisikan dengan besaran vektor.

In [6]:
# Vector Norm

## Pembuatan Vektor
vect_a = np.array([3,4])

## Vector Norm (menggunakan Euclidean/L2 (Default NumPy))
print('Vector Norm - Euclidean (syntax 1) : ', np.linalg.norm(vect_a))
print('Vector Norm - Euclidean (syntax 2) : ', np.linalg.norm(vect_a, 2))

## Vector Norm (menggunakan Manhattan/L1)
print('Vector Norm - Manhattan : ', np.linalg.norm(vect_a, 1))

Vector Norm - Euclidean (syntax 1) :  5.0
Vector Norm - Euclidean (syntax 2) :  5.0
Vector Norm - Manhattan :  7.0


## Operasi Aritmatika

In [7]:
# Pendefinisian list

a = [1,2,3]
vect_a = np.array(a)

b = [10, 11, 12]
vect_b = np.array(b)

print('Vector A : ', vect_a)
print('Vector B : ', vect_b)

Vector A :  [1 2 3]
Vector B :  [10 11 12]


### Penjumlahan dan Pengurangan

Vektor dapat dijumlahkan atau dikurangkan dengan vektor lain, dengan syarat jumlah elemen harus sama.

In [8]:
## Operasi Penjumlahan

print('Penjumlahan - Dengan Bilangan : ', vect_a + 2)
print('Penjumlahan - Antar Vektor    : ', vect_a + vect_b)

Penjumlahan - Dengan Bilangan :  [3 4 5]
Penjumlahan - Antar Vektor    :  [11 13 15]


In [9]:
## Operasi Pengurangan

print('Pengurangan - Dengan Bilangan : ', vect_a - 2)
print('Pengurangan - Antar Vektor    : ', vect_a - vect_b)

Pengurangan - Dengan Bilangan :  [-1  0  1]
Pengurangan - Antar Vektor    :  [-9 -9 -9]


### Pembagian

Sebuah vektor dapat dibagi oleh sebuah vektor. Pembagian dilakukan sama seperti perkalian vektor-vektor.

In [10]:
## Operasi Pembagian

print('Pembagian - Dengan Bilangan : ', vect_a / 2)
print('Pembagian - Antar Vektor : ', vect_a / vect_b)

Pembagian - Dengan Bilangan :  [0.5 1.  1.5]
Pembagian - Antar Vektor :  [0.1        0.18181818 0.25      ]


### Perkalian

Ada tiga cara untuk melakukan perkalian dengan vektor, yaitu 

- Perkalian dengan skalar, 
- Perkalian dengan vektor, dan 
- Perkalian dot product.

Untuk melakukan perkalian vektor dengan skalar (bilangan), cukup kalikan setiap elemen dengan skalar.

Untuk melakukan perkalian antar vektor, langkah-langkahnya menyerupai penjumlahan/pengurangan. Operasi dilakukan berdasarkan elemen.

In [11]:
## Operasi Perkalian

print('Perkalian - Dengan Bilangan                     : ', vect_a * 2)
print('Perkalian - Antar Vektor (Vector Multiplication : ', vect_a * vect_b)

Perkalian - Dengan Bilangan                     :  [2 4 6]
Perkalian - Antar Vektor (Vector Multiplication :  [10 22 36]


Hasil perkalian `dot product` sangat berbeda dengan perkalian lainnya. Hasil perkalian titik adalah skalar. Selanjutnya, dengan menggunakan `dot product`, kita bisa mendapatkan sudut antara dua vektor. Ini mewakili seberapa jauh/dekat setiap vektor ke vektor lainnya.

In [12]:
## Perkalian Dot Product

print('Dot Product - Syntax 1 : ', vect_a.dot(vect_b))
print('Dot Product - Syntax 2 : ', np.dot(vect_a,vect_b))
print('Dot Product - Syntax 3 : ', vect_a@vect_b) # Hanya berlaku untuk versi NumPy terbaru
### Hasil outputnya akan sama

Dot Product - Syntax 1 :  68
Dot Product - Syntax 2 :  68
Dot Product - Syntax 3 :  68


## Cosine Similarity

In [13]:
# Pendefinisian List# Cosine Similarity

vect_f = np.array([4,0])
vect_g = np.array([6,0])

In [14]:
# Cosine Similarity
# Berawal dari rumus lain Dot Product
# vect_f . vect_g = ||vect_f|| * ||vect_g|| * cos_theta

result_dot_product = vect_f.dot(vect_g)
cos_theta = (vect_f.dot(vect_g))/ (np.linalg.norm(vect_f) * np.linalg.norm(vect_g))

# Mengubah cos_theta ke dalam radians untuk dicari derajat sudutnya
radians = np.arccos(cos_theta)

# Mengubah radians untuk dicari derajat sudutnya
degree = np.degrees(radians)

print('Cos Theta      : ', cos_theta)
print('Radians        : ', radians)
print('Degree/Derajat : ', degree)

Cos Theta      :  1.0
Radians        :  0.0
Degree/Derajat :  0.0


## Studi Kasus

```
teks_1 = saya pergi ke rumah nenek saya
teks_2 = saya pergi ke rumah kakek saya
```

Sebelum mencari nilai Cosinus Similarity, terlebih dahulu buat sebuah tabel yang menyatakan frekuensi kemunculan suatu kata dalam suatu teks diatas.

| Kata Unik | Jumlah Kata di teks_1 | Jumlah Kata di teks_2 |
| --- | --- | --- |
| saya | 2 | 2 | 
| pergi | 1 | 1 | 
| ke | 1 | 1 | 
| rumah | 1 | 1 | 
| nenek | 1 | 0 | 
| kakek | 0 | 1 | 

In [15]:
# Pembuatan vektor yang merepresentasikan `teks_1` dan `teks_2`

teks_1 = [2, 1, 1, 1, 1, 0]
teks_2 = [2, 1, 1, 1, 0, 1]

vect_t1 = np.array(teks_1)
vect_t2 = np.array(teks_2)

In [16]:
# Cosine Similarity
result_dot_product = vect_t1.dot(vect_t2)
cos_theta = result_dot_product / (np.linalg.norm(vect_t1) * np.linalg.norm(vect_t2))

# Mengubah cos_theta ke dalam radians untuk dicari derajat sudutnya
radians = np.arccos(cos_theta)

# Mengubah radians untuk dicari derajat sudutnya
degree = np.degrees(radians)

print('Cos Theta      : ', cos_theta)
print('Radians        : ', radians)
print('Degree/Derajat : ', degree)

Cos Theta      :  0.8749999999999998
Radians        :  0.5053605102841577
Degree/Derajat :  28.955024371859874


## Studi Kasus 2

```
teks_3 = Selamat pagi dunia`
teks_4 = Nusantara ibu kota baru`
```

Berikut ini adalah tabel yang menyatakan frekuensi kemunculan suatu kata dalam suatu teks diatas.

| Kata Unik | Jumlah Kata di teks_3 | Jumlah Kata di teks_4 |
| --- | --- | --- |
| selamat | 1 | 0 | 
| pagi | 1 | 0 | 
| dunia | 1 | 0 | 
| nusantara | 0 | 1 |
| ibu | 0 | 1 |
| kota | 0 | 1 | 
| baru | 0 | 1 |

In [17]:
# Pembuatan vektor yang merepresentasikan `teks_3` dan `teks_4`

teks_3 = [1, 1, 1, 0, 0, 0, 0]
teks_4 = [0, 0, 0, 1, 1, 1, 1]

vect_t3 = np.array(teks_3)
vect_t4 = np.array(teks_4)

In [18]:
# Cosine Similarity
result_dot_product = vect_t3.dot(vect_t4)
cos_theta = result_dot_product / (np.linalg.norm(vect_t3) * np.linalg.norm(vect_t4))

# Mengubah cos_theta ke dalam radians untuk dicari derajat sudutnya
radians = np.arccos(cos_theta)

# Mengubah radians untuk dicari derajat sudutnya
degree = np.degrees(radians)

print('Cos Theta      : ', cos_theta)
print('Radians        : ', radians)
print('Degree/Derajat : ', degree)

Cos Theta      :  0.0
Radians        :  1.5707963267948966
Degree/Derajat :  90.0


# Studi Kasus 3

```
teks_5 = Selamat pagi ibu dunia
teks_6 = Nusantara ibu kota baru
```

Berikut ini adalah tabel yang menyatakan frekuensi kemunculan suatu kata dalam suatu teks diatas.

| Kata Unik | Jumlah Kata di teks_3 | Jumlah Kata di teks_4 |
| --- | --- | --- |
| selamat | 1 | 0 | 
| pagi | 1 | 0 | 
| dunia | 1 | 0 | 
| nusantara | 0 | 1 |
| ibu | 1 | 1 |
| kota | 0 | 1 | 
| baru | 0 | 1 |

In [19]:
# Pembuatan vektor yang merepresentasikan `teks_5` dan `teks_6`

teks_5 = [1, 1, 1, 0, 1, 0, 0]
teks_6 = [0, 0, 0, 1, 1, 1, 1]

vect_t5 = np.array(teks_5)
vect_t6 = np.array(teks_6)

In [20]:
# Cosine Similarity
result_dot_product = vect_t5.dot(vect_t6)
cos_theta = result_dot_product / (np.linalg.norm(vect_t5) * np.linalg.norm(vect_t6))

# Mengubah cos_theta ke dalam radians untuk dicari derajat sudutnya
radians = np.arccos(cos_theta)

# Mengubah radians untuk dicari derajat sudutnya
degree = np.degrees(radians)

print('Cos Theta      : ', cos_theta)
print('Radians        : ', radians)
print('Degree/Derajat : ', degree)

Cos Theta      :  0.25
Radians        :  1.318116071652818
Degree/Derajat :  75.52248781407008
