# Euclidian Distance

Misalkan $x_{1}, x_{2} \in \mathbb{R}$ adalah dua buah titik pada ruang berdimensi $n$, maka jarak Euclidean antara kedua titik tersebut pada koordinat kartesius adalah sebagai berikut:

$$d(x_{1}, x_{2}) = \sqrt{(x_{11}-x_{21})^{2} + (x_{12}-x_{22})^2 + ... + (x_{1n} - x_{2n})^{2}}$$

Buatlah sebuah fungsi yang bisa menghitung jarak dari dua buah titik tersebut dengan input sebagai list dan berlaku untuk dimensi apapun.

Contoh:

```python
jarak_euclidean(x1=[1,2,3],x2=[3,2,1])

# output: 2.8284271247461903

jarak_euclidean(x1=[1,2,3,4],x2=[4,3,2,1])

# output: 4.47213595499958

jarak_euclidean(x1=[1,2,3,4],x2=[4,3,2])

# output: "error, panjang vektor tidak sama"

```

Catatan: Tidak boleh menggunakan package atau module apapun, hanya menggunakan plain Python.


In [4]:
def jarak_euclidean(x1, x2):
    if len(x1) != len(x2):
        return 'error, panjang vektor tidak sama'
    else:
        ls = []
        for i in range(len(x1)):
            hitung = (x1[i] - x2[i]) ** 2
            ls.append(hitung)
        hasil = sum(ls) ** 0.5
        return hasil

In [5]:
jarak_euclidean(x1=[1,2,3,4],x2=[4,3,2,1])

4.47213595499958

In [6]:
jarak_euclidean(x1=[1,2,3],x2=[3,2,1])

2.8284271247461903

In [7]:
jarak_euclidean(x1=[1,2,3,4],x2=[4,3,2])

'error, panjang vektor tidak sama'

# Pearson Correlation

Misalkan diberikan dua buah field data yaitu ```tinggi_badan``` dan ```berat_badan```. Kita ingin menghitung korelasi antara kedua field ini dengan menggunakan korelasi pearson, dimana:

$$r_{xy} = \frac{\Sigma^{n}_{i=1}(x_{i}-\bar{x})(y_{i}-\bar{y})}{\sqrt{\Sigma^{n}_{i=1}(x_{i}-\bar{x})^{2}}\sqrt{\Sigma^{n}_{i=1}(y_{i}-\bar{y})^{2}}}$$

dengan:

- $n$ adalah ukuran sampel
- $x_{i}, y_{i}$ adalah titik sampel untuk $x$ dan $y$
- $\bar{x}, \bar{y}$ adalah rerata dari $x$ dan $y$

Buatlah sebuah fungsi yang dapat menerima input berupa list data sehingga diperoleh nilai korelasi pearson.

Contoh:

```python
tinggi_badan = [150,145,175,165]
berat_badan = [60,75,80,80]
korelasi_pearson(x=tinggi_badan, y=berat_badan)

# output: 0.6234616
```

Note: Hanya boleh menggunakan [built-in module Python](https://docs.python.org/3/library/index.html).

In [1]:
def korelasi_pearson(x, y):
    if len(x) != len(y):
        return 'jumlah data tinggi badan dan berat badan harus sama!'
    else:
        n = len(x)
        mean_x = sum(x) / n
        mean_y = sum(y) / n
        
        ls_kali_beda = []
        ls_beda_x_kuadrat = []
        ls_beda_y_kuadrat = []
        
        for i in range(n):
            beda_x = mean_x - x[i]
            beda_y = mean_y - y[i]
            
            ls_kali_beda.append(beda_x * beda_y)
            ls_beda_x_kuadrat.append(beda_x ** 2)
            ls_beda_y_kuadrat.append(beda_y ** 2)
            
    pembilang = sum(ls_kali_beda)
    penyebut = (sum(ls_beda_x_kuadrat) ** 0.5)  * (sum(ls_beda_y_kuadrat) ** 0.5)
    return round((pembilang / penyebut), 7)

In [2]:
tinggi_badan = [150,145,175,165]
berat_badan = [60,75,80,80]
korelasi_pearson(x=tinggi_badan, y=berat_badan)

0.6234616

In [4]:
tinggi_badan = [155,145,178,172,190]
berat_badan = [61,71,90,84]
korelasi_pearson(x=tinggi_badan, y=berat_badan)

'jumlah data tinggi badan dan berat badan harus sama!'

In [43]:
np.corrcoef([155,145,178,172], [61,71,90,84])[0][1]

0.8300827919510421