#  **Local Outlier Factor (LOF)**

##  **Apa Itu LOF?**
**Local Outlier Factor (LOF)** adalah metode deteksi outlier berbasis kepadatan (**density-based**).  
LOF membandingkan **kepadatan lokal** suatu titik dengan tetangga terdekatnya.  
Jika suatu titik memiliki **kepadatan jauh lebih rendah** dibandingkan tetangganya, maka titik tersebut adalah **outlier**.

---

##  **Tahapan Perhitungan LOF**
Proses deteksi outlier dengan **Local Outlier Factor (LOF)** terdiri dari beberapa langkah:

### **1️⃣ Tentukan K (Jumlah Tetangga Terdekat)**
- Pilih jumlah tetangga **K** (misalnya K = 2 atau 3).
- Setiap titik akan dibandingkan dengan **K tetangga terdekatnya**.

### **2️⃣ Hitung Jarak Tetangga Terdekat (k-distance)**
- Gunakan **jarak Euclidean** untuk menghitung seberapa jauh suatu titik dari tetangga terdekatnya:

  $$
  d(p, q) = \sqrt{(x_p - x_q)^2 + (y_p - y_q)^2}
  $$

- Tentukan **k-distance(p)**, yaitu jarak antara titik **p** dan tetangga ke-K.

### **3️⃣ Hitung Reachability Distance**
- Jarak dapat dijangkau (reachability distance) antara **p dan q** dihitung sebagai:

  $$
  \text{reach-dist}_k(p, q) = \max(k\text{-distance}(q), d(p, q))
  $$

- Jika jarak antar titik lebih kecil dari **k-distance**, gunakan **k-distance**.

### **4️⃣ Hitung Kepadatan Lokal (Local Reachability Density - LRD)**
- Kepadatan lokal dari suatu titik **p** dihitung dengan:

  $$
  LRD_k(p) = \frac{k}{\sum_{q \in N_k(p)} \text{reach-dist}_k(p, q)}
  $$

- Semakin kecil **LRD**, semakin besar kemungkinan titik itu adalah **outlier**.

### **5️⃣ Hitung Local Outlier Factor (LOF)**
- Nilai **LOF** suatu titik **p** didefinisikan sebagai **rasio rata-rata kepadatan tetangga terhadap kepadatan titik itu sendiri**:

  $$
  LOF_k(p) = \frac{\sum_{q \in N_k(p)} \frac{LRD_k(q)}{LRD_k(p)}}{|N_k(p)|}
  $$

- Jika **\( LOF_k(p) > 1.5 \)**, maka titik tersebut adalah **outlier**.

---

## 📊 **Contoh Perhitungan Manual LOF (10 Baris, 2 Kolom)**  

Misalkan kita punya **dataset koordinat** berikut:

| ID  | X  | Y  |
|-----|----|----|
| A   | 2  | 3  |
| B   | 3  | 4  |
| C   | 4  | 2  |
| D   | 5  | 5  |
| E   | 3  | 3  |
| F   | 4  | 4  |
| G   | 6  | 2  |
| H   | 5  | 3  |
| I   | 7  | 4  |
| J   | 100| 100| ⬅ **(Kemungkinan Outlier)**

---

### **🔢 Langkah Perhitungan LOF untuk Titik J**
1️⃣ **Tentukan K = 2 Tetangga Terdekat**  
   - Tetangga terdekat **J** adalah **I (7,4)** dan **H (5,3)**  
   - Hitung **k-distance(J)** → **Jarak Euclidean** dari **J ke I & H**  
   - $$ d(J, I) = \sqrt{(100-7)^2 + (100-4)^2} = 131.82 $$  
   - $$ d(J, H) = \sqrt{(100-5)^2 + (100-3)^2} = 134.35 $$  

2️⃣ **Hitung Reachability Distance**  
   - $$ \text{reach-dist}(J, I) = \max(k\text{-distance}(I), d(J, I)) = 131.82 $$  
   - $$ \text{reach-dist}(J, H) = \max(k\text{-distance}(H), d(J, H)) = 134.35 $$  

3️⃣ **Hitung Local Reachability Density (LRD)**
   - $$ LRD_J = \frac{2}{131.82 + 134.35} = 0.00752 $$  

4️⃣ **Hitung Local Outlier Factor (LOF)**
   - $$ LOF_J = \frac{(LRD_I / LRD_J) + (LRD_H / LRD_J)}{2} $$  
   - Jika hasil **LOF > 1.5**, maka **J adalah outlier** ✅  

---

##  **Kesimpulan**
- Berdasarkan hasil perhitungan **LOF**, titik **J (100,100)** memiliki nilai **LOF tinggi**.
- Artinya, titik ini **berada jauh dari kepadatan lokal** dan dapat dianggap sebagai **outlier**.

---
  
