# Cost Function
<figure>
    <center> <img src="https://github.com/s-yuflih/Latihan_Lab_W1/blob/main/images/C1_W1_L3_S2_Lecture_b.png?raw=1"  style="width:1000px;height:200px;" ></center>
</figure>



## Tujuan
Dalam latihan ini Anda akan:
- Anda akan mengimplementasikan dan mengeksplorasi fungsi `cost` untuk regresi linier dengan satu variabel.

## Tools
Dalam latihan ini kita akan menggunakan:
- NumPy, pustaka populer untuk komputasi ilmiah
- Matplotlib, pustaka populer untuk memplot data
- rutinitas plot lokal dalam file lab_utils_uni.py di direktori lokal

In [None]:
import numpy as np
%matplotlib widget
import matplotlib.pyplot as plt
from lab_utils_uni import plt_intuition, plt_stationary, plt_update_onclick, soup_bowl


## Pernyataan Masalah

Anda ingin model yang dapat memprediksi harga rumah berdasarkan ukuran rumah.  
Mari gunakan dua titik data yang sama seperti sebelumnya - sebuah rumah seluas 1000 kaki persegi dijual seharga \$300.000 dan rumah seluas 2000 kaki persegi dijual seharga \$500.000.

| Ukuran (1000 sqft)     | Harga (ribu dolar) |
| ---------------------- | ------------------ |
| 1                      | 300                |
| 2                      | 500                |


In [None]:
x_train = np.array([1.0, 2.0])           # (ukuran dalam 1000 kaki persegi)
y_train = np.array([300.0, 500.0])       # (harga dalam ribuan dolar)

## Menghitung Biaya
Istilah 'biaya' dalam latihan ini mungkin sedikit membingungkan karena datanya adalah harga rumah. Di sini, biaya adalah ukuran seberapa baik model kita memprediksi harga rumah. Istilah 'harga' digunakan untuk data rumah.

Rumus biaya untuk satu variabel adalah:
$$J(w,b) = \frac{1}{2m} \sum\limits_{i = 0}^{m-1} (f_{w,b}(x^{(i)}) - y^{(i)})^2 \tag{1}$$

dimana
$$f_{w,b}(x^{(i)}) = wx^{(i)} + b \tag{2}$$

- $f_{w,b}(x^{(i)})$ adalah prediksi kita untuk contoh $i$ menggunakan parameter $w,b$.  
- $(f_{w,b}(x^{(i)}) -y^{(i)})^2$ adalah selisih kuadrat antara nilai target dan prediksi.  
- Selisih-selisih ini dijumlahkan untuk semua $m$ contoh dan dibagi dengan `2m` untuk menghasilkan biaya $J(w,b)$.  
> Catatan, dalam kuliah jangkauan penjumlahan biasanya dari 1 sampai m, sementara dalam kode dari 0 sampai m-1.

Kode di bawah ini menghitung biaya dengan melakukan loop pada setiap contoh. Dalam setiap loop:
- `f_wb`, prediksi dihitung
- selisih antara target dan prediksi dihitung dan dikuadratkan.
- ini ditambahkan ke total biaya.

In [None]:
def compute_cost(x, y, w, b):
    """
    Menghitung fungsi biaya untuk regresi linier.

    Argumen:
      x (ndarray (m,)): Data, m contoh
      y (ndarray (m,)): nilai target
      w,b (skalar)    : parameter model

    Mengembalikan
        total_cost (float): Biaya menggunakan w,b sebagai parameter untuk regresi linier
                             untuk menyesuaikan titik data dalam x dan y
    """
    # jumlah contoh pelatihan
    m = x.shape[0]

    cost_sum = 0
    for i in range(m):
        f_wb = w * x[i] + b
        cost = (f_wb - y[i]) ** 2
        cost_sum = cost_sum + cost
    total_cost = (1 / (2 * m)) * cost_sum

    return total_cost

## Intuisi Fungsi Biaya

<img align="left" src="https://github.com/s-yuflih/Latihan_Lab_W1/blob/main/images/C1_W1_Lab02_GoalOfRegression.PNG?raw=1"    style=" width:380px; padding: 10px;  " />
Tujuan Anda adalah menemukan model $f_{w,b}(x) = wx + b$ dengan parameter $w$ dan $b$, yang dapat secara akurat memprediksi harga rumah berdasarkan input $x$. Biaya adalah ukuran akurasi model terhadap data pelatihan.

Persamaan biaya (1) menunjukkan bahwa jika $w$ dan $b$ dipilih sedemikian rupa sehingga prediksi $f_{w,b}(x)$ sesuai dengan data target $y$, maka nilai $(f_{w,b}(x^{(i)}) - y^{(i)})^2$ akan menjadi nol dan biaya akan minimum. Dalam contoh sederhana dua titik ini, Anda bisa mencapainya!

Pada lab sebelumnya, Anda telah menentukan bahwa $b=100$ memberikan solusi optimal, maka mari kita tetapkan $b = 100$ dan fokus pada nilai $w$.

Gunakan kontrol slider di bawah untuk memilih nilai $w$ yang meminimalkan biaya. Mungkin perlu beberapa detik untuk plot diperbarui.

In [None]:
plt_intuition(x_train,y_train)

Plot menunjukkan beberapa hal penting:
- Biaya minimum saat $w = 200$, sesuai dengan hasil lab sebelumnya
- Karena selisih antara target dan prediksi dikuadratkan dalam persamaan biaya, nilai biaya akan naik drastis jika $w$ terlalu besar atau terlalu kecil
- Dengan memilih `w` dan `b` yang meminimalkan biaya, kita mendapatkan garis yang sangat sesuai dengan data


## Visualisasi Fungsi Biaya - 3D

Anda dapat melihat bagaimana biaya berubah terhadap *baik* `w` maupun `b` melalui plot 3D atau contour plot.  

Perlu dicatat bahwa beberapa proses plotting dalam kursus ini bisa cukup kompleks. Rutin plotting telah disediakan dan meskipun berguna untuk membaca kodenya agar familiar, itu tidak wajib untuk menyelesaikan kursus ini. Rutin ini ada di file `lab_utils_uni.py`.

### Dataset yang Lebih Besar
Menarik juga untuk melihat skenario dengan lebih banyak titik data. Dataset ini berisi data yang tidak berada pada garis yang sama. Apa artinya ini bagi fungsi biaya? Apakah kita bisa menemukan $w$ dan $b$ yang menghasilkan biaya = 0?

In [None]:
x_train = np.array([1.0, 1.7, 2.0, 2.5, 3.0, 3.2])
y_train = np.array([250, 300, 480,  430,   630, 730,])

Dalam plot kontur (contour plot), klik pada sebuah titik untuk memilih nilai `w` dan `b` yang menghasilkan biaya terendah. Gunakan kontur sebagai panduan dalam memilih. Perlu beberapa detik agar grafik diperbarui.

In [None]:
plt.close('all')
fig, ax, dyn_items = plt_stationary(x_train, y_train)
updater = plt_update_onclick(fig, ax, x_train, y_train, dyn_items)

Di atas, perhatikan garis putus-putus pada plot sebelah kiri. Garis ini menunjukkan kontribusi biaya dari masing-masing contoh dalam dataset pelatihan Anda. Dalam kasus ini, nilai sekitar $w=209$ dan $b=2.4$ memberikan biaya yang rendah. Perlu dicatat bahwa karena contoh pelatihan kita tidak berada pada satu garis lurus, maka biaya minimum tidak akan nol.

### Convex Cost surface
Fakta bahwa fungsi biaya mengkuadratkan selisih prediksi dan target memastikan bahwa 'permukaan error' berbentuk cekung seperti mangkuk sup. Akan selalu ada titik minimum yang bisa dicapai dengan mengikuti gradien ke segala arah. Pada plot sebelumnya, karena skala sumbu $w$ dan $b$ berbeda, bentuk ini tidak mudah dikenali. Plot berikut menampilkan bentuk simetris dari $w$ dan $b$, seperti yang ditunjukkan dalam modul:

In [None]:
soup_bowl()