# Model Representation

<figure>
 <img src="https://github.com/s-yuflih/Lab_W1/blob/main/images/C1_W1_L3_S1_Lecture_b.png?raw=1"   style="width:600px;height:200px;">
</figure>

## Tujuan
Dalam praktik lab ini, Anda akan:
- Mempelajari cara mengimplementasikan model $f_{w,b}$ untuk linear regresi dengan satu variabel.

## Notasi
Berikut adalah ringkasan beberapa notasi yang akan Anda temui.  

|General <img width=70/> <br />  Notation  <img width=70/> | Description<img width=350/>| Python (if applicable) |
|: ------------|: ------------------------------------------------------------||
| $a$ | scalar, non bold                                                      ||
| $\mathbf{a}$ | vector, bold                                                      ||
| **Regression** |         |    |     |
|  $\mathbf{x}$ | Training Example feature values (in this lab - Size (1000 sqft))  | `x_train` |   
|  $\mathbf{y}$  | Training Example  targets (in this lab Price (1000s of dollars))  | `y_train`
|  $x^{(i)}$, $y^{(i)}$ | $i_{th}$Training Example | `x_i`, `y_i`|
| m | Number of training examples | `m`|
|  $w$  |  parameter: weight                                 | `w`    |
|  $b$           |  parameter: bias                                           | `b`    |     
| $f_{w,b}(x^{(i)})$ | The result of the model evaluation at $x^{(i)}$ parameterized by $w,b$: $f_{w,b}(x^{(i)}) = wx^{(i)}+b$  | `f_wb` |


## Tools yang Digunakan
Dalam lab ini Anda akan menggunakan:
- **NumPy**, pustaka populer untuk komputasi ilmiah
- **Matplotlib**, pustaka populer untuk visualisasi data

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Pernyataan Masalah
<img align="left" src="https://github.com/s-yuflih/Lab_W1/blob/main/images/C1_W1_L3_S1_trainingdata.png?raw=1"    style=" width:380px; padding: 10px;  " />

Seperti yang dijelaskan dalam modul, Anda akan menggunakan contoh prediksi harga rumah.
Lab ini akan menggunakan dataset sederhana hanya dengan dua titik data:
- Sebuah rumah dengan luas 1000 sqft terjual seharga $300.000
- Sebuah rumah dengan luas 2000 sqft terjual seharga $500.000

Dua titik ini akan menjadi data pelatihan kita. Dalam lab ini:
- Unit ukuran: **1000 sqft**
- Unit harga: **ribuan dolar**

| Ukuran (1000 sqft)     | Harga (ribu dolar) |
| -------------------| ------------------------ |
| 1.0               | 300                      |
| 2.0               | 500                      |

Tujuan Anda adalah memodelkan regresi linear (digambarkan sebagai garis lurus biru) yang melalui dua titik ini, sehingga Anda bisa memprediksi harga rumah lainnya—misalnya rumah dengan ukuran **1200 sqft**.


Silakan jalankan sel kode berikut untuk membuat variabel `x_train` dan `y_train`. Data disimpan dalam array NumPy satu dimensi.

In [None]:
# x_train adalah variabel input (ukuran dalam 1000 kaki persegi)
# y_train adalah target (harga dalam ribuan dolar)
x_train = np.array([1.0, 2.0])
y_train = np.array([300.0, 500.0])
print(f"x_train = {x_train}")
print(f"y_train = {y_train}")

>**Catatan**: Latihan ini sering menggunakan format output Python [f-string'](https://docs.python.org/3/tutorial/inputoutput.html).

### Jumlah Contoh Pelatihan `m`
Anda akan menggunakan `m` untuk menyatakan jumlah contoh pelatihan (training examples). Array NumPy memiliki parameter `.shape`. `x_train.shape` akan mengembalikan tuple Python dengan elemen untuk setiap dimensi array. `x_train.shape[0]` menunjukkan panjang array tersebut, yang berarti jumlah contoh pelatihan, seperti ditunjukkan di bawah ini.

In [None]:
# m adalah jumlah contoh pelatihan
print(f"x_train.shape: {x_train.shape}")
m = x_train.shape[0]
print(f"Jumlah contoh pelatihan adalah: {m}")

Anda juga bisa menggunakan fungsi `len()` dalam Python untuk mendapatkan jumlah contoh, seperti berikut:

In [None]:
# m adalah jumlah contoh pelatihan
m = len(x_train)
print(f"Jumlah contoh pelatihan adalah: {m}")

### Contoh Pelatihan ke-i `x_i, y_i`

Anda akan menggunakan notasi $(x^{(i)}, y^{(i)})$ untuk menyatakan contoh pelatihan ke-i. Karena Python menggunakan indeks mulai dari nol (zero-indexed), maka $(x^{(0)}, y^{(0)})$ adalah $(1.0, 300.0)$ dan $(x^{(1)}, y^{(1)})$ adalah $(2.0, 500.0)$.

Untuk mengakses nilai dalam array NumPy, Anda dapat menggunakan indeks sesuai dengan posisi yang diinginkan. Misalnya, sintaks untuk mengakses elemen pertama dari `x_train` adalah `x_train[0]`.

Silakan jalankan blok kode berikut untuk mendapatkan contoh pelatihan ke-i:

In [None]:
i = 0 # Ubah ini ke 0 atau 1 untuk melihat (x^(i), y^(i))

x_i = x_train[i]
y_i = y_train[i]
print(f"(x^({i}), y^({i})) = ({x_i}, {y_i})")

### Memvisualisasikan Data

Anda dapat memvisualisasikan kedua titik data ini menggunakan fungsi `scatter()` dari pustaka `matplotlib`, seperti yang ditunjukkan pada blok kode di bawah ini.

Argumen `marker` dan `c` digunakan untuk mengatur bentuk dan warna titik. Dalam contoh ini, `marker='x'` dan `c='r'` digunakan untuk menampilkan titik sebagai tanda silang merah (default-nya adalah titik biru).

Anda juga dapat menggunakan fungsi lain dalam pustaka `matplotlib` untuk mengatur judul grafik dan label sumbu agar lebih informatif.

Berikut adalah contoh penggunaannya:

In [None]:
# Menampilkan data menggunakan scatter plot
plt.scatter(x_train, y_train, marker='x', c='r')  # Titik merah berbentuk silang

# Mengatur judul grafik
plt.title("Harga Rumah")

# Mengatur label sumbu-y
plt.ylabel("Harga (dalam ribuan dolar)")

# Mengatur label sumbu-x
plt.xlabel("Ukuran (1000 kaki persegi)")

# Menampilkan grafik
plt.show()

## Fungsi Model

<img align="left" src="https://github.com/s-yuflih/Lab_W1/blob/main/images/C1_W1_L3_S1_model.png?raw=1"     style=" width:380px; padding: 10px; " > Seperti yang dijelaskan dalam kuliah, fungsi model untuk **regresi linier** (yaitu fungsi yang memetakan dari x ke y) dinyatakan sebagai:

$$
f_{w,b}(x^{(i)}) = w \cdot x^{(i)} + b \tag{1}
$$

Rumus di atas merupakan cara untuk merepresentasikan **garis lurus** — nilai-nilai yang berbeda dari **w** (kemiringan/slope) dan **b** (intersep/titik potong) akan menghasilkan garis lurus yang berbeda pada grafik.

Mari kita coba memahami konsep ini lebih baik melalui blok kode di bawah. Kita akan mulai dengan nilai:

* `w = 100`
* `b = 100`

> 💡 *Catatan: Anda dapat kembali ke bagian ini nanti untuk mengubah nilai parameter w dan b sesuai keinginan.*

In [None]:
w = 100
b = 100
print(f"w: {w}")
print(f"b: {b}")

Sekarang, mari kita hitung nilai dari $f_{w,b}(x^{(i)})$ untuk dua titik data Anda. Anda bisa menuliskannya secara eksplisit untuk masing-masing titik data seperti berikut:

* Untuk $x(0)$, maka $f_{w,b} = w \cdot x[0] + b$
* Untuk $x(1)$, maka $f_{w,b} = w \cdot x[1] + b$

Jika terdapat banyak titik data, cara ini akan menjadi merepotkan dan berulang. Oleh karena itu, Anda bisa menghitung keluaran fungsi tersebut menggunakan **perulangan `for`**, seperti yang ditunjukkan pada fungsi `compute_model_output` di bawah ini.

> 💡 Catatan: Deskripsi argumen `(ndarray (m,))` menunjukkan bahwa input berupa array Numpy berdimensi satu dengan panjang m. `(scalar)` menunjukkan bahwa argumen tersebut berupa skalar (tanpa dimensi, hanya berupa nilai).
>
> 💡 Catatan: `np.zeros(n)` akan menghasilkan array numpy berdimensi satu dengan **n entri**, semuanya bernilai nol.

In [None]:
def compute_model_output(x, w, b):
    """
    Menghitung prediksi dari model linear
    Argumen:
        x (ndarray (m,)): Data, m contoh
        w, b (skalar): Parameter model
    Output:
        f_wb (ndarray (m,)): Prediksi model
    """
    m = x.shape[0]
    f_wb = np.zeros(m)
    for i in range(m):
        f_wb[i] = w * x[i] + b

    return f_wb

Sekarang, mari kita panggil fungsi `compute_model_output` dan tampilkan hasilnya dalam bentuk plot.

In [None]:
tmp_f_wb = compute_model_output(x_train, w, b,)

# Menampilkan prediksi model kita
plt.plot(x_train, tmp_f_wb, c='b',label='Prediksi Kita')

# Menampilkan titik-titik data aktual
plt.scatter(x_train, y_train, marker='x', c='r',label='Nilai Aktual')

# Menambahkan judul grafik
plt.title("Harga Rumah")
# Menambahkan label pada sumbu y
plt.ylabel('Harga (dalam ribuan dolar)')
# Menambahkan label pada sumbu x
plt.xlabel('Luas (1000 kaki persegi)')
plt.legend()
plt.show()

Seperti yang dapat Anda lihat, menetapkan nilai $w = 100$ dan $b = 100$ tidak menghasilkan garis yang sesuai dengan data kita.

<details>
<summary>
    <font size='3', color='darkgreen'><b>Bantuan</b></font>
</summary>
    <p>
    <ul>
        <li>Coba $w = 200$ dan $b = 100$ </li>
    </ul>
    </p>

### Prediksi
Sekarang kita telah memiliki sebuah model, kita bisa menggunakannya untuk membuat prediksi awal kita. Mari kita prediksi harga sebuah rumah dengan luas 1200 sqft. Karena satuan dari $x$ adalah dalam ribuan sqft, maka nilai $x$ adalah 1.2.


In [None]:
w = # input prediksi w
b = # input prediksi b
x_i = 1.2
cost_1200sqft = w * x_i + b

print(f"${cost_1200sqft:.0f} tribu dolar")