In [None]:
import matplotlib.pyplot as plt
import numpy as np
import scipy.io as scio

Dalam praktikum ke-5 ini, anda akan mengimplementasi _regularized linear regression_ dan menggunakannya untuk mempelajari model-model dengan sifat _bias-variance_ yang berbeda.

# 1. Regularized Linear Regression

Bagian pertama dari praktikum membahas bagaimana anda akan mengimplementasi regularized linear regression untuk memprediksi jumlah air yang mengalir keluar dari bendungan dengan menggunakan perubahan ketinggian air di dalam waduk.

## 1.1 Visualisasi dataset
Kita akan mulai dengan memvisualisasikan dataset yang berisi history tentang perubahan ketinggian air, $x$, dan jumlah air yang mengalir keluar dari bendungan, $y$.

This dataset is divided into three parts:
- Data latih (_train set_) yang akan dipelajari oleh model anda: `X`, `y`
- Data validasi (_validation set_) untuk menentukan parameter regularisasi: `Xval`, `yval`
- Data uji (_test set_) untuk mengevaluasi kinerja model anda. Ini adalah contoh-contoh data "tak terlihat" yang tidak dilihat model anda selama _training_: `Xtest`, `ytest`

Selanjutnya, kita akan plot the training data sbb:

In [None]:
plt.ion()
np.set_printoptions(formatter={'float': '{: 0.6f}'.format})

# ===================== Part 1: Loading and Visualizing Data =====================
# We start the exercise by first loading and visualizing the dataset.
# The following code will load the dataset into your environment and pot
# the data.
#

# Load Training data
print('Loading and Visualizing data ...')

# Load from ex5data1:
data = scio.loadmat('ex5data1.mat')
X = data['X']
y = data['y'].flatten()
Xval = data['Xval']
yval = data['yval'].flatten()
Xtest = data['Xtest']
ytest = data['ytest'].flatten()

m = y.size

# Plot training data
plt.figure()
plt.scatter(X, y, c='r', marker="x")
plt.xlabel('Change in water level (x)')
plt.ylabel('Water folowing out of the dam (y)')

## 1.2 Regularized linear regression cost function
Seperti yang sudah dijelaskan di kelas bahwa _regularized linear regression_ memiliki _cost function_ berikut:

$$
   J(\theta) = \underbrace{ \frac{1}{2m} \left( \sum_{i=1}^m ( h_\theta(x^{(i)}) - y^{(i)} )^2 \right) }_{\text{MSE}}  + \underbrace{\frac{\alpha}{2m} \left( \sum_{j=1}^n{\theta_j^2} \right)}_{\text{suku regularisasi}} 
$$

dengan $\alpha$ adalah parameter regularisasi yang mengontrol derajat regularisasi.

Suku regularisasi memberi penalti pada keseluruhan _cost function_ $J$. Saat parameter model $θ_j$ meningkat, penalti juga meningkat. Perhatikan bahwa anda sebaiknya tidak mengatur suku $θ_0$.

### Tugas anda
- Anda sekarang harus melengkapi fungsi `linearRegCostFunction`.
- Tugas anda adalah menulis fungsi untuk menghitung fungsi biaya regresi linier teregulasi.
- Jika memungkinkan, cobalah untuk membuat kode program anda dalam bentuk _vectorized_ dan hindari menulis loop. 
Ketika anda selesai, anda akan menjalankan fungsi `linearRegCostFunction` anda dengan menggunakan $\theta$ yang diinisialisasi di \[1, 1\]. Hasilnya, anda akan melihat output `303.993`.

## 1.3 Regularized linear regression gradient
Gradient dalam kasus ini terdiri dari 2 bagian, yaitu:
$$
\frac{\partial J(\theta)}{\partial \theta_0} = \frac{1}{m} \sum_{i=1}^{m}{(h_\theta(x^{(i)}) - y^{(i)}) x_0^{(i)}}
$$

dan

$$
\frac{\partial J(\theta)}{\partial \theta_1} = \left( \frac{1}{m} \sum_{i=1}^m{ ( h_\theta(x^{(i)}) - y^{(i)} ) x_1^{(i)} } + \frac{\alpha}{m} \theta_1 \right).    
$$

Dalam implementasi kode dalam fungsi `linear_reg_cost_function`, $J$ diwakili oleh `cost` dan 

$$
\texttt{grad} = \begin{bmatrix}
        \frac{\partial J(\theta)}{\partial \theta_0} \\
        \frac{\partial J(\theta)}{\partial \theta_1}
    \end{bmatrix}
$$

In [None]:
def linear_reg_cost_function(theta, x, y, alpha):
    # Initialize some useful values
    m = y.size

    # You need to return the following variables correctly
    cost = 0
    grad = np.zeros(theta.shape)

    # ===================== Your Code Here =====================
    # Instruksi : Hitunglah the cost and gradient dari regularized linear
    #                regression untuk suatu nilai theta
    #
    #                You should set 'cost' to the cost and 'grad'
    #                to the gradient
    #

    error = # Write your code here

    cost = # Write your code here

    reg_term = # Write your code here
    reg_term[0] = # Write your code here
    grad = # Write your code here

    # ==========================================================

    return cost, grad

Kita jalankan fungsi `linearRegCostFunction` dengan menggunakan theta bernilai `[1, 1]`.

In [None]:
# ===================== Part 2: Regularized Linear Regression Cost =====================
# You should have implemented the cost function for regularized linear regression. 
# Now you are going to call the cost function.

theta = np.ones(2)
cost, _ = linear_reg_cost_function(theta, np.c_[np.ones(m), X], y, 1)

Kita cetak `cost` pada saat `theta = [1 1]`. 

In [None]:
print(f'Cost at theta = [1  1]: {cost:0.6f}\n(this value should be about 303.993192')

Selanjutnya, kita akan coba menghitung gradient yang disimpan dalam variabel `grad`.

In [None]:
# ===================== Part 3: Regularized Linear Regression Gradient =====================
# You should now have implemented the gradient for regularized linear regression.
# Now you are going to call the function.

theta = np.ones(2)
cost, grad = linear_reg_cost_function(theta, np.c_[np.ones(m), X], y, 1)

print('Gradient at theta = [1  1]: {}\n(this value should be about [-15.303016  598.250744]'.format(grad))

## 1.4 Melatih Model Linear Regression

Kita definisikan fungsi `train_linear_reg` yang akan menghitung `theta` dengan _cost_ paling minimum.

In [None]:
import numpy as np
import scipy.optimize as opt

# ===========================
#   Jangan diubah ya
# ===========================
def train_linear_reg(x, y, alpha):
    initial_theta = np.ones(x.shape[1])

    def cost_func(t):
        return linear_reg_cost_function(t, x, y, alpha)[0]

    def grad_func(t):
        return linear_reg_cost_function(t, x, y, alpha)[1]

    theta, *unused = opt.fmin_cg(cost_func, initial_theta, grad_func, maxiter=200, disp=False,
                                     full_output=True)

    return theta

Selanjutnya kita panggil method `train_linear_reg` untuk mendapatkan `theta` terbaik dan plot garis regresinya. 

In [None]:
# ===================== Part 4: Train Linear Regression =====================
# Once you have implemented the cost and gradient correctly, the
# train_linear_reg function will use your cost function to train the regularized linear regression.
#
# Train linear regression with alpha = 0
alpha = 0

theta = train_linear_reg(np.c_[np.ones(m), X], y, alpha)

# Plot fit over the data
plt.plot(X, np.dot(np.c_[np.ones(m), X], theta))

plt.scatter(X, y, c='r', marker="x")
plt.xlabel('Change in water level (x)')
plt.ylabel('Water folowing out of the dam (y)')

### Pertanyaan Refleksi
Apakah model regresi linier yang dibuat cocok dengan dataset yang ada?

- Meskipun visualisasi untuk mengetahui kecocokan model yang paling sesuai seperti yang ditunjukkan di atas adalah salah satu cara yang mungkin untuk men-debug algoritma pembelajaran anda, memvisualisasikan data dan model tidaklah selalu mudah.
- Di bagian berikutnya, anda akan mengimplementasikan fungsi untuk menghasilkan kurva pembelajaran (_learning curve_) yang dapat membantu anda men-debug algoritma pembelajaran jika memvisualisasikan data sulit untuk dilakukan.

# 2. Bias-variance
Konsep penting dalam machine learning adalah pertukaran bias-variance tradeoff. Model dengan **bias tinggi** tidak cukup kompleks untuk data dan cenderung _underfit_, sedangkan model dengan **variance tinggi** mengalami overfit dengan training data.

Pada bagian latihan ini, anda akan memplot training dan test errors pada dengan kurva pembelajaran (_learning curve_) untuk mendiagnosa masalah bias-variance.

## 2.1 Learning curve
Anda sekarang akan mengimplementasi kode untuk menghasilkan _learning curve_ yang akan berguna dalam men-debug algoritme machine learning.

Ingatlah bahwa _learning curve_ memplot training dan validation error sebagai fungsi dari ukuran training set. 

Tugas anda adalah melengkapi fungsi `learning_curve` sehingga fungsi mengembalikan vektor error untuk training set dan validation set.

In [None]:
def learning_curve(X, y, Xval, yval, alpha):
    # Number of training examples
    m = X.shape[0]

    # You need to return these values correctly
    error_train = np.zeros(m)
    error_val = np.zeros(m)

    # ===================== Your Code Here =====================
    # Instruksi : Lengkapi fungsi ini untuk mengembalikan training errors dalam variabel
    #                error_train dan validation errors dalm error_val.
    #                i.e., error_train[i] and error_val[i] should give you
    #                the errors obtained after training on i examples
    #
    # Catatan : You should evaluate the training error on the first i training
    #           examples (i.e. X[:i] and y[:i])
    #
    #        For the validation error, you should instead evaluate on
    #        the _entire_ validation set (Xval and yval).
    #
    # Note : If you're using your cost function (linear_reg_cost_function)
    #        to compute the training and validation error, you should
    #        call the function with the alpha argument set to 0.
    #        Do note that you will still need to use alpha when running the
    #        training to obtain the theta parameters.
    #
    for i in range(m):
        x_i = # Write your code here
        y_i = # Write your code here
        theta = # Write your code here

        error_train[i] = # Write your code here
        error_val[i] = # Write your code here

    # ==========================================================

    return error_train, error_val

Untuk memplot learning curve, kita memerlukan training set dan validation error untuk _training set size_ yang berbeda. 

In [None]:
# ===================== Part 5: Learning Curve for Linear Regression =====================
# Next, you should have implemented the learning_curve function.
# Now you are going to call the function.

alpha = 0
error_train, error_val = learning_curve(np.c_[np.ones(m), X], y, np.c_[np.ones(Xval.shape[0]), Xval], yval, alpha)

plt.figure()
plt.plot(np.arange(m), error_train, np.arange(m), error_val)
plt.title('Learning Curve for Linear Regression')
plt.legend(['Train', 'Cross Validation'])
plt.xlabel('Number of Training Examples')
plt.ylabel('Error')
plt.axis([0, 13, 0, 150])

## Pertanyaan Refleksi
Bagaimanakah _performance_ dari model linear regression di atas? 

**Hint**: Jelaskan dari konsep bias-nya

# Polynomial regression
- Masalah dengan model linier yang sudah dibuat adalah model linier terlalu sederhana untuk data dan menghasilkan underfitting (bias tinggi). 
- Di bagian latihan ini, anda akan mengatasi masalah ini dengan menambahkan lebih banyak fitur.

Untuk menggunakan regresi polinomial (_polynomial regression_), hipotesis anda akan berbentuk:

$$
\begin{align}
    h_\theta(x) &= \theta_0 + \theta_1 \times (\text{waterLevel}) + \theta_2 \times (\text{waterLevel})^2 + \cdots + \theta_p \times (\text{waterLevel})^p \\
                &= \theta_0 + \theta_1 x_1 + \theta_2 x_2 + \cdots + \theta_p x_p. 
\end{align}
$$

Perhatikan bahwa dengan mendefinisikan $x_1 = (\text{waterLevel})$, $x_2 = (\text{waterLevel})^2$, $\ldots$, $x_p = (\text{waterLevel})^p$, anda memperoleh model regresi linier dengan fiturnya adalah berbagai pangkat dari nilai asli ($\text{waterLevel}$).

In [None]:
def poly_features(X, p):
    # You need to return the following variable correctly.
    X_poly = np.zeros((X.size, p))

    # ===================== Write Your Code Here =====================
    # Instruksi : Diberikan vektor X, return a matrix X_poly where the p-th
    #                column of X contains the values of X to the p-th power.
    #

    P = # Write your code here

    X_poly = # Write your code here

    # ==========================================================

    return X_poly

In [None]:
# =====================
#   Jangan diubah ya
# =====================
import matplotlib.pyplot as plt

def plot_fit(min_x, max_x, mu, sigma, theta, p):
    x = np.arange(min_x - 15, max_x + 25, 0.05)

    X_poly = poly_features(x, p)
    X_poly -= mu
    X_poly /= sigma

    X_poly = np.c_[np.ones(x.size), X_poly]

    plt.plot(x, np.dot(X_poly, theta))

## 3.1 Polynomial regression

Setelah anda melengkapi fungsi `poly_features`, anda akan melanjutkan dengan melatih regresi polinomial menggunakan cost function regresi linier anda.

Untuk bagian latihan ini, anda akan menggunakan polinomial berderajat $8$.
Ternyata jika anda melatih pada data yang diproyeksikan (data berpolinomial berderajat $8$), _training_ tidak akan berjalan dengan baik karena fitur akan diskalakan dengan amat buruk (misalnya, contoh dengan $x = 40$ sekarang akan memiliki fitur $x^8 = 40^8 = 6,5 × 10^{12}$). Oleh karena itu, anda perlu menggunakan normalisasi fitur (_feature normalization_).

In [None]:
# =======================
#    Jangan diubah ya
# =======================
import numpy as np

def feature_normalize(X):
    mu = np.mean(X, 0)
    sigma = np.std(X, 0, ddof=1)
    X_norm = (X - mu) / sigma

    return X_norm, mu, sigma

In [None]:
# =======================
#    Jangan diubah ya
# =======================
p = 8

# Map X onto Polynomial Features and Normalize
X_poly = poly_features(X, p)
X_poly, mu, sigma = feature_normalize(X_poly)
X_poly = np.c_[np.ones(m), X_poly]

# Map X_poly_test and normalize (using mu and sigma)
X_poly_test = poly_features(Xtest, p)
X_poly_test -= mu
X_poly_test /= sigma
X_poly_test = np.c_[np.ones(X_poly_test.shape[0]), X_poly_test]

# Map X_poly_val and normalize (using mu and sigma)
X_poly_val = poly_features(Xval, p)
X_poly_val -= mu
X_poly_val /= sigma
X_poly_val = np.c_[np.ones(X_poly_val.shape[0]), X_poly_val]

print('Normalized Training Example 1 : \n{}'.format(X_poly[0]))

In [None]:
# ===================== Part 7 : Learning Curve for Polynomial Regression =====================
# Now, you will get to experiment with polynomial regression by using multiple
# values of alpha. The code below runs polynomial regression with
# alpha = 0. You should try running the code with different values of
# alpha to see how the fit and learning curve change.
#

alpha = 0
theta = train_linear_reg(X_poly, y, alpha)

# Plot training data and fit
plt.figure()
plt.scatter(X, y, c='r', marker="x")
plot_fit(np.min(X), np.max(X), mu, sigma, theta, p)
plt.xlabel('Change in water level (x)')
plt.ylabel('Water folowing out of the dam (y)')
plt.ylim([0, 60])
plt.title('Polynomial Regression Fit (alpha = {})'.format(alpha))

error_train, error_val = learning_curve(X_poly, y, X_poly_val, yval, alpha)
plt.figure()
plt.plot(np.arange(m), error_train, np.arange(m), error_val)
plt.title('Polynomial Regression Learning Curve (lambda = {})'.format(alpha))
plt.legend(['Train', 'Validation'])
plt.xlabel('Number of Training Examples')
plt.ylabel('Error')
plt.axis([0, 13, 0, 150])

print('Polynomial Regression (alpha = {})'.format(alpha))
print('# Training Examples\tTrain Error\t\tValidation Error')
for i in range(m):
    print('  \t{}\t\t{}\t{}'.format(i, error_train[i], error_val[i]))

### Pertanyaan Refleksi
1. Apakah model _polynomial regression_ cocok dengan dataset?
2. Jelaskan _training error_ yang terjadi?
3. Jelaskan _validation error_ yang terjadi?
4. Apakah yang terjadi pada model tersebut setelah model belajar dari $12$ training examples?
5. Coba anda lakukan kembali eksperimen di atas dengan $\alpha = 1$.
6. Apakah yang terjadi dengan model tersebut ketika anda menggunakan $\alpha = 1$?
5. Coba anda lakukan kembali eksperimen di atas dengan $\alpha = 100$.
6. Apakah yang terjadi dengan model tersebut ketika anda menggunakan $\alpha = 100$?

## 3.3 Memilih $\alpha$ berdasarkan validation set

Di bagian ini, anda akan menerapkan metode otomatis untuk memilih $\alpha$ parameter.

Secara konkret, anda akan menggunakan validation set untuk mengevaluasi seberapa baik setiap nilai $\alpha$. 
Setelah anda memilih nilai $\alpha$ terbaik dengan menggunakan validation set, kemudian anda dapat mengevaluasi model pada test set untuk memperkirakan seberapa baik prediksi model pada data aktual yang tidak terlihat.

Tugas Anda adalah melengkapi kode di fungsi `validation_curve`. 
Secara khusus, anda harus menggunakan fungsi `train_linear_reg` untuk melatih model dengan menggunakan nilai $\alpha$ yang berbeda dan menghitung training error dan validation error.    
Anda sebaiknya mencoba $\alpha$ dalam rentang sbb: {0, 0.001, 0.003, 0.01, 0.03, 0.1, 0.3, 1, 3, 10}.

In [None]:
def validation_curve(X, y, Xval, yval):
    # Selected values of alpha (don't change this)
    alpha_vec = np.array([0., 0.001, 0.003, 0.01, 0.03, 0.1, 0.3, 1, 3, 10])

    # You need to return these variables correctly.
    error_train = np.zeros(alpha_vec.size)
    error_val = np.zeros(alpha_vec.size)

    # ===================== Write Your Code Here =====================
    # Instruksi : Lengkapi fungsi ini untuk mengembalikan training errors dalam variabel
    #                error_train and the validation errors dalam error_val. The
    #                vector alpha_vec contains the different alpha parameters
    #                to use for each calculation of the errors, i.e,
    #                error_train[i], and error_val[i] should give
    #                you the errors obtained after training with
    #                alpha = alpha_vec[i]
    #

    for i in range(alpha_vec.size):
        alpha = # Write your code here
        theta = # Write your code here

        error_train[i] = # Write your code here
        error_val[i]   = # Write your code here

    # ==========================================================

    return alpha_vec, error_train, error_val

In [None]:
# ===================== Part 8 : Validation for Selecting Alpha =====================
# You will now implement validation_curve to test various values of
# alpha on a validation set. You will then use this to select the
# 'best' alpha value.

# ====================
#  Jangan diubah ya
# ====================
alpha_vec, error_train, error_val = validation_curve(X_poly, y, X_poly_val, yval)

plt.figure()
plt.plot(alpha_vec, error_train, alpha_vec, error_val)
plt.legend(['Train', 'Validation'])
plt.xlabel('Alpha')
plt.ylabel('Error')


### Pertanyaan Refleksi
Berdasarkan plot di atas, berapakah nilai $\alpha$ yang terbaik?     
**Hint**: Pilih $\alpha$ bilangan bulat. 


## 3.4 Hitung error pada test set 

Finally, anda akan menghitung error pada test set atau yang biasa disebut _test error_.    
Sebelum anda menghitung _test error_, anda akan melatih model dengan menggunakan gabungan train set dan validation set dan best $\alpha$. 

Anda gabungkan `X_poly` dan `X_poly_val`.

In [None]:
#### Write Your Code Here ####
X_train_final = # Write your code here

Anda gabungkan `y` dan `yval`.

In [None]:
#### Write Your Code Here ####
y_train_final = # Write your code here

Hitunglah $\theta$ yang merupakan hasil latih linear regression dengan $\alpha$ terbaik.    
**Hint**: Gunakan fungsi `train_linear_reg`

In [None]:
#### Write Your Code Here ####
theta_final = # Write your code here

Hitunglah test error dengan pada `X_poly_test` dan `ytest`.    

**Hint**: Gunakan fungsi `linear_reg_cost_function`

In [None]:
#### Write Your Code Here ####


<center><h1>The End</h1></center>