# Python Numpy cơ bản

**Hướng dẫn:**
- Sử dụng Python 3
- Hạn chế sử dụng vòng lặp.

### 1.1 - Hàm sigmoid  ###

**Bài tập**: Xây dựng hàm `sigmoid()`, sử dụng np.exp()

**Gợi ý**: 
- Hàm sigmoid có công thức là:
$$sigmoid(x) = \frac{1}{1+e^{-x}}$$
- Trong trường hợp $x$ là một vector, `sigmoid(x)` sẽ được tính như sau:
$$ \text{For } x \in \mathbb{R}^n \text{,     } sigmoid(x) = sigmoid\begin{pmatrix}
    x_1  \\
    x_2  \\
    ...  \\
    x_n  \\
\end{pmatrix} = \begin{pmatrix}
    \frac{1}{1+e^{-x_1}}  \\
    \frac{1}{1+e^{-x_2}}  \\
    ...  \\
    \frac{1}{1+e^{-x_n}}  \\
\end{pmatrix} $$
- Đồ thị hàm sigmoid

<img src="images/sigmoid.png" style="width:500px;height:228px;">


In [1]:
import numpy as np

def sigmoid(x):
    """
    Compute the sigmoid of x

    Arguments:
    x -- A scalar or numpy array of any size

    Return:
    s -- sigmoid(x)
    """
    
    ### START CODE HERE ###
    s = 1/(1+np.exp(-x))
    ### END CODE HERE ###
    
    return s

In [2]:
x = np.array([1, 2, 3])
print ("sigmoid(x) = " + str(sigmoid(x)))

sigmoid(x) = [0.73105858 0.88079708 0.95257413]


**Expected Output**: sigmoid(x) = [0.73105858 0.88079708 0.95257413]
$$-------------------------------------------$$

### 1.2 - Sigmoid gradient


**Bài tập**: Xây dựng hàm `sigmoid_derivative()` tính toán giá trị đạo hàm của hàm sigmoid với đầu vào x. 

**Gợi ý**: 
- Sử dụng công thức: $$sigmoid\_derivative(x) = \sigma'(x) = \sigma(x) (1 - \sigma(x))$$
- Thực hiện theo 2 bước: Tính s là sigmoid của x. Sau đó sử dụng hàm `sigmoid()` đã hoàn thành ở trên để tính $\sigma'(x) = s(1-s)$

In [3]:
def sigmoid_derivative(x):
    """
    Compute the gradient (also called the slope or derivative) of the sigmoid function with respect to its input x.
    You can store the output of the sigmoid function into variables and then use it to calculate the gradient.
    
    Arguments:
    x -- A scalar or numpy array

    Return:
    ds -- Your computed gradient.
    """
    
    ### START CODE HERE ###
    s = sigmoid(x)
    ds = s * (1 - s)
    ### END CODE HERE ###
    
    return ds

In [4]:
x = np.array([1, 2, 3])
print ("sigmoid_derivative(x) = " + str(sigmoid_derivative(x)))

sigmoid_derivative(x) = [0.19661193 0.10499359 0.04517666]


**Expected Output**: sigmoid_derivative(x) = [0.19661193 0.10499359 0.04517666]
$$-------------------------------------------$$

### 1.3 - Reshaping arrays ###

**Bài tập**: Xây dựng hàm `image2vector()` nhận đầu vào là array có chiều là (length, height, depth) và trả về một vector có chiều là (length\*height\*depth, 1). 

**Gợi ý**: sử dụng 2 hàm [np.shape](https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.shape.html) và [np.reshape()](https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html). 
- `X.shape`: trả về giá trị là chiều của  matrix/vector X. 
- `X.reshape(...)`: sử dụng để thay đổi chiều của matrix/vector X. 

Ví dụ, một bức ảnh được biểu diễn bằng một 3D array có chiều $(length, height, depth=3)$. Tuy nhiên, khi bạn muốn sử dụng ảnh này cho thuật toán Logistic Regression, bạn cần thay đổi chiều của bức ảnh đó để có chiều là $(length*height*3, 1)$. Hay nói cách khác, bạn cần chuyển 3D array về 1D vector.

<img src="images/image2vector_kiank.png" style="width:500px;height:300;">

Nếu bạn muốn đổi chiều một array v có chiều là (a, b, c) thành một vector có chiều (a * b, c), bạn làm theo bước sau:
``` python
v = v.reshape((v.shape[0]*v.shape[1], v.shape[2])) # v.shape[0] = a ; v.shape[1] = b ; v.shape[2] = c
```

In [5]:
# GRADED FUNCTION: image2vector
def image2vector(image):
    """
    Argument:
    image -- a numpy array of shape (length, height, depth)
    
    Returns:
    v -- a vector of shape (length*height*depth, 1)
    """
    
    ### START CODE HERE ###
    v = image.reshape((image.shape[0]*image.shape[1]*image.shape[2]), 1)
    ### END CODE HERE ###
    
    return v

In [6]:
# This is a 3 by 3 by 2 array, typically images will be (num_px_x, num_px_y,3) where 3 represents the RGB values
image = np.array(
      [[[ 0.67826139,  0.29380381],
        [ 0.90714982,  0.52835647],
        [ 0.4215251 ,  0.45017551]],

       [[ 0.92814219,  0.96677647],
        [ 0.85304703,  0.52351845],
        [ 0.19981397,  0.27417313]],

       [[ 0.60659855,  0.00533165],
        [ 0.10820313,  0.49978937],
        [ 0.34144279,  0.94630077]]])

print ("image2vector(image) = " + str(image2vector(image)))

image2vector(image) = [[0.67826139]
 [0.29380381]
 [0.90714982]
 [0.52835647]
 [0.4215251 ]
 [0.45017551]
 [0.92814219]
 [0.96677647]
 [0.85304703]
 [0.52351845]
 [0.19981397]
 [0.27417313]
 [0.60659855]
 [0.00533165]
 [0.10820313]
 [0.49978937]
 [0.34144279]
 [0.94630077]]


**Expected Output**: 


<table style="width:100%">
     <tr> 
       <td> **image2vector(image)** </td> 
       <td> [[ 0.67826139]
 [ 0.29380381]
 [ 0.90714982]
 [ 0.52835647]
 [ 0.4215251 ]
 [ 0.45017551]
 [ 0.92814219]
 [ 0.96677647]
 [ 0.85304703]
 [ 0.52351845]
 [ 0.19981397]
 [ 0.27417313]
 [ 0.60659855]
 [ 0.00533165]
 [ 0.10820313]
 [ 0.49978937]
 [ 0.34144279]
 [ 0.94630077]]</td> 
     </tr>
    
   
</table>
$$-------------------------------------------$$

### 2.1 Xây dựng hàm mất mát L1 và L2 

Hàm mất mát sử dụng để đánh giá mô hình trong quá trình huấn luyện. Giá trị loss càng lớn, tương ứng với giá trị dự đoán của mô hình ($ \hat{y} $) càng khác với giá trị đúng thực tế ($y$).

**Bài tập**: Xây dựng hàm `L1()` theo cách vector hoá sử dụng numpy.

**Gợi ý**:
- L1 được định nghĩa bởi công thức:
$$\begin{align*} & L_1(\hat{y}, y) = \sum_{i=0}^m|y^{(i)} - \hat{y}^{(i)}| \end{align*}\tag{6}$$

- Sử dụng `np.sum()` để tính tổng của vector, `np.abs()` để tính giá trị tuyệt đối của từng phần tử có trong vector.


In [7]:
# GRADED FUNCTION: L1

def L1(yhat, y):
    """
    Arguments:
    yhat -- vector of size m (predicted labels)
    y -- vector of size m (true labels)
    
    Returns:
    loss -- the value of the L1 loss function defined above
    """
    
    ### START CODE HERE ###
    loss = np.sum(np.abs(y-yhat))
    ### END CODE HERE ###
    
    return loss

In [8]:
yhat = np.array([.9, 0.2, 0.1, .4, .9])
y = np.array([1, 0, 0, 1, 1])
print("L1 = " + str(L1(yhat,y)))

L1 = 1.1


**Expected Output**: L1 = 1.1
$$-------------------------------------------$$

**Bài tập**: Xây dựng hàm mất mát `L2()` phiên bản vector hoá sử dụng numpy.

**Gợi ý**:
- L2 loss is defined as $$\begin{align*} & L_2(\hat{y},y) = \sum_{i=0}^m(y^{(i)} - \hat{y}^{(i)})^2 \end{align*}\tag{7}$$

- Có nhiều cách để tính toán L2, ví dụ như sử dụng np.dot(). Nếu $x = [x_1, x_2, ..., x_n]$, thì $$np.dot(x,x) = \sum_{j=0}^n x_j^{2}$$ 



In [9]:
# GRADED FUNCTION: L2

def L2(yhat, y):
    """
    Arguments:
    yhat -- vector of size m (predicted labels)
    y -- vector of size m (true labels)
    
    Returns:
    loss -- the value of the L2 loss function defined above
    """
    
    ### START CODE HERE ###
    loss = np.dot(y-yhat, y-yhat)
#     loss = np.sum(np.power(y-yhat,2))
    ### END CODE HERE ###
    
    return loss

In [10]:
yhat = np.array([.9, 0.2, 0.1, .4, .9])
y = np.array([1, 0, 0, 1, 1])
print("L2 = " + str(L2(yhat,y)))

L2 = 0.43


**Expected Output**: L2 = 0.43 
$$-------------------------------------------$$