[adaptado de [Programa de cursos integrados Aprendizado de m√°quina](https://www.coursera.org/specializations/machine-learning-introduction) de [Andrew Ng](https://www.coursera.org/instructor/andrewng)  ([Stanford University](http://online.stanford.edu/), [DeepLearning.AI](https://www.deeplearning.ai/) ) ]

In [None]:
# Baixar arquivos adicionais para o laborat√≥rio.
!wget https://github.com/fabiobento/dnn-course-2024-1/raw/main/00_course_folder/ml_intro/class_03/Laborat%C3%B3rios/lab_utils_ml_intro_week_3.zip
!unzip -n -q lab_utils_ml_intro_week_3.zip

In [None]:
# Testar se estamos no Google Colab
try:
  import google.colab
  IN_COLAB = True
  from google.colab import output
  output.enable_custom_widget_manager()
except:
  IN_COLAB = False

# Fun√ß√£o de Custo para Regress√£o Log√≠stica

## Objetivos
Neste laborat√≥rio, voc√™ ir√°:
- examinar a implementa√ß√£o e utilizar a fun√ß√£o de custo para regress√£o log√≠stica.

In [None]:
!pip install ipympl

In [None]:
import numpy as np
%matplotlib widget
import matplotlib.pyplot as plt
from lab_utils_common import  plot_data, sigmoid, dlc
plt.style.use('./deeplearning.mplstyle')

## Conjunto de dados
Vamos come√ßar com o mesmo conjunto de dados usado no laborat√≥rio de fronteira de decis√£o.

In [None]:
X_train = np.array([[0.5, 1.5], [1,1], [1.5, 0.5], [3, 0.5], [2, 2], [1, 2.5]])  #(m,n)
y_train = np.array([0, 0, 0, 1, 1, 1])                                           #(m,)

Usaremos uma fun√ß√£o auxiliar para plotar esses dados. Os pontos de dados com r√≥tulo $y=1$ s√£o mostrados como cruzes vermelhas, enquanto os pontos de dados com r√≥tulo $y=0$ s√£o mostrados como c√≠rculos azuis.

In [None]:
fig,ax = plt.subplots(1,1,figsize=(4,4))
plot_data(X_train, y_train, ax)

# Defina ambos os eixos como 0-4
ax.axis([0, 4, 0, 3.5])
ax.set_ylabel('$x_1$', fontsize=12)
ax.set_xlabel('$x_0$', fontsize=12)
plt.show()

## Fun√ß√£o de custo

Em um laborat√≥rio anterior, voc√™ desenvolveu a fun√ß√£o *perda log√≠stica*. Lembre-se, a perda √© definida para ser aplicada a um exemplo. Aqui voc√™ combina as perdas para formar o **custo**, que inclui todos os exemplos.


Lembre-se de que para regress√£o log√≠stica, a fun√ß√£o de custo tem a forma

$$ J(\mathbf{w},b) = \frac{1}{m} \sum_{i=0}^{m-1} \left[ loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) \right] \tag{1}$$

onde
* $loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)})$ √© o custo de um √∫nico ponto de dados, que √©:

    $$loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) = -y^{(i)} \log\left(f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) - \left( 1 - y^{(i)}\right) \log \left( 1 - f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) \tag{2}$$
    
*  onde m √© o n√∫mero de exemplos de treinamento no conjunto de dados e:
$$
\begin{align}
  f_{\mathbf{w},b}(\mathbf{x^{(i)}}) &= g(z^{(i)})\tag{3} \\
  z^{(i)} &= \mathbf{w} \cdot \mathbf{x}^{(i)}+ b\tag{4} \\
  g(z^{(i)}) &= \frac{1}{1+e^{-z^{(i)}}}\tag{5} 
\end{align}
$$
 

<a name='ex-02'></a>
#### Code Description

#### Descri√ß√£o do c√≥digo

O algoritmo para `compute_cost_logistic` percorre todos os exemplos calculando a perda de cada exemplo e acumulando o total.

Observe que as vari√°veis ‚Äã‚ÄãX e y n√£o s√£o valores escalares, mas matrizes de forma ($m, n$) e ($ùëö$,) respectivamente, onde $ùëõ$ √© o n√∫mero de recursos e $ùëö$ √© o n√∫mero de exemplos de treinamento .


In [None]:
def compute_cost_logistic(X, y, w, b):
    """
    Calcula o custo

    Args:
      X (ndarray (m,n)): Dados, m exemplos com n recursos
      y (ndarray (m,)) : valores alvo
      w (ndarray (n,)) : par√¢metros do modelo
      b (escalar)       : par√¢metros do modelo
      
    Returns:
      cost (escalar): custo
    """

    m = X.shape[0]
    cost = 0.0
    for i in range(m):
        z_i = np.dot(X[i],w) + b
        f_wb_i = sigmoid(z_i)
        cost +=  -y[i]*np.log(f_wb_i) - (1-y[i])*np.log(1-f_wb_i)
             
    cost = cost / m
    return cost


Verifique a implementa√ß√£o da fun√ß√£o de custo usando a c√©lula abaixo.

In [None]:
w_tmp = np.array([1,1])
b_tmp = -3
print(compute_cost_logistic(X_train, y_train, w_tmp, b_tmp))

**Sa√≠da Esperada**: 0.3668667864055175

## Exemplo
Agora, vamos ver qual √© o resultado da fun√ß√£o de custo para um valor diferente de $w$.

* Em um laborat√≥rio anterior, voc√™ tra√ßou o limite de decis√£o para  $b = -3, w_0 = 1, w_1 = 1$. Ou seja, voc√™ obteve `b = -3, w = np.array([1,1])`.

* Digamos que voc√™ queira ver se $b = -4, w_0 = 1, w_1 = 1$, ou `b = -4, w = np.array([1,1])` fornece um modelo melhor.

Vamos primeiro tra√ßar o limite de decis√£o para esses dois valores $b$ diferentes para ver qual deles se ajusta melhor aos dados.

* For $b = -3, w_0 = 1, w_1 = 1$, we'll plot $-3 + x_0+x_1 = 0$ (mostrado em azul)
* For $b = -4, w_0 = 1, w_1 = 1$, we'll plot $-4 + x_0+x_1 = 0$ (mostrado em magenta)

In [None]:
import matplotlib.pyplot as plt

# Escolha valores entre 0 e 6
x0 = np.arange(0,6)

# Trace os duas fronteiras de decis√£o
x1 = 3 - x0
x1_other = 4 - x0

fig,ax = plt.subplots(1, 1, figsize=(4,4))
# Plote as fronteiras de decis√£o
ax.plot(x0,x1, c=dlc["dlblue"], label="$b$=-3")
ax.plot(x0,x1_other, c=dlc["dlmagenta"], label="$b$=-4")
ax.axis([0, 4, 0, 4])

# Plote or dados originais
plot_data(X_train,y_train,ax)
ax.axis([0, 4, 0, 4])
ax.set_ylabel('$x_1$', fontsize=12)
ax.set_xlabel('$x_0$', fontsize=12)
plt.legend(loc="upper right")
plt.title("Fronteira de Decis√£o")
plt.show()

Voc√™ pode ver neste gr√°fico que `b = -4, w = np.array([1,1])` √© um modelo pior para os dados de treinamento. Vamos ver se a implementa√ß√£o da fun√ß√£o de custo reflete isso.

In [None]:
w_array1 = np.array([1,1])
b_1 = -3
w_array2 = np.array([1,1])
b_2 = -4

print("Custo para b = -3 : ", compute_cost_logistic(X_train, y_train, w_array1, b_1))
print("Custo para b = -4 : ", compute_cost_logistic(X_train, y_train, w_array2, b_2))

**Sa√≠da Esperada**

Custo para b = -3 :  0.3668667864055175

Custo para = -4 :  0.5036808636748461


Voc√™ pode ver que a fun√ß√£o de custo se comporta conforme o esperado e o custo para `b = -4, w = np.array([1,1])` √© realmente maior do que o custo para `b = -3, w = np.array ([1,1])`

## Parab√©ns!
Neste laborat√≥rio voc√™ examinou e utilizou a fun√ß√£o de custo para regress√£o log√≠stica.