[adaptado de [Programa de cursos integrados Aprendizado de máquina](https://www.coursera.org/specializations/machine-learning-introduction) de [Andrew Ng](https://www.coursera.org/instructor/andrewng)  ([Stanford University](http://online.stanford.edu/), [DeepLearning.AI](https://www.deeplearning.ai/) ) ]

In [None]:
# Baixar arquivos adicionais para o laboratório
!wget https://github.com/fabiobento/dnn-course-2024-1/raw/main/00_course_folder/nn_adv/class_02/Laborat%C3%B3rios/lab_utils_ml_adv_add_week_2
      
!unzip -n -q lab_utils_ml_adv_add_week_2

In [None]:
# Testar se estamos no Google Colab
# Necessário para ativar widgets
try:
  import google.colab
  IN_COLAB = True
  from google.colab import output
  output.enable_custom_widget_manager()
except:
  IN_COLAB = False

# Derivadas
Este laboratório lhe dará uma compreensão mais intuitiva das derivadas. Ele mostrará uma maneira simples de calcular derivadas aritmeticamente. Ele também apresentará a você uma biblioteca Python útil que permite calcular derivadas simbolicamente.

In [None]:
from sympy import symbols, diff

## Definição Informal de Derivadas

A derivada de uma função descreve como a saída da função muda quando há uma pequena mudança em uma variável de entrada.

Vamos usar a função de custo $J(w)$ como exemplo. O custo $J$ é o resultado e $w$ é a variável de entrada.  
Vamos dar a uma "pequena mudança" o nome de *epsilon* ou $\epsilon$. Usamos essas letras gregas porque é tradicional na matemática usar *epsilon* ($\epsilon$) ou *delta* ($\Delta$) para representar um valor pequeno. Você pode pensar nisso como se representasse 0,001 ou algum outro valor pequeno.  

$$
\begin{equation}
\text{se } w \uparrow \epsilon \text{ causa }J(w) \uparrow \text{em }k \times \epsilon \text{ então}  \\
\frac{\partial J(w)}{\partial w} = k \tag{1}
\end{equation}
$$

Isso significa que se você alterar a entrada da função $J(w)$ um pouco e a saída mudar $k$ vezes esse valor, então a derivada de $J(w)$ é igual a $k$.

Vamos testar isso.  Vejamos a derivada da função $J(w) = w^2$ no ponto $w=3$ e $\epsilon = 0,001$


In [None]:
J = (3)**2
J_epsilon = (3 + 0.001)**2
k = (J_epsilon - J)/0.001    # diferença dividida por epsilon
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k:0.6f} ")

Aumentamos um pouco o valor da entrada (0,001), fazendo com que a saída mude de 9 para 9,006001, um aumento de 6 vezes o aumento da entrada. Fazendo referência a (1) acima, isso diz que $k=6$, portanto $\frac{\partial J(w)}{\partial w} \approx 6$.

Se você estiver familiarizado com cálculo, saberá que, escrito simbolicamente, $\frac{\partial J(w)}{\partial w} = 2 w$. Com $w=3$, isso é 6. Nosso cálculo acima não é exatamente 6 porque, para ser exatamente correto, $\epsilon$ precisaria ser [infinitesimalmente pequeno](https://www.dictionary.com/browse/infinitesimally) ou muito, muito pequeno. É por isso que usamos os símbolos $\approx$ ou ~= em vez de =. Vamos ver o que acontece se tornarmos $\epsilon$ menor.

In [None]:
J = (3)**2
J_epsilon = (3 + 0.000000001)**2
k = (J_epsilon - J)/0.000000001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

O valor se aproxima de exatamente 6 à medida que reduzimos o tamanho de $\epsilon$.

Sinta-se à vontade para tentar reduzir ainda mais o valor.

## Obtendo Derivadas Simbólicas
No _backprop_, é útil conhecer a derivada de funções simples para qualquer valor de entrada. Em outras palavras, gostaríamos de conhecer a derivada "simbólica" em vez da derivada "aritmética". Um exemplo de uma derivada simbólica é $\frac{\partial J(w)}{\partial w} = 2 w$, para $J(w) = w^2$.  Com a derivada simbólica, você pode encontrar o valor da derivada em qualquer valor de entrada $w$.  

Se você fez um curso de cálculo, está familiarizado com as muitas [regras de diferenciação](https://en.wikipedia.org/wiki/Differentiation_rules#Power_laws,_polynomials,_quotients,_and_reciprocals) que os matemáticos desenvolveram para resolver a derivada de uma expressão. Bem, acontece que esse processo foi automatizado com programas de diferenciação simbólica. Um exemplo disso em python é a biblioteca [SymPy](https://www.sympy.org/en/index.html). Vamos dar uma olhada em como usá-la.

### $J = w^2$
Defina as variáveis python e seus nomes simbólicos.

In [None]:
J, w = symbols('J, w')

Defina e imprima a expressão. Observe que o SymPy produz uma string [latex](https://en.wikibooks.org/wiki/LaTeX/Mathematics) que gera uma equação bem legível.

In [None]:
J=w**2
J

Use o `diff` do SymPy para diferenciar a expressão de $J$ com relação a $w$.

Observe que o resultado corresponde ao nosso exemplo anterior.

In [None]:
dJ_dw = diff(J,w)
dJ_dw

Avalie a derivada em alguns pontos, "substituindo" os valores simbólicos por valores numéricos.

No primeiro exemplo, $w$ é substituído por $2$.

In [None]:
dJ_dw.subs([(w,2)])    # derivada no ponto w = 2

In [None]:
dJ_dw.subs([(w,3)])    # derivada no ponto w = 3

In [None]:
dJ_dw.subs([(w,-3)])    # derivada no ponto = -3

## $J = 2w$

In [None]:
w, J = symbols('w, J')

In [None]:
J = 2 * w
J

In [None]:
dJ_dw = diff(J,w)
dJ_dw

In [None]:
dJ_dw.subs([(w,-3)])    # derivada no ponto w = -3

Compare isso com o cálculo aritmético

In [None]:
J = 2*3
J_epsilon = 2*(3 + 0.001)
k = (J_epsilon - J)/0.001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

Para a função $J=2w$, é fácil ver que qualquer alteração em $w$ resultará em duas vezes essa quantidade de alteração no resultado $J$, independentemente do valor inicial de $w$. Nossos resultados aritméticos e do NumPy confirmam isso. 

## $J = w^3$

In [None]:
J, w = symbols('J, w')

In [None]:
J=w**3
J

In [None]:
dJ_dw = diff(J,w)
dJ_dw

In [None]:
dJ_dw.subs([(w,2)])   # derivada no ponto w=2

Compare isso com o cálculo aritmético

In [None]:
J = (2)**3
J_epsilon = (2+0.001)**3
k = (J_epsilon - J)/0.001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

## $J = \frac{1}{w}$

In [None]:
J, w = symbols('J, w')

In [None]:
J= 1/w
J

In [None]:
dJ_dw = diff(J,w)
dJ_dw

In [None]:
dJ_dw.subs([(w,2)])

Compare isso com o cálculo aritmético

In [None]:
J = 1/2
J_epsilon = 1/(2+0.001)
k = (J_epsilon - J)/0.001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

## $J = \frac{1}{w^2}$

In [None]:
J, w = symbols('J, w')

Tente repetir as etapas acima na função $J = \frac{1}{w^2}$ e avalie em w=4

Compare isso com o cálculo aritmético

In [None]:
J = 1/4**2
J_epsilon = 1/(4+0.001)**2
k = (J_epsilon - J)/0.001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

<details>
  <summary><font size="3" color="darkgreen"><b>Click para Dicas</b></font></summary>
    
```python 
J= 1/w**2
dJ_dw = diff(J,w)
dJ_dw.subs([(w,4)])
```
  

</details>

    


## Parabéns!
Se você já analisou os exemplos acima, entendeu que uma derivada descreve a alteração na saída de uma função que é resultado de uma pequena alteração em uma entrada para essa função. Você também pode usar o *SymPy* em python para encontrar a derivada simbólica de funções.