# Laboratorio opcional - Derivadas
Este laboratorio le proporcionará una comprensión más intuitiva de las derivadas. Le mostrará una forma sencilla de calcular derivadas aritméticamente. También le presentará una práctica biblioteca de Python que le permite calcular derivadas simbólicamente.

In [1]:
from sympy import symbols, diff

## Informal definition of derivatives

La definición formal de las derivadas puede resultar un poco desalentadora, con límites y valores que "van a cero". En realidad, la idea es mucho más sencilla. 

La derivada de una función describe cómo cambia la salida de una función cuando se produce un pequeño cambio en una variable de entrada.

Utilicemos la función de coste $J(w)$ como ejemplo. El coste $J$ es la salida y $w$ es la variable de entrada.  
Vamos a dar a un "pequeño cambio" un nombre *epsilon* o $\epsilon$. Utilizamos estas letras griegas porque es tradicional en matemáticas utilizar *epsilon*($\epsilon$) o *delta* ($\Delta$) para representar un valor pequeño. Se puede pensar que representa 0,001 o algún otro valor pequeño.  

$$
\begin{equation}
\text{Si } w \uparrow \epsilon \text{ causa }J(w) \uparrow \text{por }k \times \epsilon \text{ entonces}  \\
\frac{\partial J(w)}{\partial w} = k \tag{1}
\end{equation}
$$

Esto sólo dice que si cambias la entrada a la función $J(w)$ un poco y la salida cambia $k$ veces ese poco, entonces la derivada de $J(w)$ es igual a $k$.

Vamos a probar esto.  Veamos la derivada de la función $J(w) = w^2$ en el punto $w=3$ y $\epsilon = 0.001$.

In [2]:
J = (3)**2
J_epsilon = (3 + 0.001)**2
k = (J_epsilon - J)/0.001    # difference divided by epsilon
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k:0.6f} ")

J = 9, J_epsilon = 9.006001, dJ_dw ~= k = 6.001000 


Hemos aumentado un poco el valor de entrada (0,001), haciendo que la salida cambie de 9 a 9,006001, un aumento de 6 veces el aumento de entrada. Haciendo referencia a (1) más arriba, esto dice que $k=6$, por lo que $\frac{\partial J(w)}{\partial w} \approx 6$. Si estás familiarizado con el cálculo, ya sabes, escrito simbólicamente,  $\frac{\partial J(w)}{\partial w} = 2 w$. Con $w=3$ esto es 6. Nuestro cálculo anterior no es exactamente 6 porque para ser exactamente correcto $\epsilon$ tendría que ser [infinitesimalmente pequeño](https://www.dictionary.com/browse/infinitesimally) o muy, muy pequeño. Por eso utilizamos los símbolos $\approx$ o ~= en lugar de =. Veamos qué pasa si hacemos $\epsilon$ más pequeño.

In [None]:
J = (3)**2
J_epsilon = (3 + 0.000000001)**2
k = (J_epsilon - J)/0.000000001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

El valor se acerca exactamente a 6 a medida que reducimos el tamaño de $\epsilon$. Siéntase libre de tratar de reducir el valor aún más.

## Encontrar derivadas simbólicas
En backprop es útil conocer la derivada de funciones simples para cualquier valor de entrada. Dicho de otra manera, nos gustaría saber la derivada "simbólica" en lugar de la derivada "aritmética". Un ejemplo de una derivada simbólica es, $\frac{\partial J(w)}{\partial w} = 2 w$, la derivada de $J(w) = w^2$ arriba.  Con la derivada simbólica se puede encontrar el valor de la derivada en cualquier valor de entrada $w$.  

Si has tomado un curso de cálculo, estás familiarizado con las muchas [reglas de diferenciación](https://en.wikipedia.org/wiki/Differentiation_rules#Power_laws,_polynomials,_quotients,_and_reciprocals) que los matemáticos han desarrollado para resolver una derivada dada una expresión. Pues bien, resulta que este proceso se ha automatizado con programas de diferenciación simbólica. Un ejemplo de ello en python es la librería [SymPy](https://www.sympy.org/en/index.html). Veamos cómo usarla.

### $J = w^2$
Definir las variables python y sus nombres simbólicos.

In [4]:
J, w = symbols('J, w')

Define e imprime la expresión. Nota SymPy produce una cadena [latex](https://en.wikibooks.org/wiki/LaTeX/Mathematics) que genera una ecuación bien legible.

In [5]:
J=w**2
J

w**2

Utilice `diff` de SymPy para diferenciar la expresión para $J$ con respecto a $w$. Observe que el resultado coincide con nuestro ejemplo anterior.

In [6]:
dJ_dw = diff(J,w)
dJ_dw

2*w

Evaluate the derivative at a few points by 'substituting' numeric values for the symbolic values. In the first example, $w$ is replaced by $2$.

In [7]:
dJ_dw.subs([(w,2)])    # derivative at the point w = 2

4

In [8]:
dJ_dw.subs([(w,3)])    # derivative at the point w = 3

6

In [9]:
dJ_dw.subs([(w,-3)])    # derivative at the point w = -3

-6

## $J = 2w$

In [10]:
w, J = symbols('w, J')

In [11]:
J = 2 * w
J

2*w

In [12]:
dJ_dw = diff(J,w)
dJ_dw

2

In [13]:
dJ_dw.subs([(w,-3)])    # derivative at the point w = -3

2

Compárese con el cálculo aritmético

In [14]:
J = 2*3
J_epsilon = 2*(3 + 0.001)
k = (J_epsilon - J)/0.001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

J = 6, J_epsilon = 6.002, dJ_dw ~= k = 1.9999999999997797 


Para la función $J=2w$, es fácil ver que cualquier cambio en $w$ resultará en 2 veces esa cantidad de cambio en la salida $J$, independientemente del valor inicial de $w$. Nuestros resultados NumPy y aritméticos lo confirman. 

## $J = w^3$

In [15]:
J, w = symbols('J, w')

In [16]:
J=w**3
J

w**3

In [17]:
dJ_dw = diff(J,w)
dJ_dw

3*w**2

In [26]:
re=dJ_dw.subs([(w,2)])   # derivative at the point w=2

In [32]:
display(re)
float(re)

-1/4

-0.25

Compárese con el cálculo aritmético

In [19]:
J = (2)**3
J_epsilon = (2+0.001)**3
k = (J_epsilon - J)/0.001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

J = 8, J_epsilon = 8.012006000999998, dJ_dw ~= k = 12.006000999997823 


## $J = \frac{1}{w}$

In [20]:
J, w = symbols('J, w')

In [21]:
J= 1/w
J

1/w

In [22]:
dJ_dw = diff(J,w)
dJ_dw

-1/w**2

In [23]:
dJ_dw.subs([(w,2)])

-1/4

Compárese con el cálculo aritmético

In [24]:
J = 1/2
J_epsilon = 1/(2+0.001)
k = (J_epsilon - J)/0.001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

J = 0.5, J_epsilon = 0.49975012493753124, dJ_dw ~= k = -0.2498750624687629 


## $J = \frac{1}{w^2}$

In [25]:
J, w = symbols('J, w')

Si tienes tiempo, intenta repetir los pasos anteriores sobre la función $J = \frac{1}{w^2}$ y evalúa en w=4

In [34]:
J = 1/ w**2
J

w**(-2)

In [35]:
dj_dw = diff(J)
dj_dw

-2/w**3

In [38]:
dj_dw_4 = dJ_dw.subs([(w,4)])
display(dj_dw_4)
float(dj_dw_4)

-1/16

-0.0625

Compare this with the arithmetic calculation

In [37]:
J = 1/4**2
J_epsilon = 1/(4+0.001)**2
k = (J_epsilon - J)/0.001
print(f"J = {J}, J_epsilon = {J_epsilon}, dJ_dw ~= k = {k} ")

J = 0.0625, J_epsilon = 0.06246876171484496, dJ_dw ~= k = -0.031238285155041345 


<details>
  <summary><font size="3" color="darkgreen"><b>Click for hints</b></font></summary>
    
```python 
J= 1/w**2
dJ_dw = diff(J,w)
dJ_dw.subs([(w,4)])
```
  

</details>

    


## Enhorabuena.
Si usted ha corrido a través de los ejemplos anteriores, usted entiende una derivada describe el cambio en la salida de una función que es el resultado de un pequeño cambio en una entrada a esa función. También puedes usar *SymPy* en python para encontrar la derivada simbólica de funciones.