# Diferenciación automática

La **diferenciación automática** es una técnica para calcular derivadas numéricas de forma automática.

Supongamos que queramos encontrar la derivada $f'(a)$ de la función $f$ en el punto $a$.

- Expandamos $f(x)$ cerca de $x=a$, con Taylor:
    
    $$ f(x) \simeq f(a) + (x - a) \, f'(a)  + \cdots$$
    

- A primer orden, la información que requerimos de la función $f$ es un par ordenado:

    $$ f \rightsquigarrow ( \, f(a), \, f'(a) \, ) $$

Esto lo representamos en Julia al definir un **nuevo tipo**:

In [1]:
struct Dual
    valor::Float64
    deriv::Float64
end

In [2]:
d = Dual(1.0, 2.0)

Dual(1.0, 2.0)

Esto representa una función con valor $f(a) = 1.0$ y derivada $f'(a) = 2.0$; esta combinación a menudo se llama un **número dual**. 

Nota que no representamos $a$ explícitamente (aunque podríamos). Además, un número dual representa *cualquier* función con los mismo valores de $f(a)$ y $f'(a)$; o bien, representa el conjunto de *todas* las funciones con estas propiedades, llamado un [**jet**](https://en.wikipedia.org/wiki/Jet_(mathematics).

Ahora le enseñaremos a Julia cómo hacer aritmética con estos objetos nuevos:

In [3]:
import Base: +, *, -

In [14]:
+(a::Dual, b::Dual) = Dual(a.valor+b.valor, a.deriv+b.deriv)

*(a::Dual, b::Dual) = Dual(a.valor*b.valor, a.deriv*b.valor + a.valor*b.deriv)
*(b::Number, a::Dual) = Dual(a.valor*b, a.deriv*b)


-(a::Dual, b::Number) = Dual(a.valor - b, a.deriv)

- (generic function with 195 methods)

En Julia, una **función** consiste en una colección de **métodos**; cada método actúa sobre una combinación diferente de tipos de objeto.

In [5]:
methods(+)

## Diferenciación automática con funciones duales

Ahora podemos usar los `Dual`es para derivar funciones usuales de Julia, e.g.

In [6]:
f(x) = x^2 - 2    # una función común y corriente de Julia

f (generic function with 1 method)

Definiremos un objeto que representa la variable independiente `x`, o la función identidad $x \to x$. Su valor en $a$ es $a$, y su derivada es $1$:

In [7]:
a = 3
xx = Dual(a, 1)  # identity function

Dual(3.0, 1.0)

Ahora metemos el objeto `xx` a la función `f`. Utilizará las reglas sobre `Dual`es que ya definimos:

In [9]:
yy = f(xx)

Dual(7.0, 6.0)

Vemos que el resultado es un `Dual` nuevo. 
La primera entrada es el valor de `f(a)`, y la segunda entrada es la derivada `f'(a)`.

Así, podemos hacer una función `derivar`:

In [10]:
function derivar(f, a)
    xx = Dual(a, 1)
    
    yy = f(xx)
    
    return yy.deriv
end


derivar (generic function with 1 method)

In [15]:
derivar(x->x^3 + 2x^2, 1)

7.0

## El paquete `ForwardDiff`

El paquete `ForwardDiff.jl` provee una implementación de clase mundial de la diferenciación automática ("para adelante"):

In [16]:
using ForwardDiff

ForwardDiff.derivative(x->x^3 + 2x^2, 1)

7