# Derivadas superiores

Hasta ahora hemos visto que, usando diferenciación automática, podemos calcular la derivada de funciones de una variable esencialmente con un error del orden del epsilon de la máquina.

La pregunta que abordaremos ahora, es cómo hacer para calcular la segunda derivada, y derivadas de orden superior.

Una posibilidad, específica para el caso de la segunda derivada, es proceder como en el caso anterior, es decir, definir una *terna ordenada* donde la primer componente es el valor de la función en $x_0$, i.e., $f(x_0)$, el de la segunda es el valor de la primer derivada $f'(x_0)$, y la tercer componente tiene el valor de la segunda derivada, $f^{(2)}(x_0) = f''(x_0)$. 


Con esta definición, las operaciones aritméticas vienen dadas por:

\begin{eqnarray}
\vec{u} + \vec{v} & = & (u + v, \quad u'+ v', \quad u''+v''),\\
\vec{u} - \vec{v} & = & (u - v, \quad u'- v', \quad u''-v''),\\
\vec{u} \times \vec{v} & = & (u v, \quad u v' + u' v, \quad u v'' + 2 u' v' + u'' v),\\
\frac{\vec{u}}{\vec{v}} & = & \Big( \frac{u}{v}, \quad \frac{u'-( u/v) v'}{v}, \quad 
\frac{u'' - 2 (u/v)' v' - (u/v)v'' }{v}\Big).\\
\end{eqnarray}

Claramente, este proceso es muy ineficiente para derivadas de orden aún más alto, dado que las expresiones se complican y es fácil cometer errores.

# Series de Taylor

El punto importante a recordar, es que las derivadas de orden superior de una función $f(x)$ en un punto $x_0$ están contenidas en el desarrollo de Taylor de la función entorno a ese punto. La suposición importante en esto es que $f(x)$ es suficientemente suave; por simplicidad supondremos que $f(x)$ es ${\cal C}^\infty$ y que estamos suficientemente cerca del punto $x_0$, i.e., $|x-x_0|\ll 1$. 


La serie de Taylor de $f(x)$ viene dada por

\begin{eqnarray}
f(x) & = & f(x_0) + f^{(1)}(x_0) (x-x_0) + \frac{f^{(2)}(x_0)}{2!} (x-x_0)^2 + \dots + \frac{f^{(k)}(x_0)}{k!} (x-x_0)^k + \dots,\\
& = & f_{[0]} + f_{[1]} (x-x_0) + f_{[2]} (x-x_0)^2 + \dots + f_{[k]} (x-x_0)^k + \dots,\\
\end{eqnarray}

donde los coeficientes *normalizados* de Taylor $f_{[k]}$ que aparecen en la segunda línea de la ecuación anterior se definen como

\begin{equation}
f_{[k]} = \frac{f^{(k)}(x_0)}{k!} = \frac{1}{k!}\frac{{\rm d}^k f}{{\rm d}x^k}(x_0).
\end{equation}



Vale la pena **enfatizar** que la expresión anterior es exacta en tanto que la serie **no** sea truncada. En el caso de que la serie truncada a orden k, el [teorema de Taylor](https://en.wikipedia.org/wiki/Taylor%27s_theorem) asegura que el residuo (error del truncamiento) se puede escribir como:

\begin{equation}
{\cal R_{k}} = \frac{f^{(k+1)}\,(\xi)}{(k+1)!} (x-x_0)^{k+1},
\end{equation}

donde $\xi$ es un punto que pertenece al interval $[x_0,x]$.


Si la serie es truncada, la aproximación es un polinomio de orden $k$ (grado máximo es $k$) en $x$. Dado que los polinomios en una variable están definidos por $k+1$ coeficientes, entonces pueden ser mapeados a vectores en $\mathbb{R}^{k+1}$. 

Las operaciones aritméticas, en este caso, vienen dadas por:

\begin{eqnarray}
(f+g)_{[k]} & = & f_{[k]} + g_{[k]} ,\\
(f-g)_{[k]} & = & f_{[k]} - g_{[k]} ,\\
(f \cdot g)_{[k]} & = & \sum_{i=0}^k f_{[i]} \,g_{[k-i]} \, ,\\
\Big(\frac{f}{g}\Big)_{[k]} & = & \frac{1}{g_{[0]}}
\Big( f_{[k]} - \sum_{i=0}^{k-1} \big(\frac{f}{g}\big)_{[i]} \, g_{[k-i]} \Big) . \\
\end{eqnarray}

### Ejercicio

Implementen una nueva estructura paramétrica (`type`) que defina el tipo `Taylor`, donde el parámetro debe ser un subtipo de `Number`. Definan métodos que implementen las operaciones aritméticas básicas (`+`, `-`, `*`, `/`) y la igualdad (`==`). Esto deberá ser incluido en un módulo.

Incluyan pruebas (en el archivo "runtests.jl") para cada uno de los métodos que implementen.


In [1]:
"""
Taylor

Es un tipo parametrizado por subtipos de Number. Consiste en una entrada
vecotrial Taylor.taylor_vec donde se mapean los primeros k coeficientes
de Taylor. La k escogida en esta estructura en particular es 10 y está
implementada para que si se mete un arreglo con menos de 10 entradas se
complemente con ceros restantes y si se mete un arreglo con más de 10 
entradas se tomen sólo las primeras 10.
"""
type Taylor{T<:Number}
    # Aquí se declara taylor_vec que es un Array unidimensional de tipo T.
    taylor_vec::Array{T, 1}
    
    # Aquí hay un constructor interno que lo que va a hacer es tomar el
    # arreglo taylor_vec y ver si tiene un tamaño mayor o menor que la
    # k que es donde se trunca la serie (en este caso k = 10).
    function Taylor(taylor_vec::Array{T, 1})
        if size(taylor_vec, 1) < 10
            # Si hay menos de k entradas, se utiliza vcat para meter ceros 
            # restantes en taylor_vec y luego se reconstruye.
            taylor_vec = vcat(taylor_vec, zeros(T, 10 - size(taylor_vec,1)))
            new(taylor_vec)
            else
            # En caso contrario se seleccionan las primeras k entradas.
            taylor_vec = taylor_vec[1:10]
            new(taylor_vec)
        end
    end
end

# Este es un constructor externo para evitar problemas de conversión. Véase:
# http://docs.julialang.org/en/release-0.4/manual/constructors/
# Específicamente la sección de Parametric Constructors.
Taylor{T<:Number}(taylor_vec::Array{T, 1}) = Taylor{T}(taylor_vec)

# Adicionalmente se declara un método para tener Taylor para un escalar.
Taylor{T<:Number}(a::T) = Taylor(a*ones(T,1))

Taylor{T<:Number}

Por ejemplo, si ponemos la serie con 15 entradas se ve que se corta hasta 10 coeficientes:

In [2]:
Taylor(ones(Int, 15))

Taylor{Int64}([1,1,1,1,1,1,1,1,1,1])

En cambio, si metemos un número insuficiente también se arregla:

In [4]:
Taylor(ones(Float64, 4))

Taylor{Float64}([1.0,1.0,1.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0])

Finalmente, la implementación escalar funciona adecuandamente:

In [3]:
Taylor(2)

Taylor{Int64}([2,0,0,0,0,0,0,0,0,0])

In [29]:
import Base: +, -, *, /, ==

# La suma entre los dos Taylors y entre un escalar.
+(a::Taylor, b::Taylor) = Taylor(a.taylor_vec + b.taylor_vec)
+(a::Taylor, b::Number) = a + Taylor(b)
+(a::Number, b::Taylor) = Taylor(a) + b
# La resta se implementa igualmente.
-(a::Taylor, b::Taylor) = Taylor(a.taylor_vec - b.taylor_vec)
-(a::Taylor, b::Number) = a - Taylor(b)
-(a::Number, b::Taylor) = Taylor(a) - b
# Los operadores unitarios y la comparación.
+(a::Taylor) = a
-(a::Taylor) = Taylor(-a.taylor_vec)
==(a::Taylor, b::Taylor) = a.taylor_vec == b.taylor_vec
# La mutiplicación se implementa usando dos for's. El primero que va
# desde 1, size(a.taylor_vec, 1) construye el arreglo entero de k 
# elementos. El segundo for anidado es la suma que se da en la teoría
# de arriba. Sólo hay que tener cuidado porque los índices empiezan en
# uno y no en cero como en la teoría.
*(a::Taylor, b::Taylor) = Taylor([sum([a.taylor_vec[i]*b.taylor_vec[k-i+1] 
        for i in range(1,k)]) for k in range(1,size(a.taylor_vec,1))])
/(a::Taylor, b::Taylor) = Taylor((1/b.taylor_vec[1])[(a.taylor_vec[k]-sum([for i in range(1,k)]))for k in range(1, size(a.taylor_vec,1))])
"""
# La división resulta ser un poco más complicada así que se opta por
# definirla en una función explícita y luego meterla en el método de /.
function taylor_division(a::Taylor, b::Taylor)
    # Lo primero que se hace es construir el arreglo de la división que
    # sea del mismo tamaño de k elementos y lleno de ceros enteros.
    # Enteros para que se puedan promover en el caso de que los arreglos
    # sean de tipo Float, Complex, etc.
    div_vec = 0*a.taylor_vec
    # El primer elemento es sencillamente:
    div_vec[1] = a.taylor_vec[1]/b.taylor_vec[1]
    # De esta manera nos evitamos problemas con la suma que iría sobre un
    # rango 1 a 0.
    # Ahora podemos llenar los elementos que falta. Nuestro rango empieza
    # en 2 pero es de longitud(div_vec,1) -1:
    for k in range(2, size(div_vec,1)-1)
        # sd será la suma que aparece en la ecuación, inicializada como cero.
        sd = 0
        # Con el siguiente for se ejecuta la suma.
        for i in range(1,k-1)
            # Esta es la parte delicada de la división. La fórmula que 
            # tenemos cosidera el elemento (f_i/g_i)*g_{k-i}. Bien puede suceder
            # que g_i = 0 pero si 
            if b.taylor_vec[i] == 0 & b.taylor_vec[i+1] == 0
                continue
            else
                sd = sd + (a.taylor_vec[i]/b.taylor_vec[i])*b.taylor_vec[k-i+1]
            end
        end
        div_vec[k] = (1/b.taylor_vec[1])*(a.taylor_vec[k]-sd)
    end
    return Taylor(div_vec)
end
        
/(a::Taylor, b::Taylor) = taylor_division(a,b)
"""


"# La división resulta ser un poco más complicada así que se opta por\n# definirla en una función explícita y luego meterla en el método de /.\nfunction taylor_division(a::Taylor, b::Taylor)\n    # Lo primero que se hace es construir el arreglo de la división que\n    # sea del mismo tamaño de k elementos y lleno de ceros enteros.\n    # Enteros para que se puedan promover en el caso de que los arreglos\n    # sean de tipo Float, Complex, etc.\n    div_vec = 0*a.taylor_vec\n    # El primer elemento es sencillamente:\n    div_vec[1] = a.taylor_vec[1]/b.taylor_vec[1]\n    # De esta manera nos evitamos problemas con la suma que iría sobre un\n    # rango 1 a 0.\n    # Ahora podemos llenar los elementos que falta. Nuestro rango empieza\n    # en 2 pero es de longitud(div_vec,1) -1:\n    for k in range(2, size(div_vec,1)-1)\n        # sd será la suma que aparece en la ecuación, inicializada como cero.\n        sd = 0\n        # Con el siguiente for se ejecuta la suma.\n        for i in rang

$2 + 2x$

$1 + x + x^2 + x^3 + x^4 + x^5 + x^6 + x^7$

In [32]:
a = Taylor([2,2])
b = Taylor(ones(8))
c = Taylor(2)
b*c

LoadError: LoadError: MethodError: `*` has no method matching *(::Taylor{Float64}, ::Float64)
Closest candidates are:
  *(::Any, ::Any, !Matched::Any, !Matched::Any...)
  *{T<:Number}(!Matched::Bool, ::T<:Number)
  *(!Matched::Float64, ::Float64)
  ...
while loading In[32], in expression starting on line 4

In [12]:
?range

search: 

```
range(start, [step], length)
```

Construct a range by length, given a starting value and optional step (defaults to 1).


range Range RangeIndex nzrange linrange histrange UnitRange StepRange



In [None]:
# Muestren que su código funciona con tests adecuados; para los detalles ver 
# http://julia.readthedocs.org/en/release-0.4/stdlib/test/
using Base.Test


# Funciones de polinomios

El siguiente punto, es cómo definir funciones de polinomios. 

Como veremos aquí, esto se basará en plantear una ecuación diferencial apropiada, cuya solución es, precisamente, la expresión que estamos buscando. Este punto es *importante*, y muestra que hay una conexión importante con la solución de ecuaciones diferenciales.

Como ejemplo consideraremos la función

\begin{equation}
E(x) = \exp\big(g(x)\big),
\end{equation}

donde 

\begin{equation}
g(x) = \sum_{k=0}^\infty g_{[k]} (x-x_0)^k
\end{equation}

está escrita como una serie de Taylor (¡exacta!) alrededor de $x_0$. 


El primer punto, es que escribiremos a $E(x)$ como una serie de Taylor alrededor de $x_0$, es decir,

\begin{equation}
E(x) = \sum_{k=0}^\infty E_{[k]} (x-x_0)^k.
\end{equation}

El objetivo es determinar $E_{[k]}$ para *toda* $k$.

Dado que $E(x)$ esun polinomio en $x$, su derivada viene dada por

\begin{equation}
\frac{{\rm d} E(x)}{{\rm d}x} = \sum_{k=1}^\infty k E_{[k]}\, (x-x_0)^{k-1} .
\end{equation}

Por otra parte, la derivada de $E(x)$ en términos de $g(x)$ está dada por

\begin{equation}
\frac{{\rm d} E(x)}{{\rm d}x} = \exp\big(g(x)\big) \frac{{\rm d} g(x)}{{\rm d}x} = E(x) \frac{{\rm d} g(x)}{{\rm d}x},
\end{equation}

donde del lado derecho aparece la derivada de $g(x)$. Ya que $g(x)$ *también* está escrita en forma polinomial, su derivada es

\begin{equation}
\frac{{\rm d} g(x)}{{\rm d}x} = \sum_{k=1}^\infty k g_{[k]}\, (x-x_0)^{k-1} .
\end{equation}


Tenemos, entonces, todo lo que requerimos para escribir el lado derecho de la ecuación diferencial y explotar la aritmética de polinomios. 

\begin{eqnarray}
E(x) \frac{{\rm d} g(x)}{{\rm d}x}& = & 
\Big[ \sum_{k=0}^\infty E_{[k]} (x-x_0)^k \Big]
\Big[ \sum_{j=1}^\infty j g_{[j]} (x-x_0)^{j-1}\Big] \\
 & = & \sum_{k=1}^\infty \Big[ \sum_{j=0}^k j g_{[j]} E_{[k-j]} \; \Big] (x-x_0)^{k-1} .\\
\end{eqnarray}

La segunda línea se obtiene reordenando los términos al fijar la potencia de $(x-x_0)$, esto es, $k+j$ se toma como un nuevo índice ($k$), y el nuevo índice $j$ describe el índice del producto de los polinomios. (La potencia se deja de la forma $k-1$ ya que el lado izquierdo de la ecuación aparece así.)

Igualando con el lado izquierdo de la ecuación diferencial, que sólo involucra a la derivada de $E(x)$, tenemos que se debe cumplir

\begin{equation}
E_{[k]} = \frac{1}{k} \sum_{j=0}^k j g_{[j]} \, E_{[k-j]} = 
\frac{1}{k} \sum_{j=0}^{k} (k-j) g_{[k-j]} \, E_{[j]}, \qquad k=1,2,\dots,
\end{equation}

incluyendo *la condición inicial*

\begin{equation}
E_{[0]} = \exp\big(g(x_0)\big).
\end{equation}

Estas relaciones *de recurrencia* permiten calcular $\exp\big(g(x)\big)$, para cualquier polinomio $g(x)$.

Para el caso concreto $g(x) = x$ alrededor de $x_0=0$, donde tenemos $g_{[j]} = \delta_{j,1}$, obtenemos

\begin{eqnarray}
E_{[0]} & = & 1,\\
E_{[k]} & = & \frac{1}{k} E_{[k-1]} = \frac{1}{k(k-1)} E_{[k-2]} = \dots = \frac{1}{k!} E_{[0]} = \frac{1}{k!}\ ,
\end{eqnarray}

que es el resultado bien conocido.

### Ejercicio

Obtengan las relaciones de recurrencia para las funciones $L(x) = \log\big(g(x)\big)$, $P_\alpha(x) = \big(g(x)\big)^\alpha$, $S(x) = \sin\big(g(x)\big)$, $C(x) = \cos\big(g(x)\big)$ usando el mismo procedimiento que arriba. Implementen métodos adecuados para estas funciones en el módulo, actuando sobre estructuras `Taylor` e incluyan pruebas.

**NOTA** Los ejercicios de este notebook constituyen el contenido de la Tarea6.