# Diferencias finitas: cálculo numérico de derivadas

En el último notebook, vimos que el método de Newton requiere conocer la derivada de una función.
En este notebook, veremos una manera (no necesariamente la mejor) de calcular derivadas de funciones de forma numérica: las llamadas **diferencias finitas**.

## Derivadas de funciones uni-dimensionales

[1] Considera una función uni-dimensional $f: \mathbb{R} \to \mathbb{R}$, y supón que es suficientemente diferenciable para que las derivadas que tomemos estén definidas [por ejemplo, de clase $C^2$].

Escribe, usando notación LaTeX, la definición de la derivada $f'(a)$ de $f$ en el punto $a$, como límite cuando la variable $h$ tiende a $0$.

$$ f'(a) = \lim_{h\to 0} \frac{f(a+h) - f(a)}{h} $$

[2] Desgraciadamente, **no podemos llevar a cabo el proceso de límite en la computadora**. (Intuitivamente, podemos decir que el proceso de límite es **continuo**, mientras que la computadora maneja cantidades **discretas**.)

(i) ¿Cuál solución se te ocurre para esto en términos de la variable $h$? 

La expresión $f(a+h) - f(a)$ se llama una **diferencia para adelante** ("forward difference"), y cuando lo dividimos por $h$ se llama un **cociente de diferencias** ("difference quotient"). 

(ii) ¿Geométricamente, a qué corresponde una diferencia de este tipo? ¿Y un cociente de diferencias?

**R:** (i) Hacer este proceso dentro de un for, con h muy pequeñas, tendiendo a cero.

(ii) Una diferencia para adelante es qué tanto varía la imagen de la función al modificar el argumento un paso muy chiquito. El cociente de diferencias nos dice qué tanto varía la imagen de la función en un paso chiquito con respecto a un paso chiquito en el argumento.

[3] (i) Escribe una función que implemente una diferencia para adelante para una función $f$, punto $a$ y paso $h$ dadas.

(ii) Para distintas funciones $f$, grafica la función $f$, su derivada analítica $f'$, y la aproximación a $f'$ usando diferencias finitas.

In [1]:
###(i)
function forw_diff(f::Function, a::Float64,h::Float64 = 0.00001)
   forw_diff = f(a + h) - f(a)
    return forw_diff
end

forw_diff(x -> 2x^2 - 1,2.0,0.001)

0.008001999999999398

In [2]:
g(x) = 3x^3 - 2x^2 + x + 3
dg(x) = 9x^2 - 4x + 1

dg (generic function with 1 method)

In [3]:
function derivada_en_a(f::Function, a::Float64, h::Float64 = 0.00001)
   deriv = forw_diff(f, a, h)/h
    return deriv
end

 """ Calcula la derivada de una función f en un intervalo."""
function derivada(f::Function, rango, h::Float64 = 0.00001)
    df=Float64[]
    for a in rango
        df_a = derivada_en_a(f,a,h)
        push!(df,df_a)
    end
    return df
end

derivada

In [4]:
using Plots
gr();

In [5]:
rango1 = collect(-5.0:0.1:5.0)

plot(rango1,g)
plot!(rango1, dg)
scatter!(rango1, derivada(g,rango1), markersize=1)

[4] (i) Calcula el error desde el valor analítico que se comete al utilizar la aproximación de la derivada al tomar una $f$ y $a$ dadas, y variar $h$, usando la función `logspace` para que los valores de $h$ estén espaciados de forma logarítmica. Hazlo para diferentes funciones. (¡Escribe una función que haga el cálculo!) ¿Qué podría causar este efecto?

(ii) ¿Para qué clase de funciones será el resultado exacto? Demuéstralo gráficamente. Así, qué tipo de **aproximación local** de la función estamos usando? 

In [6]:
##(i)
function errores_deriv(f::Function, df::Function, a::Float64)
    diferencia = 0.
    errores = Float64[]
    for h in logspace(-2,-30,100)
    diferencia = abs( df(a) - derivada_en_a(f,a,h) )
        push!(errores,diferencia)
    end
    return errores
end

errores_deriv (generic function with 1 method)

In [7]:
errores_deriv(g,dg,2.0);

In [8]:
rangolog = logspace(-2,-30,100);

In [9]:
plot(rangolog,errores_deriv(g,dg,2.0), xscale=:log10, yscale=:log10, marker=:auto)

In [10]:
using Interact;

In [11]:
@manipulate for fun in [log, g, sin, x-> 4x], dfun in [x->1/x, dg, cos, x-> 4]
    scatter(rangolog ,errores_deriv(fun,dfun,2.0), xscale=:log10, yscale=:log10, line=(:line,1), marker=(:auto,4))
end #las funciones y sus derivadas están por pares, hay que cambiar fun y dfun uno a uno para ver las gráficas

In [12]:
##(ii)
rangolog2 = logspace(-2,-60,100)
@manipulate for fun in [x-> 7x, x->5x + 6 , x->23x + 1.43, x-> 4x], dfun in [x->7, x->5, x->23, x-> 4]
    scatter(rangolog2 ,errores_deriv(fun,dfun,2.0), xscale=:log10, yscale=:log10, line=(:line,1), marker=(:auto,4))
end

Como podemos ver en las gráficas de arriba el resultado se sigue aproximando para muchos órdenes de magnitud por debajo del punto óptimo para las demás funciones (no explota debido a error numérico), pero esto sólo se cumple para funciones lineales para las cuales una diferencia hacia adelante es el resultado exacto. Esto nos dice que estamos usando una aproximación local lineal de las funciones.

[5] (i) Desarrolla $f(a + h)$ en una serie de Taylor con término complementario de Lagrange. Así, rederiva la expresión aproximada que ya obtuviste para la derivada, pero ahora con información *analítica* sobre **el tamaño del error** que cometes cuando utilizas esta aproximación (asintóticamente cuando $h \to 0$). Si el error va como $C.h^n$, con $C$ una constante, entonces escribimos $\mathcal{O}(h^n)$. 

(ii) Verifica que coinicide con lo que encontraste numéricamente.

[6] Una mejor aproximación (¿a qué nos referimos con eso?) es la **diferencia centrada**: expande $f(a+h)$ y $f(a - h)$ en series de Taylor separadas. Así, deriva una mejor aproximación a la primera derivada. Calcula su error y chécalo numéricamente.  ¿Para qué tipo de funciones es exacta? 

[7] Encuentra una aproximación para la segunda derivada y encuentra su error; chécalo numéricamente. 

## Funciones multi-dimensionales 

Ahora consideremos una función $f: \mathbb{R}^2 \to \mathbb{R}$ y $g: \mathbb{R}^2 \to \mathbb{R}^2$.

[8] ¿Qué tipo de derivadas quisiéramos poder calcular para $f$ y $g$? ¿Cómo podemos utilizar lo que ya hicimos para funciones uni-dimensionales para aplicarlo directamente a $f$ y $g$?

Para $f$ y $g$ lo primero que querríamos calcular son sus derivadas parciales $\frac{\partial f}{\partial x_i}$ ó $\frac{\partial g_i}{\partial x_j}$ respectivamente, para así poder construir otros tipos de derivadas, ya sea el gradiente, la divergencia, el rotacional, el laplaciano, etc. .

[9] Impleméntalo y compara con funciones cuyas derivadas conoces analíticamente.

## De regreso al método de Newton

[10] Utiliza una diferencia finita, con una $h$ pequeña, para aproximar la derivada en el método de Newton. ¿Cómo afecta el utilizar una aproximación de la derivada, en lugar del valor exacto, en la tasa de convergencia? Compara los resultados al utilizar los dos tipos de diferencias finitas (para adelante y centrada).

## Optimización

Una tarea importante es la **optimización**, es decir, encontrar máximos y mínimos de funciones.

[11] Escribe una función que toma una función $f:\mathbb{R} \to \mathbb{R}$ lisa (es decir, suficientemente diferenciable), y utiliza lo que hemos visto para encontrar:
(i) los valores de $x$ en los cuales la función toma su valor máximo y mínimo;
(ii) el valor ahí;
(iii) si es un máximo o un mínimo.

[Pista: ¿Cuáles son las condiciones matemáticas que se deben cumplir para (i) y (iii)?]