# Interpolación

Hemos visto que partiendo de una función continua, podemos utilizar una discretización para calcular numéricamente una derivada.

Un problema muy común en el cómputo científico es el problema inverso: tenemos datos discretos, y queremos encontrar una función continua que los aproxime. Una manera de hacer esto es la **interpolación**: 

> Dados datos $(x_i, y_i)$ para $i=1,\ldots,N$, encuentra una función $f(x)$ que pase exactamente por los puntos, es decir, tal que $f(x_i) = y_i$ para cada $i$.

La interpolación provee, entre muchas otras cosas, una manera de formalizar la derivación de diferencias finitas para calcular derivadas, y para llevar a cabo integrales. 
Aunque data de la época de Newton, Lagrange y Gauss, algunos de las técnicas más modernas también se basan en la interpolación, para poder trabajar con funciones de forma numérica.

Podríamos escoger distintas clases de función $f$ con las cuales interpolar. Aquí, escogemos trabajar con **polinomios**, ya que son funciones que entendemos y que son fáciles de manipular.

**[1]** El primer caso que tratar es el de dos puntos $(x_1, y_1)$ y $(x_2, y_2)$; está claro que podemos interpolar entre estos dos puntos con una recta. Aunque probablemente puedes escribir casi directamente cuál recta es, seguiremos el procedimiento siguiente, el cual se generaliza para más puntos:

(i) Define una función $\ell_1(x)$ que es lineal y tal que $\ell_1(x)$ tome el valor $0$ en $x = x_2$. Ahora haz que también tome el valor $1$ en $x = x_1$. Nota que estas dos condiciones determinan la función $\ell_1$ de forma única.

(ii) Por simetría, encuentra la función $\ell_2(x)$ tal que $\ell_2(x_1) = 0$ y $\ell_2(x_2) = 1$.

(iii) Utiliza $\ell_1$ y $\ell_2$ para encontrar un polinomio lineal que interpola los datos.

(iv) Impleméntalo y comprueba gráficamente que sí funciona.

[1] i)

Sea $l_1(x)$ una función lineal, queremos que dado el par $(x_1, x_2)$ se cumpla
$$
l_1(x1) = 1\\
l_1(x2) = 0
$$
Entonces una propuesta aceptable es
$$
l_1(x) = \gamma(x - x_2)\\
l_1(x_1) = \gamma(x_1 - x_2) = 1 \\
\Rightarrow \gamma = \dfrac{1}{x_1 - x_2}
$$
Por lo que la función es
$$
l_1(x) = \dfrac{x - x_2}{x_1 - x_2}
$$

[1] ii)
De manera análoga se tiene
$$
l_2(x) = \dfrac{x - x_1}{x_1 - x_2}
$$

[1] iii)
Se quiere un polinomio que interpole los pares de datos $(x_1, y_1), (x_2, y_2)$ mediante una combinación lineal de las dos funciones anteriormente definidas, es decir
$$
L(x) = \alpha l_1(x) + \beta l_2(x)
$$
Ahora el punto aquí es determinar quiénes son $\alpha$ y $\beta$, pero esto es sencillo, puesto que por como se definieron las funciones $l_1(x)$ y $l_2(x)$, se tiene que
$$
L_(x_1) = \alpha\\
L(x_2) = \beta
$$
La condición para que la función interpole es que $L(x_1) = y_1$ y que $L(x_2) = y_2$, de manera que los coeficientes tienen que ser $\alpha = y_1$, $\beta = y_2$.

Por lo que
$$
L(x) = y_1l_1(x) + y_2l_2(x)
$$

In [1]:
using Plots
using Interact
gr()

Plots.GRBackend()

In [16]:
# [1] iV)
function interpola(x, y)
    x1, x2 = x
    y1, y2 = y
    l1(z) = (1/(x1 - x2)) * (z - x2)
    l2(z) = (1/(x2 - x1)) * (z - x1)
    s(z) = (y1*l1(z) + y2*l2(z))
    return s
end

interpola (generic function with 1 method)

In [3]:
x = [-1, -3]
y = [1, 2]
s = interpola(x, y)
s(2)

-0.5

In [4]:
scatter(x, y)
plot!(s)

**[2]** (i) Si tenemos tres puntos $(x_i, y_i)$ con $i=1, 2, 3$, ¿cuál es grado menor del polinomio que necesitaremos en general para interpolar los tres puntos? 

Lo podemos calcular al generalizar la pregunta [1], de la forma siguiente.

(ii) Encuentra el polinomio $\ell_1$ que satisface $\ell_1(x_2) = \ell_1(x_3) = 0$ y $\ell_1(x_1) = 1$.
Por simetría, encuentra $\ell_2$ y $\ell_3$ que satisfacen que $\ell_j(x_i) = 1$ para $i = j$ y $=0$ para $i \neq j$.

(iii) Construye el polinomio $p$ que interpola los tres puntos, usando tu resultado de (ii). Verifica gráficamente que funciona. ¿De qué grado es el polinomio resultante?


[2] i) El polinomio de grado mínimo para interpolar tres puntos será uno de grado 2, gráficamente dados 3 puntos en general no colineales, es imposible encontrar una recta que pase por los tres, esto sí puede hacerse mediante una parábola, es decir, un polinomio de grado 2.

[2] ii) Se procede igual que en el problema anterior, propongamos
$$
l_1(x) = \gamma(x - x_2)(x - x_3)
$$
Debe cumplir
$$
l_1(x_1) = 1\\
\Rightarrow \gamma = \dfrac{1}{(x_1 - x_2)(x_1 - x_3)}
$$
Por lo que 
$$
l_1(x) = \dfrac{(x - x_2)(x - x_3)}{(x_1 - x_2)(x_1 - x_3)}
$$
Análogamente se encuentran
$$
l_2(x) = \dfrac{(x - x_1)(x - x_3)}{(x_2 - x_1)(x_2 - x_3)}
$$
Y 
$$
l_3(x) = \dfrac{(x - x_1)(x - x_2)}{(x_3 - x_2)(x_3 - x_2)}
$$

[2] iii)
Tras un razonamiento idéntico al del problema [1] iii) se llega a que el polinomio que interpola la tercia de pares $(x_1, y_1), (x_2, y_2), (x_3, y_3)$ es
$$
L(x) = y_1l_1(x) + y_2l_2(x) + y_3l_3(x)
$$

In [5]:
# [2] (iii)
function interpola2(X, Y)
    x1, x2, x3 = X
    y1, y2, y3 = Y
    α1 = 1 / ((x1 - x2) * (x1 - x3))
    α2 = 1 / ((x2 - x1) * (x2 - x3))
    α3 = 1 / ((x3 - x1) * (x3 - x2))
    l1(x) = α1 * (x - x2) * (x - x3)
    l2(x) = α2 * (x - x1) * (x - x3)
    l3(x) = α3 * (x - x1) * (x - x2)
    L(x) = y1*l1(x) + y2*l2(x) + y3*l3(x)
    return L
end

interpola2 (generic function with 1 method)

In [6]:
x = [j for j in 1:20]
y = x .^2
s = interpola2(x, y)

(::L) (generic function with 1 method)

In [7]:
scatter(x, y)
plot!(s)

**[3]** Ahora generalicemos esto a $N$ puntos:

(i) Encuentra un polinomio $\ell_1(x)$ sencillo, tal que $\ell_1(x)$ sea igual a $0$ para $x=x_2$, $x=x_3$, ..., y para $x=x_N$. Ahora normalízalo para que $\ell_1(x_1) = 1$. ¿De qué orden es el polinomio $\ell_1$?

(ii) De manera similar, encuentra $\ell_i(x)$ que sea igual a $1$ en $x_i$, y que se anule en $x_j$ para $j \neq i$.

(iii) Dibuja algunas $\ell_i$ para $N$ chiquitas. ¡Asegúrate de que sí se comporten correctamente!

(iv) Utiliza las $\ell_i$ para interpolar los datos $(x_i, y_i)_{i=1}^N$ con un polinomio $p$. ¿De qué orden es el polinomio resultante? Nota que $p$ es *único* en el conjunto de polinomios con grado $\le$ el grado de $p$.

[3] i) En general la función $l_i(x)$ si se define como en los ejemplos anteriores será un polinomio de grado $n -1$. 

La función que generaliza el procedimiento seguido anteriormente es
$$
l_i(x) = \gamma _i\prod _{\substack{j=1\\ j\neq i}} ^n (x - x_j)
$$

Si se quiere que $l_i(x)$ esté normalizado, entonces
$$
l_i(x_i) = \gamma_i\prod _{\substack{j=1\\ j\neq i}} ^n (x_i - x_j) = 1\\
\Rightarrow \gamma_i = \dfrac{1}{\prod _{\substack{j=1\\ j\neq i}} ^n (x_i - x_j)}
$$

**[4]** (i) Escribe una función `interpolar` que acepta un vector de $N$ pares $(x_i, y_i)$, y regresa una función que las interpole. [Pista: Puedes ¡definir una función adentro de la función `interpolar`!, y luego ¡regresar esta función de la función `interpolar`!]

(ii) Toma funciones polinomiales $f$ de orden $n$ con distintos valores de $n$, y genera $n+1$ datos al muestrear la función en puntos $x_i$ espaciados de forma uniforme. [Es decir, calcula los pares $(x_i, f(x_i))$.] Dibuja la función original y la función interpolada.

(iii) Ahora toma funciones que *no sean* polinomiales, y haz lo mismo. ¿Qué observas?

In [2]:
# [4] i)
function lp(x0, p, X)
    α = 1.
    l = 1.
    for i in 1:length(X)
        if i == p
            continue
        end
        α *= X[p] - X[i]
        l *= x0 - X[i]
    end
    return l / α
end

lp (generic function with 1 method)

In [3]:
# [4] i)
function interpola3(X)
    x = [x for (x, _) in X]
    y = [y for (_, y) in X]
    function L(s)
        lps = [lp(s, i, x) for i in 1:length(y)]
        return dot(lps, y)
    end
    return L
end

interpola3 (generic function with 1 method)



In [30]:
# [4] ii)
pol_grad_2(x) = x^2
x = 1:3
y = pol_grad_2.(x)
pol_interpola = interpola3(zip(x, y))
plot(pol_interpola)
plot!(pol_grad_2)

In [29]:
# [4] ii)
pol_grad_3(x) = x^3
x = 1:4
y = pol_grad_3.(x)
pol_interpola = interpola3(zip(x, y))
plot(pol_interpola)
plot!(pol_grad_3)

Se observa aquí que ambos polinomios coinciden a la perfección.

In [76]:
# [4] iii)
x = 0:10
y = sin.(x)
pol_interpola = interpola3(zip(x, y))
plot(pol_interpola, xlims=(0,10), ylims=(-1,1))
plot!(sin)

**[5]** Considera la función de Runga, $f(x) = \frac{1}{1+25x^2}$, en la región $x \in [-1, 1]$. Interpólala con tu función `interpolar` para distintos números $N$ de puntos. ¿Qué observas? Utiliza `@manipulate`. 

Le que observaste en [4] se llama el **fenómeno de Runge**. Esto demuestra que en general *es una muy mala idea* el utilizar puntos espaciados de forma igual para interpolar. 

Sin embargo, resulta que el problema no es la interpolación en sí, sino la elección de puntos donde interpolar.

In [77]:
# [5]
f(x) = 1/(1 + 25x^2)
@manipulate for n = 1:20
    x = -1:2/n:1
    y = f.(x)
    s = interpola3(zip(x, y))
    scatter(x, f.(x), xlims=[-1,1])
    plot!(f)
    plot!(s)
end

## Interpolación en puntos espaciados no-uniformemente

Resulta que la solución es tomar puntos en el intervalo $[-1,1]$, espaciados tales que se amontonen cerca de los puntos extremos del intervalo. [La razón por esto se puede entender con la teoría de potenciales ("potential theory"); ver e.g. Trefethen, *Approximation Theory and Approximation Practice*.] 

Lo más común es utilizar los **puntos de Chebyshev** con parámetro $n$, definidos como 

$$x_j := \cos \left( \frac{j \pi}{n} \right) \quad \text{con } 0 \le j \le n.$$

**[6]** (i) Escribe una función que calcula los puntos de Chebyshev para un valor de $n$ dado.

(ii) Escribe una función que interpola una función dada en los puntos de Chebyshev. Grafica los resultados.

(iii) Interpola la función de Runge en los puntos de Chebyshev para distintos valores de $n$. ¿Qué observas?

In [78]:
# [6] i)
function chebyshev_puntos(n)
    xj = [cos((j*π)/n) for j in 0:n]
    return xj
end

chebyshev_puntos (generic function with 1 method)

In [81]:
#[6] ii)
function interpola_cheb(f, n)
    pC = chebyshev_puntos(n)
    pares = zip(pC, f.(pC))
    L = interpola3(pares)
    return L
end

interpola_cheb (generic function with 1 method)

In [82]:
# [6] iii)
f(x) = 1/(1 + 25x^2)
@manipulate for n = 1:40
    x = chebyshev_puntos(n)
    y = f.(x)
    s = interpola_cheb(f, n)
    scatter(x, f.(x), xlims=[-1,1])
    plot!(f)
    plot!(s)
end

**[7]** (i) Dada una función $f$ , calcula numéricamente el error al utilizar la interpolación de Chebyshev $p_n$ con respecto a la función original $f$, dado por la norma

$$\|f - p\|_{\infty} := \sup_x |f(x) - p(x)|,$$

para distintos números de puntos de Chebyshev.

Conforme se aumenta el número de puntos, ¿cómo es la convergencia a $0$ del error?  

(ii) Resulta que la tasa de convergencia depende de qué tan suave es la función.
Por ejemplo, inténtalo con la función `abs` y con la función `floor`.

In [83]:
# [7] i)
function dif(dom, n, f)
    interpola = interpola_cheb(f, n)
    norma = maximum(abs.(f.(dom) - interpola.(dom)))
    return norma
end

dif (generic function with 1 method)

[7] ii)

In [84]:
@manipulate for j=1:30
    runge(x) = 1/(1 + 25x^2)
    dif(-1:1, j, runge)
end


0.09932185795194193

In [87]:

@manipulate for j=1:30
    dif(-1:1, j, abs)
end

0.06666666666666651

In [88]:
@manipulate for j=1:30
    dif(-1:1, j, floor)
end

0.5333333333333338

## Interpolación baricéntrica 

La técnica de interpolación que hemos demostrado hasta ahora no es práctica. Una versión práctica se llama la **interpolación baricéntrica**, que consiste en una manera de reescribir las cosas para que sea más eficiente. El desarrollo se puede encontrar [en este artículo](https://people.maths.ox.ac.uk/trefethen/barycentric.pdf), escrito por [Nick Trefethen](https://people.maths.ox.ac.uk/trefethen), uno de los analistas numéricos más influyentes del mundo. El artículo es muy accesible.

**[8]** Lee las secciones 3 y 4 del artículo para entender la derivación de las siguientes fórmulas.
También lee la introducción para entender el panorama histórico.

Dados puntos $x_i$, y valores $f_i := f(x_i)$, se llega a la siguiente fórmula bonita para evaluar el polonimio interpolador $p$ en el punto $x$:

$$p(x) = \frac{ \sum_{j=0}^n \frac{w_j}{x - x_j} f_j } 
{\sum_{j=0}^n\frac{w_j}{x - x_j}}.$$

Aquí, los $w_j$ son pesos dados por
$$w_j = \frac{1}{\prod_{k\neq j} (x_j - x_k)}.$$

Para los puntos de Chebyshev definidos arriba, se puede mostrar que
$$w_j = (-1)^j \delta_j,$$
con $$\delta_j = \begin{cases} \textstyle \frac{1}{2}, \quad \text{si } j=0 \text{ o } j=n;\\
                                1, \quad \text{si no}
                 \end{cases}.
                 $$

**[9]** (i) Implementa la interpolación baricéntrica en los puntos de Chebyshev, usando la fórmula explícita para las $w_j$. Verifica que funcione. Intenta hacer que sea lo más eficiente posible; es decir, no recalcules de nuevo algo que ya calculaste.

(ii) Compara la velocidad con la implementación anterior.

In [111]:
# [9] i)
function interpola_bar(x, y)
    n = length(x)
    ws = []
    for j = 0:n
        if j == 0 | j == n
            push!(ws, (-1)^j * (1/2))
        else
            push!(ws, (-1)^j)
        end
    end
    function p(s)
        cocientes = [ws[j] / (s - x[j]) for j in 1:length(x)]
        print(cocientes)
        return dot(cocientes, y) / sum(cocientes)
    end
    return p
end
        

interpola_bar (generic function with 1 method)

Ojo con la def. en $x = x_j$ los coef. divergen.

## Tema de actualidad

Lo que hemos logrado es el aproximar una función continua $f$ por un conjunto discreto de sus valores $f(x_i)$ en la **malla** (posiblemente no-uniforme) $(x_i)_{i=1}^N$. Ahora podríamos manipular la función ¡al manipular sólo estos valores discretos!

Resulta que es más útil **cambiar de base** en el espacio de polinomios, y utilizar los **polinomios de Chebyshev**. 

La idea es escribir el polinomio interpolante como una suma de polinomios de Chebyshev y examinar los coeficientes de estos polinomios, que tienen propiedades muy útiles. El campo se llama aproximación de Chebyshev, y es un tema sumamente importante hoy día. Hay una implementación en Julia en el paquete https://github.com/JuliaApproximation/ApproxFun.jl, pero el hacer una parte ¡podría hacer un buen proyecto final!