# Interpolación

En el notebook 7, vimos cómo utilizar una discretización de una función continua para calcular numéricamente una derivada.

Un problema muy común en el cómputo científico es el problema opuesto: tener datos discretos, y querer encontrar una función continua que los aproxime. Una manera de hacer esto es la **interpolación**: 

> dados datos $(x_i, y_i)$ para $i=1,\ldots,N$, queremos encontrar una función $f(x)$ que pasa exactamente por los puntos, es decir, tal que $f(x_i) = y_i$ para cada $i$.

Provee, entre muchas otras cosas, una manera de formalizar la derivación de diferencias finitas para calcular derivadas, y para llevar a cabo integrales. Mucho más allá, provee la manera de trabajar con funciones de forma numérica.

Podríamos escoger distintas clases de función $f$ que interpolar. Aquí, trabajaremos con los **polinomios**.

**[1]** El primer caso que tratar es el de dos puntos $(x_1, y_1)$ y $(x_2, y_2)$. Es claro que podemos interpolar dos puntos con una recta. Para encontrar cuál recta es, hacemos lo siguiente.

(i) Define una función $L_1(x)$ que es lineal y tal que $L_1(x)$ tome el valor $0$ en $x = x_2$. Ahora haz que también tome el valor $1$ en $x = x_1$.

(ii) Por simetría, encuentra la función $L_2(x)$ tal que $L_2(x_1) = 0$ y $L_2(x_2) = 1$.

(iii) Utiliza $L_1$ y $L_2$ para encontrar un polinomio lineal que interpola los datos.

(iv) Impleméntalo y dibuja el resultado.

In [1]:
function l1(x, x1, x2)
    l1 = (x - x2)/(x1 - x2)
   return l1
end

function l2(x, x1, x2)
    l2 = (x - x1)/(x2 - x1)
   return l2
end

function l(x, x1, x2, y1, y2)
    l = y1*l1(x,x1,x2) + y2*l2(x,x1,x2)
   return l
end

l (generic function with 1 method)

In [2]:
using Plots
gr()

Plots.GRBackend()

In [3]:
rango = collect(1:0.01:2)
plot(rango, l(rango,1,2,1,2), label="l")
xx = [1,2]
yy = [1,2]
scatter!(xx, yy)

**[2]** Ahora generalicemos esto a $N$ puntos:

(i) Encuentra un polinomio $L_1(x)$ sencillo, tal que $L(x)$ sea igual a $0$ para $x=x_2$, $x=x_3$, ..., $x=x_N$. Ahora normalízalo para que $L_1(x_1) = 1$.

$$ L_1 (x) = \frac{(x - x_2)(x - x_3)...(x - x_n)}{(x_1 - x_2)(x_1 - x_3)...(x_1 - x_n)} $$

In [4]:
function L1(x, xn:: Vector)
    n = length(xn)
    L1 = 1
    for j in 2:n
    L1 *= (x - xn[j])/(xn[1] - xn[j])
    end
   return L1
end

L1 (generic function with 1 method)

In [5]:
L1(6,[1,2,3,4,5,6])

-0.0

(ii) De manera similar, encuentra $L_i(x)$ que sea igual a $1$ en $x_i$, y que se anule en $x_j$ para $j \neq i$.

$$ L_i (x) = \prod_{j}^n \frac{(x - x_j)}{(x_i - x_j)} $$

In [6]:
"""
Polinomio que vale 1 en la entrada i de xn y cero para todos
los demás valores de xn.
"""
function Li(x, xn:: Vector, i)
    n = length(xn)
    Li = 1
    for j in 1:n
        if j==i
            continue
        end
        Li *= (x - xn[j])/(xn[i] - xn[j])
    end
    return Li
end

Li

In [7]:
Li(1,[1,2,3,4,5,6],6)

0.0

In [8]:
Li(2,[1,2,3,4,5,6],2)

1.0

In [9]:
Li(10,[1,2,3,4,5,6],2)

315.0

In [10]:
"""
Polinomio que vale 1 en xi y cero para todos
los valores de xn.
"""
function Li2(x, xn:: Vector, xi)
    n = length(xn)
    Li = 1
    for j in 1:n
        Li *= (x - xn[j])/(xi - xn[j])
    end
    return Li
end

Li2

In [11]:
Li2(2,[1,2,3,4,5,6],20)

0.0

In [12]:
Li2(20,[1,2,3,4,5,6],20)

1.0

Aquí definí dos funciones distintas que hacen lo mismo, una toma una de las entradas del vector y se hace 1 ahí, a la otra se especifica cuál es el punto que queremos sea 1. No sé cuál vaya a ser más útil después.

(iii) Dibuja algunas $L_i$ para $N$ chiquitas. ¡Asegúrate de que sí se comporten correctamente!

In [13]:
rango = collect(1:0.01:6)
for i in 1:6
    p = plot(rango,[Li(x, [1,2,3,4,5,6], i) for x in rango])
    scatter!([Li(x, [1,2,3,4,5,6], i) for x in [1,2,3,4,5,6]])
    display(p)
end

In [14]:
XX = rand(10)*10;

In [15]:
rango2 = linspace(minimum(XX)-1,maximum(XX)+1,10000);

In [16]:
plot(rango2, [Li(x, XX, 2) for x in rango2], ylims=(-0.1,1.1))
scatter!(XX,[Li(x, XX, 2) for x in XX])

(iv) Utiliza las $L_i$ para interpolar los datos $(x_i, y_i)_{i=1}^N$ con un polinomio $p$. ¿De qué orden es el polinomio resultante? Nota que $p$ es *único* en el conjunto de polinomios con grado $\le$ el grado de $p$.

In [17]:
function polXY(x, xn:: Vector, yn:: Vector)
    if length(xn) != length(yn)
        error("Ambos vectores deben ser de la misma dimensión")
    end
    n = length(yn)
    pol = 0.0
    for i in 1:n
        pol += Li(x, xn, i)*yn[i]
    end
    return pol
end

polXY (generic function with 1 method)

In [18]:
polY(1,[1,2,3,4,5,6],[0,.5,3.4,6.8,2.5,3])

LoadError: UndefVarError: polY not defined

In [19]:
function polXY(x, XY:: Array)
    pol = 0.0
    for i in 1:size(XY)[1]
        pol += Li(x, XY[:,1], i)*XY[i,2]
    end
    return pol
end

polXY (generic function with 2 methods)

Escribí el segundo método de la función porque es más fácil visualizar los datos en el vector XY, que en X y Y, y me aseguro de que funcioné igual.

In [20]:
XY = rand(9,2)*10

9×2 Array{Float64,2}:
 9.34475   1.50394
 9.17084   1.45465
 0.100063  1.34032
 2.39073   3.60454
 5.57625   5.80608
 2.13907   5.55615
 4.81353   2.19235
 8.78626   3.98119
 1.7162    9.94555

In [47]:
scatter(XY[:,1],XY[:,2])
XX = linspace(minimum(XY[:,1]),maximum(XY[:,1]), 1000)
plot!(XX, [polXY(x, XY) for x in XX], ylims = (-1,25))

In [48]:
X = XY[:,1]
Y = XY[:,2]

9-element Array{Float64,1}:
 1.50394
 1.45465
 1.34032
 3.60454
 5.80608
 5.55615
 2.19235
 3.98119
 9.94555

In [49]:
XX = linspace(minimum(X[:]),maximum(X[:]), 100)
plot(XX, [polXY(x,X,Y) for x in XX], ylims = (-1,25))
scatter!(X[:],Y[:])

El polinomio resultante debe ser de orden n-1, siendo n el número de puntos $x$ y $y$.

**[3]** (i) Escribe una función `interpolar` que acepta un vector de $N$ pares $(x_i, y_i)$, y regresa una función que las interpole. [Pista: Puedes ¡definir una función adentro de la función `interpolar`!, y luego ¡regresar esta función de la función `interpolar`!]

In [50]:
function interpolar(XY:: Array)
    function polXY(x, XY:: Array)
        pol = 0.0
        for i in 1:size(XY)[1]
            pol += Li(x, XY[:,1], i)*XY[i,2]
        end
        return pol
    end
    return polXY   #¿así?
end   



interpolar (generic function with 1 method)

In [51]:
interpolar(XY)

(::polXY) (generic function with 1 method)

In [26]:
@show interpolar(XY)(.475879,XY)
XY[1,2]

(interpolar(XY))(0.475879,XY) = 16.078328404445926


1.5039399799269138

(ii) Toma funciones polinomiales de orden $n$ diferentes, y genera $n+1$ datos al muestrear la función en distintos puntos $x_i$, espaciados de forma uniforme. Dibuja la función original y la función interpolada.

In [27]:
function puntos_funcion(f :: Function, a:: Float64, b:: Float64, n:: Int64)
    XX = collect(linspace(a,b,n))
    puntos_xy = zeros(length(XX),2)
    for i in 1:length(XX)
        puntos_xy[i,1] = XX[i]
        puntos_xy[i,2] = f(XX[i])
    end
    return puntos_xy
end

puntos_funcion (generic function with 1 method)

In [28]:
CD = puntos_funcion(x->x^2,-10.,10.,10)

10×2 Array{Float64,2}:
 -10.0      100.0    
  -7.77778   60.4938 
  -5.55556   30.8642 
  -3.33333   11.1111 
  -1.11111    1.23457
   1.11111    1.23457
   3.33333   11.1111 
   5.55556   30.8642 
   7.77778   60.4938 
  10.0      100.0    

In [29]:
#aquí grafico con polXY e interpolar, no sé para qué definimos la segunda jaja
scatter(puntos_funcion(x->x^2,-10.,10.,10)[:,2])
plot!([polXY(x, CD) for x in CD[:,1]], linewidth=3)
plot!([interpolar(CD)(x,CD) for x in CD[:,1]], alpha = 0.2, linewidth=10)

(iii) Ahora toma funciones que *no sean* polinomiales, y haz lo mismo. ¿Qué observas?

In [30]:
EF = puntos_funcion(x->sin(x),-10.,10.,100)
scatter(EF[:,1],EF[:,2])
#plot!(EF[:,1],[polXY(x, EF) for x in EF[:,1]])
plot!(EF[:,1],[interpolar(EF)(x,EF) for x in EF[:,1]])

In [31]:
GG = puntos_funcion(x-> 1/(1-x),-10.,10.,100)
scatter(GG[:,1],GG[:,2])
#plot!(GG[:,1],[polXY(x, GG) for x in GG[:,1]])
plot!(GG[:,1],[interpolar(GG)(x,GG) for x in GG[:,1]])

Para el seno observamos que las imágenes de los puntos se amontonan en los valles y crestas, mientras que para $\frac{1}{1-x}$ perdemos detalle al acercarnos a la asíntota.

**[4]** Considera la función de Runge, $f(x) = \frac{1}{1+25x^2}$, en la región $x \in [-1, 1]$. Interpólala con tu función `interpolar` para distintos números $N$ de puntos. ¿Qué observas? Utiliza `@manipulate`. 

In [32]:
runge(x) = 1/(1 + 25x^2)

runge (generic function with 1 method)

In [33]:
using Interact;

In [34]:
@manipulate for n in 2:20
    RR = puntos_funcion(runge,-1.,1.,n)
    scatter(RR[:,1],RR[:,2])
    rangoRR = linspace(-1,1,100)
    plot!(runge, c=:blue, alpha=.5)
    plot!(rangoRR,[interpolar(RR)(x,RR) for x in rangoRR], c=:red, alpha=.6)
    #plot!(rangoRR,[polXY(x, RR) for x in rangoRR], c=:green, alpha=.4)
    
end

Le que observaste en [4] se llama el **fenómeno de Runge**. Demuestra que en general es una mala idea interpolar en puntos espaciados de forma igual. Sin embargo, resulta que el problema no es la interpolación en sí, sino la elección de puntos donde interpolar.

## Interpolación en puntos espaciados no-uniformemente

Resulta que la solución es tomar puntos en el intervalo $[-1,1]$, espaciados tales que se amontonen cerca de los puntos extremos del intervalo. [La razón por esto se puede entender con la teoría de potenciales ("potential theory"); ver e.g. Trefethen, *Approximation Theory and Approximation Practice*.] 

Lo más común es utilizar los **puntos de Chebyshev** con parámetro $n$, definidos como 

$$x_j := \cos \left( \frac{j \pi}{n} \right) \quad \text{con } 0 \le j \le n.$$

**[5]** (i) Escribe una función que calcula los puntos de Chebyshev para un valor de $n$ dado.

In [35]:
function puntos_chebyshev(n:: Int64 = 10)
   return x_j = [-cos(j*pi/n) for j in 0:n]
end
puntos_chebyshev()

11-element Array{Float64,1}:
 -1.0        
 -0.951057   
 -0.809017   
 -0.587785   
 -0.309017   
 -6.12323e-17
  0.309017   
  0.587785   
  0.809017   
  0.951057   
  1.0        

(ii) Escribe una función que interpola una función dada en los puntos de Chebyshev. Grafica los resultados.

In [36]:
function interpol_chebyshev(x, f:: Function, n:: Int64 = 10)
    XX = puntos_chebyshev(n)
    puntos_xy = zeros(length(XX),2)
    for i in 1:length(XX)
        puntos_xy[i,1] = XX[i]
        puntos_xy[i,2] = f(XX[i])
    end
    return polXY(x, puntos_xy)
end

interpol_chebyshev (generic function with 2 methods)

In [37]:
plot([interpol_chebyshev(x,runge,20) for x in -1:0.01:1])

(iii) Interpola la función de Runge con puntos de Chebyshev. ¿Qué observas?

In [38]:
aa = -1:0.01:1
@manipulate for i in 2:20
    cc = puntos_chebyshev(i)
    scatter(cc,runge)
    plot!(aa,runge)
    plot!(aa,[interpol_chebyshev(x,runge,i) for x in -1:0.01:1])
end

Para empezar con puntos de chebyshev tenemos n+1 puntos. Y como tenemos que son más cercanos en los extremos podemos reproducir la función con más detalle en estos lugares, por lo que tenemos una interpolación mucho mejor.

**[6]** Dada una función $f$, calcula numéricamente el error al utilizar la interpolación de Chebyshev $p$ con respecto a la función original $f$, dado por la norma

$$\|f - p\|_{\infty} := \sup_x |f(x) - p(x)|,$$

para distintos números de puntos de Chebyshev.

Conforme se aumenta el número de puntos, ¿cómo es la convergencia a $0$ del error?  

In [39]:
function error_cheby(f:: Function, n:: Int64)
    XX = linspace(-1,1,2000)
    return error = maximum([abs(f(x) - interpol_chebyshev(x, f, n)) for x in XX])
end

error_cheby (generic function with 1 method)

In [40]:
error_cheby(runge, 20)

0.017737623028268312

In [41]:
scatter(1:10:100,[error_cheby(runge,i) for i in 1:10:100], 
    yscale = xscale = :log10,
    ylabel="error")

Da una recta en log, log por lo que se comporta como una regla de potencias la convergencia a 0 conforme n incrementa.

**[7]** Resulta que la tasa de convergencia depende de qué tan suave es la función.
Por ejemplo, inténtalo con la función `abs` y con la función `floor`.

In [42]:
scatter(1:10:100,[error_cheby(runge,i) for i in 1:10:100], 
    yscale = xscale = :log10,
    ylabel="error"
    , label="Runge")
scatter!(1:10:100,[error_cheby(abs,i) for i in 1:10:100], 
    yscale = xscale = :log10,
    ylabel="error"
    , label="abs")
scatter!(1:10:100,[error_cheby(floor,i) for i in 1:10:100], 
    yscale = xscale = :log10,
    ylabel="error"
    , label="floor")
scatter!(1:10:100,[error_cheby(cos,i) for i in 1:10:100], 
    yscale = xscale = :log10,
    ylabel="error"
    , label="coseno")

Podemos ver que mientras más diferenciable es la función el error tiende más rápidamente a cero.

## Hacia el futuro

Lo que hemos logrado es reemplazar (aproximar) una función continua $f$ por un conjunto discreto de sus valores $f(x_i)$ en la **malla** $(x_i)_{i=1}^N$. Ahora podremos manipular la función ¡al manipular sólo estos valores discretos!

Resulta que es más útil **cambiar de base** en el espacio de polinomios, y utilizar los **polinomios de Chebyshev**. 

La idea es escribir el polinomio interpolante como una suma de polinomios de Chebyshev y examinar los coeficientes de estos polinomios, que tienen propiedades muy útiles. Esto lo podremos ver hasta después de ver álgebra lineal numérica.  ¡Podría formar un proyecto final interesante!  