# Interpolação

A gente frequentemente precisaremos fazer estimativa de valores intermediarios entre dados precisos. O método mais comum usado para esse propósito é a interpolação polinomial. A formula geral para um polinomio de grau $n$ é 

$$
f(x) = a_0 + a_1 x + a_2 x^2 + ... + a_n x^n
$$

Para $n + 1$ pontos dados, existe um e somente um polinômio de grau $n$ que passa por todos os pontos. Por exemplo, existe uma única reta (isto é, um polinômio de primeiro grau) que liga dois pontos. Analogamente, existe uma única parábola ligando um conjunto de três pontos. A interpolação polinomial consiste em
determinar o único polinômio de grau n que passa pelos $n + 1$ pontos dados. Esse polinômio, então, fornece uma fórmula para calcular valores intermediários.

<img src="./images/inter.jpg" style="width:450px;height:250px;">

Há diversas tecnicas para expressar esse polinomio. Neste capitulo vamos conhecer os polinomios de Newton e de Lagrange.

## Polinomios interpoladores por diferenças divididas de Newton
O polinômio interpolador por diferenças divididas de Newton está
entre as fórmulas mais populares e úteis.

### Interpolação Linear

A forma mais simples de interpolação é ligar dois pontos dados com uma reta. A técnica,chamada de interpolação linear, é descrita graficamente na figura abaixo. Usando semelhança de triângulos,

$$
\frac{f_1(x) - f(x_0)}{x - x_0} = \frac{f(x_1) - f(x_0)}{x_1 - x_0}
$$



<img src="./images/inter_lin.jpg" style="width:350px;height:300px;">

Essa expressão pode ser reorganizada na forma

$$
f_1(x) = f(x_0) + \frac{f(x_1) - f(x_0)}{x_1 - x_0}(x - x_0)
$$

que é a *formula de interpolação linear*. A notação $f_1 (x)$ indica que esse é um polinômio interpolador de primeiro grau.

#### **Exemplo:**

Faça uma estimativa do logaritmo natural de 2 usando uma
interpolação linear. Primeiro, faça o cálculo interpolando entre $\ln 1 = 0$ e $\ln 6 = 1.791759$. Então, repita o procedimento, mas use o intervalo menor de $\ln 1$ a $\ln 4$ $(1.386294)$. Observe que o valor verdadeiro de $\ln 2$ é $0.6931472$.

**Resolução:**

Usanda a formula de interpolação linear temos para calcular $\ln 2$ no intervalo de $[1, 6]$ temos

$$
f_1(2) = 0 + \frac{1.791759 - 0}{6 -1}(2 - 1) = 0.3583519
$$

o que representa um erro de $\varepsilon_t = 48.3 \%$. No intervalo menor de $[1,4]$ o resultado fica um pouco melhor

$$
f_1(2) = 0 + \frac{1.386294 - 0}{4 -1}(2 - 1) = 0.4620981
$$

Neste caso o erro relativo porcentual reduz para $\varepsilon_t = 33.3\%$. 




In [7]:
import numpy as np
import plotly.graph_objects as go

x = [1, 2, 4, 6]
y = [0, np.log(2), 1.386294, 1.791759]
t = np.linspace(0.8, 7, 50)

fig = go.Figure()
fig.add_scatter(x=x, y=y, mode='markers', name='dados')
fig.add_scatter(x=t, y=np.log(t), name='f(x)=ln x')
fig.add_scatter(x=x[0:3:2], y=y[0:3:2], name='intervalo menor')
fig.add_scatter(x=x[0:4:3], y=y[0:4:3], name='intervalo maior')
fig.add_scatter(x=[2,2], y=[-0.5, 2], 
                line_width=1,line_color = 'black', line_dash='dot', mode='lines')

### Interpolação Quadrática

Na seção anterior aproximamos uma curva usando uma reta. O que podemos para melhorar essa aproximação é usar um polinomio de segundo grau no lugar de reta, ou seja, um objeto geometrico que tem curvatura. Um polinomio de segundo grau pode ser escrito na seguinte maneira

$$
f_2(x) = b_0 + b_1(x - x_0) + b_2(x - x_0)(x - x_1)
$$

Essa expressão é equivalente a exprssão padrão de uma polinomio de segundo grau. Basta abrir os termos e reorganizar eles para obter

$$
f_2(x) = a_0 + a_1x + a_2 x^2
$$

onde

\begin{align}
a_0 &= b_0 - b_1 x_0 + b_2 x_0 x_1 \\
a_1 &= b_1 - b_2 x_0 - b_2 x_1 \\
a_2 &= b_2
\end{align}

Um procedimento simples pode ser usado para determinar os valores dos coeficientes. Para $b_0$, inserimos $x = x_0$ na equação acima e obtemos

$$
b_0 = f(x_0)
$$

E se inserimos $x = x_1$ na equação ganhamos

$$
b_1 = \frac{f(x_1) - f(x_0)}{x_1 - x_0}
$$

Finalmente, substituimos essas equação na equação geral de um polinomio de segundo grau e inserimos $x = x_2$

$$
b_2 = \frac{\frac{f(x_2) - f(x_1)}{x_2 - x_1} - \frac{f(x_1) - f(x_0)}{x_1 - x_0}}{x_2 - x_0}
$$

Observe que, como foi o caso com a interpolação linear, $b_1$ ainda representa a inclinação da reta ligando os pontos $x_0$ e $x_1$ . Logo, os dois primeiros termos da equação geral são equivalentes à interpolação linear de $x_0$ a $x_1$. O último termo, $b_2 (x - x_0 )(x - x_1 )$, introduz a curvatura de segundo grau na fórmula.

#### **Exemplo:**

Ajuste um polinômio de segundo grau aos três pontos usados no exemplo anterior. Use o polinomio para calcular o valor de $\ln 2$

**Resolução:**




In [8]:
x = [1, 4, 6]
y = [0, 1.386294, 1.791759]

b0 = y[0]
b1 = (y[1] - y[0])/ (x[1] - x[0])
b2 = ((y[2]-y[1])/(x[2] - x[1]) - b1)/(x[2] - x[0])

print(f"b0 é {b0}, b1 é {b1} e b2 é {b2}")

b0 é 0, b1 é 0.46209799999999995 e b2 é -0.05187309999999997


Então o polinomio é 
$$
f_2(x) = 0 + 0.462097 (x - 1) - 0.051873 (x - 1)(x - 4)
$$

O valor de $\ln 2$ é 

In [9]:
f2 = lambda x: b0 + b1*(x - 1) + b2*(x-1)*(x-4)
f2(2)

0.5658441999999999

## Forma Geral dos Polinômios Interpoladores de Newton

A análise anterior pode ser generalizada para ajustar um polinômio de grau $n$ a $n + 1$ pontos dados. O polinômio de grau $n$ é

$$
f_n(x) = b_0 + b_1(x - x_0) + ... + b_n(x - x_0)(x - x_1)...(x - x_{n-1})
$$

Agora, os pontos dados podem ser usados para calcular os coeficientes $b_0, b_1, ..., b_n$ . Para um polinômio de grau
$n$, $n + 1$ pontos dados são necessários: $(x_0, f(x_0)), (x_1, f(x_1)),..., (x_n , f(x_n))$. Usamos esses pontos dados e as seguintes equações para calcular os coeficientes:

$$
\begin{align*}
b_0 &= f(x_0)\\
b_1 &= f[x_1, x_0]\\
&.\\
&.\\
&.\\
b_n &= f[x_n, x_{n-1}, ..., x_1, x_0]
\end{align*}
$$

onde a função com colchetes corresponde a diferenças divididas finitas. Por exemplo, a primeira diferença dividida finita é representada em geral por

$$
f[x_i, x_j] = \frac{f(x_i) - f(x_j)}{x_i - x_j}
$$

A segunda *diferença dividida finita*, que representa a diferença das duas primeiras diferenças divididas, é expressa em geral por

$$
f[x_i, x_j, x_k] = \frac{f[x_i, x_j] - f[x_j, x_k]}{x_i - x_k}
$$

Analogamente, a *n-ésima diferença dividida finita* é

$$
f[x_n, x_{n-1}, ..., x_1, x_0] = \frac{f[x_n, x_{n-1}, ..., x_1] - f[x_{n-1}, x_{n-2}, ..., x_1, x_0]}{x_n - x_0}
$$

<img src="./images/int_new.jpg" style="width:600px;height:150px;">

Substituindo esses termos na equação geral chegamos no polinomio interpolador

$$
f_n(x) = f(x_0) + (x - x_0)f[x_1, x_0] + (x - x_0)(x - x_1)f[x_2, x_1, x_0]\\ + ... + (x - x_0)(x - x_1)...(x - x_{n-1})f[x_n, x_{n-1}, ..., x_0]
$$

que é chamado *polinômio interpolador por diferenças divididas de Newton*.

### **Exemplo:**
No exemplo anterior, dados em $x_0 = 1, x_1 = 4$ e $x_2 = 6$ foram
usados para fazer uma estimativa de $\ln 2$ com uma parábola. Agora, adicionando um quarto ponto $[x_3 = 5; f(x_3 ) = 1,609438]$, faça uma estimativa de $\ln 2$ com um polinômio interpolador de Newton de terceiro grau.

**Resolução:**

Os dados são 

|$x$|$y$|
|--|--|
|1|0|
| 4|1.386294 |
|6|1.791759 |
|5| 1.609438|

Um polinomio de tericeiro grau pode ser escrito como


\begin{align*}
f_3(x) &= b_0 + b_1(x - x_0) + b_2(x - x_0)(x - x_1) + b_3(x - x_0)(x - x_1)
(x - x_2)\\
&= f(x_0) + f[x_1, x_0](x - x_0) + f[x_2, x_1, x_0](x - x_0)(x - x_1)\\ 
&+  f[x_3, x_2, x_1, x_0](x - x_0)(x - x_1)(x - x_2)
\end{align*}

As primeiras diferenças divididas para o problema são

\begin{align*}
f[x_1, x_0] &= \frac{1.386294 - 0}{4 - 1} = 0.460981\\
f[x_2, x_1] &= \frac{1.791759 - 1.386294}{6 - 4} = 0.2027326\\
f[x_3, x_2] &= \frac{1.609438 - 1.791759}{5 - 6} = 0.1823216
\end{align*}

As segundas diferenças divididas são

\begin{align*}
f[x_2,x_1, x_0] &= \frac{0.2027326 - 0.4620981}{6 - 1} = -0.05187311\\
f[x_3, x_2, x_1] &= \frac{0.1823216 - 0.2027326}{5 - 4} = -0.02041100  
\end{align*}

E a terceira diferença dividida é 

$$
f[x_3, x_2, x_1, x_0] = \frac{-0.02041100 - (-0.05187311)}{5 - 1} = 0.007865529
$$

Os resultados para $f[x_1 , x_0], f[x_2, x_1 , x_0]$ e $f[x_3, x_2, x_1, x_0]$ representam os coeficientes $b_1, b_2$ e $b_3$, respectivamente. Junto com $b_0 = f(x_0) = 0$ temos

$$
f_3(x) = 0 + 0.4620981(x − 1) − 0.05187311(x − 1)(x − 4)+ 0.007865529(x − 1)(x − 4)(x − 6)
$$

## Erros nos Polinômios Interpoladores de Newton

A estrutura da interpolação de Newton é muito parecido com a serie de Taylor. No sentido que os termos são adicionados seqüencialmente para capturar o comportamento de ordem superior da função subjacente. Esses termos são diferenças divididas finitas e, portanto, representam aproximações de derivadas de ordem superior.

Para um polinômio interpolador de grau $n$, uma relação análoga para o erro é

$$
R_n = \frac{f^{n+1}(\xi)}{(n+1)!} (x - x_0)(x - x_1)...(x - x_n)
$$

onde $\xi$ é algum ponto no intervalo contendo a variável e os dados. Para essa fórmula ser útil, a função em questão deve ser conhecida e $(n + 1)$ vezes diferenciável. Em geral, esse não é o caso. Felizmente, está disponível uma formulação alternativa que não requer conhecimento anterior da função. Em vez disso, ela usa diferenças divididas finitas para aproximar a $(n + 1)$-ésima derivada. Entretanto, se estiver disponível um ponto dado adicional $f (x_{n+1})$, o erro pode ser estimado usando a seguinte relação

$$
R_n \approx f[x_{n+1}, x_n, x_{n-1},...,x_0](x - x_0)(x - x_1)...(x - x_n)
$$

A validade dessa aproximação se baseia no fato de que a série é fortemente convergente. Para tal situação, a previsão de ordem $(n + 1)$ deveria estar muito mais próxima do valor verdadeiro do que a previsão de ordem $n$


### **Exemplo:**

No exemplo anterior, use o ponto adicional para calcular o erro do polinomio interpolador de segundo grau

**Resolução:**

$$
R_2 = f[x_3, x_2, x_1, x_0](x − x_0)(x − x_1)(x − x_2)
$$

ou

$$R_2 = 0.007865529(x − 1)(x − 4)(x − 6)$$

onde o valor da diferença dividida finita de terceira ordem é como calculado anteriormente. Essa relação pode ser calculada em $x = 2$ por

$$R_2 = 0.007865529(2 − 1)(2 − 4)(2 − 6) = 0.0629242$$

que é da mesma ordem de grandeza que o erro verdadeiro, $0.6931472 − 0.5658444 = 0.1273028$.


### Implementação do Polinômio Interpolador de Newton

<img src="./images/inter_newton_alg.jpg" style="width:300px;height:400px;">



In [10]:
def newton_interpolation(x, y, n, xi, return_fdd=False, return_last=True):

    assert len(x) == len(y), 'the same size'
    assert len(x) > n, 'there is no sufficient point'
    n += 1
    
    fdd = np.zeros((len(y), len(y)))
    fdd[:, 0] = y

    for j in range(1, n):
        for i in range(0, n-j):
            fdd[i, j] = (fdd[i+1, j-1] - fdd[i, j-1])/(x[i+j] - x[i])

    
    
    errors = np.zeros(n-1)
    ys = np.zeros(n)
    ys[0] = y[0]
    xterm = 1
    for i in range(1, n):
        xterm *= xi - x[i-1]
        ys[i] = (ys[i-1] + xterm * fdd[0, i])
        errors[i-1] = fdd[0, i] * xterm
    
    if return_last:
        return ys[-1], errors[-1]

    elif return_fdd:
        return ys, errors, fdd
    else:
        return ys, errors

Agora vamos aplicar esse algoritmo nos exemplos que resolvemos

In [11]:
x = [1, 4, 6, 5]
y = [0, 1.386294, 1.791759, 1.609438]

In [12]:
newton_interpolation(x, y, 3, 2)

(0.6287674, 0.06292320000000011)

## Polinômios Interpoladores de Lagrange

O polinômio interpolador de Lagrange é simplesmente uma reformulação do polinômio de Newton que evita o cálculo de diferenças divididas. Ele pode ser representado concisamente por:

$$f_n(x) = \sum_{i=0}^n L_i (x)f(x_i)$$

onde

$$L_i(x) = \prod_{\substack{j=0\\ j\neq i}}^n \frac{x-x_j}{x_i - x_j}$$

onde $\prod$ indica o "produto de". Por exemplo, a versão linear $(n = 1)$ seria 

$$
f_1(x) = \frac{x-x_1}{x_0 - x_1}f(x_0) + \frac{x-x_0}{x_1 - x_0}f(x_1)
$$

e a versão de segundo grau seria

$$
\begin{align*}
f_2(x) &= \frac{(x - x_1)(x - x_2)}{(x_0 - x_1)(x_0 - x_2)}f(x_0) + \frac{(x - x_0)(x - x_2)}{(x_1 - x_0)(x_1 - x_2)}f(x_1) \\
&+ \frac{(x - x_0)(x - x_1)}{(x_2 - x_0)(x_2 - x_1)}f(x_2)
\end{align*}
$$

O raciocínio por trás da formulação de Lagrange pode ser entendido diretamente percebendo-se que cada termo $L_i (x)$ será 1 em $x = x_i$ e $0$ em todos os outros pontos da amostra. Logo, cada produto $L_i (x) f(x_i)$ assume o valor $f (x_i)$ no ponto x i da amostra. Conseqüentemente, a somatória de todos os produtos indicados na equação geral é o único polinômio de grau $n$ que passa exatamente por todos os $n + 1$ pontos dados.

### **Exemplo:**
Use um polinômio interpolador de Lagrange de primeiro e de
segundo graus para calcular $\ln 2$ com base nos dados abaixo

|$x$|$y$|
|--|--|
|1|0|
| 4|1.386294 |
|6|1.791759 |

**Resolução:**

O polinômio de primeiro grau pode ser usado para se obter a estimativa em $x = 2$,

$$
f_1(2) = \frac{2-4}{1-4}0 + \frac{2-1}{4-1}1.386294 = 0.4620981
$$

De modo semelhante, o polinômio de segundo grau é desenvolvido como

$$
f_2(2) = \frac{(2-4)(2-6)}{(1-4)(1-6)}0 + \frac{(2-1)(2-6)}{(4-1)(4-6)}1.386294 + \frac{(2-1)(2-4)}{(6-1)(6-4)}1.791760 = 0.5658444
$$

Como esperado, ambos os resultados coincidem com os obtidos anteriormente usando-se o polinômio interpolador de Newton.

### Implementação do Polinômio Interpolador de Lagrange

<img src="./images/inter_lag_alg.jpg" style="width:300px;height:400px;">


In [13]:
def lagrange_interpolation(x, y, n, xi):

    assert len(x) == len(y), 'The same size'
    assert len(x) > n, 'for the n-degree interpolation n+1 points are needed'

    sum = 0
    for i in range(n+1):
        product = y[i]
        for j in range(n+1):
            if i != j:
                product *= (xi - x[j])/(x[i] - x[j])
        sum += product
    
    return sum


### **Exemplo:**

Pode-se usar o algoritmo para estudar o problema de análise de tendência associado com o agora familiar páraquedista em queda livre. Suponha que tenhamos

|Tempo(s)|Velocidade medida (cm/s)|
|--|--|
|1|800|
|3|2310 |
|5|3090 |
|7|3940|
|13|4755|

Nosso problema é fazer uma estimativa da velocidade do páraquedista em $t = 10 s$ para preencher o grande salto nas medidas entre $t = 7$ e $t = 13s$. Estamos cientes de que o comportamento dos polinômios interpoladores pode ser inesperado. Logo, construiremos polinômios de quarto, terceiro, segundo e primeiro graus e compararemos os resultados.

**Resolução:**

In [14]:
x = [1, 3, 5, 7, 13]
y = [800, 2310, 3090, 3940, 4755]

In [15]:
xx = np.linspace(0, 16, 100)
f2 = [lagrange_interpolation(x, y, 2, i) for i in xx]
f3 = [lagrange_interpolation(x, y, 3, i) for i in xx]
f4 = [lagrange_interpolation(x, y, 4, i) for i in xx]

import plotly.graph_objects as go

fig = go.Figure()
fig.add_scatter(x=xx, y=f2, name='order 2')
fig.add_scatter(x=xx, y=f3, name='order 3')
fig.add_scatter(x=xx, y=f4, name='order 4')
fig.add_scatter(x=x, y=y, mode='markers')
fig.update_layout(yaxis_range=(0, 7000))

Em geral, para construir um polinomio de primeiro grau usamos os dois primeiros pontos, para segundo grau, os primeiros tres pontos e assim adinate. No livro, na figura 18.12, foram usados os ultimos pontos para calcular os polinomios interpoladores. Algo que não está no pseudocodigo. Mas podemos generalizar o nosso algoritmo para fazer interpolação nas duas formas

In [16]:
def lagrange_interpolation(x, y, n, xi, reverse=False):

    assert len(x) == len(y), 'The same size'
    assert len(x) > n, 'for the n-degree interpolation n+1 points are needed'

    
    if reverse:    
        sum = 0
        for i in range(len(x)-1, len(x)-n, -1):
            product = y[i]
            for j in range(len(x)-1, len(x)-n, -1):
                if i != j:
                    product *= (xi - x[j])/(x[i] - x[j])
            sum += product
        
        return sum
    else:
        sum = 0
        for i in range(n+1):
            product = y[i]
            for j in range(n+1):
                if i != j:
                    product *= (xi - x[j])/(x[i] - x[j])
            sum += product
        return sum


In [17]:
xx = np.linspace(0, 16, 100)
f2 = [lagrange_interpolation(x, y, 2, i, reverse=True) for i in xx]
f3 = [lagrange_interpolation(x, y, 3, i, reverse=True) for i in xx]
f4 = [lagrange_interpolation(x, y, 4, i, reverse=True) for i in xx]

import plotly.graph_objects as go

fig = go.Figure()
fig.add_scatter(x=xx, y=f2, name='order 2')
fig.add_scatter(x=xx, y=f3, name='order 3')
fig.add_scatter(x=xx, y=f4, name='order 4')
fig.add_scatter(x=x, y=y, mode='markers')
fig.update_layout(yaxis_range=(0, 6000))

Neste caso podemos ver que polinômios de grau mais alto tendem a ser mal condicionados, isto é, tendem a ser altamente sensíveis a erros de arredondamento. O mesmo problema se aplica à regressão polinomial de grau mais alto. A aritmética de dupla precisão às vezes ajuda a aliviar o problema. Entretanto, conforme o grau aumenta, existirá um ponto no qual os erros de arredondamento interferirão com a habilidade de interpolar usando as abordagens simples descritas até aqui.

## Coeficientes de um Polinômio Interpolador

Embora ambos os polinômios, de Newton e de Lagrange, sejam adequados para a determinação de valores intermediários entre pontos, não fornecem um polinômio conveniente na forma convencional

$$
f(x) = a_0 + a_1 x + a_2 x^2 + ··· + a_n x^n
$$

Um método direto para calcular os coeficientes desses polinômios é baseado no fato de que são necessários $n + 1$ pontos dados para determinar os $n + 1$ coeficientes. Logo, equações algébricas lineares simultâneas podem ser usadas para calcular os $a$’s. Por exemplo, suponha que você queira calcular os coeficientes da parábola

$$f(x) = a_0 + a_1 x + a_2 x^2$$

São necessários os três pontos dados: $(x_0 , f(x_0)), (x_1 , f(x_1))$ e $(x_2 , f(x_2))$. Cada um pode ser
substituído na equação para fornecer

$$
\begin{align*}
f(x_0) &= a_0 + a_1 x_0 + a_2 x_0^2\\
f(x_1) &= a_0 + a_1 x_1 + a_2 x_1^2\\
f(x_2) &= a_0 + a_1 x_2 + a_2 x_2^2
\end{align*}
$$

Logo, nesse caso, os $x$’s são conhecidos e os $a$’s são as incógnitas. Como há o mesmo número de equações e de incógnitas, a aquação acima poderia ser resolvida por um método de eliminação que foi estudado anteriormente.

Deve ser observado que a abordagem anterior não é o método mais eficiente disponível para determinar os coeficientes de um polinômio interpolador. Press et al. (1992) fornecem uma discussão e códigos computacionais para abordagens mais eficientes. Qualquer que seja a tecnologia usada, deve-se tomar cuidado. Os sistemas como a aquação acima são notoriamente mal condicionados. Tanto se forem resolvidos por um método de eliminação quanto
se forem resolvidos com um algoritmo mais eficiente, os coeficientes resultantes podem ser altamente não-acurados, particularmente para valores altos de n. Quando usados em uma interpolação subseqüente, em geral eles fornecem resultados errados.