# Regra de Simpson

## $ \S 1 $ Regra de Simpson simples

### $ 1.1 $ Idéia da regra de Simpson simples

Seja $ f \colon [a, b] \to \mathbb{R} $ uma função contínua, cuja integral
$$ \int_a^b f(x)\,dx $$
gostaríamos de calcular. Usando a regra do trapézio simples, a estratégia era aproximá-la pela integral do único polinômio de grau $ \le 1 $ que interpola $ f $ em $ a $ e $ b $.

A idéia da **regra de Simpson simples** é análoga, exceto que utilizaremos o único polinômio $ p $ de grau $ \le 2 $ que interpola $ f $ em $ a $, em $ b $ e em
$$ m = \frac{a + b}{2}. $$

📝 Exceto no caso em que $ (a, f(a)) $, $ (b, f(b)) $ e $ (m, f(m)) $ são colineares, $ p $ tem grau exatamente 2, e o seu gráfico é uma parábola.

### $ 1.2 $ Derivação da fórmula da regra de Simpson simples

De acordo com a fórmula de Lagrange para o polinômio interpolador $ p$, temos:
\begin{equation*}\label{E:p}
p(x) = f(a)\frac{(x-m)(x-b)}{(a-m)(a-b)}
    + f(m) \frac{(x-a)(x-b)}{(m-a)(m-b)}
    + f(b) \frac{(x-a)(x-m)}{(b-a)(b-m)}\ .\tag{1}
\end{equation*}
Para calcular sua integral sobre $ [a, b] $ mais facilmente, introduza a substituição
$$
x = a + (b-a)u.
$$
Então:
* $ x - a = (b-a) u $, de modo que $ a $ corresponde a $ u = 0 $;
* $ x - b = (b-a) (u - 1) $, de modo que $ b $ corresponde a $ u = 1 $;
* $ x - m = (b-a) (u - \frac{1}{2}) $;
* $ dx = h\, du $.

Avaliando separadamente as integrais dos numeradores em (\ref{E:p}):
\begin{alignat*}{9}
    \int_a^b (x-m)(x-b)\,dx &= (b-a)^3\int_0^1\big(u - \tfrac{1}{2}\big)(u-1)\,du\\
    &=(b-a)^3\bigg(\frac{u^3}{3}-\frac{3u^2}{4}+\frac{u}{2}\bigg)\bigg|_0^1 \\ 
    &= \frac{(b-a)^3}{12}  \\
    \int_a^b (x-a)(x-b)\,dx &= (b-a)^3\int_0^1u (u - 1)\,du\\
    &=(b-a)^3\bigg(\frac{u^3}{3}-\frac{u^2}{2}\bigg)\bigg|_0^1 \\
    &= -\frac{(b-a)^3}{6} \\
    \int_a^b (x-a)(x-m)\,dx &= (b-a)^3\int_0^1u(u - \tfrac{1}{2})\,du\\
    &=(b-a)^3\bigg(\frac{u^3}{3}-\frac{u^2}{4}\bigg)\bigg|_0^1 \\
    &= \frac{(b-a)^3}{12} 
\end{alignat*}

Finalmente, substituindo estes valores em \eqref{E:p} e lembrando que $ m = \frac{a+b}{2} $, concluímos após algumas contas diretas que:
\begin{equation*}
    \int_a^b p(x)\,dx = \boxed{\frac{b-a}{6} \bigg[f(a) + 4f(m) + f(b) \bigg]}
\end{equation*}
A aproximação de $ \int_a^b f(x)\,dx $ por este valor é conhecida como **regra de Simpson simples**.

**Problema 1:** Calcule $ \int_0^\pi \sin x\,dx $ exatamente e através da aplicação da regra de Simpson simples.

**Problema 2:** Calcule $ \int_0^1 e^{-x}\,dx $ exatamente e usando a fórmula de Simpson.


📝 Como a regra de Simpson simples nada mais é que a substituição da integral $ \int_a^bf(x)\,dx $ pela integral do polinômio de grau $ \le 2 $ que interpola $ f $ em $ a $, $ m $ e $ b $, a aproximação é *exata* caso a própria função $ f $ seja um polinômio de grau $ \le 2 $; afinal, neste caso $ p = f $.

⚡ Surpreendentemente, o mesmo ocorre quando $ f $ é um polinômio de grau $ 3 $. Sob esta hipótese, $ f - p $ é um polinômio de grau $ 3 $ que se anula em $ a $, $ m $ e $ b $. Sem perda de generalidade, podemos supor que $ a = -1 $, $ b = 1 $ e $ m = 0 $. Escrevendo 
$$
(f - p)(x) = c_3x^3 + c_2x^2 + c_1x + c_0,
$$
deduzimos da condição $ (f-p)(m) = 0 $ que $ c_0 = 0 $. E das condições $ (f-p)(a) = 0 = (f-p)(b) $ tiramos que $ c_2 = 0 $. Portanto $ f - p $ é um polinômio *ímpar* no intervalo $ [a, b] = [-1, 1] $, querendo dizer que $ (f-p)(-x) = -(f-p)(x) $. Por sua vez, isto implica que sua integral aí vale zero, ou seja, 
$$
\int_a^bf(x)\,dx = \int_a^b p(x)\,dx\, .
$$
Este fato também segue da fórmula para o erro; veja a $ \S 5 $.

## $ \S 2 $ Regra de Simpson composta

Seja $ N \ge 2 $ um natural _par_. Defina
$$
    h = \frac{b - a}{N} \quad \text{e} \quad x_i = a + ih \qquad (i = 0, 1, \dots, N).
$$

Em particular, note que $ x_0 = a $, $ x_N = b $ e que
$$ x_i - x_{i-1} = h $$
para cada $ i $. Neste contexto, $ h $ é chamado de **tamanho do passo**.

Para melhor a precisão da estimativa para $ \int_a^b f(x)\,dx $ obtida na $ \S 1 $, para cada $ i = 2, 4, \dots, N $, vamos aproximar a integral
$$ \int_{x_{i - 2}}^{x_i} f(x)\,dx $$
usando a regra de Simpson simples. Como o intervalo de integração tem comprimento $ 2h $, o resultado é:
$$
    \frac{h}{3}\big[f(x_{i - 2}) + 4f(x_{i-1}) + f(x_i) \big].
$$
Tomando a soma para  $ i = 2, 4, \dots, N $, obtemos a expressão:
$$
\begin{alignat*}{9}
    \int_a^b f(x)\,dx & \approx \frac{h}{3}\Big[f(a) + 4 f(x_1) + f(x_2) \Big] \\
    &+ \frac{h}{3}\Big[f(x_2) + 4 f(x_3) + f(x_4) \Big] \\
    &+\ \vdots \\
    &+ \frac{h}{3}\Big[f(x_{N - 2}) + 4 f(x_{N-1}) + f(b) \Big] \\
    &=\boxed{\frac{h}{3}\Bigg[f(a) + f(b) + 4 \sum_{\substack{i=1 \\ i \text{ímpar}}}^{N - 1} f(x_i)
    + 2 \sum_{\substack{i=1 \\ i \text{par}}}^{N - 1} f(x_i)\Bigg]} \\
    % &=\frac{2h}{3}\bigg[\frac{f(a) + f(b)}{2} + 2 \sum_{\substack{i=1 \\ i \text{ímpar}}}^{N - 1} f(x_i)
    % + \sum_{\substack{i=1 \\ i \text{par}}}^{N - 2} f(x_i)\bigg]
\end{alignat*}
$$
Esta é a chamada **regra de Simpson** (composta).

⚠️ Não esqueça que na regra de Simpson, o número $ N $ de subdivisões deve ser *par*.

📝 Em geral, quanto maior o valor de $ N $, melhor será a aproximação. Para mais detalhes, veja a $ \S $ 5.

📝 Tomando $ N = 2 $, recuperamos a expressão da regra de Simpson simples.

## $ \S 3 $ Implementação da regra de Simpson

In [2]:
def simpson(f, a, b, N):
    """ Retorna uma aproximação para a integral definida de a a b
    de uma função real f de uma variável usando a regra de Simpson
    composta com N subdivisões do intervalo. N deve ser par! """
    
    if not (isinstance(N, int) and N % 2 == 0 and N >= 2):
        raise ValueError("N deve ser um natural par!")
        
    h = (b - a) / N             # tamanho do passo
    soma_impares = 0
    soma_pares = 0
    x = a                       # valor atual de x (x_i)
    
    for i in range(2, N, 2):    # para i = 2, 4, 6, ..., N - 2:
        x += h                  # tome x = a + (i - 1) * h
        soma_impares += f(x)
        x += h                  # tome x = a + i * h
        soma_pares += f(x)
    
    soma_impares += f(x + h)    # f(x_{N-1}) não foi computado acima
    soma_impares *= 4
    soma_pares *= 2
    integral = (f(a) + f(b) + soma_pares + soma_impares) * h / 3.0
    
    return integral

## $ \S 4 $ Problemas

**Problema 1:** Avalie a integral $$ \int_1^{e} \frac{1}{x} \,dx $$

(a) Exatamente, usando o Teorema Fundamental do Cálculo;

(b) Usando a regra de Simpson composta com $ N = 8 $ subdivisões;

(c) Usando a regra de Simpson composta com $ N = 16 $ subdivisões.

**Problema 2:** Calcule as integrais abaixo pelas regras do trapézio e de Simpson com $ N = 2^k $ subdivisões para $ k = 2, \dots, 6 $, e compare os resultados:

(a) $ \int_0^\pi \exp(\cos x) \,dx $;

(b) $ \int_{1}^{\frac{\pi}{2}} \sqrt{\sin x}\,dx $.

**Problema 3:** A função
$$
\text{erf(x)} = \frac{2}{\sqrt\pi}\int_0^x e^{-t^2}\,dt
$$
é chamada de *função erro (de Gauss)*. Ela é bastante importante em Estatística, mas não é uma função elementar (ou seja, não é possível encontrar uma "fórmula fechada" para $ \text{erf} $).

(a) Mostre que $ \text{erf}(-x) = -\text{erf}(x) $, isto é, $ \text{erf} $ é uma função ímpar.

(b) O limite de $ \text{erf}(x) $ conforme $ x \to +\infty $ existe. Obtenha uma estimativa para ele usando a regra de Simpson. *Dica:* Calcule $ \int_0^M \text{erf}(x)\,dx $ para $ M $ cada vez maior.

## $ \S 5 $ Análise do erro

### 5.1 Motivação

**Exemplo 1:** Neste exemplo, veremos que conforme duplicamos o número $ N $ de subdivisões, o erro cometido pela aproximação fornecida pela regra de Simpson para a integral
$$ \int_0^\pi \sin x\,dx = -\cos \pi + \cos 0 = 2 $$
é cortado por um fator de aproximadamente $ 16 = 2^4 $. Isto sugere que _o erro cometido diminui com a quarta potência de $ N $ conforme $ N $ aumenta_. E é isto que acontece de fato em geral, não apenas neste exemplo.

In [21]:
from numpy import sin, pi


I_velho = simpson(sin, 0, pi, 4)

for k in range(3, 8):
    I_novo = simpson(sin, 0, pi, 2**k)
    erro_novo = abs(I_novo - 2)
    erro_velho = abs(I_velho - 2)
    print(f"Quociente entre os erros das aproximações I_{2**(k - 1)} e I_{2**k}:")
    print(erro_velho / erro_novo)
    I_velho = I_novo

Quociente entre os erros das aproximações I_4 e I_8:
16.940059660175127
Quociente entre os erros das aproximações I_8 e I_16:
16.223806322213832
Quociente entre os erros das aproximações I_16 e I_32:
16.055292275691855
Quociente entre os erros das aproximações I_32 e I_64:
16.013782256098068
Quociente entre os erros das aproximações I_64 e I_128:
16.003424727310932


### $ 5.2 $ Fórmula para o erro


**Teorema 5.1 (fórmula para o erro na regra de Simpson):** *Seja $ f \colon [a, b] \to \mathbb R $ uma função com quarta derivada contínua. O **erro** $ E $, diferença entre a integral de $ f $ neste intervalo e o valor fornecido pela regra de Simpson, é dado por
$$
\boxed{E = -\frac{(b-a)^5}{180N^4}f^{(4)}(c) \quad \text{para algum } c\in [a, b]}\,
$$*

Omitiremos a demonstração, que é parecida mas mais trabalhosa que a da fórmula para o erro na regra do trapézio.

📝 Concluímos imediatamente que, grosso modo, na regra de Simpson *o erro decresce com a quarta potência do número $ N $ de subdivisões conforme $ N $ aumenta*.

📝 A fórmula do erro também implica que a regra de Simpson fornece o valor *exato* para a integral caso $ f $ seja um polinômio de grau $ \le 3 $, conforme discutido no final da $ \S 1 $, apesar de termos utilizado um polinômio interpolador de grau $ 2 $ para obtê-la. Esta precisão maior advém da escolha do terceiro nodo (além de $ a $ e $ b $) como sendo o ponto médio $ m $ do intervalo (em oposição a algum outro ponto dentro dele).

**Corolário 5.2:** *Seja $ f \colon [a, b]  \to \mathbb R $ uma função com quarta derivada contínua em $ [a, b] $. Então o erro $ E $ cometido na aproximação da integral de $ f $ sobre $ [a, b] $ pela regra de Simpson com $ N $ subdivisões satisfaz
$$
    \boxed{\lvert{E}\rvert \le \frac{(b-a)^5}{180N^4}\max_{[a,b]} \lvert{f^{(4)}}\rvert}
$$*