# Integración y Derivación Básica

La evaluación numérica de integrales es un concepto central en las ciencias. A pesar de que usualmente buscamos soluciones análiticas para obtener expresiones cerradas con técnicas sofisticadas (e.g., valores principales, extensión analítica), es usualmente muy complicado o incluso *imposible* encontrar estas soluciones para una gran gama de problemas.

En esta clase, vamos a estudiar distintas técnicas para evaluar integrales de forma numérica. Note que las integrales se pueden ver en algunos casos como la solución a una ecuación diferencial, de manera tal que podemos usar estas técnicas para evaluar derivadas. Sin embargo, para soluciones de ecuaciones diferenciales veremos otras técnicas de integración más adelante.

## Conceptos fundamentales

La idea básica corresponde a:

* Pensar las integrales como áreas bajo una curva
* Aproximar estas áreas usando formas básicas (rectángulos, trapezoides, rectángulos con punto alto polinomial...)

La forma más básica corresponde a utilizar rectángulos. El procedimiento que se conoce como sumas de Riemann:
\begin{equation}
I(a, b) = \int_{a}^{b} {\rm{d}}x f(x) \approx \sum_{k=1}^{N} f(x_k) h,
\end{equation}
done $h$ corresponde al ancho del rectángulo y $f(x_k)$ es la función a integrar evaluada en el punto $x_k$, con dominio de $x$ discretizado en una grilla unidimensional, tal que $N$ corresponde al número de "pasos" que satisface $b = a + (N * h)$.

![](Fig1.png)

## Regla de trapezoides

<div>
<img src="Fig2.png" width="350"/>
</div>

Para aplicar la regla de trapezoides:

* Dividimos el intervalo en $N$ subregiones
* La función se aproxima con segmentos en cada subregión

De esta forma, tenemos $N$ subregiones de ancho
\begin{equation}
h = \frac{b - a}{N}
\end{equation}

El área del trapezoide de con índice k está dada por (rectángulo + triángulo)
\begin{align}
A_k &= f(x_k) + \frac{h [f(x_k + h) - f(x_k)]}{2} \\
&= \frac{h [f(x_k + h) + f(x_k)]}{2}
\end{align}

De esta manera, podemos aproximar la integral por la suma total de los trapezios. Definiendo $x_k = a + kh$, tenemos
\begin{align}
\boxed{I(a, b) \approx h\left[\frac12 f(a) + \frac12f(b) + \sum_{k=1}^{N-1} f(a+kh)\right]}.
\end{align}

Note la similitud con la suma de Riemann, con la excepción de los puntos finales e iniciales. A pesar de esto, la diferencia en la aproximación es significante!

## Regla de Simpson

<div>
<img src="Fig3.png" width="350"/>
</div>

La regla de Simpson es similar a la anterior, con la excepción de que entre cada punto $x_k$ y $x_{k+1}$, la función no se aproxima con una línea recta como en la regla de trapezoides, si no con una función cuadrática.

Puntos importantes al aplicar la regla de Simpson:

* De la misma forma, subdividimos la región en $N$ subregiones. 
    - $N$ debe ser un número par! Si no es par, se descarta un elemento de la región de integración o se utiliza la regla de trapezoides para el último punto.
* La función de integración se aproxima con una función **cuadrática** por cada dos elementos de la subregión.
* Se necesitan dos elementos porque se requiren tres puntos para definir la función cuadrática
* Igual que con toda la metología de esta clase, más elementos $\implies$ mejor aproximación.
* La idea es que con esta aproximación de orden mayor, se obtiene una mejor aproximación con menos elementos de integración.

Utilizando la misma notación que utilizamos anteriormente, el área de cada **dos segmentos con la función aproximada de manera cuadrática** está dada por
\begin{align}
A_k = \frac{h}3\left\{f[a+(2k-2)h] + 4f[a+(2k-1)h] + f(a+2kh)\right\}.
\end{align}
De manera tal que, al sumar todos los segmentos obtenemos
\begin{align}
\boxed{I(a,b) \approx \frac{h}3\left[f(a) + f(b) + 4\sum_{\substack{k\ impar\\ 1\dots{}N-1}}f(a+kh) + 2\sum_{\substack{k\ par \\ 2\dots{}N-2}}f(a+kh)\right].}
\end{align}

* En Python, se puede sumar fácilmente utilizando solamente números pares e impares, con la siguiente sintaxis:
    - `for k in range(1, N, 2)` para los términos impares y
    - `for k in range(2, N, 2)` para los términos pares.

## Fórmulas de Newton-Cotes

La regla de Simpson y de trapezoides pertenecen a una clase más general de reglas de integración:

* Subdividir la región de integración en $N$ subintervalos
* Aproximar la función con un polinomio, el orden de la aproximación es tal que:
    - Orden 0: Suma de Riemann
    - Orden 1: Regla de trapezoides
    - Order 2: Regla de Simpson

Esta clase de métodos da lugar a las fórmulas de Newton-Cotes.
Todas las fórmulas de Newton-Cotes puede ser escritas de la forma
\begin{align}
\int_a^b {\rm{d}}x f(x) \approx \sum_{k=1}^{N+1} w_k f(x_k).
\end{align}
donde:
  * $w_k$ son los "pesos"
  * $x_k$ son los puntos de muestreo. Nótese que usamos $N+1$ puntos (es decir, $N$ subregiones o subintervalos)
  * Para las fórmulas de Newton-Cotes, los puntos de muestreo son **equidistantes**.

## Generalización

Orden | Polinomio | Coeficientes |
:---: | :---: | :---: |
1 | Línea | $\frac{1}{2}, 1, 1,\dots, 1, \frac{1}{2}$ |
2 | Parábola | $\frac13, \frac43, \frac23, \frac43,\dots, \frac23, \frac43, \frac13$ |
3 | Cúbico | $\frac38, \frac98, \frac98, \frac34, \frac98, \frac98, \frac34, \dots, \frac98, \frac 38$ |
4 | Cuártico | $\frac{14}{45}, \frac{64}{45}, \frac{8}{15}, \frac{64}{45}, \frac{28}{45}, \frac{64}{45},\dots,\frac{64}{45}, \frac{14}{45}$ |

## Estimación de errores

Uno de los temas más importantes de los métodos numéricos corresponde a estudiar y analizar los errores en los que incurrimos utilizando metodología numérica

* Por ejemplo, si utilizamos la regla de trapezoides con un valor fijo de $N$, el valor real de la integral y nuestra aproximación difieren
* Conforme incrementamos $N$, la aproximación mejora
* El análisis de errores se refiere a **que tasa decrece o incrementa el error conforme variamos los recursos numéricos** (en este caso, $h$, que depende de $N$)

En la mayoría de métodos numéricos complejos, usualmente se desconoce este error. En matemática aplicada, para estos casos, se suelen estimar **cotas superiores** al error.

## Ecuaciones de Euler-McLaurin para estimación de errores

Para nuestras estimaciones de integrales, podemos basar nuestros cálculos en expansiones de Taylor para estimar el error. 

Por ejemplo, para la regla de trapezoides:
\begin{align}
I(a, b) = \int_a^b {\rm{d}}x f(x) \underbrace{=}_{ojo!} \underbrace{h\left[\frac12 f(a) + \frac12f(b) + \sum_{k=1}^{N-1} f(a+kh)\right]}_{\text{el método}} + \underbrace{\epsilon}_{\text{el error}}
\end{align}

* Para la regla de trapezoides es una estimación de 1$^{\rm er}$ orden, lo cual implica que es una estimación correcta con respecto a términos de orden $h$. El error es de 2$^{\rm do}$ orden:
$$\boxed{\epsilon = \frac{h^2[f'(a) - f'(b)]}{12} + O(h^{\geq 3})}$$

* La regla de Simpson es una estimación de 3$^{\rm er}$ orden y su estimación es correcta a términos proporcionales a $h^3$. El error es de orden proporcional a $h^4$:
$$\boxed{\epsilon = \frac{h^4[f'''(a) - f'''(b)]}{180} + O(h^{\geq 5})}$$

## Métodos adaptativos

Las ecuaciones de Euler-McLaurin suponen que conocemos las derivadas de la función que corresponde al argumento de integración. 
Que pasa si desconocemos estas derivadas?

Los métodos adaptativos se pueden utilizar para en estos casos, con base en el **orden de nuestra aproximación**. 

La idea corresponde a estimar la integral usando $N$ intervalos, luego hacer la misma estimación con $2N$ intervalos. Dependiendo del orden de la estimación, el error se puede evaluar de la siguiente manera:

* Orden 1 (Trapezoides): $\epsilon = (I_{2N} - I_N) / 3$
* Orden 2 (Simpson): $\epsilon = (I_{2N} - I_N) / 15$

Estas ecuaciones son importantes por dos razones:
* Si conocemos $\epsilon$, podemos estimar $I_{2N}$ de forma gratuita :)
* Podemos utilizar los resultados intermedios de $I_N$ para evaluar $I_{2N}$

### Derivaciones y más sobre el tema

Ver: Computational Physics - Mark Newman (Capítulo 5)

# Laboratorio

Utilice el método de trapezoides (Simpson si hay tiempo) para evaluar 
\begin{align}
E(x) = \int_{0}^{x} {\rm{d}}t e^{-t^2}.
\end{align}

Realice un gráfico de $E(x)$ como función de $x$. Esta integral no tiene solución analítica!! :o