# Tópicos avanzados de programación con Julia

## _Lenguajes y Errores_

### Temario para cubrir el objetivo 2

__Tratamiento de errores mediante la depuración, el testing y buenas prácticas de programación.__
- Lenguajes formales, naturales y metalenguajes.
  - Lenguajes.
  - Lenguajes Naturales.
  - Lenguajes formales.
  - Metalenguajes.
  - Traducción y codificación de un lenguaje formal a otro.
  
- Tipos de errores en programación.
  - Errores de sintaxis.
  - Errores en tiempo de ejecución.
  - Errores semánticos.
    - Errores semánticos relacionados con la implementación del programa.
    - Errores en el planteamiento del modelo.
      - Mapeo de Lorenz.
      - Fenómeno de Gibbs.
    - Errores numéricos en general.
    - Errores derivados de la aproximación del método numérico.
    - Errores numéricos debidos a la aritmética finita.
      - Errores al realizar operaciones aritméticas.
      - Modelos teóricos que no aplican debido a la aritmética finita.
      - Acumulación de errores de redondeo.
      - Más precisión.

#### Errores de sintaxis

### Lenguajes formales, naturales y metalenguajes

#### Lenguajes

- Un __símbolo__ es un objeto indivisible.
  - «_a_», «_A_» ..., «_z_», «_Z_», «_0_», ..., «_9_», «_,_», «_;_», «_._», «_:_», «𝄞»,..., etc.
- Un __alfabeto__ $S$ es un conjunto de __símbolos__ $\{s_i\}_{i\in I}$, que puede ser __finito__ o __infinito__.
  - Para fines prácticos será __finito__:
    -  $S = \{s_1 , s_2 , \dots , s_n\}$
- Una __cadena__ o __palabra__ $x$ es una sucesión __finita__ de __símbolos__, de un __alfabeto__ __finito__.
 -  La longitud de una cadena $x = x_1 x_2 \dots x_k$ es el número de símbolos «$k$» que la constituyen. La denotaremos por $l(x)=k$.
   - La cadena de longitud cero es la cadena vacía. Esta es una cadena especial y la denotaremos por $e$.
- $S^*$ es el conjunto de todas las __cadenas__ sobre un __alfabeto__ $S$.
  - $S^n = \{x\in S^* | l(x) = n\}$ es el conjunto de todas las cadenas de longitud $n$.
    - Si $|S|=k$ $\implies$ $|S^n|= k^n$
  - $S^*=    \bigcup S^n$ $\implies$ $S^*$ es numerable.
  - Sea $\circ\colon S^*\times S^*\to S^*$, $x\circ y=xy$. A la operación $\circ$ se le llama __concatenación__, __yuxtaposición__ o producto de cadenas.
    - $(S^*, \circ, e)$ es un semigrupo (semigrupo libre).
    - $S^*=\langle S\rangle$. El conjunto de todas las palabras $S^*$, es el conjunto finitamente generado por el subconjunto __alfabeto__ $S$ con la operación __concatenación__ $\circ$.
    
- $L\subseteq S^*$ es un __lenguaje__.
- O más general, $L$ es un lenguaje si existe $f\colon L\to S^*$.

__Ejemplo de lenguajes__
1. El español. Donde $S$ es el alfabeto tradicional, unión el resto de símbolos usados, unión el espacio en blanco y el salto de linea.
- En general cualquier idioma, norma, dialecto o jerga es un lenguaje según la definición anterior.
- Los grupos libres $(S^*, \circ, e)$ (cada palabra tiene un inverso).
  - La edición de texto (caso particular de una máquina de Turing) puede modelarse como una sucesión de operaciones en el grupo libre generado por todos los caracteres que se pueden escribir. Donde borrar un símbolo es equivalente a concatenarlo con su inverso.
- El conjunto «$\{ 1011, 01, 0011\}$» es un lenguaje de 3 palabras en $S=\{0, 1\}$.
- El lenguaje matemático.
- La musica (las partituras).
- Las fórmulas químicas.
- Los pseudocódigos.
- UML (en particular los diagramas de actividad o de flujo).
- $\TeX$, $\LaTeX$ y __HTML__
- Los lenguajes de máquina y de programación.

Debido a que un lenguaje puede tener una cardinalidad muy grande o incluso infinita, en ocasiones es necesario determinarlo mediante alguna regla de pertenencia (empleando el axioma de esquema de comprensión).
- La __sintaxis__ de un lenguaje es el conjunto de reglas que conforman la propiedad de selección. De ese modo podemos saber si una palabra formada con elementos de $S^*$ pertenece o no a $L$.

Dado que un lenguaje se crea para comunicar algo, es necesario saber cual es el significado de cada elemento.
- La __semántica__ de un lenguaje es el estudio del significado de sus palabras.

#### Lenguajes Naturales

- Son lenguajes que surgen de manera espontánea.
- Los dos primeros ejemplos son lenguajes naturales.
- La sintaxis está en constante cambio y en ocasiones es confusa.
  - Las reglas de pertenencia son poco claras. Es decir, es difícil o imposible determinar todos los elementos de $L\subseteq S^*$, aunque $S^*$ si esté bien determinado.
  - Cuando una palabra que no pertenece al lenguaje, es aceptada por un número significativo de personas, entonces su uso se regulariza y pasa a pertenecer al lenguaje.
- La semántica es ambigua. 
  - Una palabra puede tener distintos significados, dependiendo del contexto o de la región que la utiliza.
  - Una palabra puede tener un significado distinto al significado literal (metáforas o lenguaje figurado).
  - Dado a que suelen ser muy imprecisos, en ocasiones es necesario aumentar el tamaño de la palabra, para eliminar ambigüedades. Esto los hace bastante extensos para transmitir una idea.

#### Lenguajes formales

- Son lenguajes construidos artificialmente.
- Todos los ejemplos del tres en adelante, son lenguajes formales.
- Su sintaxis es clara.
  - Siempre es posible determinar si una palabra pertenece o no al lenguaje.
- La semántica es determinista.
  - El significado de las palabras es preciso (o esa es la idea).
  - El significado es literal.
  - Debido a que no hay ambigüedades (se trata de que no hayan), suelen ser muy densos o crípticos.

#### Metalenguajes

El metalenguaje es un lenguaje que se usa para hablar de otro lenguaje (lenguaje objeto).
Se puede ver como una extensión del lenguaje objeto.

__Ejemplo:__
1. Cadenas compuestas por varios idiomas:

  - «Nos vemos mañana, bye»

- Cuando usas un idioma para describir otro idioma.
  - Se puede usar el mismo idioma para describirse a si mismo. En ese caso el lenguaje objeto coincide con el metalenguaje.
  
- Un «script» comentado es un metalenguaje.
```julia
println("Hola") #Imprime la palabra «Hola».
```
- En las matemáticas, casi siempre se emplea un metalenguaje.
Por ejemplo para definir sucesiones convergentes $\{a_n\}_{n\in\mathbb N}$ en un espacio métrico $(X, d)$:

Si existe un $l\in X$ tal que $\forall_{\epsilon>0}\exists_{N\in\mathbb N}$, tal que si $N\le n$, entonces $d(a_n,l)<\epsilon$

En el lenguaje formal matemático sería:

$\exists_{l\in X}\forall_{\epsilon>0}\exists_{N\in\mathbb N}[\forall_{n\ge N}\implies d(a_n,l)<\epsilon]$

Incluso en ese caso, necesitas de algún otro lenguaje para presentar al espacio métrico, y escribir el nombre de la definición.

5. La fórmula del agua es $H_2O$.
- Todo este notebook es un metalenguaje que incorpora varios lenguajes objetos.

#### Traducción y codificación de un lenguaje formal a otro

1. Dado dos lenguajes, $L_1$ y $L_2$. Una _traducción_ de $L_1$ a $L_2$ es una función de $f\colon L_1\to L_2$.
  - Un script o «palabra» de Julia se traduce a una palabra en lenguaje binario.
  - Una traducción no necesariamente es biyectiva.
    - Un lenguaje puede no abarcar todas las instrucciones posibles en binario.
    - Pueden existir dos palabras de $L_1$ que se traduzcan a una misma palabra en $L_2$.

__Ejemplo__

  `x="hola"; println(x)` y `saludo="hola"; println(saludo)` se traducen de la misma manera a binario.
  
2. Si $f$ es biyectiva, entonces se le llama función de codificación o simplemente _codificación_.
  - A los lenguajes formales que tienen una función de codificación se les llama códigos.
    - Si el alfabeto tiene $n$ símbolos entonces  es un código $n-ario$.
    - Es posible convertir a un lenguaje formal en un código si trabajamos en el cociente de ese lenguaje con alguna relación de equivalencia.
      - En el ejemplo anterior «$x\sim y$, si son nombres de variables».

### Tipos de errores en programación

Los errores se pueden clasificar en tres grandes grupos:

1. Errores de sintaxis.
- Errores en tiempo de ejecución.
- Errores semánticos.

#### Errores de sintaxis

1. Al utilizar un símbolo que no pertenezca al alfabeto del lenguaje.

La palabra «El perr🌝 duerme» es un error de sintaxis en el español, ya que «🌝», no pertenece al alfabeto.

Para lenguajes como `Julia`, esto no es un problema, ya que aceptan cualquier caracter unicode. En este caso $|S|\le2^{32}$, ya que los caracteres unicode ocupan entre uno y cuatro Bytes. Por tanto sólo pueden haber como máximo $2^{32}$ caracteres unicode.

Esta palabra pertenece a Julia:

In [None]:
☕ = "una tasa de café"
🌝 = "feliz"
string("tomar ", ☕, " me pone ", 🌝)

En lenguajes como `C` (al menos en el estándar _ANSI_ ), no podría emplear los símbolos ☕ o 🌝, para definir variables, ya que estos no están en su alfabeto.

2. Al utilizar una palabra que no existe en el lenguaje, aunque cada símbolo esté en el alfabeto.

  - La palabra «eL perro duerme» no pertenece al español.

  - ¿Las palabras «español», y «espannol» pertenece al español?

  - Las siguientes palabras no pertenecen a Julia:

In [None]:
☕ = "una tasa de café
🌝 = "feliz"
string("tomar ", ☕, " me pone ", 🌝)

In [None]:
x=1
if x<=1
    println("Es menor a uno") #Esto no es python 🌝.

Los errores de sintaxis son reportados por el compilador o el intérprete. En la mayoría de los casos el error está presente en alguna linea anterior a la que indica el intérprete. Muchas veces esto ocurre en la linea inmediata anterior.

Los errores de sintaxis se descubren cuando el intérprete o el compilador, traduce el «script» a binario. 

Los errores de sintaxis disminuyen con la práctica del programador.

En la mayoría de los casos se debe a:
- La falta de un cierre «end», «"» «)», «]», «}»

- Uso de palabras reservadas par nombre de variables:

In [None]:
if=1

- Uso del nombre de una función para nombre de variable:

In [None]:
cos=2 #Si ya se usó el coseno esto dará error, en caso contrario no.

In [None]:
cos(1) #Si se usó «cos» para nombrar una variable esto dará error.

- Uso de «=» en lugar de «==» en una comprobación.

In [None]:
x=1
if x=1 #Esto es una asignación, no una comprobación.
    println("Es igual a uno")
end

#### Errores en tiempo de ejecución

Los errores en tiempo de ejecución se presentan si algo falla mientras se ejecuta el programa. La mayoría de los mensajes de error en tiempo de ejecución indican dónde ocurrió el error y qué funciones se estaban ejecutando.

Alguno de los errores en tiempo de ejecución más comunes:
- Si no se cumplen las condiciones para la entrada de un programa o función.

In [None]:
function CombLineal(x,y)#y no puede ser cero.
    a=x÷y
    b=x%y
    s=string(x,"=",a,"⋅",y,"+",b)
    println(s)
end

In [None]:
CombLineal(5,2)#Perfecto.

In [None]:
CombLineal(5,0) #El operador «÷» no admite que el segundo operando sea 0.

In [None]:
0.0/0.0 #En Julia no es un error, pero sin duda da problemas.

In [None]:
1.0/0.0 #Igual que el anterior.

En Julia, los errores anteriores serían considerados errores semánticos, más que errores en tiempo de ejecución.
En otros lenguajes como Python, se consideran errores de ejecución, ya que levantan excepciones.

- Llamada a una variable que no se ha declarado.

In [None]:
existencia = 10
function Venta(vendido::Bool, exist::Int64)
   if vendido
        local_exist = exist - 1 #Lugar incorrecto par definir variable local.
        println("Se vendió un producto")
    end
    return local_exist
end

In [None]:
existencia = Venta(true, existencia)

In [None]:
#En este caso local_exist, no está definida.
existencia = Venta(false, existencia)

- Bucle infinito.

In [None]:
function Contador(a)
    i=a
    s=string("El último es ", i)
    while i != 10
        i+=1
        s=string("El último es ", i)
    end
    println(s)
end

In [None]:
Contador(2)
Contador(10)

In [None]:
Contador(12) #bucle infinito.

- Recursión infinita.

In [None]:
function factorial(n)
    fact=n
    if fact == 0 || fact == 1
        return 1
    end
    fact*=factorial(fact-1)
end

In [None]:
factorial(5)

In [None]:
factorial(0)

In [None]:
factorial(5.0) #Funciona.

In [None]:
factorial(5.1) #La recursión es infinita.

In [None]:
factorial(-5) #Igualmente.

- Acceso fuera de los límites de indexación.

In [None]:
arreglo=[1,2,3]

In [None]:
arreglo[1]

In [None]:
arreglo[0] #fuera de rango.

In [None]:
arreglo[4] #Igualmente.

#### Errores semánticos

Los errores semánticos ocurren cuando la palabra pertenece al lenguaje, pero tiene un significado distinto al que nosotros creemos que tiene. Dicho de otra forma. Un error semántico es aquel que ocurre sin levantar una excepción, pero provoca un resultado distinto al que nosotros esperamos.

Los errores semánticos son los más complejos de identificar y corregir, ya que el intérprete no te indica que existe. La forma de identificarlos es realizar pruebas e identificar si el resultado es el deseado o no.

Los errores semánticos pueden ser de naturaleza muy variada. En general se pueden clasificar en dos grupos:

1. Errores semanticos relacionados con la implementación del programa.
- Errores semánticos independientes a la implementación del programa.
  - Errores en el planteamiento del modelo.
  - Errores numéricos.
    - Errores numéricos derivados de la aproximación del método numérico.
    - Errores numéricos debidos a la aritmética finita


En las secciones siguientes se mostrarán algunos casos particulares de interés para nosotros.

##### Errores semánticos relacionados con la implementación del programa

En algunos casos son fáciles de detectar. Sólo con hacer algunos casos de pruebas, se puede ver rápidamente que el programa no devuelve el resultado esperado.

En otros el error puede ser más sutil. Puede funcionar aparentemente de forma correcta, e incluso puede que devuelva el resultado deseado, y aún así estar mal implementado.

Veamos el siguiente ejemplo:

Sea un sistema de ecuaciones diferenciales ordinarias
$$
\left\{
\begin{array}{ll}
    \frac{dx_1}{dt} = f_{x_1}(x_1,x_2, \cdots, x_n, t)\\
    \frac{dx_2}{dt} = f_{x_2}(x_1,x_2, \cdots, x_n, t)\\
    \vdots\\
    \frac{dx_n}{dt} = f_{x_n}(x_1,x_2, \cdots, x_n, t)\\
\end{array} 
\right.
$$

El sistema anterior es equivalente a $\frac{d\mathbf{r}}{dt} = \mathbf{f}(\mathbf{r},t)$, con $\mathbf{r}\in\mathbb R^n$ y $\mathbf{f}\colon A\subseteq\mathbb R^{n+1}\to\mathbb R^{n}$

Supongamos que queremos integrar el sistema en el intervalo $t\in [a, b]$ y $\mathbf{r}(a)=\mathbf{r}_a$

Por Taylor:
$$\mathbf{r}(t+h)=\mathbf{r}(t)+h\frac{d\mathbf{r}}{dt}+O(h^2)=\mathbf{r}(t)+h\mathbf{f}(x,t)+O(h^{2})$$

Esto conduce al método de Euler

$$
\mathbf{r}(t+h)=\mathbf{r}(t)+h\mathbf{f}(x,t)+O(h^2)
$$

Se puede demostrar que el método RK4 es equivalente a usar los primeros cinco términos del desarrollo de Taylor de \mathbf{r}.

Una de las formas más comunes de RK4 (existen una cantidad no numerable de variaciones de RK4) es la siguiente:

$$
\left\{
\begin{array}{ll}
    \mathbf{k_1}=h\mathbf{f}(\mathbf{r},t)\\
    \mathbf{k_2}=h\mathbf{f}(\mathbf{r}+0.5\mathbf{k_1},t+0.5h)\\
    \mathbf{k_3}=h\mathbf{f}(\mathbf{r+}0.5\mathbf{k_2},t+0.5h)\\
    \mathbf{k_4}=h\mathbf{f}(\mathbf{r}+\mathbf{k_3},t+h)
\end{array} 
\right.
$$

$$
\mathbf{r(t+h)}=\mathbf{r}(t)+\frac{(\mathbf{k_1+2k_2+2k_3+k_4)}}{6.}+O(h^5)
$$

El código siguiente es una implementación del método RK4 en Python. Esta implementación tiene un error que hace que se tenga una precisión igual a la del método de Euler.

```python
def RK4(f,a,b,N,x_0,v_0):
    #RK4 para un sistema de dos ecuaciones diferenciales ordinarias.
    h = (b-a)/N
    lista_t=arange(a,b,h)
    lista_x = []
    lista_v = []
    r = array([x_0,v_0],float)#Condiciones iniciales.
    for t in lista_t:
        k1=h*f(r,t)
        k2=h*f(r+0.5*k1,t+0.5*h)
        k3=h*f(r+0.5*k2,t+0.5*h)
        k4=h*f(r+k3,t+h)
        r+=(k1+2*k2+2*k3+k4)/6.0
        lista_x.append(r[0])
        lista_v.append(r[1])
    return [lista_t, lista_x, lista_v]
```

<tr>
    <td> <img src="img/rk4-1.png" width="100%"/> </td>
    <td> <img src="img/rk4-2.png" width="100%"/> </td>
</tr>

En la próxima plática hablaremos más sobre este tema.

##### Errores en el planteamiento del modelo

###### Mapeo de Lorenz

Al discretizar un sistema dinámico continuo (convertirlo en un sistema de ecuaciones en diferencias), el nuevo sistema dinámico (_discreto_ ) puede comportarse de manera distinta. Un ejemplo de lo anterior es la logística.

El siguiente sistema propuesto por Lorenz, fue famoso por acuñar el nombre de «caos computacional».

$$
\left\{
\begin{array}{ll}
    \frac{dx}{dt} = x-y-x^3\\
    \frac{dy}{dt} = x-x^2y
\end{array} 
\right.
$$

¿Que ocurre al integrarlo mediante Euler?

### <span style="color:red">CÓDIGO PYTHON</span>.

In [None]:
from pylab import *
from numpy import*

#Método de Euler para sistemas de dos ecuaciones.
#«f» función a integrar en el intervalo temporal [«a», «b»].
#«N» número de intervalos en que se dividirá [«a», «b»].
#«x_0» y «v_0» son las condiciones iniciales.
def Euler(f,a,b,N,x_0,v_0):
    h = (b-a)/N
    lista_t=arange(a,b,h) #Lista con tiempo discreto.
    lista_x = []
    lista_v = []
    r = array([x_0,v_0],float)#Condiciones iniciales.
    for t in lista_t:
        lista_x.append(r[0]) #Órbita de x.
        lista_v.append(r[1]) #Órbita de v.
        r+=h*f(r,t+h)
    return [lista_t, lista_x, lista_v]
    
def f(r,t):
    x=r[0]
    y=r[1]
    fx=x-y-x**3
    fy=x-x**2*y
    return array([fx,fy],float)

def graficar(solu):
    fig1,(ax1, ax2) = plt.subplots(nrows=1,ncols=2, figsize=(10, 4))
    ax1.plot(solu[0], solu[1], label='x')
    ax1.plot(solu[0], solu[2], label='y')
    ax1.set_xlabel('t')
    ax1.set_ylabel('Órbitas de $x$ y $y$')
    ax1.set_title('Discretizado por Euler')
    ax1.legend()
    ax2.plot(solu[1], solu[2])
    ax2.set_xlabel('x')
    ax2.set_ylabel('y')
    ax2.set_title('Espacio de fase')
    show()

Con $t\in[0,100]$, $N=3000$ y $(x_0, y_0)=(0.1,0.0)$:

In [None]:
solu=Euler(f,0,100,3000,0.1,0.0)
graficar(solu)

Con $t\in[0,100]$, $N=300$ y $(x_0, y_0)=(0.1,0.0)$:

In [None]:
solu=Euler(f,0,100,300,0.1,0.0)
graficar(solu)

Con $t\in[0,100]$, $N=170$ y $(x_0, y_0)=(0.1,0.0)$:

In [None]:
solu=Euler(f,0,100,170,0.1,0.0)
graficar(solu)

Otra forma de expresar el sistema discretizado es:
$$
\left\{
\begin{array}{ll}
    x_{n+1} = x_n+h(x_n-y_n-x_n^3)\\
    y_{n+1} = y_n+h(x_n-x_n^2y_n)
\end{array} 
\right.
$$

Donde $h=x_{n+1}-x_n=\frac{(b-a)}{N}$, $t\in[a, b]$, $N$ es el número de iteraciones y $(x_0,y_0)$ es el punto inicial.

Nosotros estamos acostumbrados a expresar el sistema de esta manera:

Sea la familia de funciones $f_h\colon\mathbb R^2 \to \mathbb R^2$, $f_h(x,y)=\left(x+h(x-y-x^3), y+h(x-x^2y)\right)$

Se observa que el sistema es estructuralmente inestable respecto al parámetro h.

Al resolver un sistema de ecuaciones diferenciales por métodos numéricos, lo que se está haciendo es sustituir el sistema dinámico continuo por uno discreto, que suponemos, tiene el mismo comportamiento.

###### Fenómeno de Gibbs

Aunque una función se pueda desarrollar en series trigonométricas Fourier, existen problemas en las discontinuidades de salto.

In [None]:
using Plots
Salto(x)=x<0 ? -1 : 1 #función salto o escalón.
    
# Suma parcial de la serie de Fourier de la función salto.
function SaltoFourier(x::Float64, n::Int64)
    suma=0.0
    for i in 1:n
       suma+=sin((2*i-1)*x)/(2*i-1)
    end
    return 4.0*suma/π
end

In [None]:
n=20
plot(-π:0.001:π, x -> SaltoFourier(x,n))
plot!(-π:0.001:π, Salto)

In [None]:
n=1000
plot(-π:0.001:π, x -> SaltoFourier(x,n))
plot!(-π:0.001:π, Salto)

En los puntos de discontinuidad, la gráficas no convergen al promedio de los límites laterales. En esos puntos, la gráfica converge a un segmento de longitud:

$$
L=\frac{2}{\pi}|f(a+)-f(a-)|\int \limits_{0}^{\pi} \frac{\sin(t)}{t}dt
$$

Centrado en el punto $\left(a, \frac{f(a+)+f(a-)}{2}\right)$, donde $a$ es el punto de discontinuidad.

Se puede modificar la serie de Fourier para que la gráfica converja adecuadamente. La idea es sustituir las sumas parciales, por los promedios de todas las sumas parciales, desde la primera hasta la última. Este método se conoce como suma de Féjer, y además de solucionar el problema anterior, hace que se necesiten condiciones más débiles para que las series de Fourier (modificadas por Féjer) converjan.

In [None]:
#Suma parcial de Féjer para la función salto.
function SaltoFejer(x::Float64, n::Int64)
    suma=0.0
    for i in 1:n
        suma+=(1-(2*i-1)/(2*n))*sin((2*i-1)*x)/(2*i-1)
    end
    return 4.0*suma/π
end

In [None]:
n=20
plot(-π:0.001:π, x -> SaltoFejer(x,n))
plot!(-π:0.001:π, Salto)

In [None]:
n=1000
plot(-π:0.001:π, x -> SaltoFejer(x,n))
plot!(-π:0.001:π, Salto)

Adjunto el artículo donde saqué el ejemplo.

##### Errores numéricos en general

Sea $x_{t}$ el valor teórico o verdadero de alguna número y $x_{a}$ el valor aproximado. 

El error absoluto está definido por:

$$err(x_{a})=|x_{t}-x_{a}|$$

El error relativo es: 
$$err_r(x_{a})=\frac{|x_{t}-x_{a}|}{x_{t}}$$

El error porcentual es:
$$err_p(x_{a})=err_r(x_{a})(100\%)$$

En la mayoría de los casos los que realmente importan son los errores relativos. En eso se basa el punto flotante (trata de mantener el mismo error relativo).

Al ejecutar funciones u operaciones con valores aproximados, sus errores se propagan. Si se ejecutan un número considerable de operaciones con valores aproximados, el resultado puede distar bastante del esperado.

Si $z=f(x,y)$ es diferenciable y las variables $x$, $y$ son independientes $\implies$ $err(z_a)=\sqrt{f_x^2dx^2+f_y^2dy^2}$, donde $dx=err(x_a)$, $dy=err(y_a)$ y las derivadas se evalúan en $(x_a, y_a)$.

Si las variables son dependientes, entonces hay que considerar la covarianza. [Aquí](https://es.wikipedia.org/wiki/Propagaci%C3%B3n_de_errores) se muestra como quedaría la expresión.

##### Errores derivados de la aproximación del método numérico

En la mayoría de los casos, los métodos numéricos son aproximaciones polinomiales (Taylor) de una función (derivada, integral, ...).

- En cada paso del método de Newton-Raphson, el cero de $f$ se aproxima mediante los dos primeros términos del desarrollo en serie de Taylor de $f$. El error que se comente en cada paso es $O(h^2)$, donde $h=err(x_a)$ y $x_a$ es la aproximación del cero de $f$ en ese paso. Si el punto inicial está en la cuenca de atracción del sistema dinámico discreto, entonces $h\to 0$ a medida que recorremos la órbita $\implies$ $f(x_a)\to 0$ también.

- Lo mismo ocurre con los métodos de integración de funciones y de ecuaciones diferenciales.
  - En cada iteración del método de Euler, el error es $O(h^2)$ y el error global (el error propagado al final) es $O(h)$.
  - El error local (en cada paso) del método RK4 es $O(h^5)$ y el error global es $O(h^4)$.
  - Verlet tiene un error local de $O(h^3)$ y un error global de $O(h^2)$. Sin embargo tiene una propiedad interesante. Conserva la energía del sistema dinámico continuo original. Es por eso que durante mucho tiempo se usó para modelar la mecánica de cuerpos celestes (para que conservaran la órbita).

<img src="img/c.png" width="60%"/>
<img src="img/c-2.png" width="60%"/>

##### Errores numéricos debidos a la aritmética finita

Debido a que contamos con un número finito de valores para representar a los reales, la precisión es limitada. Además, al realizar varias operaciones aritméticas consecutivas, los errores de redondeo se van acumulando. En la próxima plática hablaremos más sobre este tema.

Ahora veamos algunos ejemplos.

###### Errores al realizar operaciones aritméticas

Algunos ejemplos donde falla la aritmética es al restar dos números muy cercanos. También al dividir uno grande por uno pequeño y viceversa. En ocasiones se pueden atenuar el error, haciendo alguna manipulación algebraica.

In [None]:
x=5.7e14
y1=log(x+1)-log(x)
y2=log((x+1)/x)

x=big"5.7e14"
y3=log(x+1)-log(x)

println(y1, "\n", y2, "\n", y3)

In [None]:
x=5.7e14
y1=√(x^2+1)-x
y2=1/(√(x^2+1)+x)

x=big"5.7e14"
y3=√(x^2+1)-x

println(y1, "\n", y2, "\n", y3)

In [None]:
π/4.0

###### Modelos teóricos que no aplican debido a la aritmética finita

Muchos modelos teóricos asumen que las funciones son suficientemente bien comportadas. El problema es que la aritmética finita impiden ese buen comportamiento.

En la interpolación, podemos encontrar un ejemplo donde esto ocurre.

El fenómeno es independiente del método usado. Yo voy a emplear uno de los mejores.

Sean $(x_j,f_j)$ (nodos) con $j=0,1,\dots n$ puntos distintos.

El método de interpolación baricéntrica, está dado por la siguiente expresión.

$$p(x)=\frac{\sum_{j=0}^n\frac{w_j}{x-x_j}f_j}{\sum_{j=0}^n\frac{w_j}{x-x_j}}, w_j=\frac{1}{\prod_{k=0,k\neq j}^{n}(x_j-x_k)}$$

Si particionamos el intervalo $[a, b]$ con $n+1$ puntos equidistantes, obtenemos después de simplificar los factores independientes de $j$:

$$w_j=(-1)^j\binom{n}{j}$$

In [6]:
using Plots
function InterpBaric(x::Float64, f::Function, a::Float64, b::Float64,n::Int64)
    suma_num, suma_den = 0.0, 0.0 #Almacenan las sumas del numerador y del denominador.
    #Se crea la lista de los puntos equidistantes.
    xj=range(a, length=n+1, stop=b)
    fj=f.(xj)
    
    if x in xj
       return f(x) #Para que el algoritmo funcione bien, x no puede estar en xj.
    end
    
    #Se realiza la interpolación baricéntrica.
    for j in 0:n
        wj=(-1)^j*binomial(n,j)
        suma_num+=wj*fj[j+1]/(x-xj[j+1])
        suma_den+=wj/(x-xj[j+1])
    end
    return suma_num/suma_den
end

Runge(x)=1.0/(1.0+x^2)

Runge (generic function with 1 method)

In [None]:
a, b, n = -5.0, 5.0, 10
#Se crea la lista equidistante de puntos para graficar.
xp=range(a, length=n+1, stop=b)
yp=Runge.(xp)
plot(a:0.001:b, x -> InterpBaric(x, Runge, a, b, n))
plot!(a:0.001:b,Runge)
plot!(xp, yp, seriestype=:scatter)

In [None]:
a, b, n = -5.0, 5.0, 20
#Se crea la lista equidistante de puntos para graficar.
xp=range(a, length=n+1, stop=b)
yp=Runge.(xp)
plot(a:0.001:b, x -> InterpBaric(x, Runge, a, b, n))
plot!(a:0.001:b,Runge)
plot!(xp, yp, seriestype=:scatter)

In [None]:
a, b, n = -0.5, 0.5, 10
#Se crea la lista equidistante de puntos para graficar.
xp=range(a, length=n+1, stop=b)
yp=Runge.(xp)
plot(a:0.001:b, x -> InterpBaric(x, Runge, a, b, n))
plot!(a:0.001:b,Runge)
plot!(xp, yp, seriestype=:scatter)

In [None]:
a, b, n = -0.5, 0.5, 65
#Se crea la lista equidistante de puntos para graficar.
xp=range(a, length=n+1, stop=b)
yp=Runge.(xp)
plot(a:0.001:b, x -> InterpBaric(x, Runge, a, b, n))
plot!(a:0.001:b,Runge)
plot!(xp, yp, seriestype=:scatter)

El problema es que se necesita que la función sea demasiado suave y los errores aritméticos lo impiden.

No obstante existe una manera de combatir el problema. Se trata de seleccionar una distribución de nodos que contrarreste los efectos. Una manera es tomar una de las distribuciones de Chebyshev.

Se puede particionar $[-1, 1]$ en los puntos:
$$x_j=\cos\left(\frac{j\pi}{n}\right), \quad j=0,\dots, n$$

Es fácil transformarlos a un intervalo arbitrario $[a, b]$

$$x_j'=\frac{(b-a)x_j+a+b}{2}$$

Al sustituir en $w_j$ y eliminar los factores comunes, se obtiene:

$$w_j=(-1)^j\delta_j, \quad\delta_j=\begin{cases} 1/2,& j=0\text{ o }j=n,\\ 1,& \text{para los demás casos}\end{cases}$$

In [None]:
function InterpBaricCheb(x::Float64, f::Function, a::Float64, b::Float64,n::Int64)
    suma_num, suma_den = 0.0, 0.0 #Almacenan las sumas del numerador y del denominador.
    #Se crea la lista de puntos distribuidos según Chebyshev.
    xj=[]
    
    for j in 0:n
        xj_aux=cos((j*π)/n) #En [-1, 1]
        xj_aux=((b-a)*xj_aux+a+b)*0.5 #En [a, b].
        push!(xj, xj_aux)
    end
    
    fj=f.(xj)
    
    if x in xj
        return f(x) #Para que el algoritmo funcione bien, x no puede estar en xj.
    end
    
    δ(i) = (i == 0)||(i == n) ? 0.5 : 1.0
    
    #Se realiza la interpolación baricéntrica.
    for j in 0:n
        wj=(-1)^j*δ(j)
        suma_num+=wj*fj[j+1]/(x-xj[j+1])
        suma_den+=wj/(x-xj[j+1])
    end
    return suma_num/suma_den
end

In [None]:
a, b, n = -5.0, 5.0, 10
#Se crea la lista (Chebyshev) de puntos para graficar.
xp=[]
for j in 0:n
    xp_aux=cos((j*π)/n)
    xp_aux=((b-a)*xp_aux+a+b)*0.5
    push!(xp, xp_aux)
end
yp=Runge.(xp)
plot(a:0.001:b, x -> InterpBaricCheb(x, Runge, a, b,n))
plot!(a:0.001:b,Runge)
plot!(xp, yp, seriestype=:scatter)

In [None]:
a, b, n = -5.0, 5.0, 20
#Se crea la lista (Chebyshev) de puntos para graficar.
xp=[]
for j in 0:n
    xp_aux=cos((j*π)/n)
    xp_aux=((b-a)*xp_aux+a+b)*0.5
    push!(xp, xp_aux)
end
yp=Runge.(xp)
plot(a:0.001:b, x -> InterpBaricCheb(x, Runge, a, b,n))
plot!(a:0.001:b,Runge)
plot!(xp, yp, seriestype=:scatter)

In [None]:
#Se crea la lista (Chebyshev) de puntos para graficar.
xp=[]
a, b, n = -5.0, 5.0, 65
for j in 0:n
    xp_aux=cos((j*π)/n)
    xp_aux=((b-a)*xp_aux+a+b)*0.5
    push!(xp, xp_aux)
end
yp=Runge.(xp)
plot(a:0.001:b, x -> InterpBaricCheb(x, Runge, a, b,n))
plot!(a:0.001:b,Runge)
plot!(xp, yp, seriestype=:scatter)

Adjunto un artículo bastante interesante sobre este tema.

###### Acumulación de errores de redondeo

En ocasiones no es posible mejorar más el resultado aunque el modelo teórico sea más preciso.

<img src="img/comp.png" width="60%"/>

Los errores aritméticos se empiezan a acumular al aumentar el número de pasos.

RK4 es el que mejor resiste, pero aún así termina empeorando si disminuimos demasiado h.

Este es el comportamiento en el intervalo bueno.
<img src="img/comp-2.png" width="60%"/>

<img src="img/comp-3.png" width="60%"/>

###### Más precisión

- Se puede aumentar la precisión de forma «ilimitada» (hasta que se acabe la memoria __RAM__) usando [BigFloat](https://docs.julialang.org/en/v1/base/numbers/#BigFloats-and-BigInts).
- Además existen las librerías [Decimals.jl](https://github.com/JuliaMath/Decimals.jl) y [DecFP.jl](https://github.com/JuliaMath/DecFP.jl), para trabajar con más precisión.