# Tópicos avanzados de programación con Julia

## _Lenguajes y Errores_

### Temario para cubrir el objetivo 2

__Tratamiento de errores mediante la depuración, el testing y buenas prácticas de programación.__
- Lenguajes formales, naturales y metalenguajes.
  - Lenguajes.
  - Lenguajes Naturales.
  - Lenguajes formales.
  - Metalenguajes.
  - Traducción y codificación de un lenguaje formal a otro.
  
- Tipos de errores en programación.
  - Errores de sintaxis.
  - Errores en tiempo de ejecución.
  - Errores semánticos.
    - Errores en el planteamiento del modelo (¡La vacas esféricas,!).
    - Errores numéricos derivados de la aproximación del método numérico.
    - Errores numéricos de la aritmética finita.

#### Errores de sintaxis

### Lenguajes formales, naturales y metalenguajes

#### Lenguajes

- Un __símbolo__ es un objeto indivisible.
  - «_a_», «_A_» ..., «_z_», «_Z_», «_0_», ..., «_9_», «_,_», «_;_», «_._», «_:_», «𝄞»,..., etc.
- Un __alfabeto__ $S$ es un conjunto de __símbolos__ $\{s_i\}_{i\in I}$, que puede ser __finito__ o __infinito__.
  - Para fines prácticos será __finito__:
    -  $S = \{s_1 , s_2 , \dots , s_n\}$
- Una __cadena__ o __palabra__ $x$ es una sucesión __finita__ de __símbolos__, de un __alfabeto__ __finito__.
 -  La longitud de una cadena $x = x_1 x_2 \dots x_k$ es el número de símbolos «$k$» que la constituyen. La denotaremos por $l(x)=k$.
   - La cadena de longitud cero es la cadena vacía. Esta es una cadena especial y la denotaremos por $e$.
- $S^*$ es el conjunto de todas las __cadenas__ sobre un __alfabeto__ $S$.
  - $S^n = \{x\in S^* | l(x) = n\}$ es el conjunto de todas las cadenas de longitud $n$.
    - Si $|S|=k$ $\implies$ $|S^n|= k^n$
  - $S^*=    \bigcup S^n$ $\implies$ $S^*$ es numerable.
  - Sea $\circ\colon S^*\times S^*\to S^*$, $x\circ y=xy$. A la operación $\circ$ se le llama __concatenación__, __yuxtaposición__ o producto de cadenas.
    - $(S^*, \circ, e)$ es un semigrupo (semigrupo libre).
    - $S^*=\langle S\rangle$. El conjunto de todas las palabras $S^*$, es el conjunto finitamente generado por el subconjunto __alfabeto__ $S$ con la operación __concatenación__ $\circ$.
    
- $L\subseteq S^*$ es un __lenguaje__.

__Ejemplo de lenguajes__
1. El español. Donde $S$ es el alfabeto tradicional, unión el resto de símbolos usados, unión el espacio en blanco y el salto de linea.
- En general cualquier idioma, norma, dialecto o jerga es un lenguaje según la definición anterior.
- Los grupos libres $(S^*, \circ, e)$ (cada palabra tiene un inverso).
  - La edición de texto (caso particular de una máquina de Turing) puede modelarse como una sucesión de operaciones en el grupo libre generado por todos los caracteres que se pueden escribir. Donde borrar un símbolo es equivalente a concatenarlo con su inverso.
- El conjunto «$\{ 1011, 01, 0011\}$» es un lenguaje de 3 palabras en $S=\{0, 1\}$.
- El lenguaje matemático.
- La musica (las partituras).
- Las fórmulas químicas.
- Los pseudocódigos.
- UML (en particular los diagramas de actividad o de flujo).
- $\TeX$, $\LaTeX$ y __HTML__
- Los lenguajes de máquina y de programación.

Debido a que un lenguaje puede tener una cardinalidad muy grande o incluso infinita, en ocasiones es necesario determinarlo mediante alguna regla de pertenencia (empleando el axioma de esquema de comprensión).
- La __sintaxis__ de un lenguaje es el conjunto de reglas que conforman la propiedad de selección. De ese modo podemos saber si una palabra formada con elementos de $S^*$ pertenece o no a $L$.

Dado que un lenguaje se crea para comunicar algo, es necesario saber cual es el significado de cada elemento.
- La __semántica__ de un lenguaje es el estudio del significado de sus palabras.

#### Lenguajes Naturales

- Son lenguajes que surgen de manera espontánea.
- Los dos primeros ejemplos son lenguajes naturales.
- La sintaxis está en constante cambio y en ocasiones es confusa.
  - Las reglas de pertenencia son poco claras. Es decir, es difícil o imposible determinar todos los elementos de $L\subseteq S^*$, aunque $S^*$ si esté bien determinado.
  - Cuando una palabra que no pertenece al lenguaje, es aceptada por un número significativo de personas, entonces su uso se regulariza y pasa a pertenecer al lenguaje.
- La semántica es ambigua. 
  - Una palabra puede tener distintos significados, dependiendo del contexto o de la región que la utiliza.
  - Una palabra puede tener un significado distinto al significado literal (metáforas o lenguaje figurado).
  - Dado a que suelen ser muy imprecisos, en ocasiones es necesario aumentar el tamaño de la palabra, para eliminar ambigüedades. Esto los hace bastante extensos para transmitir una idea.

#### Lenguajes formales

- Son lenguajes construidos artificialmente.
- Todos los ejemplos del tres en adelante, son lenguajes formales.
- Su sintaxis es clara.
  - Siempre es posible determinar si una palabra pertenece o no al lenguaje.
- La semántica es determinista.
  - El significado de las palabras es preciso (o esa es la idea).
  - El significado es literal.
  - Debido a que no hay ambigüedades (se trata de que no hayan), suelen ser muy densos o crípticos.

#### Metalenguajes

El metalenguaje es un lenguaje que se usa para hablar de otro lenguaje (lenguaje objeto).
Se puede ver como una extensión del lenguaje objeto.

__Ejemplo:__
1. Cadenas compuestas por varios idiomas:

  - «Nos vemos mañana, bye»

- Cuando usas un idioma para describir otro idioma.
  - Se puede usar el mismo idioma para describirse a si mismo. En ese caso el lenguaje objeto coincide con el metalenguaje.
  
- Un «script» comentado es un metalenguaje.
```julia
println("Hola") #Imprime la palabra «Hola».
```
- En las matemáticas, casi siempre se emplea un metalenguaje.
Por ejemplo para definir sucesiones convergentes $\{a_n\}_{n\in\mathbb N}$ en un espacio métrico $(X, d)$:

Si existe un $l\in X$ tal que $\forall_{\epsilon>0}\exists_{N\in\mathbb N}$, tal que si $N\le n$, entonces $d(a_n,l)<\epsilon$

En el lenguaje formal matemático sería:

$\exists_{l\in X}\forall_{\epsilon>0}\exists_{N\in\mathbb N}[\forall_{n\ge N}\implies d(a_n,l)<\epsilon]$

Incluso en ese caso, necesitas de algún otro lenguaje para presentar al espacio métrico, y escribir el nombre de la definición.

5. La fórmula del agua es $H_2O$.
- Todo este notebook es un metalenguaje que incorpora varios lenguajes objetos.

#### Traducción y codificación de un lenguaje formal a otro

1. Dado dos lenguajes, $L_1$ y $L_2$. Una _traducción_ de $L_1$ a $L_2$ es una función de $f\colon L_1\to L_2$.
  - Un script o «palabra» de Julia se traduce a una palabra en lenguaje binario.
  - Una traducción no necesariamente es biyectiva.
    - Un lenguaje puede no abarcar todas las instrucciones posibles en binario.
    - Pueden existir dos palabras de $L_1$ que se traduzcan a una misma palabra en $L_2$.

__Ejemplo__

  `x="hola"; println(x)` y `saludo="hola"; println(saludo)` se traducen de la misma manera a binario.
  
2. Si $f$ es biyectiva, entonces se le llama función de codificación o simplemente _codificación_.
  - A los lenguajes formales que tienen una función de codificación se les llama códigos.
    - Si el alfabeto tiene $n$ símbolos entonces  es un código $n-ario$. Por eso al lenguaje que usan los dispositivos digitales se le llama código binario.
    - Es posible convertir a un lenguaje formal en un código si trabajamos en el cociente de ese lenguaje con alguna relación de equivalencia.
      - En el ejemplo anterior «$x\sim y$, si son nombres de variables».

### Tipos de errores en programación

#### Errores de sintaxis

1. Al utilizar un símbolo que no pertenezca al alfabeto del lenguaje.

La palabra «El perr🌝 duerme» es un error de sintaxis en el español, ya que «🌝», no pertenece al alfabeto.

Para lenguajes como `Julia`, esto no es un problema, ya que aceptan cualquier caracter unicode. En este caso $|S|\le2^{32}$, ya que los caracteres unicode ocupan entre uno y cuatro Bytes. Por tanto sólo pueden haber como máximo $2^{32}$ caracteres unicode.

Esta palabra pertenece a Julia:

In [None]:
☕ = "una tasa de café"
🌝 = "feliz"
string("tomar ", ☕, " me pone ", 🌝)

En lenguajes como `C` (al menos en el estándar _ANSI_ ), no podría emplear los símbolos ☕ o 🌝, para definir variables, ya que estos no están en su alfabeto.

2. Al utilizar una palabra que no existe en el lenguaje, aunque cada símbolo esté en el alfabeto.

  - La palabra «eL perro duerme» no pertenece al español.

  - ¿Las palabras «español», y «espannol» pertenece al español?

  - Las siguientes palabras no pertenecen a Julia:

In [None]:
☕ = "una tasa de café
🌝 = "feliz"
string("tomar ", ☕, " me pone ", 🌝)

In [None]:
x=1
if x<=1
    println("Es menor a uno") #Esto no es python 🌝.

Los errores de sintaxis son reportados por el compilador o el intérprete. En la mayoría de los casos el error está presente en alguna linea anterior a la que indica el intérprete. Muchas veces esto ocurre en la linea inmediata anterior.

Los errores de sintaxis se descubren cuando el intérprete o el compilador, traduce el «script» a binario. 

Los errores de sintaxis disminuyen con la práctica del programador.

En la mayoría de los casos se debe a:
- La falta de un cierre de «end», «"» «)», «]», «}»N

- Uso de palabras reservadas par nombre de variables:

In [None]:
if=1

- Uso del nombre de una función para nombre de variable:

In [None]:
cos=2 #Si ya se usó el coseno esto dará error, en caso contrario no.

In [None]:
cos(1) #Si se usó «cos» para nombrar una variable esto dará error.

- Uso de «=» en lugar de «==» en una comprobación.

In [None]:
x=1
if x=1 #Esto es una asignación, no una comprobación.
    println("Es igual a uno")
end

#### Errores en tiempo de ejecución

Los errores en tiempo de ejecución se presentan si algo falla mientras se ejecuta el programa. La mayoría de los mensajes de error en tiempo de ejecución indican dónde ocurrió el error y qué funciones se estaban ejecutando.

Alguno de los errores en tiempo de ejecución más comunes:
- Si no se cumplen las condiciones para la entrada de un programa o función.

In [None]:
function CombLineal(x,y)#y no puede ser cero.
    a=x÷y
    b=x%y
    s=string(x,"=",a,"⋅",y,"+",b)
    println(s)
end

In [None]:
CombLineal(5,2)#Perfecto.

In [None]:
CombLineal(5,0) #El operador «÷» no admite que el segundo operando sea 0.

In [None]:
0.0/0.0 #En Julia no es un error, pero sin duda da problemas.

In [None]:
1.0/0.0 #Igual que el anterior.

En Julia, los errores anteriores serían considerados errores semánticos, más que errores en tiempo de ejecución.
En otros lenguajes como Python, se consideran errores de ejecución, ya que levantan excepciones.

- Llamada a una variable que no se ha declarado.

In [None]:
existencia = 10
function Venta(vendido::Bool, exist::Int64)
   if vendido
    local_exist = exist - 1 #Lugar incorrecto par definir variable local.
    println("Se vendió un producto")
    end
    return local_exist
end

In [None]:
existencia = Venta(true, existencia)

In [None]:
#En este caso local_exist, no está definida.
existencia = Venta(false, existencia)

- Bucle infinito.

In [None]:
function Contador(a)
    i=a
    s=string("El último es ", i)
    while i != 10
        i+=1
        s=string("El último es ", i)
    end
    println(s)
end

In [None]:
Contador(2)
Contador(10)

In [None]:
Contador(12) #bucle infinito.

- Recursión infinita.

In [None]:
function factorial(n)
    fact=n
    if fact == 0 || fact == 1
        return 1
    end
    fact*=factorial(fact-1)
end

In [None]:
factorial(5)

In [None]:
factorial(0)

In [None]:
factorial(5.0) #Funciona.

In [None]:
factorial(5.1) #La recursión es infinita.

In [None]:
factorial(-5) #Igualmente.

- Acceso fuera de los límites de indexación.

In [None]:
arreglo=[1,2,3]

In [None]:
arreglo[1]

In [None]:
arreglo[0] #fuera de rango.

In [None]:
arreglo[4] #Igualmente.

#### Errores Errores semánticos

Los errores semánticos ocurren cuando la palabra pertenece al lenguaje, pero tiene un significado distinto al que nosotros creemos que tiene. Dicho de otra forma. Un error semántico es aquel que ocurre sin levantar una excepción, pero provoca un resultado distinto al que nosotros esperamos.

Los errores semánticos son los más complejos de identificar y corregir, ya que el intérprete no te indica que existe. La forma de identificarlos es realizar pruebas e identificar si el resultado es el deseado o no.

Los errores semánticos pueden ser de naturaleza muy variada. En las secciones siguientes se mostrarán algunos casos particulares de interés para nosotros.

##### Errores en el planteamiento del modelo (¡La vacas esféricas,!)

_Discretización_

Al discretizar un sistema dinámico continuo (convertirlo en un sistema de ecuaciones en diferencias), el nuevo sistema dinámico (_discreto_ ) puede comportarse de manera distinta.

- La logística.

- El siguiente sistema, fue famoso por acuñar el nombre de caos computacional.

$$
\left\{
\begin{array}{ll}
    \frac{dx}{dt} = x-y-x^3\\
    \frac{dy}{dt} = x-x^2y
\end{array} 
\right.
$$

¿Que ocurre al integrarlo mediante Euler?

In [None]:
from pylab import *
from numpy import*

#Método de Euler para sistemas de dos ecuaciones.
#«f» función a integrar en el intervalo temporal [«a», «b»].
#«N» número de intervalos en se dividirá [«a», «b»].
#«x_0» y «v_0» son las condiciones iniciales.
def Euler(f,a,b,N,x_0,v_0):
    h = (b-a)/N
    lista_t=arange(a,b,h) #Lista con tiempo discreto.
    lista_x = []
    lista_v = []
    r = array([x_0,v_0],float)#Condiciones iniciales.
    for t in lista_t:
        lista_x.append(r[0]) #Órbita de x.
        lista_v.append(r[1]) #Órbita de v.
        r+=h*f(r,t+h)
    return [lista_t, lista_x, lista_v]
    
def f(r,t):
    x=r[0]
    y=r[1]
    fx=x-y-x**3
    fy=x-x**2*y
    return array([fx,fy],float)

def graficar(solu):
    fig1,(ax1, ax2) = plt.subplots(nrows=1,ncols=2, figsize=(10, 4))
    ax1.plot(solu[0], solu[1], label='x')
    ax1.plot(solu[0], solu[2], label='y')
    ax1.set_xlabel('t')
    ax1.set_ylabel('Órbitas de $x$ y $y$')
    ax1.set_title('Discretizado por Euler')
    ax1.legend()
    ax2.plot(solu[1], solu[2])
    ax2.set_xlabel('x')
    ax2.set_ylabel('y')
    ax2.set_title('Espacio de fase')
    show()

Con $t\in[0,100]$, $N=3000$ y $(x_0, y_0)=(0.1,0.0)$:

In [None]:
solu=Euler(f,0,100,3000,0.1,0.0)
graficar(solu)

Con $t\in[0,100]$, $N=300$ y $(x_0, y_0)=(0.1,0.0)$:

In [None]:
solu=Euler(f,0,100,300,0.1,0.0)
graficar(solu)

Con $t\in[0,100]$, $N=180$ y $(x_0, y_0)=(0.1,0.0)$:

In [None]:
solu=Euler(f,0,100,180,0.1,0.0)
graficar(solu)

##### Errores numéricos

Sea $x_{t}$ el valor teórico o verdadero de alguna número y $x_{a}$ el valor aproximado. 

El error absoluto está definido por:

$$err(x_{a})=|x_{t}-x_{a}|$$

El error relativo es: 
$$err_r(x_{a})=\frac{|x_{t}-x_{a}|}{x_{t}}$$

El error porcentual es:
$$err_p(x_{a})=err_r(x_{a})(100\%)$$

En la mayoría de los casos los que realmente importan son los errores relativos. En eso se basa el punto flotante (trata de mantener el mismo error relativo).

Al ejecutar funciones u operaciones con valores aproximados, sus errores se propagan. Si se ejecutan un número considerable de operaciones con valores aproximados, el resultado puede distar bastante del esperado.

Si $z=f(x,y)$ es diferenciable y las variables $x$, $y$ son independientes $\implies$ $err(z_a)=\sqrt{f_x^2dx^2+f_y^2dy^2}$, donde $dx=err(x_a)$, $dy=err(y_a)$ y las derivadas se evalúan en $(x_a, y_a)$.

Si las variables son dependientes, entonces hay que considerar la covarianza. [Aquí](https://es.wikipedia.org/wiki/Propagaci%C3%B3n_de_errores) se muestra como quedaría la expresión.

##### Errores numéricos derivados de la aproximación del método numérico

En la mayoría de los casos los métodos numéricos son aproximaciones polinomiales (Taylor) de una función (derivada, integral, ...).

- En cada paso del método de Newton-Raphson, el cero de $f$ se aproxima mediante los dos primeros términos del desarrollo en serie de Taylor de $f$. El error que se comente en cada paso es $O(h^2)$, donde $h=err(x_a)$ y $x_a$ es la aproximación del cero de $f$ en ese paso. Si el punto inicial está en la cuenca de atracción del sistema dinámico discreto, entonces $h\to 0$ a medida que recorremos la órbita $\implies$ $f(x_a)\to 0$ también.

- Lo mismo ocurre con los métodos de integración de funciones y de ecuaciones diferenciales.
  - En cada iteración del método de Euler, el error es $O(h^2)$ y el error global (el error propagado al final) es $O(h)$.
  - El error local (en cada paso) del método RK4 es $O(h^5)$ y el error global es $O(h^4)$.
  - Verlet tiene un error local de $O(h^3)$ y un error global de $O(h^2)$. Sin embargo tiene una propiedad interesante. Conserva la energía del sistema dinámico continuo original. Es por eso que durante mucho tiempo se usó para modelar la mecánica de cuerpos celestes (para que conservaran la órbita).

<img src="img/c.png" width="60%"/>
<img src="img/c-2.png" width="80%"/>

##### Errores numéricos de la aritmética finita

Errores numéricos de la aritmética finita

Las equipos de cómputo no trabajan con reales, sino en un campo discreto que se puede representar como $\mathbb R/\sim$. 

Donde $x\sim y$ si tienen la misma representación binaria (excepto el cero que tiene dos representaciones binarias).

La representación binaria tiene una cantidad finita de guarismos para almacenar la información. 

Por ejemplo, `Float64` cuenta con 64 guarismos que pueden tomar los valores 0 o 1.

Es por eso que $\mathbb R/\sim$ no sólo es discreto, sino finito.

El error semántico consiste en suponer que los cálculos se realizan en $\mathbb R$, y no en el cociente finito $\mathbb R/\sim$.

Por ejemplo $0.0\sim 1.0\cdot 10^{-324}$, ya que:

In [None]:
println(bitstring(0.0))
println(bitstring(1.0e-324))

¿Cómo se representan los números`Float64`?

<img src="img/f.svg" width="100%"/>

Hay una explicación muy buena en [este](https://www.wextensible.com/temas/javascript-number/precision.html) sitio.

In [None]:
eps(2.2250738585072014e-308)
println("±",2.2250738585072014e-308)
println("eps: ", eps(2.2250738585072014e-308))
println(bitstring(2.2250738585072014e-308))
println(bitstring(-2.2250738585072014e-308))

In [None]:
println("±",4.450147717014403e-308)
println("eps: ", eps(4.450147717014403e-308))
println(bitstring(4.450147717014403e-308))
println(bitstring(-4.450147717014403e-308))

In [None]:
println("±",1.1125369292536007e-308)
println("eps: ", eps(1.1125369292536007e-308))
println(bitstring(1.1125369292536007e-308))
println(bitstring(1.1125369292536007e-308))

In [None]:
println("±",5.0e-324)
println("eps: ", eps(5.0e-324))
println(bitstring(5.0e-324))
println(bitstring(-5.0e-324))

In [None]:
println("±",0.0)
println("eps: ", eps(0.0))
println(bitstring(0.0))
println(bitstring(-0.0))

In [None]:
println("±",8.98846567431158e+307)
println("eps: ", eps(8.98846567431158e+307))
println(bitstring(8.98846567431158e+307))
println(bitstring(-8.98846567431158e+307))

In [None]:
println("Este es el máximo antes de Inf\n")
println("±",1.7976931348623157e+308)
println("eps: ", eps(1.7976931348623157e+308))
println(bitstring(1.7976931348623157e+308))
println(bitstring(1.7976931348623157e+308))

println("\nA partir de aquí es Inf\n")
println("±",8.98846567431158e+307*2)
println("eps: ", eps(8.98846567431158e+307*2))
println(bitstring(8.98846567431158e+307*2))
println(bitstring(-8.98846567431158e+307*2))

println("±",Inf)
println("eps: ",  eps(Inf))
println(bitstring(Inf))
println(bitstring(-Inf))

Algunos ejemplos donde falla la aritmética es al restar dos números muy cercanos, no importa la magnitud.

También al dividir uno grande por uno pequeño y viseversa.

En ocasiones no es posible mejorar más el resultado aunque el modelo teórico sea más preciso.

<img src="img/comp.png" width="60%"/>

<img src="img/comp-2.png" width="60%"/>

Los errores aritméticos se empiezan a acumular al aumentar el número de pasos.

RK4 es el que mejor resiste, pero aún así termina empeorando si disminuimos demasiado h.