# `Primer Bloque`

- Arquitectura de computadores
- Errores

## Errores

Usualmente en los libros en ingles aparecen dos definiciones *accuracy* y *precision*, en español ambas significarían lo mismo *precisión*. Sin embargo, comunmente la primera indicaría cuanto coincide el valor numérico con el valor verdadero (en muchos casos desconocido) y la segunda cuantos dígitos se usarán en una operación matemática, esto sin importar si estos dígitos son correctos o no. 



Si dejamos a un lado los errores de medición y humanos, típicamente en un código númerico tendremos que lidiar con dos tipos de errores:
- los de Aproximación
- los de Redondeo

=> `Errores de Aproximación`

Para entender mejor este error, veamos un ejemplo. 

Intentemos aproximar una exponencial $y=e^{x}$ alrededor de x=0 usando una serie de Taylor: $\sum_n^{\infty} \frac{f^{(n)}(a)}{n!}(x-a)^{n}$,
$$y_{approx}=\sum_n^{n_{max}}\frac{x^2}{n!}. $$

Como se enuncia en el Teorema de Taylor, $y_{approx}=y$ en el límite cuando $n_{max}\to \infty$, en cualquier otro caso lo que estamos haciendo es aproximar la exponencial hasta los términos correspondientes a $n_{max}$ considerado y descartar los restantes ($n_{max}+1$ hasta $\infty$). Entonces, `en principio`, con el simple coste de considerar $n_{max}$ grandes, se puede obtener una mejor aproximación.

=> `Errores de redondeo`

Este tipo de errores aparecen cada vez que realizamos un cálculo usando números con cifras decimales, y es una consecuencia de no tener una precisión infinita, lo que hace que se "pierda" parte de la información. Veamos un ejemplo:

- Usando cálculo básico sabemos que esta igualdad es cierta $(\sqrt{2})^2-2=0$, sin embargo, si realizamos esta operación numéricamente veremos que no es así

In [2]:
print((2**(1/2))**2-2)

4.440892098500626e-16


Lo que ocurre es que $\sqrt{2}$ no puede ser evaluado con infinítos dígitos y por lo tanto resulta "ligeramente" inexacto su resultado, y este es el que se utiliza para la próxima operación propagándose el error y ocurriendo lo que se conoce como error de redondeo. 

### Error Absoluto y Relativo

- `Error absoluto`: Supongamos que se está estudiando una cierta cantidad cuyo valor exacto es $x_0$. Si $x$ es una aproximación de este, entonces se define el error absoluto como:
\begin{equation}
\triangle x:=|x-x_0|
\end{equation}
La fuente de este error absoluto puede ser debido a la incertidumbre en los datos, un error de redondeo o de aproximación.


No especificamos en este punto la fuente de este error absoluto: podrían ser incertidumbres en los datos de entrada, una inexactitud introducida por nuestro imperfecto cálculo anterior o el resultado de un error de redondeo (posiblemente acumulado en varios cálculos). 

Usualmente a partir de este error se puede definir un límite:
$$|\triangle x|=|x-x_0|\leq \epsilon$$
donde $\epsilon$ debe ser lo más pequeño posible. 

A partir de este límite uno puede reportar hasta donde sus resultados son correctos:
$$x-\epsilon \leq x_0 \leq x+\epsilon$$

Esto significa que, aunque no conocemos el valor exacto de $x_0$, sí sabemos que podría ser como máximo $x+\epsilon \leq$ y como mínimo $x-\epsilon \leq$. Usualmente este límite es escrito como $x_0=x\pm \epsilon$. IMPORTANTE: en ocasiones el $\epsilon$ que se usa no es el definido anteriormente, sino la desviación estandar, lo que es aplicado cuando se tiene un conjunto de datos.

AHORA, ven algún error en este tipo de error. ¿Qué sería un error absoluto pequeño?

Veamos unos ejemplos:

- Consideremos el valor real $x_0 = 1.000$ y el aproximado $x=0.999$, esto nos da un error absoluto $\triangle x_{caso1}=10^{-3}$. Bastante pequeño ¿no?

- Consideremos ahora el valor real $x_0= 1\, 000\, 000\, 000.0$ y la aproximación $x= 999\, 999\,999.0$, esto nos da un error absoluto de $\triangle x_{caso2}=1$.

Si comparamos el error absoluto de ambos ejemplos uno (sin conocer el valor real) podría estar tentado a pensar que el primer caso es una mejor aproximación que el último. Notar que el error absoluto del último es ridiculamente más grande (3 ordenes de magnitud). Sin embargo, como se aprecia el valor aproximado no está tan lejos del real. Entonces para comparar aproximaciones de diferentes escalas el error absoluto no es un buen medidor. 

- `Error relativo`: En los casos que se desea comparar aproximaciones en diferentes escalas se recomienda usar el error relativo:
$$\delta x :=\frac{\triangle x}{x_0}=\frac{|x-x_0|}{|x_0|}$$ 

Si repetimos los cálculos para los ejemplos anteriores tendremos que: $\delta x_{caso1}=10^{-3}$, mientras que $\delta x_{caso2}=10^{-9}$. Siendo el segundo caso una mejor aproximación: el primero representa un $0.1\%$ respecto al valor real, mientras que el segundo $10^{-7} \%$.

Para este tipo de error se define el límite como:
$$|\delta x| :=\bigg|\frac{\triangle x}{x}\bigg|\leq \epsilon$$ 

COMENTARIOS:

- En ocasiones no conocemos el valor exacto, por lo que es más conveniente utilizar en el denominador el valor aproximado.

- Este tipo de error no es adecuado cuando el valor exacto es $x_0=0$ (o muy cercano a cero). En estos casos suele utilizarse 
$$\delta x :=\frac{|x-x_0|}{1+|x_0|}$$ 

Lo cual no es del todo correcto ya que no representa una diferencia relativa pues no cumple la propiedad de rescalamiento: $d(x, x_0)=d(\lambda x, \lambda x_0)$. Es decir, no se le puede llamar error relativo.

En estos casos se ha de utilizar otros tipos de errores relativos como por ejemplo: 

- [Relative Percent Difference (PRD)](https://en.wikipedia.org/wiki/Relative_change):
$$\delta x :=2\frac{x-x_0}{|x|+|x_0|}$$ 


- [Relative Change and Difference](https://en.wikipedia.org/wiki/Relative_change):
$$\delta x :=\frac{|x-x_0|}{\max{(x, x_0)}}$$ 

### Propagación de Errores:

- `Suma o Resta`

Supongamos que queremos obtener el resultado de la siguiente operación: $x_0=a_0-b_0$. Sin embargo no conocemos estos valores exactos, sinó sus aproximados $a, b$ con sus respectivos errores absolutos $\triangle a, \triangle b$. El error absoluto de la operación será:
$$|\triangle x|\leq|\triangle a|+|\triangle b|$$

donde el más es debido a que es el límite superior. El resultado anterior es válido para ambas operaciones.

- `Multiplicación o División`

Similar al caso anterior se puede probar que el error de la operación $x=a\times b$ será:
$$|\delta x|\leq|\delta a|+|\delta b|$$

- `Propagación del error en funciones de una variable`

Suponiéndose que se tiene una función $f(x)$ y se quiere calcular su valor $y=f(x)$, se puede probar que en error absoluto sería:
$$\triangle y\approx \bigg|\frac{d f(x)}{dx}\bigg|\triangle x$$

mientras que el Relativo es:
$$\delta y=\frac{\triangle y}{y}\approx \frac{x}{f(x)}\bigg|\frac{d f(x)}{dx}\bigg|\delta x$$

- `Generalización a varias variables`

Error absoluto:
$$\triangle y\approx \sum_i\bigg|\frac{d f}{dx_i}\bigg|\triangle x_i$$

Error relativo:
$$\delta y\approx \sum_i \frac{x_i}{f}\bigg|\frac{d f}{dx_i}\bigg|\delta x_i$$

NOTAR como se recuperan las fórmulas anteriores.


### Representación de número reales

Las computadoras codifican toda la información en binario, o lo que es lo mismo, en dígito o bit: los bits `sólo pueden tomar dos valores posibles, por convención 0 o 1`. Los números se almacenan en forma binaria, es decir, como colecciones de $0$ y $1$. Por ejemplo, los números reales se almacenen mediante representación de punto flotante. Esto tiene la forma general:
$$\pm \, \text{mantissa} \times 10^{\text{exponente}}$$

Ahora, debido a que la computadora solo puede almacenar un número finito de bits, esta tendrá un límite, una `precisión de máquina` (no es más que el número de decimales que puede almacenar usando la representación del punto flotante). Estos vienen en dos variedades: `números normales` y `subnormales`. Existiendo tres formas de perder presición numérica:
- underflow: ocurre para números muy pequeños.
- overflow: ocurre para números muy grandes.
- rounding: ocurre para números decimales cuyo valor se encuentra entre dos números exactamente representables.

<img src="capturas/1.png">


En particular `Python` emplea *doble precisión* para el caso de los número flotantes. En estos casos su almacenamiento es de $64$ bits en total. Es decir, puede almacenar números desde:
$$\pm 4.9\times10^{-324} \leftrightarrow \pm 1.8\times 10^{308}$$

La mayor parte de esta capacidad de almacenamiento se encuentra en el término correspondiente al exponente. En este caso para los doble precisión si intentamos representar un número menor a $4.9\times10^{-324}$ ocurre un *underflow*, mientras que uno mayor que $1.8\times 10^{308}$ conllevaría a un *overflow*.

IMPORTANTE: Hay que tener en cuenta que poder representar $4.9\times10^{-324}$ no significa que seamos capaces de almacenar $324$ cifras significativas en un doble precisión. El número de cifras significativas (y el concepto relacionado de precisión) se encuentra en el coeficiente (mantissa). Por ejemplo $1.8$ o $1.234567$. Para los doble precisión el número de cifras significativas es $1$ parte en $2^{52}$, es decir $1/2^{52}\approx 2.2\times10^{-16}$, lo que equivale a $15$ o $16$ dígitos decimales.

Veamos unos ejemplos:

In [17]:
# Overflow

k = 298  # 303
large = 2.*10**(k)
for _ in range(3):
    print(r'$2\times 10^{%d}$ -> '%k, large)
    k += 2
    large *=10**k    

$2\times 10^{298}$ ->  2e+298
$2\times 10^{300}$ ->  inf
$2\times 10^{302}$ ->  inf


### Precisión de máquina 

¿Saben que es la precisión de máquina?

La precisión de máquina no está relacionado con los número que podamos representar, sinó con la distancia entre dos líneas verticales en la figura anterior. Como se comentó, cualquier número entre las dos líneas se redondea, ya sea hacia la izquierda o hacia la derecha.

Al realizar operaciones aritméticas con dos números de punto flotante y el resultado no es un número de punto flotante exactamente representable (por ejemplo: 1 y 10 se pueden representar, pero 1/10 no), entra en juego la precisión de máquina. 


Pasamos ahora a la cuestión de realizar operaciones aritméticas utilizando tales números: esto da lugar a la importante cuestión del redondeo. Esta pregunta surge cada vez que intentamos combinar dos números de punto flotante pero la respuesta no es un número de punto flotante exactamente representable.

Veamos un ejemplo ficticio para entender mejor. Consideremos que solo podemos almacener 5 cifras significativas (dígitos). Supongamos que queremos sumar los números $0.12345$ y $1.2345$. Se podría intentar llevarlo a la notación de punto flotante, es decir $1.2345 = 0.12345 \times 10^{1}$ mientras que $0.12345 = 0.12345 \times 10^{0}$. Ahora, en nuestro sistema, estos dos números tendrían la misma mantisa y diferentes exponentes. Sin embargo, para sumar dos mantisas tenemos que tener los mismo exponente, por ende esta opción no es viable y debemos realizar la operación como números reales (es decir, no números decimales de cinco dígitos):

$$0.12345 + 1.2345 = 1.35795$$

Ahora, si notan, la respuesta contiene seis dígitos decimales, $1.35795$. Dado que estamos limitados a números decimales de cinco dígitos, esto nos deja con la opción de reducir el resultado a $1.3579$ o redondearlo a $1.3580$. Lo cual nos llevaría a perder precisión.

En resumen, la precisión de máquina $e_{m}$, se define como el número más pequeño en punto flotante que, sumando al 1.0, produce un resultado diferente de 1.0. Usualmente para un doble precisión es de $e_{m}\approx 2.2\times10^{-16}$, y para un flotante $e_{m}\approx 1.2\times10^{-7}$.

Ejemplo: Calculemos la precisión de máquina comenzamos con un número pequeño y lo vamos reduciendo a la mitad, después de lo cual lo sumamos a $1.0$ y así sucesivamente hasta que eventualmente obtendremos el gap.

In [23]:
# precisión de máquina
small = 1/2**50
for i in range(4):
    small /= 2
    print(i, ' -> ', 1+small, small)


0  ->  1.0000000000000004 4.440892098500626e-16
1  ->  1.0000000000000002 2.220446049250313e-16
2  ->  1.0 1.1102230246251565e-16
3  ->  1.0 5.551115123125783e-17


NOTESE como aún siendo doble precisión (puede almacenar números tan pequeños como $10^{-300}$), no significa que pueda almacenar $1+10^{-300}$ ya que esto necesitarías 301 dígitos de precisión (y todo lo que tienes es 16).

`La resta`

Hagamos un paréntesis y analicemos que ocurre en una resta:

    - la pérdida de cifras significativas al restar dos números casi iguales

    - la pérdida de aún más dígitos al realizar la resta utilizando números de punto flotante (que tienen precisión finita). 

Empecemos por el primer caso. Resta dos números casi iguales, cada uno de los cuales tiene 20 cifras significativas:
$$1.2345678912345678912−1.2345678900000000000 = 0.0000000012345678912$$

Note que al restar número reales (no representaciones de punto flotante) terminamos con 11 cifras significativas, aunque estamos tratando con números reales/precisión infinita perdimos precisión. Ahora, analicemos el segundo caso, y utilicemos la representación de coma flotante:

In [25]:
1.2345678912345678912 - 1.2345678900000000000

1.234568003383174e-09

En comparación con la respuesta que teníamos arriba (para números reales), vemos que solo coinciden en las primeras 6 (de 11) cifras significativas. Esto se debe en parte al hecho de que cada uno de nuestras entradas no se representan en el ordenador utilizando las 20 cifras significativas completas, sino sólo 16 dígitos como máximo. Explícitamente:

In [26]:
1.2345678912345678912, 1.2345678900000000000

(1.234567891234568, 1.23456789)

Esto muestra que perdemos precisión en el primer número, lo que luego conduce a una pérdida de precisión en el resultado de la resta.

### Comparando flotantes

Dado que sólo cierto números se pueden representar exactamente como flotantes (otros números se redondean al número de máquina más cercano), debemos tener cuidado al comparar números de punto flotante. 

In [27]:
xt = 0.1 + 0.2
yt = 0.3

xt == yt

False

¿qué paso?

In [28]:
xt, yt

(0.30000000000000004, 0.3)

Una posible solución para realizar esta igualdad de variables de punto flotante es tomar el valor absoluto de su diferencia y verificar si esta es menor que algún humbral aceptable por ejemplo: $10^{-10}-10^{-12}$

In [29]:
abs(xt-yt)<1.e-12

True

La metodología comentada (denominada *absulute epsilon*) es adecuada en muchas ocasiones donde el "tamaño" de los números es "natural". Sin embargo, hay situaciones donde puede darnos resultados erroneos:

In [32]:
xt = 12345678912.345
yt = 12345678912.346
print(xt-yt)

abs(xt-yt)<1.e-12

-0.0010013580322265625


False

La solución para este caso es usar una diferencia relativa (*relative epsilon*)

In [34]:
maxFin = lambda x, y: max(abs(x), abs(y))

abs(xt-yt)/maxFin(xt, yt)<1.e-12

True

### Suma compensada

Pasamos ahora a una cuestión crucial relativa a las operaciones con flotadores; En resumen, debido a errores de redondeo, cuando se trata de números de punto flotante, `la ley asociativa del álgebra no necesariamente se cumple`. 

Usted sabe que $0.1+0.2=0.3$ sin embargo, este resultado puede depender del orden en que se lleva a cabo las operaciones si usamos números de puntos flotantes.

Veamos:

In [35]:
res1 = (0.7 + 0.1) + 0.3
res2 = 0.7 + (0.1 + 0.3)
print(res1)
print(res2)

1.0999999999999999
1.1


De este ejemplo queda claro que operaciones que son equivalentes en números reales pueden no serlo si se usan flotantes. Este ejemplo no es atípico, de hecho, puede ocurrír más drástico:

In [36]:
xt = 1.e20
yt = -1.e20
zt = 1.

res1 = (xt + yt) + zt
res2 = xt + (yt + zt)

print(res1)
print(res2)

1.0
0.0


- En el primer caso, los dos números grandes, `xt`, `yt`, se cancelan entre sí y nos queda la unidad como respuesta. 
- En el segundo caso, nos enfrentamos a una situación similar a la discutida en la precisión de máquina, sumar $1$ al número grande (negativo) `yt` simplemente se redondea a `yt`, luego, se cancela con `xt`.

Como se puede apreciar el error garrafal viene del hecho de estar trabajando con magnitudes muy diferentes (muy grandes y muy pequeños) y con signos opuestos. Uno podría decir entonces que cuando esto ocurre no se puede confiar en el resultado numérico. Sin embargo, en muchas ocasiones no somos concientes de que esto ocurre (ya que puede aparecer internamente en operaciones intermedias). En tal sentido `la lección es que uno debe acostumbrarse a razonar sobre sus cálculos, en lugar de confiar ciegamente en lo que produce la computadora`.


A continuación veamos como podemos intentar resolver estos problemas. Una manera de evitar estos errores de redondeo es `ordenar los números y luego sumarlos comenzando por el más pequeño`. Sin embargo, hay escenarios en que esto no es viable, en estos casos se emplea un truco llamado `suma compensada` o `suma Kahan`. Este truco lo que hace es estimar el error de redondeo en cada suma y luego compensarlo con un término de corrección.

In [40]:
def kahansum(lis):
    s, e = 0., 0.
    for x in lis:
        temp = s
        y = x + e
        s = temp + y 
        e = (temp - s) + y
    return s

lis = [0.7, 0.1, 0.3]
print(sum(lis), kahansum(lis))

1.0999999999999999 1.1


La suma de Kahan requiere más cálculos que la suma regular lo cual penaliza el rendimiento.

### Manipulando expresiones

A continuación se discutirá como es posible perder precisión como consecuencia de la forma en que se escriben las ecuaciones. Por ejemplo consideremos:
$$f(x)=\frac{1}{\sqrt{x^2+1}-x}$$

para valores grandes de $x$.

In [42]:
import numpy as np 
f = lambda x: 1/(np.sqrt(x**2+1)-x)

xs = [10**i for i in range(4, 8)]
ys = [f(i) for i in xs]

for x, y in zip(xs, ys):
    print(x, '->',  y)

10000 -> 19999.99977764674
100000 -> 200000.22333140278
1000000 -> 1999984.77112922
10000000 -> 19884107.85185185


Noten como el resultado parece empeorar cada vez más a medida que aumenta el valor de x. Una manera de verlo es considerando $x=10^{8}$

In [43]:
f(1e8)

  f = lambda x: 1/(np.sqrt(x**2+1)-x)


inf

Esto sucede porque para valores grandes de $x$, sabemos que $x + 1 \approx x$, lo que implica que necesitemos evaluar la raíz cuadrada con mucha precisión si quiero poder restarle un número casi igual.

Una forma sencilla de evitar este problema consiste en reescribir la expresión inicial como:
$$ f(x)=\sqrt{x^2+1}+x$$

In [44]:
import numpy as np 
f = lambda x: np.sqrt(x**2+1)+x

xs = [10**i for i in range(4, 8)]
ys = [f(i) for i in xs]

for x, y in zip(xs, ys):
    print(x, '->',  y)

10000 -> 20000.000050000002
100000 -> 200000.00000499998
1000000 -> 2000000.0000005001
10000000 -> 20000000.000000052


Noten como mejoró. De hecho, como se aprecia de la ecuación para $x$ grandes la función se comporta como $2x$. 

Resumiendo, en muchas ocasiones una simple reescritura de la expresión inicial puede evitar problemas de precisión numérica (a menudo evitando una resta).

## Tarea:
1- 

<img src="capturas/2.png">

2-

<img src="capturas/3.png">