# `Primer Bloque`

- Errores
- Tipos de errores
- Error Real, Absoluto y Relativo
- Propagación de errores
- Representación de número reales. Comparando flotantes. Suma compensada
- Manipulando expresiones

# Errores

Usualmente, en los libros en inglés aparecen dos definiciones: *accuracy* y *precision*. En español, ambas suelen traducirse como *precisión*. Sin embargo, comúnmente la primera se refiere a `cuán cercano está un valor numérico al valor verdadero` (que en muchos casos es desconocido), mientras que la segunda indica `cuántos dígitos se utilizan en una operación matemática`, independientemente de si dichos dígitos son correctos o no.

### Tipos de Errores

Si dejamos de lado los errores de medición y los errores humanos, típicamente en un código numérico tendremos que lidiar con dos tipos de errores:

- errores de aproximación;

- errores de redondeo.

=> `Errores de Aproximación`

Para entender mejor este tipo de error, veamos un ejemplo.

Intentemos aproximar la función exponencial $y = e^{x}$ alrededor de $x = 0$ usando una serie de Taylor: 
\begin{align}
\sum_n^{\infty} \frac{f^{(n)}(a)}{n!}(x-a)^{n},
\end{align}


En este caso, la aproximación queda:

\begin{align}
y_{approx}=\sum_n^{n_{max}}\frac{x^n}{n!}.
\end{align}

Como se enuncia en el Teorema de Taylor, $y_{\text{approx}} = y$ en el límite cuando $n_{\max} \to \infty$. En cualquier otro caso, lo que estamos haciendo es aproximar la exponencial considerando únicamente los términos hasta $n_{\max}$ y descartando los restantes (desde $n_{\max}+1 hasta \infty$).

Entonces, en principio, aumentando el valor de $n_{\max}$ se puede obtener una mejor aproximación, a costa de un mayor esfuerzo computacional.

In [None]:
# Ver Ejemplo_1_Lect1.nb

=> `Errores de redondeo`

Este tipo de errores aparece cada vez que realizamos cálculos utilizando números con cifras decimales y es consecuencia de no disponer de una precisión infinita. Como resultado, parte de la información numérica se *pierde* en cada operación.

Veamos un ejemplo sencillo. Desde el punto de vista del cálculo exacto, sabemos que la igualdad:

\begin{align}
(\sqrt{2})^2-2=0,
\end{align}

es cierta. Sin embargo, si realizamos esta operación numéricamente, observamos que el resultado no es exactamente cero:

In [53]:
print((2**(1/2))**2-2)

4.440892098500626e-16


Esto ocurre porque $\sqrt{2}$ no puede representarse con infinitos dígitos en la computadora y, por lo tanto, su valor es solo una aproximación. Este valor aproximado se utiliza en la operación siguiente, propagando el error y dando lugar a lo que se conoce como **error de redondeo**.

### Error Real, Absoluto y Relativo

- `Error real`: Supongamos que se está estudiando una cierta cantidad cuyo valor exacto es $x_0$. Si $x$ es una aproximación de dicho valor, se define el error real como:

\begin{equation}
\triangle_r x:=x-x_0
\end{equation}

- `Error absoluto`: Bajo las mismas suposiciones, el error absoluto se define como:

\begin{equation}
\triangle x:=|\triangle_r x|=|x-x_0|
\end{equation}

Hasta este punto no se ha especificado el origen del `error absoluto`. Este puede provenir de incertidumbres en los datos, de inexactitudes introducidas por el método de cálculo utilizado o del efecto acumulado de errores de redondeo en varias operaciones.

Usualmente, a partir del error absoluto se puede establecer una cota:

\begin{align}
|\triangle x|=|x-x_0|\leq \varepsilon,
\end{align}
donde $\varepsilon$ debe ser lo más pequeño posible. 

A partir de esta cota, se puede indicar el intervalo dentro del cual se encuentra el valor exacto:

\begin{align}
x - \varepsilon \leq x_0 \leq x + \varepsilon.
\end{align}

Esto significa que, aunque no conocemos el valor exacto de $x_0$, sabemos que este se encuentra entre $x - \varepsilon$ y $x + \varepsilon$. Usualmente, este resultado se expresa de forma compacta como:
\begin{align}
x_0 = x \pm \varepsilon.
\end{align} 

**IMPORTANTE**: En algunos contextos, el valor de $\varepsilon$ no corresponde al error absoluto definido anteriormente, sino a la desviación estándar, lo cual es habitual cuando se trabaja con conjuntos de datos experimentales.

AHORA: `¿Qué sería un error absoluto pequeño?`

Veamos algunos ejemplos:

- Consideremos el valor real $x_0 = 1.000$ y el valor aproximado $x = 0.999$. En este caso, el error absoluto es:

\begin{align}
\Delta x_{\text{caso 1}} = 10^{-3}.
\end{align} 

A primera vista, este error parece bastante pequeño.

- Consideremos ahora el valor real $x_0 = 1\,000\,000\,000.0$ y la aproximación $x = 999\,999\,999.0$. En este caso, el error absoluto es
\begin{align}
\Delta x_{\text{caso 2}} = 1.
\end{align} 

Si comparamos únicamente los errores absolutos de ambos ejemplos (sin conocer el valor real), uno podría verse tentado a pensar que el primer caso es una mejor aproximación que el segundo, ya que el error absoluto del segundo es considerablemente mayor (tres órdenes de magnitud).

Sin embargo, si se observa la escala de los valores involucrados, se aprecia que en el segundo caso el valor aproximado no está realmente lejos del valor real. Esto muestra que, al comparar aproximaciones en diferentes escalas, el error absoluto no es un buen indicador de la calidad de la aproximación.

- `Error relativo`: Cuando se desea comparar aproximaciones correspondientes a valores de distintas magnitudes, es preferible utilizar el error relativo, definido como:

\begin{align}
\delta x :=\frac{\triangle x}{x_0}=\frac{|x-x_0|}{|x_0|}
\end{align}


Si repetimos los cálculos para los ejemplos anteriores, obtenemos:
\begin{align}
\delta x_{\text{caso 1}} = 10^{-3}, \qquad \delta x_{\text{caso 2}} = 10^{-9}.
\end{align}

Esto indica que el segundo caso es una mejor aproximación: el primer error corresponde a un $0.1\%$ del valor real, mientras que el segundo corresponde a $10^{-7}\%$.


Para este tipo de error suele definirse una cota:

\begin{align}
|\delta x| :=\bigg|\frac{\triangle x}{x}\bigg|\leq \epsilon
\end{align}

**COMENTARIOS**:

- 	En muchas situaciones el valor exacto $x_0$ no es conocido. En esos casos, resulta más conveniente utilizar el valor aproximado en el denominador:
\begin{align}
\delta x := \left|\frac{x - x_0}{x}\right|.
\end{align}

- El error relativo no es adecuado cuando el valor exacto es $x_0 = 0$ (o muy cercano a cero). En estos casos, a veces se utiliza la expresión:
\begin{align}
\delta x := \frac{|x - x_0|}{1 + |x_0|}.
\end{align}

No obstante, esta cantidad no es estrictamente un error relativo, ya que no cumple la propiedad de reescalamiento:
\begin{align}
d(x, x_0) = d(\lambda x, \lambda x_0),
\end{align}
por lo que no puede interpretarse como una diferencia relativa en sentido estricto.

En estos casos, es preferible utilizar otras medidas de diferencia relativa, por ejemplo:

- [Relative Percent Difference (PRD)](https://en.wikipedia.org/wiki/Relative_change):
\begin{align}
\delta x :=2\frac{x-x_0}{|x|+|x_0|}
\end{align}


- [Relative Change and Difference](https://en.wikipedia.org/wiki/Relative_change):
\begin{align}
\delta x :=\frac{|x-x_0|}{\max{(x, x_0)}}
\end{align}

### Propagación de Errores:

- `Suma o Resta`

Supongamos que queremos obtener el resultado de la operación:
\begin{align}
x_0 = a_0 - b_0.
\end{align}
Sin embargo, no conocemos los valores exactos $a_0$ y $b_0$, sino sus aproximaciones $a$ y $b$, con errores absolutos $\Delta a$ y $\Delta b$, respectivamente.

El error absoluto de la operación satisface:
\begin{align}
|\Delta x| \leq |\Delta a| + |\Delta b|.
\end{align}

El signo `+` aparece porque estamos considerando una cota superior del error. Este resultado es válido tanto para la suma como para la resta y puede demostrarse de manera directa.

- `Multiplicación o División`

De forma análoga, puede demostrarse que, para la operación
\begin{align}
x = a \times b \quad \text{(o } x = a / b\text{)},
\end{align}

el error relativo satisface la desigualdad:
\begin{align}
|\delta x| \leq |\delta a| + |\delta b|.
\end{align}

Esto muestra que, en productos y cocientes, los errores relativos se combinan de manera aproximadamente aditiva.

- `Propagación del error en funciones de una variable`

Supongamos que se tiene una función $y = f(x)$ y que el valor de $x$ contiene un error absoluto $\Delta x$. Entonces, para errores pequeños, el error absoluto en $y$ puede aproximarse por:
\begin{align}
\Delta y \approx \left|\frac{d f(x)}{d x}\right| \Delta x.
\end{align}

El error relativo correspondiente es:
\begin{align}
\delta y = \frac{\Delta y}{y} \approx \frac{x}{f(x)} \left|\frac{d f(x)}{d x}\right| \delta x.
\end{align}

Estas expresiones se obtienen a partir de una aproximación lineal de la función alrededor del valor considerado.

- `Generalización a varias variables`

Si la función depende de varias variables: $y = f(x_1, x_2, \dots, x_n)$, y cada variable $x_i$ tiene un error absoluto $\Delta x_i$, entonces el error absoluto total puede aproximarse por:

\begin{align}
\Delta y \approx \sum_i \left|\frac{\partial f}{\partial x_i}\right| \Delta x_i.
\end{align}

De manera análoga, el error relativo queda:
\begin{align}
\delta y \approx \sum_i \frac{x_i}{f} \left|\frac{\partial f}{\partial x_i}\right| \delta x_i.
\end{align}


**PROBAR** como se recuperan las fórmulas anteriores para la suma, resta y multiplicación.

### Representación de números reales

Las computadoras codifican toda la información en binario, es decir, usando dígitos llamados bits, los cuales solo pueden tomar dos valores posibles: 0 o 1. Los números se almacenan como secuencias de bits. En particular, los números reales se representan mediante aritmética de punto flotante.

La forma general de un número en punto flotante es:
$$
\pm \, \text{mantisa} \times 2^{\text{exponente}}
$$

Debido a que una computadora solo puede almacenar un número finito de bits, la representación de los números reales es necesariamente aproximada. Esto introduce un límite conocido como `precisión de máquina`, que corresponde al menor número positivo $\varepsilon$ tal que
$$
1 + \varepsilon \neq 1
$$
en la aritmética de la máquina.

En el estándar IEEE 754, los números de punto flotante se dividen en dos categorías:
- **Números normales**, que utilizan toda la precisión disponible en la mantisa.
- **Números subnormales**, que permiten representar números muy cercanos a cero, aunque con menor precisión.

Existen varias limitaciones importantes asociadas a la representación en punto flotante:
- **Overflow**: ocurre cuando un número es demasiado grande para ser representado.
- **Underflow**: ocurre cuando un número es demasiado pequeño y se aproxima a cero.
- **Redondeo (rounding)**: ocurre cuando un número real no puede representarse exactamente y debe aproximarse al número representable más cercano.


 <p align="center"> <img src="capturas/1.png"> </p>


`NOTA`: Aunque los números reales se introducen y se muestran en base 10, Python almacena los números de punto flotante en base 2, siguiendo el estándar IEEE 754.

In [4]:
x = 0.1
format(x, '.17f')  # error de redondeo

'0.10000000000000001'

In [6]:
# para usar base 10
from decimal import Decimal

x = Decimal('0.1')
format(x, '.17f')

'0.10000000000000000'

En particular, `Python` emplea *doble precisión* para el caso de los números flotantes. En este formato, el almacenamiento ocupa un total de $64$ bits. Esto permite representar números aproximadamente en el rango:

$$
\pm 4.9\times10^{-324} \;\; \leftrightarrow \;\; \pm 1.8\times 10^{308}.
$$

El límite inferior corresponde al menor número positivo *subnormal*, mientras que el límite superior es el mayor número finito representable. La mayor parte de este rango dinámico proviene del término asociado al exponente.

En el caso de la doble precisión, si se intenta representar un número menor que $4.9\times10^{-324}$ ocurre un *underflow*, mientras que un número mayor que $1.8\times 10^{308}$ produce un *overflow*.

\textbf{IMPORTANTE:} El hecho de poder representar números tan pequeños como $4.9\times10^{-324}$ no implica que se disponga de $324$ cifras significativas. El número de cifras significativas (y, por tanto, la precisión) está determinado por la mantisa.

En doble precisión, la mantisa dispone de $52$ bits, lo que implica una precisión relativa de:
$$
\varepsilon_{\text{máquina}} = 2^{-52} \approx 2.2\times10^{-16}.
$$

Esto equivale aproximadamente a $15$–$16$ cifras decimales significativas, independientemente de la magnitud del número representado.

In [29]:
# Info de floats
import sys

print('Base del sistema de representación: ', sys.float_info.radix)  # base del sistema de representación
print('Dígitos en la mantisa: ', sys.float_info.mant_dig)  # dígitos en la mantisa

print('Menor exponente: ', sys.float_info.min_exp)  # menor exponente
print('Mayor exponente: ', sys.float_info.max_exp)  # mayor exponente

print('Menor número positivo normalizado: ', sys.float_info.min)  # menor número positivo normalizado
print('Mayor número representable: ', sys.float_info.max)  # mayor número representable
print('Precisión de máquina: ', sys.float_info.epsilon)  # precisión de máquina


print('Menor exponente en base 10: ', sys.float_info.min_10_exp)  # menor exponente en base 10
print('Mayor exponente en base 10: ', sys.float_info.max_10_exp)  # mayor exponente en base 10

print('Dígitos en base 10 de la mantisa: ', sys.float_info.dig)  # dígitos en base 10 de la mantisa

# sys.float_info  # all info as a named tuple

Base del sistema de representación:  2
Dígitos en la mantisa:  53
Menor exponente:  -1021
Mayor exponente:  1024
Menor número positivo normalizado:  2.2250738585072014e-308
Mayor número representable:  1.7976931348623157e+308
Precisión de máquina:  2.220446049250313e-16
Menor exponente en base 10:  -307
Mayor exponente en base 10:  308
Dígitos en base 10 de la mantisa:  15


In [None]:
# ¿Underflow?
x = 1e-320
x / 2

5e-321

¿Qué ocurrió acá?

Noten que pude representar un número menor que arrojó `sys.float_info.min`. Lo que ocurre es que lo que arroja es el `mínimo normal`, los  `subnormales` se consideran una extensión del rango, no parte del rango normal

Por eso:
- min marca el punto donde empieza el underflow gradual
- no el valor más pequeño distinto de cero

In [32]:
print('Menor número positivo: ', sys.float_info.min * sys.float_info.epsilon)

Menor número positivo:  5e-324


In [33]:
# Underflow
x = 1e-324
x / 2

0.0

Notar como cuando ocurre, lo redondea a cero

In [36]:
# Overflow

k = 298
for _ in range(6):
    large = 2.0 * 10**k
    print(r'2\times 10^{%d} -> ' % k, large)
    k += 2

2\times 10^{298} ->  2e+298
2\times 10^{300} ->  2e+300
2\times 10^{302} ->  2e+302
2\times 10^{304} ->  2e+304
2\times 10^{306} ->  2e+306
2\times 10^{308} ->  inf


### Precisión de máquina

¿Saben qué es la precisión de máquina?

La precisión de máquina no está relacionada con los números que podemos representar, sino con la distancia entre dos líneas verticales en la figura anterior. Como se comentó, cualquier número entre estas dos líneas se redondea, ya sea hacia la izquierda o hacia la derecha.

Al realizar operaciones aritméticas con dos números de punto flotante, si el resultado no es un número de punto flotante exactamente representable (por ejemplo, 1 y 10 se pueden representar exactamente, pero 1/10 no), entra en juego la precisión de máquina.

Pasamos ahora a la cuestión de realizar operaciones aritméticas utilizando tales números: esto da lugar a la importante cuestión del redondeo. Esta situación surge cada vez que intentamos combinar dos números de punto flotante y el resultado no es un número de punto flotante exactamente representable.

`Ejemplo conceptual`

Veamos un ejemplo ficticio para entender mejor. Consideremos que solo podemos almacenar cinco cifras significativas (dígitos). Supongamos que queremos sumar los números $0.12345$ y $1.2345$. Se podría intentar llevarlos a la notación de punto flotante, es decir, $1.2345 = 0.12345 \times 10^{1}$ mientras que $0.12345 = 0.12345 \times 10^{0}$. Ahora, en nuestro sistema, estos dos números tendrían la misma mantisa y diferentes exponentes. Sin embargo, para sumar dos mantisas debemos tener el mismo exponente; por ende, esta opción no es viable y debemos realizar la operación como números reales (es decir, no como números decimales de cinco dígitos):

\begin{align}
0.12345 + 1.2345 = 1.35795.
\end{align}

Ahora, si notan, la respuesta contiene seis cifras significativas, $1.35795$. Dado que estamos limitados a números decimales de cinco dígitos, esto nos deja la opción de truncar el resultado a $1.3579$ o redondearlo a $1.3580$, lo cual nos lleva a perder precisión.

`En resumen`, la precisión de máquina $\varepsilon_m$ se define como el número positivo más pequeño en punto flotante que, al sumarse a $1.0$, produce un resultado diferente de $1.0$ (al redondearse). Usualmente, para doble precisión se tiene $\varepsilon_m \approx 2.2 \times 10^{-16}$, y para precisión simple $\varepsilon_m \approx 1.2 \times 10^{-7}$.

Ejemplo: calculemos la precisión de máquina. Comenzamos con un número pequeño y lo vamos reduciendo a la mitad; después de cada reducción lo sumamos a $1.0$, y repetimos el proceso hasta que eventualmente obtenemos el gap entre números representables.

In [40]:
# precisión de máquina
small = 1/2**50
for i in range(5):
    small /= 2
    print(i, ' -> ', 1+small, small)


0  ->  1.0000000000000004 4.440892098500626e-16
1  ->  1.0000000000000002 2.220446049250313e-16
2  ->  1.0 1.1102230246251565e-16
3  ->  1.0 5.551115123125783e-17
4  ->  1.0 2.7755575615628914e-17


Notese que:

-  A partir de la iteración 2, el redondeo no es diferente de $1$, lo que nos da la precisión de máquina.
-  Como aún siendo doble precisión (puede almacenar números tan pequeños como $10^{-300}$), no significa que pueda almacenar $1+10^{-300}$ ya que esto necesitarías 301 dígitos de precisión (y todo lo que tienes es 16).

`La resta`

Hagamos un paréntesis y analicemos qué ocurre en una resta:

- `la pérdida de cifras significativas al restar dos números casi iguales`;

- `la pérdida de aún más dígitos al realizar la resta utilizando números de punto flotante (que tienen precisión finita)`.


Empecemos por el primer caso: 

Restemos dos números casi iguales, cada uno de los cuales tiene $20$ cifras significativas:

\begin{align}
1.2345678912345678912 - 1.2345678900000000000 = 0.0000000012345678912
\end{align}

Nótese que, al restar números reales (no representaciones de punto flotante), terminamos con solo $11$ cifras significativas. Es decir, aun trabajando con números reales y precisión infinita, hemos perdido precisión debido a la cancelación entre las cifras comunes.



Analicemos ahora el segundo caso y utilicemos la representación de punto flotante:

In [41]:
1.2345678912345678912 - 1.2345678900000000000

1.234568003383174e-09

En comparación con la respuesta que teníamos arriba (para números reales), vemos que solo coinciden en las primeras 6 (de 11) cifras significativas. Esto se debe en parte al hecho de que cada uno de nuestras entradas no se representan en el ordenador utilizando las 20 cifras significativas completas, sino sólo 16 dígitos como máximo. 

Explícitamente, los números almacenados en la máquina son:

In [26]:
1.2345678912345678912, 1.2345678900000000000

(1.234567891234568, 1.23456789)

Esto muestra que ya se pierde precisión en la representación del primer número, lo que posteriormente conduce a una pérdida aún mayor de precisión en el resultado de la resta.


Este fenómeno, en el cual la resta de dos números cercanos produce una pérdida significativa de cifras significativas, se conoce como `cancelación catastrófica`. La cancelación ocurre cuando *las cifras más significativas de los operandos coinciden y se eliminan en la resta*, dejando como resultado un número cuyo valor depende principalmente de cifras menos significativas, las cuales son precisamente las más afectadas por los errores de redondeo.

*Como consecuencia, aunque los errores relativos en los datos de entrada sean pequeños, el error relativo del resultado puede ser muy grande.* Este efecto no es un problema del computador en sí, sino una característica inherente de la aritmética de punto flotante.

Por esta razón, en el diseño de métodos numéricos no solo importa la expresión matemática que se desea evaluar, sino también su forma computacional. Reformulaciones algebraicamente equivalentes pueden presentar comportamientos numéricos muy distintos, y elegir una formulación estable es esencial para obtener resultados fiables.

### Comparando flotantes

Dado que sólo cierto números se pueden representar exactamente como flotantes (otros números se redondean al número de máquina más cercano), debemos tener cuidado al comparar números de punto flotante. 

In [42]:
xt = 0.1 + 0.2
yt = 0.3

xt == yt

False

¿qué paso?

In [43]:
xt, yt

(0.30000000000000004, 0.3)

Una posible solución para realizar esta igualdad de variables de punto flotante es tomar el valor absoluto de su diferencia y verificar si esta es menor que algún humbral aceptable por ejemplo: $10^{-10}-10^{-12}$

In [44]:
abs(xt-yt) < 1.e-12

True

La metodología comentada (denominada *absulute epsilon*) es adecuada en muchas ocasiones donde el "tamaño" de los números es "natural". Sin embargo, hay situaciones donde puede darnos resultados erroneos:

In [45]:
xt = 12345678912.345
yt = 12345678912.346
print(xt - yt)

abs(xt - yt) < 1.e-12

-0.0010013580322265625


False

La solución para este caso es usar una diferencia relativa (*relative epsilon*)

In [46]:
maxFin = lambda x, y: max(abs(x), abs(y))

abs(xt - yt)/maxFin(xt, yt) < 1.e-12

True

### Suma compensada

Pasamos ahora a una cuestión crucial relativa a las operaciones con números de punto flotante. En resumen, debido a los errores de redondeo, cuando se trabaja con aritmética de punto flotante, `la ley asociativa del álgebra` no necesariamente se cumple.

Usted sabe que, matemáticamente,
\begin{align}
0.1 + 0.2 = 0.3
\end{align}

Sin embargo, cuando se utilizan números de punto flotante, el resultado de una suma puede depender del orden en que se realizan las operaciones, debido a los errores de redondeo introducidos en cada paso.

Veamos un ejemplo sencillo:

In [48]:
print(f'Resultado de: (0.7 + 0.1) + 0.3 = {(0.7 + 0.1) + 0.3}')
print(f'Resultado de:  0.7 + (0.1 + 0.3) = {0.7 + (0.1 + 0.3)}')

Resultado de: (0.7 + 0.1) + 0.3 = 1.0999999999999999
Resultado de:  0.7 + (0.1 + 0.3) = 1.1


Aunque ambas expresiones son algebraicamente equivalentes, los resultados difieren ligeramente debido a la acumulación de errores de redondeo. Esto muestra que, `en aritmética de punto flotante, la suma no es asociativa`.

Este problema se vuelve especialmente relevante al sumar una gran cantidad de números, `en particular cuando existen números de magnitudes muy distintas`. En tales casos, los errores de redondeo pueden acumularse y provocar una pérdida significativa de precisión.

De este ejemplo queda claro que operaciones que son equivalentes en números reales pueden no serlo si se usan flotantes. Este ejemplo no es atípico, de hecho, puede ocurrír más drástico:

\begin{align}
    (10^{20} - 10^{20}) + 1 \neq 10^{20} + (1 - 10^{20})
\end{align}

In [36]:
xt = 1.e20
yt = -1.e20
zt = 1.

res1 = (xt + yt) + zt
res2 = xt + (yt + zt)

print(res1)
print(res2)

1.0
0.0


- En el primer caso, los dos números grandes, `xt`, `yt`, se cancelan entre sí y nos queda la unidad como respuesta. 

- En el segundo caso, nos enfrentamos a una situación similar a la discutida en la precisión de máquina, sumar $1$ al número grande (negativo) `yt`, simplemente se redondea a `yt`, luego, se cancela con `xt`.

    El **error garrafal** viene del hecho de estar trabajando con magnitudes muy diferentes (muy grandes y muy pequeños) y con signos opuestos. Uno podría decir entonces que cuando esto ocurre no se puede confiar en el resultado numérico. Sin embargo, en muchas ocasiones no somos concientes de que esto ocurre (ya que puede aparecer internamente en operaciones intermedias). En tal sentido `la lección es que uno debe acostumbrarse a razonar sobre sus cálculos, en lugar de confiar ciegamente en lo que produce la computadora`.



Para mitigar este efecto, se han desarrollado técnicas como la suma compensada, cuyo objetivo es reducir el error de redondeo acumulado durante la suma de muchos términos.

A continuación veamos como podemos intentar resolver estos problemas. Una manera de evitar estos errores de redondeo es `ordenar los números y luego sumarlos comenzando por el más pequeño`. Sin embargo, hay escenarios en que esto no es viable, en estos casos se emplea un truco llamado `suma compensada` o `suma Kahan`. Este truco lo que hace es estimar el error de redondeo en cada suma y luego compensarlo con un término de corrección.

En el algoritmo de Kahan lLa idea central es llevar un registro explícito del error de redondeo que se introduce en cada suma, y compensarlo en las operaciones posteriores.

`Idea básica del algoritmo:`

Supongamos que queremos calcular la suma:
\begin{align}
S = \sum_{i=1}^{n} x_i.
\end{align}

En la suma directa, cada operación de suma introduce un pequeño error de redondeo que se pierde inmediatamente. En la suma compensada, se introduce una variable adicional que acumula estos errores perdidos y los reincorpora en los pasos siguientes.

De manera esquemática, el algoritmo mantiene dos variables:
- una suma acumulada,

- un término de compensación que almacena el error de redondeo.

In [49]:
def kahansum(lis):
    suma, compensacion = 0., 0.
    for x in lis:
        y = x - compensacion
        temp = suma + y
        compensacion = (temp - suma) - y
        suma = temp
    return suma

lis = [0.7, 0.1, 0.3]
print(sum(lis), kahansum(lis))

1.0999999999999999 1.1


La suma de Kahan requiere más cálculos que la suma regular lo cual penaliza el rendimiento y además `no elimina el error de redondeo`.

### Manipulando expresiones

A continuación se discutirá como es posible perder precisión como consecuencia de la forma en que se escriben las ecuaciones. Por ejemplo consideremos:
$$f(x)=\frac{1}{\sqrt{x^2+1}-x}$$

para valores grandes de $x$.

In [50]:
import numpy as np 
f = lambda x: 1/(np.sqrt(x**2+1)-x)

xs = [10**i for i in range(4, 8)]
ys = [f(i) for i in xs]

for x, y in zip(xs, ys):
    print(x, '->',  y)

10000 -> 19999.99977764674
100000 -> 200000.22333140278
1000000 -> 1999984.77112922
10000000 -> 19884107.85185185


Noten como el resultado parece empeorar cada vez más a medida que aumenta el valor de x. Una manera de verlo es considerando $x=10^{8}$

In [51]:
f(1e8)

  f = lambda x: 1/(np.sqrt(x**2+1)-x)


inf

Esto sucede porque para valores grandes de $x$, sabemos que $x + 1 \approx x$, lo que implica que necesitemos evaluar la raíz cuadrada con mucha precisión si quiero poder restarle un número casi igual.

Una forma sencilla de evitar este problema consiste en reescribir la expresión inicial como:
$$ f(x)=\sqrt{x^2+1}+x$$

In [52]:
import numpy as np 
f = lambda x: np.sqrt(x**2+1)+x

xs = [10**i for i in range(4, 8)]
ys = [f(i) for i in xs]

for x, y in zip(xs, ys):
    print(x, '->',  y)

10000 -> 20000.000050000002
100000 -> 200000.00000499998
1000000 -> 2000000.0000005001
10000000 -> 20000000.000000052


Noten como mejoró. De hecho, como se aprecia de la ecuación para $x$ grandes la función se comporta como $2x$. 

Resumiendo, en muchas ocasiones una simple reescritura de la expresión inicial puede evitar problemas de precisión numérica (a menudo evitando una resta).

## Tarea:
1- 

<img src="capturas/2.png">

2-

<img src="capturas/3.png">