# Laboratorio 4: Precisión Numérica y Condicionamiento de Problemas

### Introducción

En este laboratorio, exploraremos los conceptos de precisión numérica y condicionamiento de problemas discutidos en la Clase 4. Investigaremos cómo las computadoras representan y manipulan números de punto flotante, las limitaciones de estas representaciones, y cómo estas limitaciones pueden afectar la precisión de nuestros cálculos. También examinaremos el concepto de condicionamiento de problemas y cómo afecta la estabilidad de los algoritmos numéricos.

### Estructura del Laboratorio
1. Precisión Numérica y Punto Flotante
    1. Punto Flotante (IEEE 754)
    2. Epsilon de máquina
    3. Errores en la aritmética de punto flotante
2. Condicionamiento de Problemas

## 1. Precisión Numérica y Punto Flotante
### 1.1 Punto Flotante (IEEE 754)

**Ejercicio 1.1.1** Defina en numpy una variable `x=0.1` e imprimala utilizando `print(f"{x:.20f}")` ¿Qué valor tiene `x`? ¿Es exactamente 0.1? ¿Por qué?

*NOTA:* La notación `f"{x:.20f}"` imprime el valor de `x` con 20 decimales.

La clase `float` de Python utiliza por defecto precisión doble (64 bits).  `numpy` permite seleccionar la precisión de los números flotantes. Por ejemplo, `np.float32` crea un número flotante de precisión simple (32 bits).

**Ejercicio 1.1.2** Defina en numpy una variable `x=0.1` como un número flotante de doble precisión e imprimala utilizando `print(f"{x:.20f}")` ¿Qué valor tiene `x`? 

**Ejercicio 1.1.3** Defina en numpy una variable `x=0.1` como un número flotante de precisión simple e imprimala utilizando `print(f"{x:.20f}")` ¿Qué valor tiene `x`? 

**Ejercicio 1.1.4** Defina en numpy una variable `x=0.1` como un número flotante de media precisión e imprimala utilizando `print(f"{x:.20f}")` ¿Qué valor tiene `x`? 

*NOTA:* La precisión de los números flotantes en `numpy` se puede seleccionar utilizando `np.float16`, `np.float32`, `np.float64`.

**Ejericio 1.1.5** La función `np.fininfo` de `numpy` permite obtener información sobre los números flotantes. Utilice esta función para obtener información sobre los números flotantes de precisión simple, doble y media. ¿Cuál es la precisión de cada uno de estos tipos de números flotantes?

In [6]:
import numpy as np
# --------------------------------------
# Ejercicio 1.1.1
# --------------------------------------
print("-"*63)
x = 0.1
print(f"Los valores decimales son: {x:.20f}")

# --------------------------------------
# Ejercicio 1.1.2
# --------------------------------------

y = np.float64(0.1)
print(f"Los valores decimales son: {y:.20f}")

# --------------------------------------
# Ejercicio 1.1.3
# --------------------------------------

z = np.float32(0.1)
print(f"Los valores decimales son: {z:.20f}")

# --------------------------------------
# Ejercicio 1.1.4
# --------------------------------------

a = np.float16(0.1)
print(f"Los valores decimales son: {a:.20f}")
print("-"*63)

# --------------------------------------
# Ejercicio 1.1.5
# --------------------------------------

info_float16 = np.finfo(np.float16)
info_float32 = np.finfo(np.float32)
info_float64 = np.finfo(np.float64)

print("Información sobre números flotantes de precisión media (float16):")
print(info_float16)

print("\nInformación sobre números flotantes de precisión simple (float32):")
print(info_float32)

print("\nInformación sobre números flotantes de precisión doble (float64):")
print(info_float64)


---------------------------------------------------------------
Los valores decimales son: 0.10000000000000000555
Los valores decimales son: 0.10000000000000000555
Los valores decimales son: 0.10000000149011611938
Los valores decimales son: 0.09997558593750000000
---------------------------------------------------------------
Información sobre números flotantes de precisión media (float16):
Machine parameters for float16
---------------------------------------------------------------
precision =   3   resolution = 1.00040e-03
machep =    -10   eps =        9.76562e-04
negep =     -11   epsneg =     4.88281e-04
minexp =    -14   tiny =       6.10352e-05
maxexp =     16   max =        6.55040e+04
nexp =        5   min =        -max
smallest_normal = 6.10352e-05   smallest_subnormal = 5.96046e-08
---------------------------------------------------------------


Información sobre números flotantes de precisión simple (float32):
Machine parameters for float32
-------------------------------

### 1.2 Precisión relativa y epsilon de máquina
La función `math.nextafter()` de Python devuelve el siguiente número de punto flotante más cercano a un número dado en la dirección especificada. Por ejemplo, `math.nextafter(1.0, math.inf)` devuelve el siguiente número de punto flotante más grande después de 1.0. 

**Ejercicio 1.2.1** Utilice la función `math.nextafter()` para calcular la distancia entre los siguientes números: `0.001, 1.0, 1000.` y el siguiente número de punto flotante más grande. Imprima la distancia absoluta y relativa entre dichos números y el siguiente en la representación de punto flotante. ¿Qué puede concluir sobre la precisión de los números de punto flotante?

**Ejercicio 1.2.2** Busque el valor de `epsilon` en Python y comparelo con el valor de las precisiones relativas calculadas en el Ejercicio 1.2.1. 

In [None]:
import math

# ------------------------------
# Ejercicio 1.2.1
# ------------------------------

epsilon_de_maquina = (math.nextafter(1.0, math.inf)) - 1
# El epsilon de máquina es la distancia entre 1 y el siguiente número más cercano representable.
print(epsilon_de_maquina)

flotante = (math.nextafter(0.001, math.inf)) - 0.001
flotante2 = (math.nextafter(1.0, math.inf)) - 1
flotante3 = (math.nextafter(1000, math.inf)) - 1000

print(f"{flotante}\n{flotante2}\n{flotante3}")

# ------------------------------
# Ejercicio 1.2.2
# ------------------------------

epsilon = np.finfo(float).eps
print(f"Epsilon en Python: {epsilon}")
print(epsilon_de_maquina == epsilon)


2.220446049250313e-16
2.168404344971009e-19
2.220446049250313e-16
1.1368683772161603e-13
Epsilon en Python: 2.220446049250313e-16
True


### 1.3 Errores en la aritmética de punto flotante
La aritmética de punto flotante es aproximada.  En general, es posible esperar que las operaciones en punto flotante respeten el "axioma":
$$ x \oplus y = (x + y)(1 + \epsilon), \, \epsilon \leq \epsilon_{\text{maq}}$$
donde $\oplus$ es una operación cualquiera de punto flotante entre dos elementos $x$ e $y$, $+$ es la operación en aritmética (real) estándar y $\epsilon$ es el error relativo de la operación.

**Ejercicio 1.3.1: Precisión aritmética** Considere los números $x=0.1$ e $y=0.2$. Calcule su suma $z=x+y$ en punto flotante y evalúe la expresión booleana `z==0.3`. ¿Qué sucede? Calcule el error relativo respecto del valor esperado y comparelo con el valor de $\epsilon_{\text{maq}}$. ¿El error relativo de la suma es menor o mayor que $\epsilon_{\text{maq}}$?

**Ejercicio 1.3.2: Operaciones irrelevantes** Considere los números $x=1e16$ e $y=1$. Calcule su suma $z=x+y$ en punto flotante y evalúe la expresión booleana `z==x`. ¿Qué sucede/ Calcule el error relativo respecto del valor esperado y comparelo con el valor de $\epsilon_{\text{maq}}$. ¿El error relativo de la resta es menor o mayor que $\epsilon_{\text{maq}}$?

**Ejercicio 1.3.3: Cancelación catastrófica** Considere los números $x=0.123456789012345678$ y $y=0.123456789012345677$. Calcule su resta $z=x-y$ en punto flotante y evalúe la expresión booleana `z==0`. ¿Qué sucede? Calcule el error relativo respecto del valor esperado y comparelo con el valor de $\epsilon_{\text{maq}}$. ¿El error relativo de la resta es menor o mayor que $\epsilon_{\text{maq}}$?

**Ejercicio 1.3.4: overflow** Estime (a mano o programáticamente) el orden de magnitud de $e^{800}$ y luego calcúlelo en python directamente. *Sugerencia:* note que $e^x = 10^{800\log_{10}(e)}$

**Ejercicio 1.3.5: underflow** Repita el ejercicio anterior para $e^{-800}$

In [None]:
# --------------------------------
# Ejercicio 1.3.1
# --------------------------------

x = 0.1
y = 0.2
z = x + y

print(f"z == 0.3: {z == 0.3}")

# Error relativo respecto al valor esperado
valor_esperado = 0.3
error_relativo = abs(z - valor_esperado) / valor_esperado
print(f"Error relativo: {error_relativo}")

# Comparación con epsilon de máquina
print(f"Error relativo <= epsilon_de_maquina: {error_relativo <= epsilon_de_maquina}")

# El error relativo es menor que el epsilon de máquina, cumpliendo así con la definición


z == 0.3: False
Error relativo: 1.8503717077085943e-16
Error relativo < epsilon_de_maquina: True


In [None]:
# --------------------------------
# Ejercicio 1.3.2
# --------------------------------

x = 1e16
y = 1
z = x + y

print(f"z == x: {z == x}")

# Error relativo respecto al valor esperado
valor_esperado = 10000000000000001.0
error_relativo = abs(z - valor_esperado) / valor_esperado
print(f"Error relativo: {error_relativo}")

# Comparación con epsilon de máquina
print(f"Error relativo <= epsilon_de_maquina: {error_relativo <= epsilon_de_maquina}")

# El error relativo es menor que el epsilon de máquina y además es igual a 0, cumpliendo así con la definición

z == x: True
Error relativo: 0.0
Error relativo <= epsilon_de_maquina: True


In [4]:
# --------------------------------
# Ejercicio 1.3.3
# --------------------------------

x = 0.123456789012345678
y = 0.123456789012345677
z = x - y

print(f"z == x: {z == 0}")

# Error relativo respecto al valor esperado
valor_esperado = 0.000000000000000001
error_relativo = abs(z - valor_esperado) / valor_esperado
print(f"Error relativo: {error_relativo}")

# Comparación con epsilon de máquina
print(f"Error relativo <= epsilon_de_maquina: {error_relativo <= epsilon_de_maquina}")

# El error relativo es mayor que el epsilon de máquina y además es igual a 1, ya que al considerar que z es igual a 0
# se divide al valor esperado por sí mismo causando el error en la definición.

z == x: True
Error relativo: 1.0


NameError: name 'epsilon_de_maquina' is not defined

In [28]:
# --------------------------------
# Ejercicio 1.3.4
# --------------------------------

orden_magnitud = 800 * math.log10(math.e) # Es un número gigantesco: un 1 seguido de ~347 ceros.
print(f"Orden de magnitud de e^800: 10^{orden_magnitud}")

# Cálculo directo de e^800
try:
    resultado = math.exp(800)
    print(f"Resultado directo de e^800: {resultado}\n")
except OverflowError:
    print("OverflowError: El resultado es demasiado grande para representarlo.\n")

# --------------------------------
# Ejercicio 1.3.5
# --------------------------------

orden_magnitud = -800 * math.log10(math.e)
print(f"Orden de magnitud de e^-800: 10^{orden_magnitud:.4f}")

try:
    resultado = math.exp(-800)
    print(f"Resultado directo de e^-800: {resultado:.4e}")  
except OverflowError:
    print("OverflowError: El resultado es demasiado pequeño para representarlo.")


Orden de magnitud de e^800: 10^347.43558552260146
OverflowError: El resultado es demasiado grande para representarlo.

Orden de magnitud de e^-800: 10^-347.4356
Resultado directo de e^-800: 0.0000e+00


## 2. Condicionamiento de Problemas
### 2.1 Condicionamiento de un problema
El condicionamiento de un problema es una medida de cuánto cambia la solución de un problema cuando se cambian los datos de entrada. Un problema mal condicionado es aquel en el que pequeñas variaciones en los datos de entrada pueden resultar en grandes variaciones en la solución.  Un ejemplo clásico de un problema mal condicionado es el siguiente sistema lineal: 

$$\begin{bmatrix} 1 & 2 \\ 2 & 4.0001 \end{bmatrix} x = b$$

Con cualquier valor de $b$. 

**Ejercicio 2.1.1:** Sea $b_1=\begin{bmatrix} 3 \\ 6.0001 \end{bmatrix}$, halle la solución del sistema a mano.  Repita para $b_2=\begin{bmatrix} 3 \\ 6.0002 \end{bmatrix}$.   Calcule la variación relativa de la solución sobre la variación relativa del vector b:
$$ \frac{\|x_2-x_1\|}{\|x_1\|} / \frac{\|b_2-b_1\|}{\|b_1\|}$$

**Ejercicio 2.1.2:** Calcule el número de condición de la matriz $A$.  Muestre que el cociente del problema anterior es menor este número de condición. 

**Ejercicio 2.1.3:** Utilizando representación flotante de precisión simple, resuelva los problemas anteriores en numpy.  Calcule el error relativo respecto de la respuesta correcta calculada en los ejercicios anteriores. ¿Por qué?

In [None]:
# --------------------------------
# Ejercicio 2.1.1
# --------------------------------

A = np.array([[1, 2], 
              [2, 4.0001]])

b1 = np.array([3, 6.0001])
x1 = np.linalg.solve(A, b1)

b2 = b = np.array([3, 6.0002])
x2 = np.linalg.solve(A, b2)
vals = np.linalg.eigvals(A)
print("Valores", vals)

variacion_relativa_solucion = np.linalg.norm(x2 - x) / np.linalg.norm(x1)
variacion_relativa_b = np.linalg.norm(b2 - b1) / np.linalg.norm(b1)
formula = variacion_relativa_solucion / variacion_relativa_b

print(f"Variación relativa de la solución: {variacion_relativa_solucion}")
print(f"Variación relativa de b: {variacion_relativa_b}")
print(f"Condicionamiento: {formula}")


Valores [1.999968e-05 5.000080e+00]


NameError: name 'x' is not defined

In [None]:
# --------------------------------
# Ejercicio 2.1.2
# --------------------------------

# Cálculo del número de condición de la matriz A
numero_condicion = np.linalg.cond(A, p=2)

print(f"Número de condición de la matriz A: {numero_condicion}")
# La matriz A está mal condicionada, por lo tanto, es muy sensible a errores en los datos.

print(f"El cociente del problema anterior ({formula}) es menor que el número de condición ({numero_condicion}): {formula < numero_condicion}")

Número de condición de la matriz A: 250008.00009210614
El cociente del problema anterior (106067.43139414866) es menor que el número
de condición (250008.00009210614): True


In [None]:
# --------------------------------
# Ejercicio 2.1.3
# --------------------------------

# Convertir la matriz A y los vectores b1 y b2 a precisión simple
A_float32 = A.astype(np.float32)
b1_float32 = b1.astype(np.float32)
b2_float32 = b2.astype(np.float32)

# Resolver los sistemas lineales con precisión simple
x1_float32 = np.linalg.solve(A_float32, b1_float32)
x2_float32 = np.linalg.solve(A_float32, b2_float32)

# Calcular el error relativo respecto a las soluciones originales
error_relativo_x1 = np.linalg.norm(x1_float32 - x1) / np.linalg.norm(x1)
error_relativo_x2 = np.linalg.norm(x2_float32 - x2) / np.linalg.norm(x2)

print(f"Error relativo para x1 (precisión simple): {error_relativo_x1}")
print(f"Error relativo para x2 (precisión simple): {error_relativo_x2}")

# En x1: el resultado de float32 coincidió con float64 porque el sistema era relativamente 
# estable en ese punto (o porque los errores estaban dentro del rango tolerado por float32).

# En x2: el sistema estaba en una zona mucho más sensible, y la menor precisión sí afectó 
# notablemente la solución.

Error relativo para x1 (precisión simple): 0.0
Error relativo para x2 (precisión simple): 0.004761910447400291


### 2.2 Propagación de errores y estabilidad algorítmica.
Los errores numéricos se propagan a través de los cálculos. Supongamos que queremos calcular:
$$f(x) = \sqrt{x+1}-\sqrt{x}$$ 
En el caso de que $x$ es muy grande, la resta de dos números casi iguales puede llevar a errores grandes (cancelación catastrófica).  Sin embargo, si reescribimos la función como:
$$f(x) = \frac{(\sqrt{x+1}-\sqrt{x})(\sqrt{x+1}+\sqrt{x})}{\sqrt{x+1}+\sqrt{x}} = \frac{x+1-x}{\sqrt{x+1}+\sqrt{x}} = \frac{1}{\sqrt{x+1}+\sqrt{x}}$$
podemos evitar la cancelación catastrófica.

Es decir: distintas estrategias de cálculo (algoritmos) pueden llevar a resultados con distintos niveles de precisión.

**Ejercicio 2.2.1:** Implemente las dos formas de calcular $f(x)$ en python.  Evalúe los resultados para $x=10$, $x=10^12$ y $x=10^{16}$. ¿Qué puede concluir sobre la estabilidad de los algoritmos?

**Ejercicio 2.2.2:** Considere el problema de hallar los valores propios de una matrix $A$ dada por:
$$A = \begin{pmatrix} 1+\epsilon & 0 \\ 0 & 1 \end{pmatrix}$$
donde $\epsilon$ es un número muy pequeño. Halle los valores propios de $A$ mediante cálculo directo (*Nota:* la matriz A es diagonal). Implemente un algoritmo para calcular los valores propios de $A$ mediante el cálculo y resolución del polinomio característico. Utilice su función para evaluar el caso en que $\epsilon=10^{-14}$.  Compare los resultados de este método con el cálculo directo realizado previamente. ¿Qué puede concluir sobre la precisión y estabilidad del algoritmo utilizados?

**Ejercicio 2.2.3:** Determine el número de condición de la matriz anterior.  ¿Es esperada la pérdida de precisión observada en el cálculo de los valores propios?

**Ejercicio 2.2.4:** Repita el ejercicio 2.1.2 utilizando ahora  `np.linalg.eigvals()` en lugar de calcular las raícies del polinomio característico. ¿Qué puede concluir sobre la precisión y estabilidad del algoritmo utilizado?

In [None]:
# ---------------------------------
# Ejercicio 2.2.1
# ---------------------------------

def f_original(x):
    return math.sqrt(x + 1) - math.sqrt(x)

def f_reformulada(x):
    return 1 / (math.sqrt(x + 1) + math.sqrt(x))

# Evaluación para los valores dados
valores_x = [10, 1e12, 1e16]
for x in valores_x:
    resultado_original = f_original(x)
    resultado_reformulada = f_reformulada(x)
    print(f"x = {x}")
    print(f"f_original(x) = {resultado_original}")
    print(f"f_reformulada(x) = {resultado_reformulada}")
    print(f"Diferencia absoluta: {abs(resultado_original - resultado_reformulada)}\n")


# Con los valores 1e^{12} y 1e^{16} podemos notar que la propagación de errores se hacen relevantes.
# Reescribiendo la formula se puede evitar la cancelación catastrófica.

x = 10
f_original(x) = 0.1543471301870203
f_reformulada(x) = 0.1543471301870205
Diferencia absoluta: 2.220446049250313e-16

x = 1000000000000.0
f_original(x) = 5.00003807246685e-07
f_reformulada(x) = 4.999999999998749e-07
Diferencia absoluta: 3.807246810093941e-12

x = 1e+16
f_original(x) = 0.0
f_reformulada(x) = 5e-09
Diferencia absoluta: 5e-09



In [None]:
# ---------------------------------
# Ejercicio 2.2.2
# ---------------------------------

def calculo_directo(epsilon):
    A = np.array([[1 + epsilon, 0], [0, 1]])
    valores_propios_directos = np.diag(A)
    return valores_propios_directos


def resolucion_poly_caracteristico(epsilon):
    A = np.array([[1 + epsilon, 0], [0, 1]])
    polinomio_caracteristico = np.poly(A)
    valores_propios_polinomio = np.roots(polinomio_caracteristico)
    return valores_propios_polinomio

epsilon = 1e-14
valores_propios_directos = calculo_directo(epsilon)
valores_propios_polinomio = resolucion_poly_caracteristico(epsilon)

np.set_printoptions(precision=17) # Agrego para que devuelva el valor directo
print(f"Valores propios calculados directamente: {valores_propios_directos}")
print(f"Valores propios calculados mediante el polinomio característico: {valores_propios_polinomio}")


# El cálculo directo de los valores propios es más preciso y estable cuando la matriz es diagonal,
# ya que simplemente extrae los elementos de la diagonal sin realizar operaciones numéricamente inestables.
# Por otro lado, el método que utiliza el polinomio característico puede sufrir pérdida de precisión,
# especialmente cuando epsilon es muy pequeño, debido a cancelaciones numéricas al resolver el polinomio.
# Por esta razón, en la práctica, no se recomienda usar el polinomio característico para calcular valores propios
# cuando se pueden emplear métodos más estables como la descomposición o funciones optimizadas como numpy.linalg.eig().


Valores propios calculados directamente: [1.00000000000001 1.              ]
Valores propios calculados mediante el polinomio característico: [1.0000000000000049+2.1073424255447067e-08j
 1.0000000000000049-2.1073424255447067e-08j]


In [None]:
# ---------------------------------
# Ejercicio 2.2.3
# ---------------------------------

condicion = np.linalg.cond(A)
print("El valor de condicíon de la matriz A es: \n", condicion)

# El número de condición de A es muy chico, lo que convierte a A en una matriz estable. Por lo tanto el error
# que se da en el cálculo de los valores propios es por el método utilizado.

El valor de condicíon de la matriz A es: 
 2.0


In [None]:
# ---------------------------------
# Ejercicio 2.2.4
# ---------------------------------

epsilon = 1e-14
A = np.array([[1 + epsilon, 0],
              [0, 1]])
valores_propios_eigvals = np.linalg.eigvals(A)

print(f"Valores propios calculados con np.linalg.eigvals(): {valores_propios_eigvals}")
print(f"Valores propios calculados mediante el polinomio característico: {valores_propios_polinomio}")

# El método np.linalg.eigvals() es más preciso y estable que el cálculo mediante el polinomio característico,
# ya que evita las cancelaciones numéricas y otros errores asociados con la resolución de polinomios.

Valores propios calculados con np.linalg.eigvals(): [1.00000000000001 1.              ]
Valores propios calculados mediante el polinomio característico: [1.0000000000000049+2.1073424255447067e-08j
 1.0000000000000049-2.1073424255447067e-08j]
Conclusión:
El método np.linalg.eigvals() es más preciso y estable que el cálculo mediante el polinomio característico,
ya que evita las cancelaciones numéricas y otros errores asociados con la resolución de polinomios.
