# Seminario sobre Solución de Ecuaciones No Lineales Numericamente

**Autor**: Leynier Gutiérrez González

## Separación de raíces

En todos los métodos de resolución de ecuaciones que serán considerados en este capítulo, se parte del conocimiento de un intervalo `(a, b)` en el que la ecuación tiene exactamente una raíz. Lo más frecuente, sin embargo, es que en el intervalo de interés, lo más que se pueda asegurar es la existencia de una o más raíces. Por esta razón, el cálculo de las raíces de una ecuación consta, en general, de dos etapas; la primera, llamada separación de las raíces, persigue precisamente determinar intervalos como el `(a, b)` que contengan una raíz; la segunda es ya la aplicación de un algoritmo para hallar una aproximación de la raíz deseada con la aproximación requerida.

### Separación gráfica de raíces

La técnica más elemental para la separación de raíces es el método gráfico que utiliza el conocido hecho de que las raíces de `f(x) = 0` son las abscisas de los puntos en que la gráfica de la función `y = f(x)` corta al eje `x`.

Es obvio que de esta forma no se pueden determinar las raíces con una precisión aceptable, pero sí se pueden acotar dentro de intervalos de separación suficientemente pequeños. Como en la actualidad existe una enorme cantidad de programas que grafican funciones, el método gráfico es sumamente atractivo y eficiente. Por lo general, se comienza graficando la función `f(x)` en un intervalo grande y se van precisando intervalos de búsqueda más pequeños en los cuales se ordena de nuevo graficar la función, hasta obtener un intervalo en que solamente esté contenida la raíz que interese. El método gráfico brinda, además, valiosa información acerca de las características de la función `f(x)`, tales como los signos de la función y de su primera y segunda derivadas en diferentes puntos del intervalo de separación; esta información puede ser de gran importancia para la aplicación posterior de los métodos de cálculo de raíces.

### Algunos resultados importantes para ecuaciones algebraicas

**Teorema 1:** Una ecuación algebraica de grado `n` tiene n raíces, reales o imaginarias, si cada raíz se cuenta tantas veces según sea su multiplicidad.

**Colorario 1:** Una ecuación algebraica de grado `n` tiene como máximo n raíces reales.

**Regla de Descartes:** Sea `m` el número de cambios de signo que se presentan en la sucesión de coeficientes de la ecuación algebraica. Entonces el número de raíces positivas de la ecuación es menor o igual que `m` y tiene su misma paridad.

**La fórmula de Lagrange para acotar raíces:** Sea la ecuación algebraica de grado `n`, cuyo primer coeficiente `a_0` es positivo. Si `B` es el valor absoluto del coeficiente negativo con mayor valor absoluto y `a_k` es el primer coeficiente negativo contando desde la izquierda, entonces todas las raíces positivas de la ecuación, si existen, son menores que el número `R = 1 + (B / a_0)^(1/k)`

**Análisis de las raíces negativas de una ecuación algebraica**: Las reglas de Descartes y de Lagrange solo se refieren a raíces positivas. Cuando se desee investigar las raíces negativas, bastará cambiar en la ecuación la variable `x` por `–x` y analizar las raíces positivas de la nueva ecuación obtenida, ya que, evidentemente, si `r` es una raíz positiva de la nueva ecuación `f(–x) = 0` entonces `–r` es una raíz negativa de la ecuación original `f(x) = 0`.

## El método de la bisección

### Hipótesis

Sea la ecuación `f(x) = 0` y un intervalo `[a, b]` tales que:

1. En el intervalo la ecuación tiene una sola raíz `x = r`.
2. `f(x)` es continua en `[a, b]`
3. `f(x)` posee signos diferentes en `a` y en `b`, es decir, `f(a) * f(b) < 0`

### El método

Tal como indica su nombre, el método consiste en aproximar la raíz de la ecuación como el punto medio del intervalo `[a, b]`. Evaluando la función en este punto se decide si la raíz se encuentra en la mitad izquierda del intervalo o en la mitad derecha. De esta manera, una de las dos mitades queda descartada y la amplitud del nuevo intervalo de búsqueda es exactamente un medio de la anterior. A medida que este proceso se repite, el intervalo de búsqueda va disminuyendo en amplitud. Si se conviene en llamar `[a_1, b_1]` al intervalo inicial, entonces, en la iteración número `n` del método se tiene:

    x_n = (a_n + b_n) / 2           n = 1, 2, 3, ...

con el error absoluto máximo: `E_m(x_n) = (b_n - a_b) / 2`

Al evaluar la función `f(x)` en `x_n` se selecciona el nuevo intervalo de búsqueda `[a_(n + 1), b_(n + 1)]` de acuerdo con la siguiente regla:

* Si `f(a_n) * f(x_n) < 0` entonces la raíz se encuentra en `[a_n, x_n]` y se escoge `a_(n + 1) = a_n` y `b_(n + 1) = x_n`
* Si `f(x_n) * f(b_n) < 0` entonces la raíz se encuentra en `[x_n, b_n]` y se escoge `a_(n + 1) = x_n` y `b_(n + 1) = b_n`
* Si `f(x_n) * f(b_n) = 0` entonces `x_n` es la raíz buscada y no hay que continuar.

### Convergencia del método

**Error máximo en la interación `n`**: `E_m(x_n) = (b - a) / 2^n`

Si la variable `n` tiene al infinito, `E_m` tiende a `0`. Y como `|r - x_n| <= E_m(x_n)`, quedando que si `n` tiende al infinito `x_n` tiende a `r`.

### Condición de terminación

Una vez que se tiene una forma de hallar el error absoluto máximo en cada paso de un método iterativo el proceso se puede detener tan pronto como dicho error sea suficientemente pequeño. Para precisar ideas, si el número `e > 0` es la tolerancia con que se necesita la raíz de la ecuación, entonces el proceso iterativo se debe detener cuando `E_m(x_n)` sea menor o igual que `e`. El error absoluto máximo se halla en cada paso mediante la ecuación `E_m(x_n) = (b_n - a_b) / 2`. Entonces la condición de terminación del proceso iterativo será:

> Condición de terminación: Si se desea obtener la raíz de la ecuación con un error absoluto menor que `e`, el método de bisección se llevará a cabo hasta la aproximación `x_n` para la cual `E_m(x_n) = (b_n - a_n) - 2 <= e`.

En el método de bisección se puede determinar, antes de comenzar, el número de iteraciones que será necesario realizar para alcanzar una cierta precisión; en efecto, de acuerdo con la ecuación `E_m(x_n) = (b - a) / 2^n` se tiene `n >= ln((b - a) / e) / ln(2)`.

### Implementación

In [2]:
from scipy import sign


def bisection(f, a, b, e=10**(-12)):
    while (b - a) > e:
        m = a + (b - a) / 2
        if sign(f(a)) == sign(f(m)):
            a = m
        else:
            b = m
    m = a + (b - a) / 2
    return m

## Ejemplo

`f(x) = x^2 - 10` en `[0, 10]`

In [3]:
from scipy.optimize import bisect


f = lambda x: x**2 - 10
a = 0
b = 10

print('Bisección Propio:', bisection(f, a, b))
print('Bisección Scipy:', bisect(f, a, b))
print('Raíz Exacta:', 10**(1/2))

Bisección Propio: 3.162277660168513
Bisección Scipy: 3.162277660168229
Raíz Exacta: 3.1622776601683795


## El método Regula Falsi

### Hipótesis

Sea la ecuación `f(x) = 0` y un intervalo `[a, b]` tales que:

1. En el intervalo la ecuación tiene una sola raíz `x = r`.
2. `f(x)` es continua en `[a, b]`
3. `f(x)` posee signos diferentes en `a` y en `b`, es decir, `f(a) * f(b) < 0`

### El método

El nombre de este método proviene de una frase latina que significa regla inclinada y geométricamente consiste en tomar como aproximación de la raíz en el intervalo `[a_n, b_n]` el punto de intersección con el eje `x` de un segmento que une los extremos del arco de la gráfica en ese intervalo. Por esta razón, también se le conoce como método de las cuerdas.

    x_n = a_n - (b_n - a_n) / (f(b_n) - f(a_n)) * f(a_n)

Tal como en el método de bisección, una vez obtenido el valor `x_n`, se analiza el signo de `f(x_n)` y de acuerdo con él se determina si la raíz `r` se encuentra en `[a_n, x_n]` o en `[x_n, b_n]` y el proceso se repite sucesivamente.

### El error del método

Si `f(x)` es continua y dos veces derivable en `[a, b]`, `f(x)` posee en `[a, b]` una sola raíz siendo `f(a)` y `f(b)` de signos opuestos, `f'(x)` y `f"(x)` no cambian de signo en `[a, b]` y existen números `d` y `D` tales que `d <= f'(x) <= D` en `[a, b]` y se cumple que `2d > D`, entonces el error absoluto máximo de la aproximación `x_n` obtenida por el método Regula Falsi puede tomarse como:

    E_m (x_n) = |x_n - x_(n - 1)|

### Condición de terminación

Si se desea obtener la raíz de la ecuación con un error absoluto menor que `e` y se satisfacen las hipótesis de convergencia, el método Regula Falsi se llevará a cabo hasta la aproximación `x_n` para la cual `E_m (x_n) = |x_n - x_(n - 1)| <= e`.

### Implementación

In [4]:
from scipy import sign


def regula_falsi(f, a, b, e=10**(-12)):
    x_a = 10**6
    while True:
        x = a - ((b - a) / (f(b) - f(a))) * f(a)
        t_e = abs(x - x_a)
        if f(x) == 0:
            return x
        elif sign(f(a)) == sign(f(x)):
            b = x
        else:
            a = x
        x_a = x
        if t_e <= e:
            return x

### Ejemplo

`f(x) = x^2 - 10` en `[0, 10]`

In [5]:
f = lambda x: x**2 - 10
a = 0
b = 10

print('Regula Falsi Propio:', regula_falsi(f, a, b))
print('Raíz Exacta:', 10**(1/2))

Regula Falsi Propio: 3.162277660168651
Raíz Exacta: 3.1622776601683795


## El método de Newton – Raphson

Sea `f: [a, b] -> R` función derivable definida en el intervalo real `[a, b]`. Empezamos con un valor inicial `x_0` y definimos para cada número natural `n`

    x_(n + 1) = x_n - f(x_n) / f'(x_n)

### El error del método

    E_m(x_n) = (M / 2d) * [E_m(x_(n - 1))]^2

### Condición de terminación

Si se desea obtener la raíz de la ecuación con un error absoluto menor que `e` el método de Newton - Raphson se llevará a cabo hasta la aproximación `x_n` para la cual: `E_m(x_n) = |x_n - x_(n - 1)| <= e`

### Implementación

In [6]:
def newton_raphson(f, df, x_a, e=10**(-12)):
    while True:
        x = x_a - f(x_a) / df(x_a)
        if abs(x - x_a) <= e:
            return x
        x_a = x

### Ejemplo

    f(x) = x^2 - 10
    f'(x) = 2x

Aproximación inicial: `3`

In [7]:
f = lambda x: x**2 - 10
df = lambda x: 2 * x
x_a = 3

print('Newton Raphson Propio:', newton_raphson(f, df, x_a))
print('Raíz Exacta:', 10**(1/2))

Newton Raphson Propio: 3.162277660168379
Raíz Exacta: 3.1622776601683795


## El método de las secantes

El método se define por la relación de recurrencia:

    x_(n + 1) = x_n - ((x_n - x_(n - 1)) / (f(x_n) - f(x_(n - 1)))) * f(x_n)

Como se puede ver, este método necesitará dos aproximaciones iniciales de la raíz para poder inducir una pendiente inicial.

### Convergencia

El orden de convergencia de este método, en un punto cercano a la solución, es `a` donde

    a = (1 + 5^(1/2)) / 2

`a` es proximadamente `1.618`, es el número áureo, por lo que se trata de una convergencia superlineal inferior a la del método de Newton - Raphson. En caso de que la aproximación inicial sea demasiado lejana o la raíz no sea simple, este método no asegura la convergencia y tiene un comportamiento similar al de Newton - Raphson.


### El error del método

    E_m(x_n) = (M / 2d)^(0.618) * [E_m(x_(n - 1))]^(1.618)

### Condición de terminación

Si se desea obtener la raíz de la ecuación con un error absoluto menor que `e` el método de Newton - Raphson se llevará a cabo hasta la aproximación `x_n` para la cual: `E_m(x_n) = |x_n - x_(n - 1)| <= e`

### Implementación

In [8]:
def secant(f, x_a, x_b, e=10**(-12)):
    while True:
        x = x_b - f(x_b) * ((x_b - x_a) / (f(x_b) - f(x_a)))
        t_e = abs(x - x_b)
        if t_e < e:
            return x
        x_a = x_b
        x_b = x

### Ejemplo

    f(x) = x^2 - 10

Aproximaciones iniciales: `3` y `4`

In [9]:
f = lambda x: x**2 - 10
x_a = 3
x_b = 4

print('Secante Propio:', secant(f, x_a, x_b))
print('Raíz Exacta:', 10**(1/2))

Secante Propio: 3.162277660168379
Raíz Exacta: 3.1622776601683795


## El método de Muller

El método de Muller es un método recursivo que genera una aproximación de la raíz `r` de `f` en cada iteración. Comenzando con los tres valores iniciales `x_0`, `x_1` y `x_2`.

`w = f[x_(k - 1), x_(k - 2)] + f[x_(k - 1), x_(k - 3)] - f[x_(k - 2), x_(k - 3)]`

Donde:

`x_k = x_(k - 1) - 2 * f(x_(k - 1)) / (w + (w^2 - 4 * f(x_(k - 1)) * f[x_(k - 1), x_(k - 2), x_(k - 3)])^(1/2))`

En esta fórmula, el signo debe elegirse de modo que el denominador sea lo más grande posible en magnitud. No usamos la fórmula estándar para resolver ecuaciones cuadráticas porque eso puede conducir a una pérdida de significación.

### Convergencia

El orden de convergencia del método de Muller es aproximadamente `1.84`. Esto se puede comparar con `1.62` para el método secante y `2` para el método de Newton. Entonces, el método secante hace menos progreso por iteración que el método de Muller y el método de Newton hace más progreso.

### Implementación

In [10]:
from cmath import sqrt


def muller(f, x_1, x_2, x_3, e=10**-12):
    while abs(f(x_1)) > e:
        q = (x_1 - x_2) / (x_2 - x_3)
        a = q * f(x_1) - q * (1 + q) * f(x_2) + q**2 * f(x_3)
        b = (2 * q + 1) * f(x_1) - (1 + q)**2 * f(x_2) + q**2 * f(x_3)
        c = (1 + q) * f(x_1)
        r = x_1 - (x_1 - x_2) * ((2 * c) / (b + sqrt(b**2 - 4 * a * c)))
        s = x_1 - (x_1 - x_2) * ((2 * c) / (b - sqrt(b**2 - 4 * a * c)))
        if abs(f(r)) < abs(f(s)):
            x = r
        else:
            x = s
        if x.imag == 0j:
            x = x.real
            return x
        else:
            return x
        x_3 = x_2
        x_2 = x_1
        x_1 = x

### Ejemplo

`f(x) = x^2 - 10`

Aproximaciones iniciales: `3`, `3.5` y `4`

In [11]:
f = lambda x: x**2 - 10
x_1 = 3
x_2 = 3.5
x_3 = 4

print('Muller Propio:', muller(f, x_1, x_2, x_3))
print('Raíz Exacta:', 10**(1/2))

Muller Propio: 3.1622776601683795
Raíz Exacta: 3.1622776601683795
