In [1]:
import matplotlib.pyplot as plt
import numpy as np
import cmath    # Provides mathematical functions of a complex variable.

# M√©todo de Laguerre

## $ \S 1 $ Introdu√ß√£o

Como antes, seja $ p $ um polin√¥mio de grau $ n $ com coeficientes
complexos.  Do teorema fundamental da √°lgebra, sabemos que $ p $ possui
exatamente $ n $ ra√≠zes em $ \mathbb C $ (contadas com suas respectivas
multiplicidades).  Neste caderno apresentaremos um m√©todo iterativo espec√≠fico
para aproxima√ß√£o de zeros (inclusive complexos) de polin√¥mios deste tipo,
conhecido como _m√©todo de Laguerre_.  Quando combinado com a defla√ß√£o polinomial
estudada no caderno anterior, ele nos ajudar√° a conseguir estimativas para
_todos_ os zeros.

O m√©todo de Laguerre quase sempre converge a um zero, n√£o importa qual seja a
estimativa inicial. Al√©m do mais, sua converg√™ncia normalmente √© ainda mais
r√°pida que a do m√©todo de Newton. Mais precisamente, para estimativas
iniciais pr√≥ximas o suficiente de um zero _simples_, a taxa de converg√™ncia
√© c√∫bica, no sentido que o erro na estimativa atual √© aproximadamente
proporcional ao cubo do erro envolvido na estimativa anterior (enquanto
no m√©todo de Newton a converg√™ncia √© quadr√°tica). Se o zero tem multiplicade
maior que $ 1 $, a taxa de converg√™ncia √© apenas linear.

O m√©todo de Laguerre √© peculiar porque a teoria por tr√°s dele n√£o √© muito
bem desenvolvida. Em particular, como j√° mencionado, ele n√£o √© infal√≠vel,
apesar de n√£o serem conhecidas as condi√ß√µes precisas em que ele pode falhar.


## $ \S 2 $ Descri√ß√£o do m√©todo de Laguerre

Seguindo [Kiusalaas], vamos derivar o m√©todo de Laguerre apenas no caso especial
em que o polin√¥mio $ p $ de grau $ n $ possui um zero simples em $ \alpha $ e
outro zero de multiplicidade $ n - 1 $ em $ \beta $. Contudo, as f√≥rmulas que
obteremos funcionam bem mesmo no caso geral. Sob estas hip√≥teses,
\begin{equation*}\label{E:zeta}
p(z) = (z - \alpha)(z - \beta)^{n - 1}\,. \tag{1}
\end{equation*}
Gostar√≠amos de aproximar $ \alpha $. Diferenciando \eqref{E:zeta}, deduzimos que
\begin{alignat*}{9}
p'(z) &= (z - \beta)^{n - 1} + (n - 1)(z - \alpha)(z - \beta)^{n - 2}
\end{alignat*}
Defina
\begin{equation*}\label{E:2}
\boxed{G(z) := \frac{p'(z)}{p(z)}}\,\tag{2}
\end{equation*}
Ent√£o
\begin{equation*}\label{E:3}
G(z) = \frac{1}{z - \alpha} + \frac{n - 1}{z - \beta}\,.
\tag{3}
\end{equation*}
Diferenciando $ - G $, obtemos
\begin{alignat*}{9}
-G'(z) &= \bigg[\frac{p'(z)}{p(z)}\bigg]^2 - \frac{p''(z)}{p(z)} \\
&= G^2(z) -\frac{p''(z)}{p(z)} \\
&= \frac{1}{(z - \alpha)^2} + \frac{n - 1}{(z - \beta)^2}\,.
\end{alignat*}
√â conveniente denotar esta fun√ß√£o por $ H(z) $. Assim, as duas
√∫ltimas equa√ß√µes nos dizem que
\begin{alignat*}{9}\label{E:4}
\boxed{H(z) := G^2(z) -\frac{p''(z)}{p(z)}}
= \frac{1}{(z - \alpha)^2} + \frac{n - 1}{(z - \beta)^2}\,. \tag{4}
\end{alignat*}
Observe que $ G $ e $ H $ podem facilmente ser calculadas, j√° que $ p $ √©
conhecido.  Isto nos permite expressar $ \alpha $ atrav√©s delas. Mais
precisamente, isolando $ \frac{1}{z - \beta} $ em \eqref{E:3}, deduz-se que
$$
\frac{1}{z - \beta} = \frac{(z - \alpha)G(z) - 1}{(n - 1)(z - \alpha)}\,.
$$
Substituindo isto em \eqref{E:4}, obtemos uma equa√ß√£o quadr√°tica para
$ \frac{1}{z - \alpha} $ em termos de $ G $ e $ H $:
$$
n\frac{1}{(z - \alpha)^2} - 2G(z)\frac{1}{z - \alpha} +
\big[G^2(z) - (n-1)H(z)\big] = 0\,.
$$
A solu√ß√£o desta equa√ß√£o (pela f√≥rmula de Bhaskara) nos d√° a
__f√≥rmula de Laguerre__:
$$
z - \alpha = \frac{n}{G(z) \pm \sqrt{(n - 1)\big[nH(z) - G^2(z)\big]}}\,.
$$
Observe que sob as hip√≥teses que fizemos a respeito de $ p $, ela fornece uma
express√£o exata para a raiz $ \alpha $ em termos de $ z \in \mathbb C $
arbitr√°rio.

No caso geral (i.e., para $ p $ qualquer), o __m√©todo de Laguerre__  na
aplica√ß√£o reiterada desta f√≥rmula na vers√£o obtida substituindo-se $ \alpha $
por $ z_{k + 1} $ e $ z $ por $ z_k $: 
\begin{equation*}\label{E:5}
\boxed{\ z_{k + 1} = z_k - \frac{n\vphantom{A^{2^x}}}{G(z_k) \pm
\sqrt{(n - 1)\big[nH(z_k) - G^2(z_k)\big]}\vphantom{A_{A_A}}}\ } \tag{5}
\end{equation*}
com $ G $ e $ H $ como em \eqref{E:2} e \eqref{E:4}. A seq√º√™ncia $ (z_k) $ assim
definida quase sempre converge a um zero de $ p $, seja qual for a escolha da
estimativa inicial $ z_0 $.

üìù As f√≥rmulas acima s√£o v√°lidas mesmo nos casos em que a express√£o sob o radical
√© negativa ou complexa. Ou seja, aqui $ \sqrt{\cdot} $ denota
qualquer uma das duas ra√≠zes quadradas _complexas_ do radicando.

__Algoritmo (m√©todo de Laguerre):__ Para aproximar um zero $ \alpha \in \mathbb C $
de um polin√¥mio $ p(z) $:

0. Seja $ z = z_0 $ uma estimativa inicial qualquer para $ \alpha $.
1. Calcule $ p $, $ p' $ e $ p'' $ na estimativa $ z $ atual (por exemplo
   atrav√©s do m√©todo de Horner).
2. Calcule $ G(z) $ e $ H(z) $ para o valor atual de $ z $, diretamente a partir
   das suas defini√ß√µes em \eqref{E:2} e \eqref{E:4}.
3. Use \eqref{E:5} para obter uma nova estimativa $ z_{k + 1} $ a partir da estimativa
   $ z = z_k $ atual, escolhendo do lado direito o sinal para o radical que
   resulta no denominador de _maior_ m√≥dulo (de modo a minimizar erros de arredondamento).
5. Caso o crit√©rio de parada ainda n√£o tenha sido satisfeito, fa√ßa $ z = z_{k + 1} $
   e retorne ao passo 1.

Os poss√≠veis crit√©rios de parada s√£o os usuais: 
* $ \vert z_{k + 1} - z_k \vert < \delta $ para algum $ \delta > 0 $ pr√©-escolhido; 
* $ \vert f(z_{k + 1}) \vert < \varepsilon $ para algum $ \varepsilon > 0 $ predeterminado; 
* O n√∫mero de itera√ß√µes n√£o excede uma cota $ N $;
* Alguma combina√ß√£o destes, ou de vers√µes relativas dos dois primeiros.

In [None]:
def horner_deriv(coefs: list[complex], z: complex
                 ) -> tuple[complex, complex, complex]:
    """
    Given a polynomial p represented by the list of its coefficients
    [c_0, c_1, ..., c_n] (where c_k is the coefficient of z^k) and a number z,
    evaluates the polynomial, its first derivative, and its second derivative
    at the point z and returns the corresponding values (y, dy, ddy).
    """
    n = len(coefs) - 1
    y = coefs.pop()     # Initial value for the polynomial.
    dy = 0.0 + 0.0j     # Initial value for the first derivative.
    ddy = 0.0 + 0.0j    # Initial value for the second derivative.

    # Iterate through the coefficients, updating the polynomial and its
    # derivatives at each step:
    for _ in range(n):
        ddy = ddy * z + 2.0 * dy
        dy = dy * z + y
        y = y * z + coefs.pop()

    return y, dy, ddy


def deflation(coefs: list[complex], r: complex) -> list[complex]:
    """
    Deflates a polynomial p represented by its list of coefficients `coefs`
    (from lowest to highest degree) by dividing it by a linear factor (z - r),
    where r is a complex root of the polynomial. Returns a list of complex
    numbers, representing the coefficients of the deflated polynomial.
    """
    n = len(coefs) - 1           # n = degree of p.
    new_coefs = [0] * n          # Initialize the list of new coefficients.
    new_coefs[n - 1] = coefs[n]  # Set the first new coefficient.
    
    # Perform the deflation algorithm:
    for k in range(n - 1, 0, -1):
        new_coefs[k - 1] = coefs[k] + r * new_coefs[k]
    return new_coefs

In [4]:
from random import random


def laguerre(coefs: list[complex], eps: float, max_iter: int = 30) -> complex:
    """
    Given a polynomial represented by the list of its coefficients, finds an
    approximate complex root of the polynomial using Laguerre's method.
    Parameters:
        * coefs: List of coefficients of the polynomial, in increasing degree.
        * eps: The tolerance for the error in the approximation of the roots.
        * max_iter: The maximum number of iterations performed.
    Returns:
        * A complex number that is an approximate root of the polynomial.
    Raises:
        * RuntimeError: If the tolerance is not achieved within
          max_iter iterations.
    """
    x = random()         # Starting value (random number).
    n = len(coefs) - 1   # Degree of the polynomial.

    for _ in range(max_iter):
        # Compute p and its first two derivatives at x:
        p, dp, ddp = horner_deriv(coefs, x)
        if abs(p) < eps:
            return x
        g = dp / p
        h = g * g - ddp / p
        # Take the (possibly complex) square root in Laguerre's formula:
        f = cmath.sqrt((n - 1) * (n * h - g * g))
        if abs(g + f) > abs(g - f):
            dx = n / (g + f)
        else:
            dx = n / (g - f)
        x = x - dx
        if abs(dx) < eps:
            return x

    raise RuntimeError("The maximum number of iterations was exceeded!")


In [3]:
def find_roots(coefs: list[complex], tol: float, max_iter: int = 30
               ) -> list[complex]:
    """
    Given a polynomial represented by the list of its coefficients, finds an
    approximations for all of its roots (including the complex ones)
    using a combination of Laguerre's method and deflation.
    Parameters:
        * coefs: List of coefficients of the polynomial, in increasing degree.
        * eps: The tolerance for the error in the approximation of the roots.
        * max_iter: The maximum number of iterations performed.
    Returns:
        * A list of complex numbers representing the approximate roots.
    """
    n = len(coefs) - 1    # n is the degree of p.
    roots = np.zeros((n), dtype=complex)    # Initialize the array of roots.
    
    # Iterate through the polynomial's degree, finding one root at a time:
    for k in range(n):
        z = laguerre(coefs, tol)
        # If the imaginary part of the root is small, consider it a real root:
        if abs(z.imag) < tol:
            z = z.real
        roots[k] = z
        # Deflate the polynomial using the root that was found:
        coefs = deflation(coefs, z)
    
    return roots

__Problema 1:__ Usando o m√©todo de Laguerre, encontre todas as ra√≠zes dos polin√¥mios seguintes:

(a) $ p(z) = z^4 + 2.1z^3 - 2.52z^2 + 2.1z - 3.52. $

(b) $ p(z) = z^5 - 156z^4 - 5z^3 + 780z^2 + 4z - 624. $

(c) $ p(z) = z^6 + 4z^5 - 8z^4 - 34z^3 + 57z^2 + 130z - 150. $

(d) $ p(z) = 8z^7 + 28z^6 + 34z^5 - 13z^4 - 124z^3 + 19z^2 + 220z - 100. $

(e) $ p(z) = 2z^3 - 6(1 + i)z^2 + z - 6(1 - i). $

(f) $ p(z) = z^4 + (5 + i)z^3 - (8 - 5i)z^2 + (30 - 14i)z - 84. $


_Solu√ß√£o:_