In [2]:
import matplotlib.pyplot as plt
import numpy as np
from typing import Callable

# Métodos numéricos para cálculo com polinômios

## $ \S 1 $ Introdução

Os zeros reais de polinômios com coeficientes reais podem ser calculados pelos
vários métodos estudados nos cadernos anteriores. Contudo, para determinar as
raízes complexas, é melhor utilizar um método especializado em polinômios.
Consideraremos apenas o _método de Laguerre_, que é confiável e de simples
implementação.

Antes precisaremos considerar dois algoritmos de interesse independente, um para
se avaliar de maneira eficiente um polinômio e suas derivadas, e o outro para
_deflacionar_ um polinômio uma vez determinada uma raiz $ \zeta $, ou seja, para
dividi-lo por $ (z - \zeta) $.

📝 Em todo este caderno,
$$
p\colon \mathbb C \to \mathbb C, \quad
p(z) = c_nz^n + c_{n - 1}z^{n - 1} + \cdots + c_1 z + c_0 \qquad
(c_k \in \mathbb C)
$$ 
é um polinômio com coeficientes complexos. Recorde do caderno anterior que as
derivadas de $ p $ são dadas pelas mesmas expressões que no caso de
um polinômio com coeficientes reais.


## $ \S 2 $ O método de Horner para avaliação de polinômios

### $ 2.1 $ Descrição do método de Horner

O __método de Horner__ (também conhecido como __esquema de Horner__) é um
algoritmo para avaliação de um polinômio de uma variável. Ele é baseado na
identidade:
\begin{alignat*}{9} 
&c_{0}+c_{1}z+c_{2}z^{2}+c_{3}z^{3}+\cdots +c_{n}z^{n}\\
=\ & c_{0}+z{\bigg (}c_{1}+z{\Big (}c_{2}+z{\big (}c_{3}+\cdots+
z\big(c_{n - 2} + z(c_{n-1}+z\,c_{n})\big)\cdots {\big )}{\Big )}{\bigg )}.
\end{alignat*}

__Algoritmo (método de Horner):__
* Inicialmente tome $ y \leftarrow c_n $;
* Para cada $ k = n - 1, \dots,\,1,\, 0 $ regressivamente, faça
  $ y \leftarrow c_k + zy $.

Ao final, $ y = p(z) $.

📝 Apesar de levar o nome do matemático inglês W. Horner (1786–1837), este
algoritmo já era conhecido pelo menos 500 anos antes por matemáticos persas e
chineses.

__Exemplo 1:__ Seja $ p(z) = z^2 - i z + (1 + i) $. Usando o método de Horner,
avalie $ p $ em $ z_0 = 2 - 3i $.

_Solução:_
\begin{alignat*}{9}
y &\leftarrow 1 \\
y &\leftarrow -i + (2 - 3i)\,1 = 2 - 4i \\
y &\leftarrow (1 + i) + (2 - 3i)\,(2 - 4i) = -7 - 13i\,.
\end{alignat*}

__Problema 1:__ Usando o método de Horner, avalie:

(a) $ p(z) = (2 - 2 i) + (1 + 5 i) z - (3 + 2 i) z^2 + z^3 $ em $ z_0 = i $.

(b) $ q(z) = z^4 - z^3 + z^2 - z + 1 $ em $ z_0 = 1 - i $.


### $ 2.2 $ Análise de desempenho do método de Horner

O método de Horner requer $ n $ operações de adição e $ n $ de
multiplicação. Em contraste, se avaliarmos o polinômio da maneira "ingênua", o
cômputo de $ c_kx^k $ utiliza $ k + 1 $ multiplicações, portanto a avaliação do
polinômio inteiro custa
$$
1 + 2 + \dots + (n + 1) = \frac{(n + 1)(n + 2)}{2} \in O(n^2)
$$
multiplicações.

Além da economia no número de passos, o menor número de multiplicações
envolvidas causa uma redução substancial do acúmulo de erros de aproximação
(arredondamento) na avaliação de $ p $, por isto o método de Horner deve sempre
ser preferido.

📝 Pode-se provar que, para um polinômio geral, o algoritmo de Horner é *ótimo*,
i.e., não existe um algoritmo que requeira um número menor de operações
aritméticas. Isto foi provado por A. Ostrowski em 1954 para o número de adições
e por V. Pan em 1966 para o número de multiplicações. Estes foram resultados
seminais da área de *análise de algoritmos*.


### $ 2.3 $ Implementação do método de Horner

In [26]:
def horner(coefs: list[complex], z: complex) -> complex:
    """
    Given a complex polynomial p represented by the list of its coefficients
    [c_0, c_1, ..., c_n] (where c_k is the coefficient of z^k), returns the
    value of p(z) calculated by Horner's method.
    """
    y = coefs.pop()    # Extract the last coefficient c_n from the list.
    while coefs:       # While the list of coefficients is not empty:
        y *= z
        y += coefs.pop()
    return y

📝 Observe que o esquema de Horner já tinha sido utilizado por nós (ainda que
não sob este nome) para determinar de maneira eficiente um número inteiro
$ n $ dada sua representação $ (c_n\,c_{n-1}\, \cdots c_1\,c_0)_b $ numa base
$ b $ diferente da decimal. De fato, $ n = p(b) $ para $ p $ como acima.

__Problema 2:__ Complete a implementação __recursiva__ (i.e., que chama a si
própria) do esquema de Horner esboçada abaixo:

In [17]:
def recursive_horner(coefs: list[complex], z: complex) -> complex:
    """
    Given a complex polynomial p represented by the list of its coefficients
    [c_0, c_1, ..., c_n] (where c_k is the coefficient of z^k), returns the
    value of p(z) calculated by Horner's method.
    """
    if not coefs:          # Se a lista de coeficientes é vazia, retorne ...
        return ...
    else:
        c = coefs.pop()    # Extrai o último coeficiente da lista
        y = ...            # Operação envolvendo c e recursive_horner(coefs, z).
        return y

📝 Recorde que em Python um número complexo $ a + bi $ é representado usando a
notação `a + bj`; o tipo dos números complexos é `complex`.

__Exemplo 2:__

In [2]:
from numpy import sqrt

print(1 + .23j)            # 1 + 0.23i
print(1j)                  # i
print(1 + sqrt(3) * 1j)    # 1 + √3i
print(1 + sqrt(3)j)        # Sintaxe errada!

SyntaxError: invalid syntax (1404722679.py, line 6)

__Problema 3:__ Verifique as suas respostas ao Problema 1 usando as implementações acima.

_Solução:_

## $ \S 3 $ Algoritmo de Horner para cálculo das derivadas

### $ 3.1 $ Descrição do método de Horner para o cálcula das derivadas

Uma pequena variação do algoritmo de Horner nos permite avaliar não só um
polinômio
$$
p(z) = c_nz^n + c_{n - 1}z^{n - 1} + \cdots + c_1 z + c_0 \qquad
(c_k \in \mathbb C)
$$
num ponto dado qualquer, mas também as suas derivadas aí.  Aqui consideraremos
apenas o cálculo das duas primeiras derivadas, já que elas serão usadas no
método de Laguerre.

Em outra formulação, o algoritmo de Horner consiste da construção da seqüência
de polinômios
\begin{alignat*}{9}
p_n(z) &= c_n \\
p_{n - 1}(z) &= c_{n - 1} + z\,p_n(z) \\
\phantom{p_3(z)} &\ \ \vdots \\
p_k(z) &= c_{k} + z\,p_{k + 1}(z) \\
\phantom{p_3(z)} &\ \ \vdots \\
p_1(z) &= c_1 + z\,p_{2}(z) \\
p(z) = p_0(z) &= c_0 + z\,p_{1}(z)
\end{alignat*}
Derivando duas vezes, deduzimos as relações:
\begin{equation*}
\boxed{
    \begin{cases}
        p_n'(z) = 0 \\
        p_k'(z) = p_{k + 1}(z) + z\,p_{k + 1}'(z)
    \end{cases}
\qquad 
    \begin{cases}
        p_n''(z) = 0 \\
        p_k''(z) = 2p_{k + 1}'(z) + z\,p_{k + 1}''(z)
    \end{cases}
}\qquad (k = n - 1, \cdots,\,1,\, 0)\,.
\end{equation*}
Podemos portanto aproveitar os resultados intermediários no algoritmo de Horner
de modo que também sejam calculados os valores de $ p' $ e $ p'' $ num ponto
qualquer.

__Exemplo 3:__ Suponha que queiramos avaliar $ p $ e $ p' $ em
$ z_0 = 1 + i $, onde
$$
p(z) = 2iz^3 - 3z^2 + z + 3 + 2i\,.
$$
Seguindo o método de Horner, fazemos:
\begin{alignat*}{9}
p_3(z_0) &= 2i&&   \qquad &p_3'(z_0) &= 0&& \\
p_2(z_0) &= -3 + (1 + i)\,2i &&= -5 + 2i
\qquad &p_2'(z_0) &= 2i + (1 + i)\,0 &&= 2i \\
p_1(z_0) &= 1 + (1 + i)\,(-5 + 2i) &&= -6 - 3i
\qquad &p_1'(z_0) &= (-5 + 2i) + (1 + i)\,2i &&= -7 + 4i \\
p_0(z_0) &= (3 + 2i) + (1+i)\,(-6 - 3i) &&= -7i
\qquad &p_0'(z_0) &= (-6-3i) + (1 + i)\,(-7 + 4i) &&= -17 - 6i
\end{alignat*}
Portanto
$$
p(1 + i) = p_0(z_0) = -7i \qquad \text{e} \qquad p'(1 + i) = p_0'(z_0) = -17 - 6i\,.
$$

__Problema 4:__ Aproveitando as contas feitas no Exemplo 3, calcule $ p''(z_0) $ usando o método de Horner.

_Solução:_

__Problema 5 (método de Horner para derivadas de ordem superior):__ Seja
$$
p(z) = c_{0}+c_{1}z+c_{2}z^{2}+c_{3}z^{3}+\cdots +c_{n}z^{n}\,.
$$

(a) Mostre que a terceira derivada $ p^{(3)} = p''' $ de $ p $ pode ser
calculada de maneira seqüencial através das relações:
$$
p_n^{(3)}(z) = 0, \quad p_k^{(3)}(z) = 3p_{k + 1}''(z) + z\,p_{k + 1}^{(3)}(z)
\qquad (k = n - 1, \dots,\,1,\, 0)
$$
de modo que $ p^{(3)}(z) = p_n^{(3)}(z)\, $. _Dica:_ Derive os polinômios
$ p_k'' $ utilizados no cálculo da segunda derivada de $ p $.

(b) Generalizando, mostre que a $ r $-ésima derivada $ p^{(r)}(z) $ é dada
por $ p_n^{(r)}(z) $ onde:
$$
p_n^{(r)}(z) = 0, \quad p_k^{(r)}(z) =
rp_{k + 1}^{(r-1)}(z) + z\,p_{k + 1}^{(r)}(z)
\qquad (k = n - 1, \dots,\,1,\, 0)\,.
$$

### $ 3.2 $ Implementação do método de Horner para cálcula de um polinômio e de suas derivadas

In [25]:
def horner_deriv(coefs: list[complex], z: complex
                 ) -> tuple[complex, complex, complex]:
    """
    Given a polynomial p represented by the list of its coefficients
    [c_0, c_1, ..., c_n] (where c_k is the coefficient of z^k) and a number z,
    evaluates the polynomial, its first derivative, and its second derivative
    at the point z and returns the corresponding values (y, dy, ddy).
    """
    n = len(coefs) - 1
    y = coefs.pop()     # Initial value for the polynomial.
    dy = 0.0 + 0.0j     # Initial value for the first derivative.
    ddy = 0.0 + 0.0j    # Initial value for the second derivative.

    # Iterate through the coefficients, updating the polynomial and its
    # derivatives at each step:
    for _ in range(n):
        ddy = ddy * z + 2.0 * dy
        dy = dy * z + y
        y = y * z + coefs.pop()

    return y, dy, ddy

## $ \S 4 $ Deflação de polinômios

### $ 4.1 $ Descrição do método de deflação polinomial

Suponha que $ r $ seja um zero de um polinômio
\begin{equation*}\label{E:1}
p(z) = c_nz^n + c_{n - 1}z^{n - 1} + \cdots + c_1 z + c_0 \qquad
(c_k \in \mathbb C) \tag{1}
\end{equation*}
de grau $ n $. Então, como visto no caderno anterior, podemos fatorar $ p $ como
\begin{equation*}\label{E:2}
p(z) = (z - r)\,q(z) \tag{2}
\end{equation*}
onde $ q $ tem grau $ n - 1 $.  Para encontrar $ q(z) $, basta dividir $ p(z) $
por $ (z - r) $. Entretanto, pela forma especial do divisor, há um método mais
simples, conhecido neste contexto por __deflação__.  Observe que os zeros
restantes de $ p $ devem ser zeros de $ q $.  Portanto a deflação reduz o grau
do polinômio a cada raiz encontrada, facilitando a busca pelas outras raízes.
Além disto, a deflação elimina a chance de calcularmos a mesma raiz mais de uma
vez. 

Seja
\begin{equation*}\label{E:3}
q(z) = b_{n-1}z^{n-1} + \cdots + b_2z^2 + b_1z + b_0\,. \tag{3}
\end{equation*}
Substituindo \eqref{E:1} e \eqref{E:3} em \eqref{E:2}, deduzimos que
$$
(z - r)(b_{n - 1}z^{n - 1} + b_{n - 2}z^{n - 2} \cdots + b_1 z + b_0) =
c_nz^n + c_{n - 1}z^{n - 1} + \cdots + c_1 z + c_0
$$
Comparando os coeficientes dos monômios de mesmo grau, obtemos regressivamente:
$$
\boxed{b_{n-1} = c_n\,, \quad b_{n - 2} = c_{n - 1} + rb_{n - 1}\,, \quad \cdots
\quad b_k = c_{k + 1} + rb_{k + 1}\,,\quad \cdots \quad b_0 = c_1 + rb_1\,}
$$
Estas relações nos permitem determinar $ q(z) $ efetuando apenas $ n - 1 $
multiplicações e $ n - 1 $ adições.

📝 Este método é equivalente ao algoritmo "usual" para divisão de polinômios
(divisão euclidiana), porém sua descrição é mais simples.

__Problema 6:__ Em cada item abaixo, são dados um polinômio $ p $ e uma 
de suas raízes $ r $. Aplique o algoritmo de deflação a ele para encontrar
o quociente de $ p $ por $ (z - r) $.

(a) $ p(z) = z^4 - z^3 - 5 z^2 - z - 6 $ e $ r = -2 $.

(b) $ p(z) = 3z^3 - 19z^2 + 45z - 13 $ e $ r = 3 - 2i $.

(c) $ p(z) = z^4 - 5 z^3 + 10 z^2 - 10 z + 4 $ e $ r = -1 + i $.

_Solução:_


### $ 4.2 $ Implementação da deflação polinomial

In [None]:
def deflation(coefs: list[complex], r: complex) -> list[complex]:
    """
    Deflates a polynomial p represented by its list of coefficients `coefs`
    (from lowest to highest degree) by dividing it by a linear factor (z - r),
    where r is a complex root of the polynomial. Returns a list of complex
    numbers, representing the coefficients of the deflated polynomial.
    """
    n = len(coefs) - 1           # n = degree of p.
    new_coefs = [0] * n          # Initialize the list of new coefficients.
    new_coefs[n - 1] = coefs[n]  # Set the first new coefficient.
    
    # Perform the deflation algorithm:
    for k in range(n - 1, 0, -1):
        new_coefs[k - 1] = coefs[k] + r * new_coefs[k]
    return new_coefs

__Problema 7:__ Usando a implementação acima, deflacione os polinômios
seguintes a um polinômio de grau $ 3 $ dada a raiz $ r $ indicada:

(a) $ p(z) = z^5 + 10 z^4 + 19 z^3 - 24 z^2 - 82 z - 84 $ e $ r = 1 + i $.

(b) $ p(z) = z^5 - 30z^4 + 361z^3 - 2178z^2 + 6588z - 7992 $ e $ r = -6 - i $.

_Dica:_ Como estes polinômios têm coeficientes reais, as suas raízes complexas
vêm em pares conjugados. Deflacione $ p $ duas vezes.

_Solução:_

## $ \S 5 $ Exponenciação rápida

### $ 5.1 $ Descrição da exponenciação rápida

O algoritmo de __exponenciação rápida__ ou __exponenciação por quadratura__ é um
método utilizado para se calcular a $ n $-ésima potência de um número real
$ b $, onde $ n \ge 1 $ é um inteiro. O algoritmo baseia-se na seguinte idéia:
\begin{equation*}
   b^n =
   \begin{cases}
      \big(b^{\tfrac{n}{2}}\big)^2 & \text{se $ n $ é par;} \\
      b\,\big(b^{\tfrac{n - 1}{2}}\big)^2 & \text{se $ n $ é ímpar.}
   \end{cases}
\end{equation*}

__Algoritmo (exponenciação rápida, versão recursiva):__ Para calcular
$ b^n $:
*  Se $ n = 1 $, retorne $ b $.
*  Se $ n > 1 $ é par, retorne $ \big(b^{\tfrac{n}{2}}\big)^2 $ como resultado,
   onde a potência entre parênteses é calculada pelo mesmo procedimento,
   fazendo $ n \leftarrow \tfrac{n}{2} = \left \lfloor \frac{n}{2} \right \rfloor $.
*  Se $ n > 1 $ é ímpar, retorne $ b\,\big(b^{\tfrac{n - 1}{2}}\big)^2 $ como resultado,
   onde a potência entre parênteses é calculada pelo mesmo procedimento,
   fazendo $ n \leftarrow \tfrac{n - 1}{2} = \left\lfloor \frac{n}{2} \right\rfloor $.

A eficiência do algoritmo deriva do fato que, a cada iteração, o expoente é
reduzido aproximadamente à metade. O número de multiplicações necessárias é
significativamente menor do que o requerido pelo método de exponenciação direta.
Grosso modo, o primeiro é aproximadamente proporcional ao logaritmo do expoente
na base $ 2 $, enquanto o segundo é igual $ n - 1 $.

__Exemplo 4:__ Para calcular $ b^{22} $, em vez de realizarmos $ 21 $
multiplicações pelo método direto, podemos utilizar o algoritmo de
exponenciação rápida.  Indicaremos à direita as divisões por $ 2 $
efetuadas a cada passo:
\begin{alignat*}{9}
b^{22} &= \big(b^{11}\big)^2 &\qquad \qquad 22 &= 2 \cdot 11 &&+ 0 \\
b^{11} &= b\big(b^{5}\big)^2 &\qquad \qquad 11 &= 2 \cdot 5 &&+ 1 \\
b^5 &= b\,\big(b^{2}\big)^2 &\qquad \qquad 5 &= 2 \cdot 2 &&+ 1 \\
b^2 &= \big(b^{1}\big)^2 &\qquad \qquad 2 &= 2 \cdot 1 &&+ 0 \\
b^1 &= b &\qquad \qquad 1 &= 2 \cdot 0 &&+ 1 \\
\end{alignat*}
Note que aqui foram necessárias $ 6 = 4 + 2 $ multiplicações, uma para cada
quadrado mais uma multiplicação (por $ b $) para cada expoente ímpar e maior que
$ 1 $ que aparece à esquerda.

__Problema 8:__ Seja $ b $ um número real qualquer. Calcule o número de multiplicações
envolvidas no cálculo de $ b^n $ usando o algoritmo de exponenciação rápida com:

(a) $ n = 7 $.

(b) $ n = 8 $.

(c) $ n = 27 $.

(d) $ n = 31 $.

(e) $ n = 2^m $ para $ m \ge 0 $ qualquer.

_Solução:_

### $ 5.2 $ Implementação do algoritmo de exponenciação rápida

In [3]:
def power(b: float, n: int) -> float:
    """ Recursively calculates the value of b raised to the n-th power
        (where n is an integer) using fast exponentiation.
    """
    if n < 0:
        return 1 / power(b, -n)
    elif n == 0:
        return 1
    elif n == 1:
        return b
    else:
        if n % 2 == 0:
            return power(b, n // 2)**2
        else:
            return b * power(b, n - 1)

### $ 5.3 $ Análise do algoritmo de exponenciação rápida

__Problema 9:__ 

(a) Mostre por indução em $ d \ge 0 $ que a representação em base $ 2 $ de um
número natural $ n $ tal que $ 2^d \le n < 2^{d + 1} $ possui $ d + 1 $ dígitos.

(b) Conclua que se $ n $ é um natural, então sua representação em base $ 2 $
requer $ \lfloor \lg n \rfloor + 1 $ dígitos, onde $ \lg = \log_2 $.

_Solução:_

Como ilustrado no Exemplo 4, quando aplicamos a algoritmo de exponenciação
rápida para calcular $ b^n $, as sucessivas divisões do expoente $ n $ por $ 2 $
seguem exatamente o mesmo padrão que aquele para determinação da representação
de $ n $ na base binária. Observe ainda que:

* Se $ n $ for par (ou seja, se o resto da divisão for $ 0 $), tomamos um
  quadrado, o que requer uma multiplicação.
* Se $ n $ for ímpar (ou seja, se o resto da divisão for $ 1 $), tomamos um
  quadrado e o multiplicamos por $ b $, o que requer duas multiplicações.

Ademais, enquanto $ n > 1 $, a cada passo o valor de $ n $ é atualizado ao valor
do quociente da divisão inteira de $ n $ por $ 2 $. Daí segue que:

* _O número de quadraturas é igual à quantidade de dígitos na representação de
  $ n $ em base binária menos 1;_
* _O número de multiplicações por $ b $ é igual à quantidade
  de bits iguais a $ 1 $ nesta representação menos $ 1 $._
  
O número de bits $ 1 $ na representação de $ n $ é chamado de __peso de
Hamming__ de $ n $ e será denotado por $ w(n) $.

__Problema 10:__ Mostre que:

(a) $ w(7) = 3 $.

(b) $ w(16) = 1 $.

(c) $ w(27) = 4 $.

(d) $ w(2^m) = 1 $ e $ w(2^m - 1) = m $ para qualquer $ m \ge 0 $.

(e) $ w(n) $ é menor ou igual ao número de bits na representação binária de $ n $:
$ \lfloor \lg n \rfloor + 1 $ (compare o Problema 9).

_Solução:_

__Teorema 5.1 (análise de desempenho do algoritmo de exponenciação rápida):__
_Usando o algoritmo de exponenciação rápida, o cálculo de $ b^n $ requer_
\begin{equation*}
\lfloor \lg{n} \rfloor + w(n) - 1 \le
2\, \lfloor \lg{n} \rfloor \quad
\text{multiplicações}\,.\tag*{$ \blacksquare $}
\end{equation*}

Resumidamente, a exponenciação rápida requer um número de multiplicações
proporcional ao _logaritmo_ do expoente.

__Problema 11:__ Compare a expressão fornecida pelo Teorema 6.1 com
os seus seus resultados no Problema 8.

_Solução:_