# Zeros de funções

Neste *notebook* vamos aprender sobre alguns métodos para encontrar zeros de funções. Este é um problema clássico que aparece em diversas áreas: temos uma função f(x) e queremos encontrar o valor de x que faz com que a função f possua um determinado valor y. Em alguns casos, é possível simplesmente isolar x e obter a resposta. Em outros, f(x) pode ser muito complicado e precisamos encontrar a resposta numericamente.

In [None]:
# Definimos a nossa função de teste e o valor de y
def f(x):
    return x*x + 2*x + 1

# Queremos encontrar o valor de x para o qual f(x) = y0
y0 = 42

Para entendermos um pouco melhor o nosso problema, vamos fazer um gráfico. Em Python, podemos utilizar as 
bibliotecas `matplotlib` e `numpy`. A primeira é uma biblioteca de gráficos propriamente dita enquanto a 
segunda é uma biblioteca de computação científica com vários recursos como vetores, matrizes, funções 
especiais, números aleatórios, etc.

O primeiro passo é importar as duas bibliotecas

In [None]:
import numpy as np
import matplotlib.pyplot as plt

% matplotlib inline

O numpy (agora chamado de `np` no nosso código) possui várias funções para gerar sequências (ou vetores) de valores numéricos. Queremos gerar uma sequência de valores para x para calcularmos os respectivos y gerando
os pontos que aparecerão no gráfico. A função que faz isto se chama `linspace`.

In [None]:
X = np.linspace(0, 10)   # cria uma sequência de números começando em zero e terminando em 10
Y = f(X)

Aqui utilizamos `np.linspace` pois importamos o módulo numpy com o "apelido" `np`. Poderíamos ter importando a 
função linspace diretamente (`from numpy import linspace`) ou utilizado o nome completo do módulo (`import numpy`). De todo modo, os apelidos que escolhemos, `np` e `plt`, são considerados padrão na comunidade Python.

Podemos imprimir X e Y para ver os resultados

In [None]:
print('X:', X)
print('Y:', Y)

Agora vamos aos gráficos! O comando mais simples possível é a função `plt.plot(X, Y)`, que faz um gráfico simples da sequência de valores X pela sequência Y. 

In [None]:
plt.plot(X, Y)

Podemos acrescentar outros elementos chamando vários comandos de gráficos na mesma célula.

In [None]:
plt.plot(X, Y)
plt.title('Busca de zero de funções')  # define um título
plt.xlabel('argumento')                # nome para eixo x
plt.ylabel('valor de f(x)')            # nome para eixo y

Podemos facilmente desenhar várias linhas. Basta chamar a função `plt.plot` várias vezes. Queremos desenhar 
$f(x)$ com uma linha horizontal no valor $y_0$.

Para criar os pontos para a linha horizontal, escolhemos como valores para X os pontos 0 e 10 e para Y o valor constante $y_0$.

In [None]:
plt.plot(X, Y)                # f(x)
plt.plot([0, 10], [y0, y0])   # função horizontal
plt.title('Ponto de intersecção')

É possível verificar visualmente que o valor de $x$ que faz com que $f(x) = y_0$ está entre 5 e 6. Precisamos refinar um pouquinho mais a nossa busca para encontrar qual é o valor correto.

Um método pouco elegante é fazer uma busca por força bruta: percorremos vários valores no intervalo e tentamos encontrar aquele que a diferença entre $f(x)$ e $y_0$ seja igual ou muito próxima de zero. O código abaixo faz exatamente isto. Dividimos o intervalo em 25 valores e buscamos qual x produz o melhor resultado.

In [None]:
for i in range(25):
    x = 5 + i / 25
    print('%2d) x: %.2f;   f(x)-y0 = %6.3f' %(i, x, f(x) - y0))

Podemos ver que o melhor resultado desta lista foi $x = 5.48$, onde $f(x)$ difere de $y_0$ por um fator de apenas $0.010$. É lógico que é possível melhorar este resultado. Uma abordagem seria repetir um passo similar ao anterior, mas agora em um intervalo próximo de $x=5.48$ (quem sabe entre $x=5.44$ e $5.52$). A partir daí encontraríamos uma estimativa mais refinada e poderíamos continuar até obter um resultado satisfatório.

Este método de busca por força bruta, por mais que funcione, não parece muito elegante. De fato, este método é ruim sob vários aspectos. Primeiramente (fora Temer!), exige um grande número de avaliações de $f(x)$. Isto pode ser irrelevante no nosso caso, mas existem situações em que a função $f(x)$ pode envolver cálculos extremamente complexos e um grande número de requisições para $f(x)$ significaria um programa lento. Além deste problema, o método exige uma escolha manual dos intervalos de início e fim em cada etapa. Isto é inaceitável e queremos métodos em que o computador consiga realizar todos os cálculos automaticamente.


## Método da bisseção

Iniciamos a nossa discussão com o método da bisseção pois este se trata de uma versão mais sofisticada do raciocínio que fizemos anteriormente.

Começamos mudando ligeiramente o nosso problema. Ao invés de encontrar o valor de x para o qual $f(x) = y_0$, passamos $y_0$ para o lado esquerdo da igualdade e buscamos o valor de $x$ para o qual $g(x) = f(x) - y_0 = 0$. Em matemática este problema é conhecido como encontrar o zero de uma função. É lógico que é trivial transformar um problema em que buscamos $x$ que produz um valor arbitrário (ex.: 42) em um problema de zero de funções. Utilizar o zero, no entanto, simplifica alguns cálculos.

In [None]:
# Definimos g(x), a função que queremos encontrar os zeros.
def g(x):
    return f(x) - y0

O método da bisseção, assim como o método de força bruta mostrado anteriormente, exige um intervalo de busca inicial. Este intervalo deve ser escolhido para conter o zero da função e deve conter um valor para o qual $g(x)$ seja positivo e outro valor para o qual $g(x)$ seja negativo. Chamamos estes valores de $x_a$ e $x_b$.  

In [None]:
# Nosso intervalo de busca inicial é entre 0 e 10
# (No método de força bruta, usamos entre 5 e 6. Vamos utilizar
# um intervalo maior só por segurança.)
x0, x1 = 0, 10

# Verificamos os valores de g(x) para descobrir quem é xa e xb.
# No nosso caso sabemos que xa = x0 e xb = x1, mas caso a função
# seja decrescescente no intervalo, esta relação se inverte
g0, g1 = g(x0), g(x1)
if g0 < g1:
    xa, xb = x0, x1
    ga, gb = g0, g1
else:
    xa, xb = x1, x0
    ga, gb = g1, g0

Fazemos um gráfico dos resultados

In [None]:
plt.plot(X, Y - y0)
plt.plot([xa, xb], [0, 0], 'ko-')     # 'k-' é uma linha (-) preta (k, de black) com círculos (o)

O próximo passo consiste em avaliar o valor de g(x) no ponto central do intervalo e investigar qual será o novo intervalo

In [None]:
xmed = (xa + xb) / 2
gmed = g(xmed)
print(gmed)

Vimos que o valor no ponto médio é igual à -6.0, e portanto negativo. Deste modo, sabemos que o zero de g(x) deve estar entre este valor e xb. Atualizamos nossas variáveis e mostramos o resultado em um gráfico.

In [None]:
xa = xmed
ga = gmed

plt.plot(X, Y - y0)
plt.plot([xa, xb], [0, 0], 'ko-')

Vemos que o intervalo reduziu pela metade. Agora repetimos outra vez o mesmo raciocínio.

In [None]:
xmed = (xa + xb) / 2
gmed = g(xmed)

Observe que desta vez o valor de g(xmed) ficou positivo. Isto significa que devemos substituir $x_b$ e não $x_a$. Novamente, o intervalo de valores aceitáveis para o zero da função reduziu pela metade.

In [None]:
xb = xmed
gb = gmed

plt.plot(X, Y - y0)
plt.plot([xa, xb], [0, 0], 'ko-')

Agora juntamos o raciocínio realizado nas duas etapas anteriores em um único passo em que o computador decide
automaticamente qual dos dois valores ($x_a$ ou $x_b$) deve ser atualizado:

In [None]:
xmed = (xa + xb) / 2
gmed = g(xmed)
if gmed <= 0:
    xa, ga = xmed, gmed
else:
    xb, gb = xmed, gmed

print('intervalo:', xa, xb)
plt.plot(X, Y - y0)
plt.plot([xa, xb], [0, 0], 'ko-')

Observe que o intervalo aceitável diminui, mas sempre contêm o valor do zero da função. Podemos verificar isto 
executando várias vezes a célula acima.

É lógico que quanto mais repetições realizarmos, melhor será a estimativa do intervalo da função. Cada repetição reduz o intervalo pela metade. Deste modo, após 10 repetições teríamos um intervalo $2^{10} = 1024$ vezes menor que o intervalo inicial. Nada mal!

Não queremos executar a célula acima várias vezes manualmente. Vamos então programar o computador para fazer isto automaticamente.

In [None]:
# Reseta o intervalo inicial (vamos começar do zero)
x0, x1 = 0, 10

# Calcula xa/ga e xb/gb
g0, g1 = g(x0), g(x1)
if g0 < g1:
    xa, xb = x0, x1
    ga, gb = g0, g1
else:
    xa, xb = x1, x0
    ga, gb = g1, g0

# Atualiza 20 vezes o intervalo
for i in range(20):
    xmed = (xa + xb) / 2
    gmed = g(xmed)
    if gmed <= 0:
        xa, ga = xmed, gmed
    else:
        xb, gb = xmed, gmed
        
    print('%2d) centro: %.6f,  g(x): %9.2e' % (i, xmed, gmed))

Vemos que o valor de x converge para 5.487... e o valor de g(x) se aproxima de zero. Podemos refazer o cálculo acima acompanhando o valor do erro, para depois mostrarmos em um gráfico.

In [None]:
# Reseta o intervalo inicial (vamos começar do zero)
x0, x1 = 0, 10

# Calcula xa/ga e xb/gb
g0, g1 = g(x0), g(x1)
if g0 < g1:
    xa, xb = x0, x1
    ga, gb = g0, g1
else:
    xa, xb = x1, x0
    ga, gb = g1, g0

# Atualiza 20 vezes o intervalo
g_lista = []
for i in range(20):
    xmed = (xa + xb) / 2
    gmed = g(xmed)
    if gmed <= 0:
        xa, ga = xmed, gmed
    else:
        xb, gb = xmed, gmed
        
    g_lista.append(abs(gmed))
    
plt.plot(g_lista)
plt.xlabel('número de iterações')
plt.ylabel('|g(x)|')


### Critério de parada

Vimos no gráfico anterior que o erro claramente reduz com o número de iterações. Mas quantas iterações devemos 
realizar? A resposta é sempre "depende".

O método da bisseção, assim como vários outros métodos numéricos atinge a resposta correta apeanas após um número infinito de iterações. Se por um lado é impossível esperar estas infinitas iterações, por outro, raramente precisamos do valor "completo" da solução com todas suas infinitas casas decimais. Na prática precisamos apenas de um valor "próximo o suficiente" do correto e é lógico que o que é "suficiente" depende muito da aplicação.

No método da bisseção escolhemos tipicamente dois critérios para definir o que é "bom o suficiente". Eles 
se traduzem em uma margem de tolerância para y ou para x.

1. $|g(x)| < y_{tol}$
2. $|x_b - x_a| < x_{tol}$

Tipicamente, paramos quando um dos dois critérios for atingido. É lógico que podemos também adotar apenas um dos dois critérios ou, se quisermos ser mais rigorosos, paramos apenas quando os dois critérios forem atingidos. O código abaixo implementa a bisseção com o critério de parada.

In [None]:
# Define tolerâncias
x_tol = 1e-6
y_tol = 1e-6

# Reseta o intervalo inicial (vamos começar do zero)
x0, x1 = 0, 10

# Calcula xa/ga e xb/gb
g0, g1 = g(x0), g(x1)
if g0 < g1:
    xa, xb = x0, x1
    ga, gb = g0, g1
else:
    xa, xb = x1, x0
    ga, gb = g1, g0

# Atualiza o intervalo até atingir o critério de parada
n_iter = 0
while True:
    n_iter += 1
    xmed = (xa + xb) / 2
    gmed = g(xmed)
    if gmed <= 0:
        xa, ga = xmed, gmed
    else:
        xb, gb = xmed, gmed
        
    if abs(xb - xa) < x_tol or abs(gmed) < y_tol:
        break

Verificamos os resultados

In [None]:
xmed = (xa + xb) / 2
print('número de iterações: %s' % n_iter)
print('xa, xb: %.7f, %.7f' % (xa, xb))
print('meio do intervalo: %.7f' % xmed)
print('g(x) no meio do intervalo: %.3e' % g(xmed))

### Convertendo em uma função

Seria bom reutilizarmos a lógica do método da bisseção com qualquer função arbitrária, não? Isto é fácil fazer em Python. Vamos criar uma função que recebe uma funçao g e um intervalo x0, x1 e a partir disto calcula o zero de g(x) contido neste intervalo.

In [None]:
def bissect(g, x0, x1, x_tol=1e-6, y_tol=1e-6):
    """
    Calcula o zero de g(x) dentro do intervalo (x0, x1).
    
    Args:
        g: uma função de uma única variável
        x0, x1: intervalo inicial para a busca do zero de g(x)
        x_tol: tolerância em x (retorna quando intervalo for menor que x_tol)
        y_tol: tolerância em y (retorna quando |g(x)| < y_tol)
    
    Retuns:
        Retorna um zero de g(x) (valor de x em que g(x) = 0).
    """
    
    # Calcula xa/ga e xb/gb
    g0, g1 = g(x0), g(x1)
    if g0 < g1:
        xa, xb = x0, x1
        ga, gb = g0, g1
    else:
        xa, xb = x1, x0
        ga, gb = g1, g0

    # Atualiza o intervalo até atingir o critério de parada
    n_iter = 0
    while True:
        n_iter += 1
        xmed = (xa + xb) / 2
        gmed = g(xmed)
        if gmed < 0:
            xa, ga = xmed, gmed
        elif gmed > 0:
            xb, gb = xmed, gmed
        else:
            return xmed

        if abs(xb - xa) < x_tol or abs(gmed) < y_tol:
            break
    if abs(ga) < abs(gb):
        return xa
    else:
        return xb

In [None]:
# Encontra o zero de g(x)
bissect(g, 0, 10)

In [None]:
# Acha o zero do cos(x) no intervalo de 0 a 4 (pi / 2)
bissect(np.cos, 0, 4)

In [None]:
# Encontra o ponto onde cos(x) é igual a 0.5 no intervalo de 0 a 4
def g2(x):
    return np.cos(x) - 0.5

bissect(g2, 0, 4)

In [None]:
# Encontra o ponto onde cos(x) é igual a sin(x) no intervalo de 0 a 4
# (sabemos que a resposta é pi/4)
def g3(x):
    return np.cos(x) - np.sin(x)

bissect(g3, 0, 4)

## Método da posição falsa

O método da posição falsa é um outro método para encontrar o zero de uma função e foi desenvolvido no Egito antigo cerca de 1.650 a.C!

Assim como o método da bisseção, a idéia é começar com um intervalo inicial (xa, xb) e reduzí-lo gradualmente até atingir uma tolerância pré-estabelecida. A única diferença com relação ao método da bisseção é que o valor
escolhido para a divisão do intervalo não é mais o centro. Na realidade o valor é calculado aproximando a função
por uma reta e escolhendo o ponto onde esta reta atinge o zero.

Esta estratégia de escolha pode ser mais eficaz e muitas vezes faz com que o método da posição falsa seja bem mais eficiente que o método da bisseção. Se a função for muito próxima de uma reta, a convergência se dá em apenas uns poucos passos. Mostramos o resultado em um gráfico:

In [None]:
x0, x1 = 0, 10
g0, g1 = g(x0), g(x1)

# A expressão abaixo fornece o zero da reta
x_falsa = (x0 * g1 - x1 * g0) / (g1 - g0)
X = np.linspace(0, 10)
Y = g(X)

plt.plot(X, Y, 'b-', label='função')
plt.plot([x0, x1], [g0, g1], 'kx-', label='aproximação linear')
plt.plot([x_falsa, x_falsa], [0, g(x_falsa)], 'ko--')
plt.legend(loc='best')   # mostra legenda com os 'labels' dados

Faremos algumas iterações manuais do algoritmo para ver como se dá a convergência. Note que como o novo valor 
x_falsa é menor que zero, substituímos xa no intervalo.

In [None]:
xa, xb = x0, x1
ga, gb = g0, g1

for _ in range(5):
    x_falsa = (gb * xa - ga * xb) / (gb - ga)
    g_falsa = g(x_falsa)
    if g_falsa <= 0:
        xa, ga = x_falsa, g_falsa
    else:
        xb, gb, = x_falsa, g_falsa

    # Fazemos o gráfico
    x_falsa = (gb * xa - ga * xb) / (gb - ga)
    plt.plot(X, Y, 'b-', label='função')
    plt.plot([xa, xb], [ga, gb], 'kx-', label='aproximação linear')
    plt.plot([x_falsa, x_falsa], [0, g(x_falsa)], 'ko--')
    plt.legend(loc='best')   # mostra legenda com os 'labels' dados
    plt.show()
    print('xa: %.7f, ga: %.2e' % (xa, ga))

Vemos que apesar da escolha inicial de novo intervalo ser boa, o método da posição falsa gera uma convergência muito lenta para certas classes de funções (infelizmente isto inclui a nossa $g(x)$ considerada). Isto ocorre porque um dos pontos extremos se mantêm fixo em cada iteração do método, enquanto o outro converge lentamente para a posição correta.

Este comportamento torna o método da posição falsa muito mais ineficiente que a bisseção para algumas funções. Como nem sempre sabemos se nossas funções vão se comportar bem ou mal com este método, é necessário criar uma estratégia para contornar este problema. Uma estratégia comum é utilizar o algoritmo de Illinois, que atualiza a posição da nova divisão com uma regra um pouco diferente da posição falsa:

$$x' = \frac{\frac12 g_b x_a - g_a x_b}{\frac12 g_b - g_a}$$

(note a presença dos fatores de 1/2)

Esta regra deve ser utilizada apenas se houver duas atualizações seguidas com o mesmo ponto.

Quando fazemos isto, o resultado melhora significativamente:

In [None]:
xa, xb = 0, 10
ga, gb = g(xa), g(xb)
ultimo_ponto = None
illinois = False

for _ in range(5):
    if illinois:
        x_falsa = (0.5 * gb * xa - ga * xb) / (0.5 * gb - ga)
        illinois = False
    else:
        x_falsa = (gb * xa - ga * xb) / (gb - ga)
    g_falsa = g(x_falsa)
    
    if g_falsa <= 0:
        xa, ga = x_falsa, g_falsa
        illinois = ponto == 0
        ultimo_ponto = 0
    else:
        xb, gb, = x_falsa, g_falsa
        illinois = ponto == 1
        ultimo_ponto = 1
        
    # Fazemos o gráfico
    x_falsa = (gb * xa - ga * xb) / (gb - ga)
    plt.plot(X, Y, 'b-', label='função')
    plt.plot([xa, xb], [ga, gb], 'kx-', label='aproximação linear')
    plt.plot([x_falsa, x_falsa], [0, g(x_falsa)], 'ko--')
    plt.legend(loc='best')   # mostra legenda com os 'labels' dados
    plt.show()
    print('xa: %.7f, ga: %.2e' % (xa, ga))

Finalmente, criamos a nossa função para encontrar o zero pela posição falsa

In [None]:
def pos_falsa(g, x0, x1, x_tol=1e-6, y_tol=1e-6, illinois=True):
    """
    Calcula o zero de g(x) dentro do intervalo (x0, x1) utilizando o método da posição falsa.
    
    Args:
        g: uma função de uma única variável
        x0, x1: intervalo inicial para a busca do zero de g(x)
        x_tol: tolerância em x (retorna quando intervalo for menor que x_tol)
        y_tol: tolerância em y (retorna quando |g(x)| < y_tol)
        illinois: se verdadeiro, usa correção de Illinois
    
    Retuns:
        Retorna um zero de g(x) (valor de x em que g(x) = 0).
    """
    
    # Calcula xa/ga e xb/gb
    g0, g1 = g(x0), g(x1)
    if g0 < g1:
        xa, xb = x0, x1
        ga, gb = g0, g1
    else:
        xa, xb = x1, x0
        ga, gb = g1, g0

    # Atualiza o intervalo até atingir o critério de parada
    n_iter = 0
    use_illinois = False
    ultimo_ponto = -1
    
    while True:
        n_iter += 1
        
        if use_illinois:
            x_falsa = (0.5 * gb * xa - ga * xb) / (0.5 * gb - ga)
            use_illinois = False
        else:
            x_falsa = (gb * xa - ga * xb) / (gb - ga)
        g_falsa = g(x_falsa)

        if g_falsa < 0:
            xa, ga = x_falsa, g_falsa
            use_illinois = illinois and ponto == 0
            ultimo_ponto = 0
        elif g_falsa > 0:
            xb, gb, = x_falsa, g_falsa
            use_illinois = illinois and ponto == 1
            ultimo_ponto = 1
        else:
            return x_falsa

        if abs(xb - xa) < x_tol or abs(g_falsa) < y_tol:
            break
    
    # Resultado
    if abs(ga) < abs(gb):
        return xa
    else:
        return xb

Testamos a função

In [None]:
x1 = pos_falsa(g, 0, 10)
x2 = bissect(g, 0, 10)
print('posição falsa: x=%.7f, g=%.2e' % (x1, g(x1)))
print('bisseção:      x=%.7f, g=%.2e' % (x2, g(x2)))

In [None]:
pos_falsa(np.cos, 0, 4)

Vemos que ambos os métodos retornam valores parecidos dentro da faixa de tolerância aceitável. Queremos descobrir qual dos dois métodos é o mais rápido:

In [None]:
%timeit -n1000 pos_falsa(g, 0, 10)
%timeit -n1000 pos_falsa(g, 0, 10, illinois=False)
%timeit -n1000 bissect(g, 0, 10)

Estes valores mudam com diferentes tolerâncias

In [None]:
%timeit -n1000 pos_falsa(g, 0, 10, x_tol=1e-10, y_tol=1e-10)
%timeit -n1000 pos_falsa(g, 0, 10, illinois=False, x_tol=1e-10, y_tol=1e-10)
%timeit -n1000 bissect(g, 0, 10, x_tol=1e-10, y_tol=1e-10)

E com diferentes funções ...

In [None]:
%timeit -n1000 pos_falsa(np.cos, 0, 4)
%timeit -n1000 pos_falsa(np.cos, 0, 4, illinois=False)
%timeit -n1000 bissect(np.cos, 0, 4)

## Método da secante

O método da secante utiliza uma filosofia um pouco diferente dos métodos anteriores. Ao invés de analisar a convergência de um intervalo que contêm a raiz, o método da secante monitora um único ponto que (sob condições favoráveis) deve convergir para a raiz. 

Assim como os métodos anteriores, começamos com dois pontos que definem um intervalo (mas estes não precisam conter a raiz). A regra de iteração é a mesma do método do ponto falso, mas ao invés de escolher qual dos dois
valore xa e xb iremos escolher, fazemos sempre a substituição:

$$\begin{align} x_b' & = \frac{x_a g_b - x_b g_a}{g_b - g_a} \\ x_a' & = x_b \end{align}$$

In [None]:
X = np.linspace(0, 10)
Y = g(X)
xa, xb = 0, 10
ga, gb = g(xa), g(xb)

for i in range(6):
    # Propriedades da reta aproximadora para desenhar no gráfico
    m = (gb - ga) / (xb - xa)
    Y_reta = ga + m * (X - xa)
    x_falsa = xa - ga / m
    
    plt.plot(X, Y, 'b-', label='função')
    plt.plot(X, Y_reta, 'k-', label='aproximação linear')
    plt.plot([xa, xb], [ga, gb], 'ko')
    plt.plot([x_falsa, x_falsa], [0, g(x_falsa)], 'ro--')
    plt.legend(loc='best')
    plt.show()
    print('%s) g(x): %.2e' % (i, gb))
    
    # Regra de atualização
    xa, xb = xb, (xa * gb - xb * ga) / (gb - ga)
    ga, gb = gb, g(xb)

In [None]:
def secante(g, x0, x1, x_tol=1e-6, y_tol=1e-6):
    """
    Calcula o zero de g(x) dentro do intervalo (x0, x1) utilizando o método da 
    secante. O método não exige que a raiz de g(x) esteja neste intervalo e
    nem garante que o resultado estará entre x0 e x1.
    
    Args:
        g: uma função de uma única variável
        x0, x1: intervalo inicial para a busca do zero de g(x)
        x_tol: tolerância em x (retorna quando intervalo for menor que x_tol)
        y_tol: tolerância em y (retorna quando |g(x)| < y_tol)
    
    Retuns:
        Retorna um zero de g(x) (valor de x em que g(x) = 0).
    """
    
    xa, xb = x1, x2
    ga, gb = g(x1), g(x2)
    
    while True:
        xa, xb = xb, (xa * gb - xb * ga) / (gb - ga)
        ga, gb = gb, g(xb)
        if abs(xb - xa) < x_tol or abs(gb) < y_tol:
            break
    return xb

Funciona como as outras funções

In [None]:
secante(g, 0, 10), secante(np.cos, 0, 4)

Fazemos uma comparação de velocidade e vemos que o método da secante é bem mais rápido!

In [None]:
%timeit pos_falsa(g, 0, 10)
%timeit bissect(g, 0, 10)
%timeit secante(g, 0, 10)

## Método de Newton

O método de Newton é semelhante ao método da secante, mas ao calcular a inclinação da reta a partir de dois pontos consecutivos, utilizamos uma derivada fornecida explicitamente. Desta forma, a regra de atualização fica

$$x' = x - \frac{f(x)}{f'(x)}$$

O método de Newton tende a ser extremamente rápido, mas o usuário precisa fornecer a derivada explicitamente.

In [None]:
def g_linha(x):
    return 2 * x + 2

X = np.linspace(0, 10)
Y = g(X)
x = 5

for i in range(6):
    # Propriedades da reta aproximadora para desenhar no gráfico
    m = g_linha(x)
    Y_reta = g(x) + m * (X - x)
    x_zero = x - g(x) / m
    
    plt.plot(X, Y, 'b-', label='função')
    plt.plot(X, Y_reta, 'k-', label='aproximação linear')
    plt.plot([x], [g(x)], 'ko')
    plt.plot([x_zero, x_zero], [0, g(x_zero)], 'ro--')
    plt.legend(loc='best')
    plt.show()
    print('%s) g(x): %.2e' % (i, g(x)))
    
    # Regra de atualização
    x = x - g(x)/g_linha(x)

In [None]:
def newton(g, g_linha, x0=0, x_tol=1e-6, y_tol=1e-6):
    """
    Calcula o zero da função g(x) com derivada g_linha(x) partindo do valor inicial
    x0.
    
    Args:
        g: uma função de uma única variável
        g_linha: derivada de g(x)
        x0: valor inicial
        x_tol: tolerância em x (retorna quando intervalo for menor que x_tol)
        y_tol: tolerância em y (retorna quando |g(x)| < y_tol)
    
    Retuns:
        Retorna um zero de g(x) (valor de x em que g(x) = 0).
    """
    
    x = x0
    
    while True:
        value = g(x)
        diff = g_linha(x)
        x = x - value / diff
        if abs(value / diff) < x_tol or abs(value) < y_tol:
            break
    return x

Funciona como as outras funções

In [None]:
def menos_seno(x):
    return -np.sin(x)

newton(g, g_linha, 5), newton(np.cos, menos_seno, 2)

O método de Newton é normalmente o mais rápido de todos.

In [None]:
%timeit -n1000 pos_falsa(np.cos, 0, 10)
%timeit -n1000 bissect(np.cos, 0, 10)
%timeit -n1000 secante(np.cos, 0, 10)
%timeit -n1000 newton(np.cos, menos_seno, 5)

Mas isto depende um pouco da função...

In [None]:
%timeit -n1000 pos_falsa(g, 0, 10)
%timeit -n1000 bissect(g, 0, 10)
%timeit -n1000 secante(g, 0, 10)
%timeit -n1000 newton(g, g_linha, 5)

# Ponto fixo

O problema do ponto fixo consiste em encontrar o valor de x para o qual $f(x) = x$. Este problema geralmente ocorre em sistemas dinâmicos em que $f(x)$ calcula o novo estado do sistema a partir do estado anterior $x$. Por exemplo, se $x$ representa a posição de um sistema em uma animação $f(x)$ representaria a posição no frame posterior. O ponto fixo portanto representaria uma posição estacionária neste sistema: se $f(x) = x$, então o próximo estado é idêntico ao primeiro e assim sucessivamente. É lógico que se reorganizarmos um pouco os termos temos $f(x) - x = 0$, que é um problema de encontrar as raízes (zeros) de uma função.

Deste modo, se quisermos encontrar o ponto fixo de uma função (digamos $f(x) = cos(x)$), então podemos utilizar qualquer método de encontrar raízes para a função $g(x) = f(x) - x$.

### Ponto fixo de cos(x)

In [None]:
def g_fixo(x):
    return np.cos(x) - x

x_fixo = secante(g_fixo, 0, 2)
print('x: %.8f,  f(x): %.8f' % (x_fixo, np.cos(x_fixo)))

## Ponto fixo como mapa

Também podemos encontrar um ponto fixo explicitamente aplicando $f(x)$ sucessivamente nos valores de x

In [None]:
valores = [1]
x = 1
for i in range(20):
    x = np.cos(x)
    valores.append(x)
    print('%2d) x: %.7f' % (i, x))
    
plt.plot(valores)
plt.xlabel('número de iterações')
plt.ylabel('x')

Podemos visualizar os dados anteriores em um gráfico com a função

In [None]:
points = [(1, 0)]
x = 1
for i in range(20):
    x, x_old = np.cos(x), x
    # Ponto na funçao cos(x)
    points.append((x_old, x))

    # Ponto projetado na reta y = x
    points.append((x, x))
   
# Desenha y = cos(x) e y = x
X = np.linspace(0, 2)
Y = np.cos(X)
plt.plot(X, Y, 'b-', label='cos(x)')
plt.plot(X, X, 'k-')

# Desenha mapa de iteração
X, Y = np.array(points).T
plt.plot(X, Y, 'r-', label='x_n')

# Define os limites do gráfico [xmin, xmax, ymin, ymax]
plt.axis([0.5, 1.1, 0.4, 1.0]) 

# Elementos do gráfico
plt.legend(loc='best')
plt.ylabel('cos(x)')
plt.xlabel('x')

### Método do ponto fixo

Vimos que é possível resolver um problema de ponto fixo como um problema de encontrar raízes. Também é possível fazer o contrário e resolver um problema de raízes como se fosse um ponto fixo. Para isto, considere a que queremos encontrar as raízes tais quais $g(x) = 0$. Com um pouquinho de álgebra, temos $x + k g(x) = x$, o que pode ser reescrito como $h(x) = x$, onde definimos $h(x) = x + k g(x)$ e $k$ é uma constante arbitrária.

Deste modo, encontrar a raiz de $g(x)$ é equivalente a encontrar o ponto fixo de $h(x) = x + k g(x)$.

In [None]:
def h(x):
    return x - 0.1 * g(x)  # definimos k = -0.1

Desenhamos um gráfico como no caso anterior

In [None]:
x = 5
points = []
for i in range(20):
    x, x_old = h(x), x
    
    # Ponto na funçao h(x)
    points.append((x_old, x))

    # Ponto projetado na reta y = x
    points.append((x, x))
   
# Desenha y = g(x) + x e y = x
X = np.linspace(0, 10)
Y = h(X)
plt.plot(X, Y, 'b-', label='x - g(x)')
plt.plot(X, X, 'k-')

# Desenha mapa de iteração
X, Y = np.array(points).T
plt.plot(X, Y, 'r-', label='x_n')

# Define os limites do gráfico [xmin, xmax, ymin, ymax]
plt.axis([5, 6, 5, 6]) 

# Elementos do gráfico
plt.legend(loc='best')
plt.ylabel('h(x)')
plt.xlabel('x')

Podemos definir uma função chamada ponto fixo que calcula as raízes como as outras

In [None]:
def ponto_fixo(g, x0, k=1, x_tol=1e-6, y_tol=1e-6):
    """
    Calcula o zero da função g(x) usando o método do ponto fixo e iterando 
    sobre a função h(x) = x + k * g(x)
    
    Args:
        g: uma função de uma única variável
        x0: valor inicial
        k: valor usado para criar h(x) = x + k * g(x)
        x_tol: tolerância em x (retorna quando intervalo for menor que x_tol)
        y_tol: tolerância em y (retorna quando |g(x)| < y_tol)
    
    Retuns:
        Retorna um zero de g(x) (valor de x em que g(x) = 0).
    """
    x = x0
    
    while True:
        value = g(x)
        x_new = x + k * value
        x, dx = x_new, x_new - x
        if abs(dx) < x_tol or abs(value) < y_tol:
            break
        x = x_new
    return x

Calculamos alguns exemplos como antes...

In [None]:
ponto_fixo(g, 5, k=-0.08), ponto_fixo(np.cos, 1)

Testamos a performance

In [None]:
%timeit -n1000 bissect(g, 0, 10)
%timeit -n1000 pos_falsa(g, 0, 10)
%timeit -n1000 secante(g, 0, 10)
%timeit -n1000 newton(g, g_linha, 5)
%timeit -n1000 ponto_fixo(g, 5, k=-0.08)

In [None]:
%timeit -n1000 bissect(np.cos, 0, 4)
%timeit -n1000 pos_falsa(np.cos, 0, 4)
%timeit -n1000 secante(np.cos, 0, 4)
%timeit -n1000 newton(np.cos, menos_seno, 1)
%timeit -n1000 ponto_fixo(np.cos, 1)

O ponto fixo é considerado um método bastante rápido. No entanto, é um dos métodos mais frágeis dos considerados. Em muitos casos não há convergência ou a velocidade de convergência pode ser fortemente dependente
do parâmetro k. Como regra geral **nunca use o método do ponto fixo!**. A única exceção é quando é possível provar que a função que você deseja encontrar a raiz possui as propriedades necessárias para que o método funcione.  

### Cálculo da raiz quadrada

Podemos definir a função y = raiz(x) como a solução da equação $x^2 - y = 0$. Deste modo, pensamos em encontrar as raizes para $g(x) = x^2 - y$, com $y$ forncecido. Esta função aceita o método do ponto fixo. Deste modo, criamos a função $h(x) = x + k (x^2 - y)$ e iteramos este mapa.

In [None]:
# Vamos calcular raiz de 2
y = 2
x = y   # começamos no final do caminho
k = - 1 / (2 * y)
for i in range(10):
    x = x + k * (x * x - y)
    print('%2d) x: %.6f' % (i, x))

### Método Babilônico

Apesar de obter a raiz quadrada do número desejado, o método converge de forma muito lenta. Compare com o método Babilônico, baseado na regra de Newton.

Se queremos calcular a raiz de y, definimos $g(x) = x^2 - y = 0$. A derivada de g é $g'(x) = 2x$. Juntando os dois resultados, temos a regra de iteração:

$$x' = \frac{x - (x^2 - y)}{2x} = \frac12\left(x + \frac yx\right)$$

In [None]:
y = 2
x = 1
for i in range(10):
    x = 0.5 * (x + y / x)
    print('%2d) x: %.8f' % (i, x))

A convergência é extremamente rápida e o resultado é muito preciso. Compare com o valor calculado usando o numpy.

In [None]:
x - np.sqrt(2)