# Amat Samuel, Linares Uziel

# Raíces de funciones uni-dimensionales

En este notebook, investigaremos algunos métodos para encontrar **raíces** de funciones uni-dimensionales, usando métodos iterativos. Esto es un problema que ocurre por todos lados en la física, por ejemplo para el pozo cuadrado en mecánica cuántica, o para encontrar el valor máximo de una función.

Recuerda que $x^*$ es una **raíz** (también llamado "cero") de la función $f$ si $f(x^*) = 0$. Como sabemos, en general las raíces de una función no se pueden encontrar de manera analítica, excepto para funciones $f$ que sean polinomios de grado $\le 4$.

Por lo tanto, para encontrar raíces tendremos que utilizar algoritmos iterativos.
Recuerda que un algoritmo iterativo tiene la forma general

$$x_{n+1} := f(x_n),$$

y consiste en comenzar en un punto inicial $x_0$ y generar una secuencia $x_1 = f(x_0)$; $x_2 = f(x_1)$, etc.
Si diseñamos correctamente el algoritmo, la esperanza es que la secuencia $(x_n)_{n=1}^\infty$ converja a alguna raíz  $x^*$ con $f(x_\infty) = 0$, es decir que $f(x_n) \to 0$ cuando $n \to \infty$.

Dado que no podemos llevar a cabo la iteración un número infinito de veces, se corta la iteración después de un cierto número de pasos, para dar una solución *aproximada*, que se encuentra dentro de cierta *tolerancia* del resultado teórico exacto $x^*$. Por lo tanto, cualquier algoritmo iterativo requiere una condición de terminación.

# Tasa de convergencia de un algoritmo iterativo

Un tema crucial en torno a los métodos iterativos es saber no sólo si converge, sino también a *qué velocidad* converge, o con qué tasa converge - es decir, "qué tan rápido" va convergiendo a la solución.

**[1]** Considera la iteración $x_{n+1} = f(x_n)$. Supón que para algún valor de $n$, ya se acercó a un punto fijo $x_{\infty}$. Define la distancia $\delta_n := x_n - x_\infty$, que suponemos es chica.

(i) Sustituye esto en la fórmula de la iteración para encontrar una expresión aproximada que relaciona $\delta_{n+1}$ con la distancia al paso anterior, $\delta_n$, es decir, cómo se va variando el error. [Pista: ¿De cuál teorema famoso necesitas echar mano?]

(ii) Por lo tanto, encuentra una expresión aproximada explícita para $\delta_n$ en términos de $n$.

(iii) Verifica numéricamente el comportamiento de los $\delta_n$ con una iteración específica, por ejemplo con $f=\cos$.

(iv) ¿Cómo puedes graficar *de forma útil* el comportamiento de $\delta_n$ en función de $n$? Hazlo.

(v) Estima cuántas iteraciones se necesitan para llegar a que el error sea del orden de $2^{-p}$

(vi) Verifica esto numéricamente para $f=\cos$ usando `BigFloat`s con precisión $p=1000$ bits y verificando cuánto tiempo se requiere para que llegue a un punto fijo. [Recuerda que la precisión de los `BigFloat` se cambia a $p$ bits con `setprecision(p)`.]

[1]
i)-ii)

Se tiene 

$$\delta_{n} := x_n-x_{\infty} \Rightarrow \delta_{n+1}=x_{n+1}-x_{\infty}$$
Y la iteración 
$$ x_{n+1}=f(x_n)\\
\Rightarrow \delta_{n+1}+x_{\infty}=f(x_n)
$$
Por otro lado
$$
f(x_n)=f(x_{\infty}+\delta_n)\approx f(x_\infty)+\delta_nf'(x_\infty)+\dfrac{1}{2!}\delta_n^2f''(x_\infty)+O(\delta_n^3)
$$
Despreciando los términos de orden 2 se tiene que
$$
\delta_{n+1}+x_\infty=f(x_\infty)+\delta_nf'(x_\infty)\\
\Rightarrow \delta_{n+1}=\delta_nf'(x_\infty)
$$

O escrito de otro modo
$$
\delta_n=\delta_0[f'(x_\infty)]^n
$$

In [23]:
# [1] iii
function iterar(f, ϵ, x0)
    err = 1
    cont = 0
    iters = Float64[]
#    numiters= []
    while ϵ <= err
        cont += 1
        x = x0
        x0 = f(x0)
        err = norm(x-x0)
        push!(iters, x)
#        push!(numiters, n)
        if cont > 10000
            break
        end
    end
    return iters
end

    

iterar (generic function with 1 method)

In [30]:
x0 = 5
ϵ = 0.00001
x_fijo = iterar(cos, ϵ, x0)[end]
δ0 = x0 - x_fijo
δn = iterar(cos, ϵ, x0) - x_fijo
δn

30-element Array{Float64,1}:
  4.26092    
 -0.455418   
  0.220957   
 -0.16559    
  0.100933   
 -0.0716264  
  0.0463207  
 -0.0319747  
  0.0211659  
 -0.0144131  
  0.00964056 
 -0.00651932 
  0.00438461 
  ⋮          
  0.000414968
 -0.000270705
  0.000191206
 -0.000119927
  8.96632e-5 
 -5.15161e-5 
  4.35854e-5 
 -2.04755e-5 
  2.2677e-5  
 -6.39088e-6 
  1.31897e-5 
  0.0        

In [29]:
scatter([δ0 * (-sin(x_fijo)^n) for n in 1:length(δn)])

In [32]:
using Plots
scatter(abs.(δn))
scatter!(abs.([δ0 * ((-sin(x_fijo))^n) for n in 1:length(δn)]))

v)

Si queremos que el error sea del orden de $2^{-p}$, esto es
$$
\delta_n\approx2^{-p}\Rightarrow \delta_0\alpha^n\approx\dfrac{2^{-p}}{\delta_0}
$$
Donde $\alpha=f'(x_\infty)$, de manera que
$$
n\approx \log_{\alpha}(\dfrac{2^{-p}}{\delta_0})
$$

# Raíz cuadrada: El algoritmo Babilónico

Un ejemplo de un algoritmo iterativo sorprendentemente eficaz y bonito es el *algoritmo Babilónico* (o de Herón) para calcular la raiz cuadrada $\sqrt{y}$ de un número real $y$ [cosa que probablemente nunca antes sabías hacer (más que tecleando una cierta tecla en una calculadora, ¡lo cual *no* cuenta!)].

**[2]** ¿De cuál ecuación es raíz el número $\sqrt{y}$? ¿Cuál otra solución de esta ecuación hay?

La ecuación de la cual es raíz es $x^2 - y =0$.

Por otro lado también es raíz $-\sqrt{y}$

Para un algoritmo, siempre necesitamos una *idea*, que toma una adivinanza $x_n$ y produce una (probablemente) mejor, $x_{n+1}$. La idea del algoritmo Babilónico es la siguiente.

**[3]** (i) Dada una adivinanza $x_n$, es posible (pero improbable) que $x_n$ ya sea igual a $\sqrt{y}$. ¿Cómo lo puedes verificar, sin utilizar (por supuesto) alguna función en Julia que calcule la raíz cuadrada? Escribe el código correspondiente.

(ii) Si $x_n$ no es raíz, demuestra (a mano) que $\frac{y}{x_n}$ se encuentra *del lado opuesto de $\sqrt{y}$ que $x_n$* sobre la recta real.

(iii) Así, tenemos dos valores que se encuentran por dos lados diferentes de $\sqrt{y}$. ¿Cuál sería una mejor adivinanza para $x_{n+1}$? 

In [91]:
# [3] i)
function adivinanza(x, y)
    if x^2 - y == 0
        return "Es raiz"
    else
        return "No es raiz"
    end
end

adivinanza (generic function with 1 method)

In [92]:
adivinanza(3, 9)

"Es raiz"

In [93]:
adivinanza(2, 6)

"No es raiz"

[3] iii) 

Una mejor adivinanza sería $x_{n+1} = \dfrac{y+x_n^2}{2x_n}$

**[4]** (i) Utiliza esta idea para escribir una función que calcule $\sqrt{y}$ para una $y$ dada. ¿Cuál condición de terminación de la iteración te parece razonable? Impleméntalo.

(ii) Dibuja el comportamiento de $\delta_n$ en función de $n$. ¿Qué observas? ¿Qué implica esto sobre la eficiencia del algoritmo comparado con una iteración de punto fijo?

In [49]:
# [4] i)
function babylon(y, x0, ϵ=0.00001)
    err = 1
    cont = 0
    iters = []
    while ϵ <= err
        cont += 1
        x = (y + x0^2) / (2 * x0)
        err = norm(x - x0)
        x0 = x
        if cont >= 10000
            break
        end
        push!(iters, x0)
    end
    return x0, iters
end

babylon (generic function with 2 methods)

In [50]:
raiz, iters = babylon(16, 20)
@show raiz

raiz = 4.0


4.0

In [51]:
raiz, iters = babylon(23, 100)
@show raiz

raiz = 4.795831523312719


4.795831523312719

In [None]:
# [4] ii)
raiz, iters = babylon(43, 1000)
δn = iters - raiz
@show raiz
scatter(δn)

Comparemos el método babilónico con el de iteración de punto fijo.

# Raíces de funciones: Bisección

Un primer método para encontrar una raíz de una función general $f$ es el **método de bisección**.
Dada una función continua $f$, una condición suficiente (pero no necesaria) para que *exista* una raiz en un intervalo dado $[a, b]$ es que $F$ cambie de signo en el intervalo, es decir, que $f(a)$ y $f(b)$ tengan signos opuestos. Si ocurre esto, entonces el teorema del valor intermedio nos dice que se sigue que $f$ sí tiene al menos una raíz en $[a, b]$.

**[5]** La idea del método de bisección es el siguiente. Lo implementaremos en una función `biseccion` que tome como argumento la función $f$ y el intervalo $[a, b]$.

(i) Verifica que $f(a)$ y $f(b)$ tengan signos opuestos. Si no, arroja un error.

(ii) Define $c$ como algún punto del intervalo. [Pista: ¿cuál sería uno sencillo?]

(iii) Esto divide el intervalo original en dos partes. Es posible (aunque improbable) que $c$ ya sea la raíz, en cuyo caso ya se termina la función y se regresa la raíz que hemos encontrado. ¿Cómo se checa si ya es la raíz? 

Si no, ¿cómo podemos saber en cuál de los dos sub-intervalos cae la raíz? Impleméntalo. 

[Pista: Probablmente querrás definir una función `signo` que toma un argumento `x` y regresa $0$ si `x` es igual a `0`, regresa `1` si `x` es mayor que cero, y regresa `-1` si `x` es menor que cero.]

(iv) Repite estos pasos hasta que encuentres la raíz con cierta tolerancia.

In [1]:
function signo(x)
    if x == 0
        return 0
    elseif x > 0
        return 1
    elseif x < 0
        return -1
    end
end
    
function biseccion(f, a, b)
    if f(a) * f(b) >= 0
        return error
    end
    c = (b + a) / 2
    if f(c) == 0
        return c
    end
    ϵ = 0.000000001
    err = 1
    while ϵ <= err
        if signo(f(a) * f(c)) == -1
            b = c
        else
            a = c
        end
        c = (b + a) / 2
        err = norm(b-a)
    end
    return c
end

            
    

biseccion (generic function with 1 method)

**[6]** Aplica tu función para encontrar *las dos* raíces cuadradas de $2$. Para hacerlo, tendrás que escoger (a mano) intervalos iniciales que cumplan con la condición de cambio de signo. 

**[7]** Haz una versión nueva de tu función que regresa un arreglo de todos los iterados `x`. Utiliza un método gráfico para estimar la tasa de convergencia del método hacia la raíz. 

In [2]:
raiz1 = biseccion(x -> x^2 - 2, 0, 2)
raiz2 = biseccion(x -> x^2 - 2, -2, 0)
println(raiz1)
println(raiz2)

1.4142135619185865
-1.4142135619185865


In [3]:
function biseccion(f, a, b)
    iters = []
    if f(a) * f(b) >= 0
        return error
    end
    c = (b + a) / 2
    if f(c) == 0
        return c
    end
    ϵ = 0.000000001
    err = 1
    while ϵ <= err
        if signo(f(a) * f(c)) == -1
            b = c
        else
            a = c
        end
        c = (b + a) / 2
        err = norm(b-a)
        push!(iters, c)
    end
    return iters
end


biseccion (generic function with 1 method)

In [4]:
biseccion(x -> x^2 - 2, 0, 2)

31-element Array{Any,1}:
 1.5    
 1.25   
 1.375  
 1.4375 
 1.40625
 1.42188
 1.41406
 1.41797
 1.41602
 1.41504
 1.41455
 1.41431
 1.41418
 ⋮      
 1.41421
 1.41421
 1.41421
 1.41421
 1.41421
 1.41421
 1.41421
 1.41421
 1.41421
 1.41421
 1.41421
 1.41421

In [11]:
using Plots
scatter(biseccion(x -> x^2 - 2, 0, 2))