# El método de Newton

El método de Newton (también llamado algoritmo de Newton-Raphson) constituye otro método numérico iterativo para encontrar raíces de funciones. 

Requiere más información sobre la función, pero a cambio puede funcionar mejor. Derivaremos e implementaremos el método en este notebook.

[1] (Esta pregunta es para llevarse a cabo con papel y pluma.)

Considera una función $f: \mathbb{R} \to \mathbb{R}$.
Supón que $x_0$ es una adivinanza inicial de una raíz, y que $x^*$ es la raíz exacta pero 
desconocida. Sigue los siguientes pasos para derivar el método de Newton.

(i) Supón que $x_0$ es suficientemente cercana a $x^*$. Define $\delta$ como la distancia  (con signo) de $x_0$ desde $x^*$. 

(ii) Escribe la ecuación que corresponde a que $x^*$ sea una raíz de la función, y exprésala en términos de $\delta$. 

(iii) Desarrolla esta ecuación en una serie de Taylor a primer orden, para encontrar un valor aproximado de $\delta$.

(iv) Así encuentra una ecuación para la siguiente aproximación $x_1$ a la raíz, $x_1 = x_0 + \delta$. 

[2] Demuestra que el método Babilónico es un caso especial del método de Newton. [Pista: ¿Para cuál función $f$?]

Con $f(x) = x^2 - c$ vemos que $f'(x) = 2x$, luego el método de Newton aplicado a esto es:
$$ x_{n+1} = x_n - \frac{f(x_n)}{f'(x_n)} = x_n - \frac{(x_n)^2 - c}{2 x_n} = \frac{2 (x_n)^2 - (x_n)^2 + c}{2 x_n} = \frac{x_n + \frac{c}{x_n}}{2} $$

[3] Escribe una función que implementa el método de Newton. Puedes suponer que el usuario provea tanto la función `f` como su derivada `fp` como argumentos a la función `newton` (así como la condición inicial `x0`). [Posteriormente veremos cómo evitar tener que proveer también la derivada.]

In [6]:
function newton1(f ::Function, df ::Function, x0::Float64)
    i = 0
    while i < 100 && abs(f(x0)) > 1e-15
        i += 1
        x0 -= f(x0)/df(x0)
    end
    return x0
end

newton1 (generic function with 1 method)

In [7]:
@time newton1(x -> x^2 - 4, x -> 2x, 4.)

  0.006275 seconds (3.31 k allocations: 149.458 KB)


2.0

In [8]:
@time newton1(x -> x^4 - 7, x -> 4x^3, -34.)

  0.005982 seconds (2.24 k allocations: 111.467 KB)


[4] Dibuja (e.g. con `Plots.jl`) la dinámica del método iterativo, dada una función $f$ y una condición inicial $x_0$. Para hacerlo, líneas entre $(x_n, 0)$ y $(x_n, f(x_n))$, así como entre $(x_n, f(x_n)$ y $(x_{n+1}, 0)$. Hazlo interactivo con `Interact.jl`. Viendo la figura, interpreta geométricamente lo que está haciendo el método de Newton-Raphson.

In [9]:
using Plots
gr()
using Interact;

In [10]:
function newton2(f ::Function, df ::Function, x0::Number)
    i = 0
    equices = Float64[x0]
    while i < 100 && abs(f(x0)) > 1e-10 #con 1e-15 llega al límite de i
        i += 1
        x0 -= f(x0)/df(x0)
        push!(equices,x0)
    end
    return raiz = x0, equices
end

newton2 (generic function with 1 method)

In [11]:
g(x) = x^4 - 7
dg(x) = 4x^3
scatter(newton2(g, dg, 4.5)[2]);
newton2(g,dg,4.5)[1]

1.6265765616977859

In [12]:
xn = newton2(g,dg,4.5)[2]
@manipulate for i in 1:(length(xn)-1)
        plot(g,xlims=(minimum(xn)-.1,maximum(xn)+.1),line=(:line,1))
        plot!([xn[i],xn[i]],[0,g(xn[i])],marker=(:auto,4),line=(:line,2))
        plot!([xn[i],xn[i+1]],[g(xn[i]),0],marker=(:auto,4), line=(:line,2))
end

[5] Aplica el método de Newton para encontrar raíces de distintas funciones. ¿Qué ocurre si empiezas con distintas condiciones iniciales? Prueba con distintas funciones.

In [13]:
@show newton2(sin,cos,3.0)
@show newton2(sin,cos, 2.0) #hace unas cuantas iteraciones más

newton2(sin,cos,3.0) = (3.141592653589793,[3.0,3.14255,3.14159,3.14159])
newton2(sin,cos,2.0) = (3.1415926536808043,[2.0,4.18504,2.46789,3.26619,3.14094,3.14159])


(3.1415926536808043,[2.0,4.18504,2.46789,3.26619,3.14094,3.14159])

In [14]:
h(x) = 3x^3 - 2x^2 + x + 3
dh(x) = 9x^2 - 4x + 1;

In [15]:
@show length(newton2(h, dh, 100.0)[2])
@show length(newton2(h, dh, -20.)[2])
@show length(newton2(h, dh, 9.0)[2])

length((newton2(h,dh,100.0))[2]) = 21
length((newton2(h,dh,-20.0))[2]) = 13
length((newton2(h,dh,9.0))[2]) = 15


15

[6] ¿Qué tan rápido converge el método cuando esté cerca de una raíz. Utiliza `BigFloat`s. ¿Es mejor que bisección?

In [16]:
function ceros_biseccion4(F::Function, a::Real, b::Real)
    iterados_x = Float64[]
    c = (a+b)/2      #calculo el punto medio
    push!(iterados_x,F(c))
    if sign(F(c)) == 0
        return raiz = c #si le atinas justo a la mitad del intervalo regresa
    else
        i = 0 #inicio contador para tolerancia
        while abs(F(c)) > 1e-15 #defino una tolerancia de la raiz menor a 10^-15
            i += 1
            if sign(F(c))*sign(F(a)) < 0
                a, b = a, c #a se queda igual, b se vuelve el punto medio [a,b]->[a,c]
                c = (a+b)/2
                if i == 100000
                    error("No se encontró raíz.")
                end
            else
                a, b = c, b #b se queda igual, a se vuelve el punto medio [a,b]->[c,b]
                c = (a+b)/2
                if i == 100000
                    error("No se encontró raíz.")
                end
            end
            push!(iterados_x,c)
        end
        end      
    return iterados_x, c
end

ceros_biseccion4 (generic function with 1 method)

In [17]:
h(x) = 3x^3 - 2x^2 + x + 3
dh(x) = 9x^2 - 4x + 1
newton2(h,dh,big(5.))[1]



-7.34244373581901496054045308187989488568411368706823847752086805798793605637189e-01

In [18]:
newton = newton2(h,dh,big(5.))[2]
bisecc = ceros_biseccion4(h,big(-10.),big(10.))[1]
scatter(1:length(newton),newton,label="newton", ylim=(-5,10))
scatter!(1:length(bisecc),bisecc,label="biseccion")

In [19]:
newton_cerca = newton2(h,dh,big(-5.))[2]
bisecc2 = ceros_biseccion4(h,big(-2.),big(2.))[1]
scatter(1:length(newton_cerca),newton_cerca,label="newton", ylim=(-5,10))
scatter!(1:length(bisecc),bisecc,label="biseccion")

Biseccion es ligeramente más rápido si el punto inicial de Newton no es cercano a la raíz, también depende de si el punto inicial es mayor o menor a la raíz buscada, para un $x_0$ menor a la raíz y cercano Newton es más rápido.

Sin embargo, es posible que el método de Newton *no converja*:

[7] El mismo código del método de Newton debería funcionar con números complejos. Utilízalo para encontrar raíces de la función $f(z) = z^3 -1$ **en el plano complejo**.

Dada una condición inicial, dibuja (por ejemplo) la parte imaginaria de la raíz a la cual converge (por ejemplo, después de un cierto número de pasos). Hazlo para una malla de condiciones iniciales en el plano. ¿Qué es lo que ves?

In [20]:
#Cambiamos un poco el código pues estaba hecha para flat64
function newton2(f ::Function, df ::Function, x0::Complex)
    i = 0
    equices = Number[x0]
    while i < 100 && abs(f(x0)) > 1e-10 #con 1e-15 llega al límite de i
        i += 1
        x0 -= f(x0)/df(x0)
        push!(equices,x0)
    end
    return raiz = x0, equices
end

newton2 (generic function with 2 methods)

In [21]:
C(z) = z^3 -1
dC(z) = 3z^2;



In [22]:
newton2(C,dC,1 + im)[1]

0.9999999999999994 - 4.556244651765188e-16im

In [23]:
?imag

search: [1mi[22m[1mm[22m[1ma[22m[1mg[22m [1mi[22msi[1mm[22m[1ma[22m[1mg[22m Un[1mi[22mfor[1mm[22mSc[1ma[22mlin[1mg[22m an[1mi[22m[1mm[22m[1ma[22mte An[1mi[22m[1mm[22m[1ma[22mtion @an[1mi[22m[1mm[22m[1ma[22mte [1mi[22ms[1mm[22m[1ma[22mtch [1mi[22ms[1mm[22m[1ma[22mrked



```
imag(z)
```

Return the imaginary part of the complex number `z`.


In [24]:
ims = abs.(imag.(newton2(C,dC,1+im)[2]))
scatter(ims) #tiende a cero en este caso

In [25]:
x0 = 1 + im
ims = (imag.(newton2(C,dC,1+im)[2]))
p = scatter(ims) #tiende a cero en este caso
for k in 1:10
    x0 += 1*k + im*k
    @show ims = (imag.(newton2(C,dC,x0)[2]))
#scatter!(ims)
end
p

ims = imag.((newton2(C,dC,x0))[2]) = Real[2,1.29167,0.764434,0.270915,-0.330718,0.00942506,-0.00298173,-0.000100431,-5.7908e-8,-8.4662e-15]
ims = imag.((newton2(C,dC,x0))[2]) = Real[4,2.65625,1.7473,1.11123,0.614917,0.0929658,-0.190735,-0.0620191,-0.00324314,1.85612e-5,-9.17423e-11,6.20937e-20]
ims = imag.((newton2(C,dC,x0))[2]) = Real[7,4.66327,3.10118,2.05018,1.3276,0.794459,0.308281,-0.29106,0.0659939,-0.0174167,-0.000243906,1.20908e-7,4.50431e-16]
ims = imag.((newton2(C,dC,x0))[2]) = Real[11,7.33196,4.88487,3.2496,2.15067,1.39812,0.849911,0.367651,-0.233189,0.146217,-0.0129292,0.000605734,4.10412e-7,-2.06611e-13]
ims = imag.((newton2(C,dC,x0))[2]) = Real[16,10.666,7.10921,4.73618,3.15003,2.08328,1.35089,0.812925,0.328441,-0.273642,0.0948929,-0.0209199,8.9328e-5,-7.79095e-8,-2.83531e-14]
ims = imag.((newton2(C,dC,x0))[2]) = Real[22,14.6663,9.77677,6.51611,4.34015,2.88459,1.90312,1.22342,0.710152,0.212131,-0.318777,-0.0471556,0.00864678,6.8867e-5,-7.98194e-9,2.21178e-17]
ims = imag.(

Para todos los demás valores de $x_0$ la parte imaginaria tiende a $\infty$.

[8] Haz lo mismo para otras funciones en el plano complejo.

In [26]:
A(z) = z^2 +3
dA(z) = 2z
B(z) = cos(z)
dB(z) = sin(z)

dB (generic function with 1 method)

In [27]:
x0 = 1 + im
ims = (imag.(newton2(A,dA,x0)[2]))
p = scatter(ims) #tiende a cero en este caso
for k in 1:10
    x0 += 1*k + im*k
    ims = (imag.(newton2(A,dA,x0)[2]))
scatter!(ims)
end
p

In [28]:
x0 = 1 + im
ims = (imag.(newton2(B,dB,x0)[2]))
p = scatter(ims) #tiende a cero en este caso
for k in 1:10
    x0 += 1*k + im*k
    ims = (imag.(newton2(B,dB,x0)[2]))
scatter!(ims) #
end
p

Varía el comportamiento del valor de la parte imaginaria de la raíz dependeindo de la función y del valor de x.

[9] Considera ahora cómo encontrar raíces de un sistema de ecuaciones, escritos en forma vectorial,

$$\mathbf{f}(\mathbf{x}) = \mathbf{0}.$$

Repite un desarrollo siguiendo la pauta de la pregunta [1] en este contexto.
¿Qué es lo que cambia? ¿Qué tipo de operación numérica necesitaríamos para llevar a cabo el método de Newton en este nuevo contexto?

Necesitaríamos conocer la derivada de la función o bien poder hacer su expansión en series de Taylor (para cada entrada) para poder aplicar el método de Newton.

#### Corrección de los incisos [7] y [8]

In [29]:
function matriz_newton()
    x = linspace(-5,5,500)
    y = linspace(-5,5,500)
    M = zeros(length(x), length(y))
    for i in 1:length(x)
        for j in 1:length(y)
        M[i,j] = imag(newton2(C,dC, x[i] + y[j]*im)[1])
        end
    end
    
    return M
end

matriz_newton (generic function with 1 method)

In [30]:
heatmap(matriz_newton(), color=:blues) #al parecer por default plots sólo tiene 3 paletas de colores D: