# El método de Newton

El método de Newton (también llamado algoritmo de Newton-Raphson) constituye otro método numérico iterativo para encontrar raíces de funciones. 

Requiere más información sobre la función, pero a cambio puede funcionar mejor. Derivaremos e implementaremos el método en este notebook.

[1] (Esta pregunta es para llevarse a cabo con papel y pluma.)

Considera una función $f: \mathbb{R} \to \mathbb{R}$.
Supón que $x_0$ es una adivinanza inicial de una raíz, y que $x^*$ es la raíz exacta pero 
desconocida. Sigue los siguientes pasos para derivar el método de Newton.

(i) Supón que $x_0$ es suficientemente cercana a $x^*$. Define $\delta$ como la distancia  (con signo) de $x_0$ desde $x^*$. 

(ii) Escribe la ecuación que corresponde a que $x^*$ sea una raíz de la función, y exprésala en términos de $\delta$. 

(iii) Desarrolla esta ecuación en una serie de Taylor a primer orden, para encontrar un valor aproximado de $\delta$.

(iv) Así encuentra una ecuación para la siguiente aproximación $x_1$ a la raíz, $x_1 = x_0 + \delta$. 

[2] Demuestra que el método Babilónico es un caso especial del método de Newton. [Pista: ¿Para cuál función $f$?]

### [2]

Si tomamos $f(x)=x^2 - y$ para una y fija, tenemos que $\frac{df}{dx}= 2x$. Así, claramente para el método de Newton-Raphson:

$$x_{n+1} = x_n - \frac{f(x_n)}{\frac{df}{dx}\Big|_{x_n}} = x_n - \frac{x_n^2 - y}{2x_n}=\frac{2x_n^2 -x_n^2 +y}{2x_n} =\frac{x_n + \frac{y}{x_n}}{2}$$

[3] Escribe una función que implementa el método de Newton. Puedes suponer que el usuario provenga tanto la función `f` como su derivada `fp` como argumentos a la función `newton` (así como la condición inicial `x0`). [Posteriormente veremos cómo evitar tener que proveer también la derivada.]

In [25]:
function newton(f::Function,df::Function,x0,test=false)
    x=x0
    i=1
    while abs(f(x))>1e-10
        if test==true
            @show (x,f(x),df(x))
        end
        if i==1000
            return "fail"
        end
        i+=1
        x=x-(f(x)/df(x))
    end
    return x
end
function newtonlist(f::Function,df::Function,x0,test=false)
    x=[]
    push!(x,x0)
    i=1
    while abs(f(x[i]))>1e-10
        if test==true
            @show (x[i],f(x[i]),df(x[i]))
        end
        if i==1000
            return "fail"
        end
        push!(x,x[i]-(f(x[i])/df(x[i])))
        i+=1
    end
    return x
end




newtonlist (generic function with 4 methods)

In [26]:
newton(x -> x^2 -2,x -> 2x,1.0)

, Function, Any) in module Main at In[24]:2 overwritten at In[25]:2.


1.4142135623746899

[4] Dibuja (e.g. con `Plots.jl`) la dinámica del método iterativo, dada una función $f$ y una condición inicial $x_0$. Para hacerlo, líneas entre $(x_n, 0)$ y $(x_n, f(x_n))$, así como entre $(x_n, f(x_n)$ y $(x_{n+1}, 0)$. Hazlo interactivo con `Interact.jl`. Viendo la figura, interpreta geométricamente lo que está haciendo el método de Newton-Raphson.

In [27]:
using Plots, Interact
gr()

Plots.GRBackend()

In [28]:
newtonlist(x -> x^2-5,x -> 2x,1.0)

6-element Array{Any,1}:
 1.0    
 3.0    
 2.33333
 2.2381 
 2.23607
 2.23607

In [29]:
function newtonvisual(f,df,x0)
    B=newtonlist(f,df,x0)
    A=linspace(minimum(B)-.1,maximum(B)+.1,100)
    @manipulate for i in 1:(length(B))-1
        plot(A,[f(x) for x in A],xlims=(minimum(B)-.1,maximum(B)+.1),label="f(x)",title="Metodo de Newton-Raphson",xlabel="x",ylabel="f(x)")
        plot!([B[i],B[i]],[0,f(B[i])],linewidth=3,marker=:square,markersize=4,alpha=.8)
        plot!([B[i],B[i+1]],[f(B[i]),0],linewidth=3,marker=:utriangle,markersize=4,alpha=.8)
        plot!(A,[0 for x in A],linewidth=2,linecolor=:black)
    end
end



newtonvisual (generic function with 1 method)

In [30]:
newtonvisual(x -> x^2 -3,x -> 2x,1)

 at In[16]:2 overwritten at In[29]:2.


In [31]:
newtonvisual(sin,cos,1.2)

[5] Aplica el método de Newton para encontrar raíces de distintas funciones. ¿Qué ocurre si empiezas con distintas condiciones iniciales? Prueba con distintas funciones.

In [32]:
newtonvisual(x->e^x-20,x-> e^x,1)

[6] ¿Qué tan rápido converge el método cuando esté cerca de una raíz. Utiliza `BigFloat`s. ¿Es mejor que bisección?

In [37]:
function biseccion2(f::Function,a,b,test=0)
    c=(b+a)/2
    l=[f(c)]
    i=1
    while abs(f(c))>1e-10
        if test==1          #codigo extra para testear la función
            @show (c,f(c),f(a),f(b))
        end
        if f(c)*f(a)<0
            if test==1
                println("ac")
            end
            b=c
            c=(a+b)/2
            elseif f(c)*f(b)<0
            if test==1
                println("bc")
            end
            a=c
            c=(a+b)/2
        end
        if i==1000
            return "fail"
        end
        i=i+1
        push!(l,c)
    end
    return l
end



biseccion2 (generic function with 2 methods)

, Any) in module Main at In[33]:2 overwritten at In[37]:2.


In [41]:
f(x)=x^3-7
df(x)=3x
x0=0



0

) in module Main at In[34]:1 overwritten at In[41]:1.


In [57]:
A=biseccion2(f,0,2)
B=newtonlist(f,df,1.5)
scatter(1:length(A),A,xlims=(0,length(A)+2),ylims=(A[end]-1,A[end]+1),
label="biseccion",title="comparacion",xlabel="n",ylabel="x_n")
scatter!(1:length(B),B,label="newton")

Sin embargo, es posible que el método de Newton *no converja*:

[7] El mismo código del método de Newton debería funcionar con números complejos. Utilízalo para encontrar raíces de la función $f(z) = z^3 -1$ **en el plano complejo**.

Dada una condición inicial, dibuja (por ejemplo) la parte imaginaria de la raíz a la cual converge (por ejemplo, después de un cierto número de pasos). Hazlo para una malla de condiciones iniciales en el plano. ¿Qué es lo que ves?

[8] Haz lo mismo para otras funciones en el plano complejo.

[9] Considera ahora cómo encontrar raíces de un sistema de ecuaciones, escritos en forma vectorial,

$$\mathbf{f}(\mathbf{x}) = \mathbf{0}.$$

Repite un desarrollo siguiendo la pauta de la pregunta [1] en este contexto.
¿Qué es lo que cambia? ¿Qué tipo de operación numérica necesitaríamos para llevar a cabo el método de Newton en este nuevo contexto?

In [65]:
newtonlist(z -> z^3 -1, z ->3z,-1/2+im/2,true)

(x[i],f(x[i]),df(x[i])) = (-0.5 + 0.5im,-0.75 + 0.25im,-1.5 + 1.5im)
(x[i],f(x[i]),df(x[i])) = (-0.8333333333333333 + 0.33333333333333337im,-1.3009259259259256 + 0.6574074074074073im,-2.5 + 1.0im)
(x[i],f(x[i]),df(x[i])) = (-1.3726053639846743 + 0.3805874840357599im,-2.9895983192156397 + 2.0960055013649064im,-4.1178160919540225 + 1.1417624521072798im)
(x[i],f(x[i]),df(x[i])) = (-2.177848058127283 + 0.6663238069031647im,-8.428770217158686 + 9.185326369194666im,-6.5335441743818485 + 1.9989714207094942im)
(x[i],f(x[i]),df(x[i])) = (-3.7508149161088116 + 1.5909384437878893im,-25.287866144609215 + 63.12008895673154im,-11.252444748326434 + 4.772815331363668im)
(x[i],f(x[i]),df(x[i])) = (-7.671976324138025 + 5.537201737223967im,253.11571490436899 + 807.9721930045066im,-23.015928972414073 + 16.6116052116719im)
(x[i],f(x[i]),df(x[i])) = (-17.100082678419092 + 33.837437332068845im,53736.07253997183 - 9059.421699060953im,-51.300248035257276 + 101.51231199620653im)
(x[i],f(x[i]),df(x[i])) = (267.0

15-element Array{Any,1}:
        -0.5+0.5im        
   -0.833333+0.333333im   
    -1.37261+0.380587im   
    -2.17785+0.666324im   
    -3.75081+1.59094im    
    -7.67198+5.5372im     
    -17.1001+33.8374im    
     267.082+419.578im    
     35171.4-74288.4im    
   1.42728e9+1.74181e9im  
  3.32255e17-1.65737e18im 
  8.78826e35+3.67113e35im 
 -2.12521e71-2.15086e71im 
 3.65585e140-3.04735e142im
         NaN+NaN*im       