# El método de Newton

El método de Newton (también llamado algoritmo de Newton-Raphson) constituye otro método numérico iterativo para encontrar raíces de funciones. 

Requiere más información sobre la función, pero a cambio puede funcionar mejor. Derivaremos e implementaremos el método en este notebook.

[1] (Esta pregunta es para llevarse a cabo con papel y pluma.)

Considera una función $f: \mathbb{R} \to \mathbb{R}$.
Supón que $x_0$ es una adivinanza inicial de una raíz, y que $x^*$ es la raíz exacta pero 
desconocida. Sigue los siguientes pasos para derivar el método de Newton.

(i) Supón que $x_0$ es suficientemente cercana a $x^*$. Define $\delta$ como la distancia  (con signo) de $x_0$ desde $x^*$. 

(ii) Escribe la ecuación que corresponde a que $x^*$ sea una raíz de la función, y exprésala en términos de $\delta$. 

(iii) Desarrolla esta ecuación en una serie de Taylor a primer orden, para encontrar un valor aproximado de $\delta$.

(iv) Así encuentra una ecuación para la siguiente aproximación $x_1$ a la raíz, $x_1 = x_0 + \delta$. 

[2] Demuestra que el método Babilónico es un caso especial del método de Newton. [Pista: ¿Para cuál función $f$?]

### [2]

Si tomamos $f(x)=x^2 - y$ para una y fija, tenemos que $\frac{df}{dx}= 2x$. Así, claramente para el método de Newton-Raphson:

$$x_{n+1} = x_n - \frac{f(x_n)}{\frac{df}{dx}\Big|_{x_n}} = x_n - \frac{x_n^2 - y}{2x_n}=\frac{2x_n^2 -x_n^2 +y}{2x_n} =\frac{x_n + \frac{y}{x_n}}{2}$$

[3] Escribe una función que implementa el método de Newton. Puedes suponer que el usuario provenga tanto la función `f` como su derivada `fp` como argumentos a la función `newton` (así como la condición inicial `x0`). [Posteriormente veremos cómo evitar tener que proveer también la derivada.]

In [1]:
function newton(f::Function,df::Function,x0;tol=1e-15,test=false)
    x=x0
    i=1
    while abs(f(x))>tol
        if test==true
            @show (x,f(x),df(x))
        end
        if i==1000
            return "fail"
        end
        i+=1
        x=x-(f(x)/df(x))
    end
    return x
end
function newtonlist(f::Function,df::Function,x0;tol=1e-15,test=false)
    x=[]
    push!(x,x0)
    i=1
    while abs(f(x[i]))>tol
        if test==true
            @show (x[i],f(x[i]),df(x[i]))
        end
        if i==1000
            return "fail"
        end
        push!(x,x[i]-(f(x[i])/df(x[i])))
        i+=1
    end
    return x
end


newtonlist (generic function with 1 method)

In [2]:
newton(x -> x^2 -2,x -> 2x,1.0)

1.4142135623730951

[4] Dibuja (e.g. con `Plots.jl`) la dinámica del método iterativo, dada una función $f$ y una condición inicial $x_0$. Para hacerlo, líneas entre $(x_n, 0)$ y $(x_n, f(x_n))$, así como entre $(x_n, f(x_n)$ y $(x_{n+1}, 0)$. Hazlo interactivo con `Interact.jl`. Viendo la figura, interpreta geométricamente lo que está haciendo el método de Newton-Raphson.

In [3]:
using Plots, Interact
gr()

Plots.GRBackend()

In [4]:
newtonlist(x -> x^2-5,x -> 2x,1.0)

7-element Array{Any,1}:
 1.0    
 3.0    
 2.33333
 2.2381 
 2.23607
 2.23607
 2.23607

In [5]:
function newtonvisual(f,df,x0)
    B=newtonlist(f,df,x0)
    A=linspace(minimum(B)-.1,maximum(B)+.1,100)
    @manipulate for i in 1:(length(B))-1
        plot(A,[f(x) for x in A],xlims=(minimum(B)-.1,maximum(B)+.1),label="f(x)",title="Metodo de Newton-Raphson",xlabel="x",ylabel="f(x)")
        plot!([B[i],B[i]],[0,f(B[i])],linewidth=3,marker=:square,markersize=4,alpha=.8)
        plot!([B[i],B[i+1]],[f(B[i]),0],linewidth=3,marker=:utriangle,markersize=4,alpha=.8)
        plot!(A,[0 for x in A],linewidth=2,linecolor=:black)
    end
end

newtonvisual (generic function with 1 method)

In [6]:
newtonvisual(x -> x^2 -3,x -> 2x,1)

In [7]:
newtonvisual(sin,cos,1.2)

[5] Aplica el método de Newton para encontrar raíces de distintas funciones. ¿Qué ocurre si empiezas con distintas condiciones iniciales? Prueba con distintas funciones.

In [8]:
newtonvisual(x->log(x^2), x-> ((1/(x^2))*2x),3)

In [9]:
newtonvisual(x->tan(x)-x, x-> (sec(x))^2 -1,.5)

[6] ¿Qué tan rápido converge el método cuando esté cerca de una raíz. Utiliza `BigFloat`s. ¿Es mejor que bisección?

In [10]:
function biseccion2(f::Function,a,b,test=0)
    c=(b+a)/2
    l=[f(c)]
    i=1
    while abs(f(c))>1e-10
        if test==1          #codigo extra para testear la función
            @show (c,f(c),f(a),f(b))
        end
        if f(c)*f(a)<0
            if test==1
                println("ac")
            end
            b=c
            c=(a+b)/2
            elseif f(c)*f(b)<0
            if test==1
                println("bc")
            end
            a=c
            c=(a+b)/2
        end
        if i==1000
            return "fail"
        end
        i=i+1
        push!(l,c)
    end
    return l
end

biseccion2 (generic function with 2 methods)

In [11]:
f(x)=x^3-7
df(x)=3x^2
x0=0

0

In [12]:
A=biseccion2(f,0,2)
B=newtonlist(f,df,3)
scatter(1:length(A),A,xlims=(0,length(A)+2),ylims=(A[end]-1,A[end]+1),
label="biseccion",title="comparacion",xlabel="n",ylabel="x_n")
scatter!(1:length(B),B,label="newton")

Sin embargo, es posible que el método de Newton *no converja*:

[7] El mismo código del método de Newton debería funcionar con números complejos. Utilízalo para encontrar raíces de la función $f(z) = z^3 -1$ **en el plano complejo**.

Dada una condición inicial, dibuja (por ejemplo) la parte imaginaria de la raíz a la cual converge (por ejemplo, después de un cierto número de pasos). Hazlo para una malla de condiciones iniciales en el plano. ¿Qué es lo que ves?

In [13]:
#[7]
A=newtonlist(z -> z^3 -1, z ->3z^2,-1/2+im/2)
println(A[end])
scatter(1:length(A),imag(A),xlabel="n",ylabel="Im[ z_n ]",title="raíz de función compleja")

-0.5 + 0.8660254037844386im


In [14]:
A=newtonlist(z -> z^3 -1, z ->3z^2,-1-im)
println(A[end])
scatter(1:length(A),imag(A),xlabel="n",ylabel="Im[ z_n ]",title="raíz de función compleja")

-0.5 - 0.8660254037844386im


[8] Haz lo mismo para otras funciones en el plano complejo.

In [15]:
#[8]
A=newtonlist(z -> 4z^5 + z^3 + 2, z -> 20z^4 +3z^2,im)
println(A[end])
B=newtonlist(z -> 4z^5 + z^3 + 2, z -> 20z^4 +3z^2,5-im)
println(B[end])
scatter(1:length(A),imag(A),label="raíz 1",xlabel="n",ylabel="Im[ z_n ]",title="raíz en complejos")
scatter!(1:length(B),imag(B),label="raíz 2")

-0.24822852336783663 + 0.8848152694619943im
0.6566658141208613 - 0.5418222689504654im


In [16]:
A=newtonlist(z -> log(z) + 3z^3 + 2, z -> 1/z + 9z^2 ,im)
println(A[end])
B=newtonlist(z -> log(z) + 3z^3 + 2, z -> 1/z + 9z^2 ,-im)
println(B[end])
scatter(1:length(A),imag(A),label="raíz 1",xlabel="n",ylabel="Im[ z_n ]",title="raíz en complejos")
scatter!(1:length(B),imag(B),label="raíz 2")

0.29685537950210583 + 0.8622318958676023im
0.29685537950210583 - 0.8622318958676023im


In [17]:
A=newtonlist(z -> log(sec(z)+tan(z)), z -> sec(z) ,im)
println(A[end])
B=newtonlist(z -> log(sec(z)+tan(z)), z -> sec(z) ,6-im)
println(B[end])
scatter(1:length(A),imag(A),label="raíz 1",xlabel="n",ylabel="Im[ z_n ]",title="raíz en complejos")
scatter!(1:length(B),imag(B),label="raíz 2")

7.814823530034392e-17 + 1.0174983278892283e-19im
6.283185307179586 + 1.7957098481791167e-18im


[9] Considera ahora cómo encontrar raíces de un sistema de ecuaciones, escritos en forma vectorial,

$$\mathbf{f}(\mathbf{x}) = \mathbf{0}.$$

Repite un desarrollo siguiendo la pauta de la pregunta [1] en este contexto.
¿Qué es lo que cambia? ¿Qué tipo de operación numérica necesitaríamos para llevar a cabo el método de Newton en este nuevo contexto?

### [9]

Usando la aproximación de $\vec{f}(\vec{x} + \vec{\delta})$ por una serie de taylor, podemos obtener la siguiente fórmula

$$\vec{f}(\vec{x} + \vec{\delta}) \approx \vec{f}(\vec{x}) + J_f(\vec{x}) \vec{\delta} =0 \implies \vec(x_{n+1}) = \vec{x_n} - J_f(\vec{x_n})^{-1} \vec{f}(\vec{x_n})$$

Es decir, para realizar esta operación numérica, tendríamos que realizar la multiplicación de una matriz por un vector, a saber, de la matriz jacobiana de la función vectorial deseada a la cual le queremos sacar raíces

In [18]:
function newtonlist2(f::Function,df::Function,x0;tol=1e-15,test=false)
    x=[]
    push!(x,x0)
    i=1
    while abs(f(x[i]))>tol
        if test==true
            @show (x[i],f(x[i]),df(x[i]))
        end
        if i==100
            break
        end
        push!(x,x[i]-(f(x[i])/df(x[i])))
        i+=1
    end
    return x
end


newtonlist2 (generic function with 1 method)

In [61]:
M=zeros(400,400)
X=linspace(-10,10,400)
Y=linspace(-10,10,400)
for i in 1:length(X)
    for j in 1:length(Y)
        M[i,j]=real(newtonlist2(z -> z^3 - 3^z, z ->3z^2 - log(3)*3^z,X[i]+im*Y[j])[end])
    end
end

In [60]:
heatmap(M)

In [65]:
M=zeros(400,400)
X=linspace(-10,10,400)
Y=linspace(-10,10,400)
for i in 1:length(X)
    for j in 1:length(Y)
        M[i,j]=imag(newtonlist2(z -> z^3 - 1, z ->3z^2 ,X[i]+im*Y[j])[end])
    end
end

In [66]:
heatmap(M)