<h3 style="text-align: center;">ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA</h3>
<h3 style="text-align: center;">UNIVERSIDAD DE SEVILLA</h3>
<h3 style="text-align: center;">MATEMÁTICA APLICADA A SISTEMAS DE INFORMACIÓN</h3>
<h3>Primera práctica de laboratorio</h3>
<p>En esta práctica estudiaremos métodos de optimización sin restricciones de funciones de una variable. Aunque nos centramos en el caso de encontar el mínimo de una función dada, todo lo que se comenta es fácilmente adaptable al caso de localizar eventualmente el máximo de una función $h(x)$ (en particular, basta estudiar el mínimo de la función opuesta, $-h(x)$). Es decir partimos del problema:</p>
<p>$$\min _{x\in[a,b]}f(x)$$</p>
<p>Gracias al teorema de Weierstrass sabemos que en un conjunto $D$ cerrado y acotado siempre se alcanza el máximo y el mínimo. Hemos estudiado métodos analíticos que nos permiten calcular dichos óptimos. En esta práctica nos centraremos en los métodos numéricos para la resolución de dichos problemas de optimización de funciones de una variable.</p>
<p>Supongamos que estamos interesados en calcular el mínimo de la función:</p>
<p>$$f(x)=x^2+e^x$$</p>
<p>en el intervalo $x\in[-1,3]$</p>

In [None]:
f(x)=x^2+exp(x)

<p>En la gráfica podemos apreciar cómo la función es unimodal en el intervalo $[-1,3]$:</p>

In [None]:
plot(f(x),(x,-1,3))

<h3>Método de la sección aúrea</h3>
<p>Si comenzamos a aplicar el método de la sección aúrea en nuestro intervalo $[-1,3]$, inicialmente:</p>
<p>$$a=-1, \,b=3,\, c=a+(1-r)(b-a),\, d=a+r(b-a),$$</p>
<p>con</p>
<p>$$r=\frac{\sqrt{5}-1}{2}$$</p>
<p>por tanto:</p>

In [None]:
a=-1;b=3;r=(sqrt(5)-1)/2;c=a+(1-r)*(b-a);d=a+r*(b-a);
print('a=',a,'; b=',b,'; c=',c,'; d=',d)

<p>Ahora tenemos que comprobar si $f(c)\leq f(d)$,</p>

In [None]:
f(c).n();f(d).n()

<p>Como estamos en ese caso, tenemos que cambiar $b=d$, $d=c$ y calcular un nuevo $c$.</p>

In [None]:
b=d;d=c;c=a+(1-r)*(b-a);
print('a=',a,'; b=',b,'; c=',c,'; d=',d)

In [None]:
print('a=',a.n(),'; b=',b.n(),'; c=',c.n(),'; d=',d.n())

<p>El criterio de parada dependerá de la cota de error que estemos considerando, en esta primera iteración, tenemos que $l_2=r(b-a)$ donde $a$ y $b$ son los valores iniciales.</p>

In [None]:
(b-a).n()

<p>Si queremos poder asegurar dos cifras decimales exactas, podemos escribir el algoritmo:</p>

In [None]:
error=10^(-2)

In [None]:
a=-1;b=3;r=(sqrt(5)-1)/2;c=a+(1-r)*(b-a);d=a+r*(b-a);l=b-a;k=1;
while l>=error:
    if f(c)<f(d):
        b=d;d=c;c=a+(1-r)*(b-a);l=b-a;
        print('iter:', k, '; a=',a.n(), '; b=',b.n())
    else:
        a=c;c=d;d=a+r*(b-a);l=b-a;
        print('iter:', k, '; a=',a.n(), '; b=',b.n())
    k=k+1

<h3>Método de Newton</h3>
<p>Si para este mismo problema hubiéramos usado el método de Newton, comenzando en $x_0=3$</p>

In [None]:
f(x)=x^2+exp(x)

In [None]:
fx=diff(f(x),x);fx2=diff(f(x),x,2);x0=3;iteraciones=8;
for i in range(iteraciones):
    x0=x0-fx(x=x0)/fx2(x=x0);
    print('iter',i+1,'; x0=',x0.n())

<p>Para poder aplicar el método de Newton necesitamos que se verifiquen las condiciones de Fourier. En la siguiente gráfica vemos cómo ni $f''(x)$ ni $f^{(3)}(x)$ se anulan en $[-1,3]$, además</p>
<p>$$f'(3)f^{(3)}(3)>0$$</p>
<p>por lo que la elección del punto de inicio ha sido la adecuada.</p>

In [None]:
fx3=f.diff(x,3)
plot(fx,(x,-1,3))+plot(fx2,(x,-1,3),color='red')+plot(fx3,(x,-1,3),color='green')

<p>Se aprecia la convergencia mucho más rápida de este método, como estamos buscando solución de la ecuación $f'(x)=0$, usando el método de parada dado por</p>
<p>$$ \epsilon_n\leq \frac{|f'(x)|}{\min \limits _{x\in[a,b]|f''(x)|}},$$</p>
<p>tendríamos que calcular una cota del valor absoluto de la segunda derivada de $f(x)$</p>

In [None]:
plot(fx2,(x,-1,3))


In [None]:
minder2=fx2(x=-1)

In [None]:
i=1;x0=3;eps=abs(fx(x=3))/minder2;
while eps>=error:
    x0=x0-fx(x=x0)/fx2(x=x0);
    eps=abs(fx(x=x0))/minder2;
    print('iter',i,'; x0=', x0.n(),'; error=', eps.n())
    i=i+1;

<h3>Método de interpolación cuadrático</h3>
<p>Como hemos visto en clase este método aproxima la función que queremos optimar mediante una parábola. Si consideramos el mismo ejemplo:</p>
<p>$$f(x)=x^2+e^x$$</p>
<p>por tanto si partimos de una terna $\{x_1,x_2,x_3\}$, con $x_1<x_2<x_3$ con $f(x_2)\leq f(x_1)$ y $f(x_2)\leq f(x_3)$,</p>
<p>podemos considerar en nuestro ejemplo $x_1=-1$ $x_2=1$ $x_3=3$,</p>
<p>la fórmula general del vértice de la parábola que pasa por $\{(x_1,f_1), (x_2,f_2),(x_3,f_3)\}$, es</p>
<p>$$\widehat{x}=\frac{1}{2}\frac{(x_2^2-x_3^2)f_1+(x_3^2-x_1^2)f_2+(x_1^2-x_2^2)f_3}{(x_2-x_3)f_1+(x_3-x_1)f_2+(x_1-x_2)f_3}$$</p>

In [None]:
f(x)=x^2+exp(x)

In [None]:
x1=-1;x2=1;x3=3;f1=f(x1);f2=f(x2);f3=f(x3)
x4=1/2*((x2^2-x3^2)*f1+(x3^2-x1^2)*f2+(x1^2-x2^2)*f3)/((x2-x3)*f1+(x3-x1)*f2+(x1-x2)*f3);f4=f(x4)

In [None]:
x4.n()

<p>Por tanto $x_1<\widehat x< x_2$, tenemos ahora que comparar las imágenes de $x_2$ y $\widehat x$ mediante $f$, para descartar uno de los extremos del intervalo, $x_1$ ó $x_3$:</p>

In [None]:
print('f(x1)=',f1.n(),'; f(x4)=',f4.n(),'; f(x2)=',f(x2).n())

<p>Así en la siguiente iteración, consideraríamos el conjunto de puntos $\{x_1,\widehat{x},x_2\}$. Hemos descartado el extremo $x_3$.</p>
<p>Podemos utilizar el criterio de parada $|\widehat{x}_{k}-\widehat{x}_{k-1}|\leq \epsilon$, para ello necesitamos al menos dos iteraciones o poner de inicio $\widehat{x}_0=10^{99}$, entendiendo que es un valor muy lejano al mínimo que queremos aproximar</p>

In [None]:
x3=x2;x2=x4;xk=x4;f3=f2;f2=f4;
x4=1/2*((x2^2-x3^2)*f1+(x3^2-x1^2)*f2+(x1^2-x2^2)*f3)/((x2-x3)*f1+(x3-x1)*f2+(x1-x2)*f3);f4=f(x4)

In [None]:
x4.n();x2.n()

In [None]:
abs(x4-xk).n()

<p>Usando dos iteraciones de la interpolación cuadrática no hemos conseguido ninguna cifra decimal exacta.</p>

In [None]:
print('f(x1)=',f1.n(),'; f(x4)=',f4.n(),'; f(x2)=',f(x2).n())

<p>Por lo tanto de nuevo descartamos $x_3$, la nueva terna sería $\{x_1,\widehat{x},x_2\}$, de esta forma si el criterio de parada fuese $|\widehat{x}_k-\widehat{x}_{k-1}|<10^{-2}$ tendriamos que seguir iterando:</p>

In [None]:
x3=x2;x2=x4;xk=x4;f3=f2;f2=f4
x4=1/2*((x2^2-x3^2)*f1+(x3^2-x1^2)*f2+(x1^2-x2^2)*f3)/((x2-x3)*f1+(x3-x1)*f2+(x1-x2)*f3);f4=f(x4)

In [None]:
x4.n();x2.n()

In [None]:
abs(xk-x4).n()

<p>No se ha alcanzado el criterio de parada, por lo que seguimos iterando</p>

In [None]:
print('f(x1)=',f1.n(),'; f(x2)=',f2.n(),'; f(x4)=',f(x4).n())

<p>Ahora descartamos $x_1$ y seguimos iterando</p>

In [None]:
xk=x4;x1=x2;x2=x4;f1=f2;f2=f4;
x4=1/2*((x2^2-x3^2)*f1+(x3^2-x1^2)*f2+(x1^2-x2^2)*f3)/((x2-x3)*f1+(x3-x1)*f2+(x1-x2)*f3);f4=f(x4)

In [None]:
abs(xk-x4).n()

In [None]:
x4.n()

<p>Ya hemos obtenido la precisión requerida, mediante cuatro iteraciones del método de interpolación cuadrática.</p>
<h3>Interpolación cúbica</h3>
<p>Ahora vamos a interpolar mediante un polinomio de grado 3, lo que se conoce como interpolación cúbica. El teorema de interpolación nos dice que necesitamos conocer cuatro puntos por donde pase nuestro polinomio, o dos donde conozcamos cúanto vale $f(x_i)$ y también $f'(x_i)$.</p>
<p>Si partimos de un intervalo donde la función es unimodal, el signo de la derivada será $f'(x_1)<0$ y $f'(x_2)>0$. Supongamos por tanto, que tenemos un intervalo $[x_1,x_2]$ donde la función es unimodal, y conocidos: $f_1=f(x_1)$, $f'_1=f'(x_1)$, $f_2=f(x_2)$, $f'_2=f'(x_2)$.</p>
<p>En ese caso el mínimo del polinomio cúbico interpolador es:</p>
<p>$$\widehat{x}=x_2-\left(\frac{f'_2+w-z}{f'_2-f_1'+2w}\right)(x_2-x_1)$$</p>
<p>donde</p>
<p>$$z=\frac{3(f_1-f_2)}{x_2-x_1}+f'_1+f'_2\qquad w=\sqrt{z^2-f'_1f'_2}$$</p>
<p>Una vez que conozcamos el mínimo procedemos a eliminar uno de los dos extremos, desechando aquél donde el signo de la derivada coincida con el signo de la derivada en $\widehat{x}$.</p>
<p>Como en el caso de interpolación cuadrática, usaremos el criterio de parada, $|\widehat{x}_{k+1}-\widehat{x}_k|<\epsilon$</p>
<p>Usaremos el mismo ejemplo</p>
<p>$$f(x)=x^2+e^x$$</p>
<p>en el intervalo $[-1,3]$:</p>

In [None]:
f(x)=x^2+exp(x);fx=f.diff()

In [None]:
x1=-1.;x2=3.;f1=f(x1);f2=f(x2);fp1=fx(x1);fp2=fx(x2); xk=10^(99);k=1;
z=3*(f1-f2)/(x2-x1)+fp1+fp2;w=sqrt(z^2-fp1*fp2);
x3=x2-(fp2+w-z)/(fp2-fp1+2*w)*(x2-x1);f3=f(x3);fp3=fx(x3);

In [None]:
x3.n();fp3.n()

<p>Como $f'(x_3)>0$ y suponemos que nuestra función es unimodal en el intervalo dado, descartaríamos el extremo $x_2$ y volveríamos a iterar:</p>

In [None]:
xk=x3;x2=x3;f2=f3;fp2=fp3;
z=3*(f1-f2)/(x2-x1)+fp1+fp2;w=sqrt(z^2-fp1*fp2);
x3=x2-(fp2+w-z)/(fp2-fp1+2*w)*(x2-x1);f3=f(x3);fp3=fx(x3);

In [None]:
abs(xk-x3).n()

<p>Si tuviésemos la condicion $|\widehat{x}_k-\widehat{x}_{k-1}|<10^{-2}$, no sería suficiente. Estudiando el signo de $f'(x_3)$</p>

In [None]:
fp3.n()

In [None]:
xk=x3;x1=x3;f1=f3;fp1=fp3;
z=3*(f1-f2)/(x2-x1)+fp1+fp2;w=sqrt(z^2-fp1*fp2);
x3=x2-(fp2+w-z)/(fp2-fp1+2*w)*(x2-x1);f3=f(x3);fp3=fx(x3);

In [None]:
abs(xk-x3).n()

In [None]:
x3

<p>Si el criterio de parada es $|\widehat{x}_k-\widehat{x}_{k-1}|<10^{-2}$, ya tendríamos la aproximación $x_3$, tras tres iteraciones.</p>

In [None]:
NUMERO_ALUMNO = 1

NOMBRE_FICHERO_EXAMEN = 'Ex_Lab_MASI1_t.htl'
load('codigo_examinar_html.sage')

if NUMERO_ALUMNO > 0:
    lector_examenes(NOMBRE_FICHERO_EXAMEN,NUMERO_ALUMNO,False)
