<p><img alt="DataOwl" width=150 src="http://gwsolutions.cl/Images/dataowl.png", align="left", hspace=0, vspace=5></p>

<h1 align="center">Aplicación de la derivada</h1>

<h4 align="center">Ecuaciones de una variable y Optimización</h4>
<pre><div align="center"> La idea de este notebook es que sirva para iniciarse en conceptos
matemáticos para aplicar la derivada numérica en la resolución
de ecuaciones de una variable y optimización.</div>

# Aplicaciones de la derivada


En clases anteriores, abordamos el problema de encontrar dónde una función se anula. En este Notebook veremos que las derivadas también nos pueden ayudar en este desafío, además de poder aplicarse en otros problemas, como la aproximación de una función mediante polinomios y la optimización de una función.

## 5. Optimización (continuación)

La clase anterior vimos la intuición tras la optimización de funciones derivables, mencionando que la derivada indica la pendiente de la función en un punto y cómo se interpreta el que ésta se anule en contraposición con el valor que adopta la segunda derivada. Hoy veremos dos métodos que pretenden resolver de forma eficiente el problema de encontrar mínimos locales de una función, y mencionaremos sus virtudes y defectos.

### 5.1 Método de Máximo Descenso

<img  src="http://flennerhag.com/img/sgd/sgd_1.png" alt="Método de máximo descenso" width=280 align="center" hspace=0 vspace=5 padding:5px />


Imaginemos que estamos en plena caminata en un cerro como el San Cristóbal, y una niebla muy densa nos impide ver en cualquier dirección. Queremos bajar para ubicarnos en un lugar más seguro, pero el cerro tiene varios accidentes topográficos, por lo cual es difícil adivinar qué camino seguir. Una estrategia para llegar abajo lo más rápido posible, es tantear el terreno cuidadosamente y movernos hacia donde notemos la mayor pendiente descendente; luego, volver a buscar dónde hay mayor pendiente descendente y avanzar, e iterar.

Esta intuición da forma al **Método de Máximo Descenso**, el cual inicia desde un punto $x_0$ y a partir de él determina hacia dónde moverse, y con qué criterio establecer que se llegó a un mínimo aproximado. La secuencia de pasos está dada por

$$x_{n+1}\ =\ x_n-\gamma\cdot f'(x_n)$$

donde $\gamma>0$ es algún valor pequeño denominado *paso*, y el signo $-$ se ocupa de dar la dirección apropiada para el avance de nuestra sucesión de puntos. Generalmente, se usa $\gamma=dx$, el paso utilizado para calcular $f'(x)$ numéricamente, ya que economiza la cantidad de variables del programa. Como es un método de aproximación, es necesario establecer un umbral de aceptación, para tener una solución suficientemente buena en un tiempo acotado.

In [1]:
# Importando las librerías
%matplotlib notebook
import numpy as np
import matplotlib.colors as mcolors
import matplotlib.pyplot as plt
import experimento6 as ex

In [2]:
def f(x): # Alguna función de ejemplo
    return 0.5 - np.sin(2 * x)

def g(x): # Alguna función de ejemplo
    return (np.exp(-x ** 2) - x) / ((x + 1) ** 2 + (x - 1) ** 2)

def h(x):
    return x ** 4 - 3 * x ** 3 + 2

In [3]:
x = np.linspace(-10, 10, 1000)

plt.plot(x, h(x))

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x252bd2d5708>]

In [4]:
x0 = 7
dx = 0.01
error = 0.00001
xopt, yopt, cont = ex.descenso(g, x0, dx, error)
print(xopt, yopt, cont)

1.5200000000001062 -0.2145931677442509 548


### 5.2 Método de Newton

Este método ya lo conocemos. Como queremos minimizar una función, deseamos encontrar un valor $\bar{x}$ en el cual $f(\bar{x})=0$. Se puede usar el método de Newton-Raphson (visto la clase anterior) pero esta vez aplicado a $f'(x)$, con lo cual el algoritmo estaría dado por la sucesión

$$x_{n+1}\ =\ x_n-\frac{f'(x_n)}{f''(x_n)}$$

El problema es que debemos tener una forma eficiente de calcular $f''$ en cada punto que se desee evaluar. En clases anteriores se ha calculado $f'$ mediante distintos métodos, uno de los cuales requería conocer $f$ de forma explícita, y en este caso es muy probable que no sepamos expresar la derivada de esta misma manera. Por lo tanto, recurriremos al cálculo numérico de las derivadas, pero sólo en el punto $x_n$ en que se está evaluando.

Sabemos que se puede aproximar muy bien $f'$ como derivada *backward*, *forward* o central. Se puede definir la derivada de segundo orden por diferencia central como

$$f_{\textrm{cent}}''(x)\ =\ \frac{f_{\textrm{for}}'(x)-f_{\textrm{back}}'(x)}{h}\ =\ \frac{\frac{f(x+h)-f(x)}{h}-\frac{f(x)-f(x-h)}{h}}{h}\ =\ \frac{f(x+h)-2f(x)+f(x-h)}{h^2}$$

donde, por lo general, se utiliza $dx$ en vez de $h$. Más generalmente, iterando esta idea de calcular diferencias centrales, se puede deducir que

$$f_{\textrm{cent}}^{[n]}(x)\ =\ \displaystyle\frac{1}{h^n}\sum_{k=0}^n(-1)^k\binom{n}{k}f\left(x+\left(\frac{n}{2}-k\right)h\right)$$
donde $\binom{n}{k}=\frac{n!}{k!(n-k)!}$. Note que, si $n$ es impar, resulta conveniente promediar $f_{\textrm{cent}}^{[n]}\left(x+\frac{h}{2}\right)$ y $f_{\textrm{cent}}^{[n]}\left(x-\frac{h}{2}\right)$.

El Método de Newton funciona bien cuando se escoge un valor inicial $x_0$ tal que tanto éste como el óptimo $\bar{x}$ pertenezcan a un intervalo $[a,b]$ tal que $f$ es convexa en él, es decir, tal que $f''(x)\ge 0$ para $x\in[a,b]$.

In [5]:
x0 = 10
dx = 0.001
error = 0.00001

xopt, yopt, dyopt = ex.newtonoptim(h, x0, dx, error)
print(xopt, yopt, dyopt)

Solución tras  8  iteraciones.
2.249999939956084 -6.542968749999961 4.7841108852253456e-06


## 6. Ajuste de datos

Sin entrar en mucho detalle, la interpolación de datos pretende completar la información entre datos que podríamos considerar insuficientes. Existen varias formas de hacerlo, como la interpolación lineal (en que se une los datos observados con rectas), la interpolación polinomial (como la interpolación de Legendre) que es bastante inestable conforme aumenta la cantidad de puntos observados y la interpolación polinomial por tramos(como el spline cúbico). En esta breve sección, veremos cómo aplicar la interpolación con spline cúbico, pretendiendo comparar datos mensuales con datos semanales y diarios en el índice del dólar.

Una de las virtudes que se espera introducir, es que se pueda predecir con suficiente precisión datos que no tenemos (en el caso de los datos mensuales, no tenemos información semanal, diaria o continua). Además, la función interpoladora va a ser diferenciable, lo cual es imposible de tener de los datos reales, pues éstos se miden de forma discreta.

Finalmente, también mostraremos por primera vez las librerías **Scipy** y **csv**, para el tratamiento científico de datos y para la lectura de datos en formato .csv, respectivamente.

In [6]:
import csv


# Leemos datos mensuales

with open('USDMensual.csv', newline='') as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        print(row)

OrderedDict([('ï»¿"Date"', 'Jul 20'), ('Price', '96.74'), ('Open', '97.39'), ('High', '97.61'), ('Low', '96.24'), ('Vol.', '-'), ('Change %', '-0.67%')])
OrderedDict([('ï»¿"Date"', 'Jun 20'), ('Price', '97.39'), ('Open', '98.20'), ('High', '98.24'), ('Low', '95.72'), ('Vol.', '-'), ('Change %', '-0.97%')])
OrderedDict([('ï»¿"Date"', 'May 20'), ('Price', '98.34'), ('Open', '99.12'), ('High', '100.55'), ('Low', '97.94'), ('Vol.', '-'), ('Change %', '-1.23%')])
OrderedDict([('ï»¿"Date"', 'Apr 20'), ('Price', '99.57'), ('Open', '98.98'), ('High', '100.93'), ('Low', '98.81'), ('Vol.', '-'), ('Change %', '0.52%')])
OrderedDict([('ï»¿"Date"', 'Mar 20'), ('Price', '99.05'), ('Open', '98.12'), ('High', '102.99'), ('Low', '94.66'), ('Vol.', '-'), ('Change %', '0.94%')])
OrderedDict([('ï»¿"Date"', 'Feb 20'), ('Price', '98.13'), ('Open', '97.37'), ('High', '99.91'), ('Low', '97.37'), ('Vol.', '-'), ('Change %', '0.76%')])
OrderedDict([('ï»¿"Date"', 'Jan 20'), ('Price', '97.39'), ('Open', '96.50'),

In [7]:
precio = []
fecha = []
with open('USDMensual.csv', newline='') as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        fecha.append(row['ï»¿"Date"'])
        precio.append(float(row['Price'].replace("'","")))

In [8]:
# Podemos ver que los datos no están ordenados cronológicamente, por lo que tenemos que reordenarlos, dándolos vuelta

precio.reverse()
fecha.reverse()

In [9]:
print(fecha)

['Aug 00', 'Sep 00', 'Oct 00', 'Nov 00', 'Dec 00', 'Jan 01', 'Feb 01', 'Mar 01', 'Apr 01', 'May 01', 'Jun 01', 'Jul 01', 'Aug 01', 'Sep 01', 'Oct 01', 'Nov 01', 'Dec 01', 'Jan 02', 'Feb 02', 'Mar 02', 'Apr 02', 'May 02', 'Jun 02', 'Jul 02', 'Aug 02', 'Sep 02', 'Oct 02', 'Nov 02', 'Dec 02', 'Jan 03', 'Feb 03', 'Mar 03', 'Apr 03', 'May 03', 'Jun 03', 'Jul 03', 'Aug 03', 'Sep 03', 'Oct 03', 'Nov 03', 'Dec 03', 'Jan 04', 'Feb 04', 'Mar 04', 'Apr 04', 'May 04', 'Jun 04', 'Jul 04', 'Aug 04', 'Sep 04', 'Oct 04', 'Nov 04', 'Dec 04', 'Jan 05', 'Feb 05', 'Mar 05', 'Apr 05', 'May 05', 'Jun 05', 'Jul 05', 'Aug 05', 'Sep 05', 'Oct 05', 'Nov 05', 'Dec 05', 'Jan 06', 'Feb 06', 'Mar 06', 'Apr 06', 'May 06', 'Jun 06', 'Jul 06', 'Aug 06', 'Sep 06', 'Oct 06', 'Nov 06', 'Dec 06', 'Jan 07', 'Feb 07', 'Mar 07', 'Apr 07', 'May 07', 'Jun 07', 'Jul 07', 'Aug 07', 'Sep 07', 'Oct 07', 'Nov 07', 'Dec 07', 'Jan 08', 'Feb 08', 'Mar 08', 'Apr 08', 'May 08', 'Jun 08', 'Jul 08', 'Aug 08', 'Sep 08', 'Oct 08', 'Nov 08',

In [10]:
# Como el arreglo fecha no es numérico, creamos uno que sí lo sea y lo pueda representar

mes1 = 2000 + 8 / 12
mes2 = 2020 + 7 / 12

fechas = np.arange(mes1, mes2 + 1 / 12, 1/12)

In [12]:
fig = plt.figure(figsize=(8, 5))
plt.plot(fechas, precio, 'b')
plt.xlabel('Año')
plt.ylabel('Índice del dólar')
plt.title('Registro mensual de índice del dólar')
plt.show()

<IPython.core.display.Javascript object>

In [13]:
from scipy.interpolate import interp1d


f2 = interp1d(fechas, precio, kind='cubic')

In [14]:
# Evaluamos las fechas en la función spline que calculamos

precios_knots = f2(fechas)

In [15]:
# Vemos que el spline efectivamente pasa por todos los puntos observados en el registro

fig2 = plt.figure(figsize=(8, 5))

plt.plot(fechas, precio, 'b', label='Datos')
plt.plot(fechas, precios_knots, 'r', marker='.', markersize=3, linestyle='', label='Spline')
plt.xlabel('Año')
plt.ylabel('Índice del dólar')
plt.title('Nudos de spline cúbico sobre datos')
plt.legend()
plt.show()

<IPython.core.display.Javascript object>

In [19]:
# Evitamos evaluar el spline en los extremos del arreglo (cosas que pasan)

fechas_spline_semana = np.linspace(mes1 + 1 / 12, mes2 - 1 / 12, 100000)
precios_spline_semana = f2(fechas_spline_semana)

In [24]:
fig3 = plt.figure(figsize=(8, 5))

plt.plot(fechas_spline_semana, precios_spline_semana, 'r', label='Spline', linewidth=1)
plt.plot(fechas, precio, '.b', label='Registro mensual', markersize=2)
plt.legend()
plt.xlabel('Año')
plt.ylabel('Índice del dólar')
plt.show()

<IPython.core.display.Javascript object>

In [25]:
# Leemos ahora los datos semanales

preciosem = []
fechasem = []
with open('USDSemanal.csv', newline='') as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        fechasem.append(row['ï»¿"Date"'])
        #precio.append(row['Price'])
        preciosem.append(float(row['Price'].replace("'","")))

In [26]:
preciosem.reverse()
fechasem.reverse()

In [27]:
sem1 = 2010 + 2 / (52)
sem2 = 2010 + 27 / (52)
fechassem = np.linspace(sem1, sem2, len(fechasem))

In [28]:
fig4 = plt.figure(figsize=(9, 4))
ax1 = None
ax2 = None

# Gráfico de arriba
ax1 = plt.subplot2grid((1, 8), (0, 0), colspan=6, fig=fig4)
ax1 = plt.plot(fechas_spline_semana, precios_spline_semana, color='red',label='Spline cúbico Reg. mensual' , linewidth=1)
ax1 = plt.plot(fechassem, preciosem, color='blue', label='Reg. semanal', linestyle='', marker='.', markersize=3)
plt.xlabel('Año')
plt.ylabel('Índice del dólar')
plt.legend()

ax2 = plt.subplot2grid((1, 8), (0, 6), colspan=2, fig=fig4)
ax2.set_xlim((2009.5, 2011))
ax2 = plt.plot(fechas_spline_semana, precios_spline_semana, color='red',label='Spline cúbico Reg. mensual' , linewidth=1)
ax2 = plt.plot(fechassem, np.asarray(preciosem), color='blue', label='Reg. semanal', linestyle='', marker='.', markersize=3)
plt.xlabel('Año')

fig4.tight_layout()
plt.show()


<IPython.core.display.Javascript object>

## Ejercicios

**1.-** Utilice distintas funciones (por ejemplo, las definidas en laboratorios anteriores) y pruebe los módulos del Método de Descenso Máximo y de Newton. Si quisiera encontrar un máximo en lugar de un mínimo, ¿cómo tendría que cambiar estar funciones?

**2.-** Lea el archivo USDDiario.csv y compare gráficamente los datos con los interpolados de los datos mensuales. Note que, para definir los valores dia1 y dia2 (tal como mes1, mes2 o semana1, semana2), tiene que definirlos como
```Python
dia1 = año + numero_de_dia_1_en_relacion_con_el_año / 365.25
dia1 = año + numero_de_dia_2_en_relacion_con_el_año / 365.25
```
Por ejemplo, si su primer dato es del 4 de marzo del 2019, el día 4 de marzo corresponde al día $31+28+4=63$ del año (ojo en caso de que el año sea bisiesto). Pruebe además distintos tipos de interpolación, para lo cual puede revisar la documentación de <a href='https://docs.scipy.org/doc/scipy/reference/generated/scipy.interpolate.interp1d.html#scipy.interpolate.interp1d'>interp1d</a>.