<img src="escudo_utfsm.gif" style="float:right;height:100px">
<img src="IsotipoDIisocolor.png" style="float:left;height:100px">
<center>
    <h1> INF/ILI 285 Computación Científica I</h1>
    <h1> Tarea N°4: Extendiendo el Método de Newton </h1>
    <h3> [S]cientific [C]omputing [T]eam 2019</h3>
</center>
<p>
<center>Septiembre 2019 - v1.0</center>
</p>

---

In [1]:
from __future__ import print_function
import numpy as np
import matplotlib.pyplot as plt
from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets

## Contexto

Un sistema de ecuaciones no lineales es un sistema en el cual la salida del problema no es linealmente proporcional a las entradas.
Este problema se puede representar vectorialmente de la siguiente manera:

\begin{equation*}
    \mathbf{F}(\mathbf{x})=\mathbf{y},
\end{equation*}

donde $\mathbf{F}:\mathbb{R}^n\rightarrow \mathbb{R}^n$ es una función no lineal, $\mathbf{x} \in \mathbb{R}^{n}$ e $\mathbf{y} \in \mathbb{R}^{n}$. Como se vio en clases, podemos solucionar este problema usando el método de *Newton multivariado*:

\begin{equation*}
    \mathbf{x_{k+1}}=\mathbf{x_k}-J_{\mathbf{G}}^{-1}(\mathbf{x_k})\mathbf{G}(\mathbf{x_k}),
\end{equation*}

donde $\mathbf{G}({\mathbf{x}})=\mathbf{F}(\mathbf{x})-\mathbf{y}=\mathbf{0}$, o sea, se está realizando una busqueda de raíces, y $J_{\mathbf{G}}(\mathbf{x_k}) \in \mathbb{R}^{n\times n}$ es la matriz jacobiana de $\mathbf{G}$. Para evitar calcular inversas, la iteración puede ser representada de la siguiente manera:
\begin{align}
    \mathbf{x_{k+1}} &= \mathbf{x_k}-\delta\mathbf{x_k}, \\
    J_{\mathbf{G}}(\mathbf{x_k})\delta\mathbf{ x_k} &= \mathbf{G}(\mathbf{x_k}).
\end{align}

### Sistema no lineal sobredeterminado

En la asignatura se aprendió a resolver sistemas no lineales con Newton multivariado cuando $\mathbf{F}$ va de $\mathbb{R}^n$ a $\mathbb{R}^n$. Ahora veremos como resolver el caso en el que $\mathbf{F}$ va de $\mathbb{R}^n$ a $\mathbb{R}^m$, con $m\geq n$.

Al desarrollar un problema de busqueda de raíces multivariado usando Newton multivariado, nos toparemos con que la matriz jacobiana $J_{\mathbf{G}}(\mathbf{x_k})$ tiene dimensiones $m\times n$, y por lo tanto debemos resolver un sistema sobredeterminado. Se introduce entonces el método de *Gauss-Newton*, el cual es similar el Método de Newton multivariado pero en vez de resolver el sistema de ecuaciones lineales sobredeterminado

$$
    J_{\mathbf{G}}(\mathbf{x}_k)\,\delta\mathbf{x}_k = \mathbf{G}(\mathbf{x}_k),
$$

resuelve el siguiente problema de mínimos cuadrados

$$
    \min_{\delta\mathbf{x}_k \in \mathbb{R}^n} \left\lVert J_{\mathbf{G}}(\mathbf{x}_k)\,\delta\mathbf{x}_k - \mathbf{G}(\mathbf{x}_k) \right\rVert_2^2.
$$

Para resolver esto, usaremos las ecuaciones normales:
\begin{equation*}
    J_{\mathbf{G}}^T(\mathbf{x_k})J_{\mathbf{G}}(\mathbf{x_k})\delta\mathbf{ x_k}=J_{\mathbf{G}}^T(\mathbf{x_k})\mathbf{G}(\mathbf{x_k}).
\end{equation*}

Para evitar tener matrices singulares, agregaremos una pequeña perturbación a la diagonal de la matriz $J_{\mathbf{G}}(\mathbf{x_k})^T\,J_{\mathbf{G}}(\mathbf{x_k})$ igual a un factor real no negativo $\lambda$ (denominado *factor de amortiguamiento*) por la matriz identidad. Esta modificación, introducida por Kenneth Levenberg, suele ser recalculada en cada iteración. Finalmente, nuestro algoritmo será:
\begin{align}
    \mathbf{x_{k+1}} &= \mathbf{x_k}-\delta\mathbf{x_k}, \\
    \left(J_{\mathbf{G}}^T(\mathbf{x_k})J_{\mathbf{G}}(\mathbf{x_k})+\lambda I\right)\delta\mathbf{ x_k} &= J_{\mathbf{G}}^T(\mathbf{x_k})\mathbf{G}(\mathbf{x_k}).
\end{align}

## Preguntas
---

Sea $m$ el número de ecuaciones y $n$ el número de incógnitas, llamaremos $F$ el sistema de funciones no lineales tal que su $i$-ésima ecuación se define como:

$$
    f_i(\mathbf{x}) = n + (j+1)\left(1 - \cos x_j + \sin x_j  \right) - \sin x_j - \frac{n}{3}\left( \cos x_j + \cos x_k + \cos x_w \right),
$$

donde $j = i\% n$, $k = (i+1) \% n$ y $w = (i+2) \% n$, y $\%$ es la operación _módulo_, la cual calcula el resto de la división entre un número y otro. Considere que el RHS del sistema es el vector nulo, esto es $F(\mathbf{x})=\mathbf{0}$.

## Sección 1 (20 puntos)

1. Calcule y muestre la estructura de la matriz Jacobiana del sistema entregado, considerando $m$ ecuaciones y $n$ variables. Implemente la rutina `evaluate_jacobian`, la cual debe retornar la matriz evaluada en el vector parámetro $\mathbf{x}$.

In [50]:
partial_xj = lambda x_j,j,n: (j*np.sin(x_j) + j*np.cos(x_j) + np.sin(x_j) + (n/3)*np.sin(x_j) )
partial_xk = lambda x_k,n: (n/3)*np.sin(x_k)
partial_xw = lambda x_w,n: (n/3)*np.sin(x_w)
'''
Input: 
m - Number of equations of F
n - Number of variables
x - (array) Vector of dimension n
Output:
Jx - (double-array) Vector x evaluated in jacobian matrix of F. Its dimension is mxn 
'''
def evaluate_jacobian(m,n,x):
    Jx = np.zeros((m,n))
    if(n<=2): return Jx
    
    for i in range(0,m):
        j = i%n
        k = (i+1)%n
        w = (i+2)%n
        print("j:{},k:{},w:{}".format(j,k,w))
        elem_j = partial_xj(x[j],j,n)
        elem_k = partial_xk(x[k],n)
        elem_w = partial_xw(x[w],n)
        Jx[i,j] = elem_j
        Jx[i,k] = elem_k
        Jx[i,w] = elem_w
        
    return Jx

In [56]:
xs = np.zeros((7,1))
xs[0] = 1
xs[1] = 1
xs[2] = 1
xs[3] = 1
xs[4] = 1
xs[5] = 1
xs[6] = 1
evaluate_jacobian(8,7,xs)

j:0,k:1,w:2
j:1,k:2,w:3
j:2,k:3,w:4
j:3,k:4,w:5
j:4,k:5,w:6
j:5,k:6,w:0
j:6,k:0,w:1
j:0,k:1,w:2


array([[ 2.80490328,  1.9634323 ,  1.9634323 ,  0.        ,  0.        ,
         0.        ,  0.        ],
       [ 0.        ,  4.18667657,  1.9634323 ,  1.9634323 ,  0.        ,
         0.        ,  0.        ],
       [ 0.        ,  0.        ,  5.56844986,  1.9634323 ,  1.9634323 ,
         0.        ,  0.        ],
       [ 0.        ,  0.        ,  0.        ,  6.95022315,  1.9634323 ,
         1.9634323 ,  0.        ],
       [ 0.        ,  0.        ,  0.        ,  0.        ,  8.33199645,
         1.9634323 ,  1.9634323 ],
       [ 1.9634323 ,  0.        ,  0.        ,  0.        ,  0.        ,
         9.71376974,  1.9634323 ],
       [ 1.9634323 ,  1.9634323 ,  0.        ,  0.        ,  0.        ,
         0.        , 11.09554303],
       [ 2.80490328,  1.9634323 ,  1.9634323 ,  0.        ,  0.        ,
         0.        ,  0.        ]])

2. Implemente el algoritmo de Gauss-Newton, con parámetro $\lambda = 0.0001$, que resuelva el sistema de ecuaciones lineales mediante PALU. Puede utilizar la implementación de `scipy` de PALU. Para esto utilice la firma entregada. Mida y grafique los tiempos de cómputo para las siguientes combinaciones de dimensiones:
    * 5000 ecuaciones y 3000 incógnitas.
    * 10000 ecuaciones y 6000 incógnitas.
    * 15000 ecuaciones y 9000 incógnitas.
   
   Si obtiene errores de memoria u obtiene tiempos de ejecución sobre los 5 minutos, comente al respecto. Puede variar el número de iteraciones en caso de altos tiempos de cómputo.

In [16]:
'''
Input: 
m - Number of equations of F
n - Number of variables
x0 - Initial guess
tol - Tolerance of root mean square error in order to return gauss-newton solution
max_it - Max. number of iterations
Output:
xk - (array) Solution vector of gauss-newton. Its dimension is n
'''
def gauss_newton_palu(m, n, x0, lamb=0.0001, tol=1e-5, max_it=10):
    xk = np.zeros(n)
    # Your code goes here!
    return xk

3. Realice el mismo experimento, pero utilizando GMRes. Considere la misma variación de dimensiones que en la pregunta anterior. Utilice la firma entregada. De igual manera, si tiene errores de memoria o tiempos de ejecución por sobre los 5 minutos, comente al respecto.

In [17]:
'''
Input: 
m - Number of equations of F
n - Number of variables
x0 - Initial guess
tol - Tolerance of root mean square error in order to return gauss-newton solution
max_it - Max. number of iterations
Output:
xk - (array) Solution vector of gauss-newton. Its dimension is n
'''
def gauss_newton_gmres(m, n, x0, lamb=0.0001, tol=1e-5, max_it=10):
    xk = np.zeros(n)
    # Your code goes here!
    return xk

4. Comente a partir de los resultados obtenidos.

## Sección 2 (35 puntos)

La matriz Jacobiana asociada al sistema de ecuaciones entregado posee la propiedad de que es *sparse*, por lo tanto es posible ahorrar almacenamiento y cómputo utilizando una estructura de datos adecuada. 

1. Modifique su implementación de cálculo de la matriz Jacobiana para que utilice una estructura de datos para matrices *sparse* [1].

2. Considere 35000 ecuaciones y 25000 incógnitas. Comente y justifique la factibilidad o infactibilidad de resolver ese problema mediante PALU.

3. Considere 35000 ecuaciones y 25000 incógnitas. Resuelva el problema mediante Gauss-Newton, resolviendo el sistema de ecuaciones lineales mediante GMRes, considerando matrices Jacobianas del tipo *sparse*. Considere un parámetro $\lambda = 0.0001$. Puede utilizar la implementación de GMRes de Scipy.

## Sección 3 (35 puntos)

1. Modifique el *widget* adjunto para que grafique el residuo $\lVert \mathbf{F}(\mathbf{x}_k) \rVert_2$ obtenido en cada iteración de su implementación de Gauss-Newton, y ejecútelo para distintos valores de $\lambda$, $m$ y $n$ . Comente sobre el efecto del parámetro de amortiguamiento al resolver el sistema de ecuaciones no lineales sobredeterminado.

In [18]:
def plot_nonlin_residual(lamb, m, n, tol):
    ## Solve the problem here using the given parameters
    res = np.exp(-np.linspace(0,2,100)**2)
    plt.figure(figsize=(14, 7))
    plt.semilogy(res, '.')
    plt.grid(True)
    plt.show()

interact(
    plot_nonlin_residual, 
    lamb=(0.00001, 10, 0.00001),
    m=widgets.FloatText(description="Num. Equations: ", value=35000),
    n=widgets.FloatText(description="Num. Unknowns : ", value=25000),
    tol=widgets.FloatText(description="Tolerance: ", value=1e-5)
);

2. Modifique el siguiente *widget* para que grafique los residuos obtenidos al resolver los distintos sistemas de ecuaciones lineales con GMRes, en su implementación de Gauss-Newton. Ejecute el algoritmo para distintos valores de $\lambda$ y dimensiones, y comente al respecto.

In [19]:
def plot_linear_residual(lamb, m, n, tol):
    ## Solve the problem here using the given parameters
    n_it = 30
    plt.figure(figsize=(14, 7))
    for i in range(n_it):
        res = np.exp(-np.linspace(0,2,100)**2) + 1e-1*np.random.rand(100)
        plt.semilogy(res, '.')
    plt.grid(True)
    plt.show()

interact(
    plot_linear_residual, 
    lamb=(0.00001, 10, 0.00001),
    m=widgets.FloatText(description="Num. Equations: ", value=35000),
    n=widgets.FloatText(description="Num. Unknowns : ", value=25000),
    tol=widgets.FloatText(description="Tolerance: ", value=1e-5)
);

---
# Instrucciones:

* **Importante, Asegúrese de responder TODO lo que la pregunta pide.**
* La estructura de la tarea es la siguiente:
     1. Título, nombre de estudiante, email y rol.
     2. Responder cada pregunta de forma personal.
     5. Referencias. Es muy importante incluir todas las fuentes usadas, de otra forma se considera que lo no se ha citado adecuadamente es su trabajo.
* La tarea debe ser realizada en `Jupyter Notebook` (`Python3`) entregado.
* Recuerde responder la encuesta en el plazo establecido
* Se evaluará la correcta utilización de librerias `NumPy`, `SciPy`, `Matplotlib` y `ipywidgets`, entre otras, así como la **correcta implementación de algoritmos vectorizados**.
* **MUY IMPORTANTE** El archivo de entrega debe denominarse TareaN-rol.tar.gz y _notebook_ debe tener como nombre TareaN-rol.ipynb, donde $N$ es el número de la tarea y debe contener un directorio con todos los archivos necesarios para ejecutar el notebook, junto con un archivo README indicando explícitamente las librerías o módulos utilizados, nombre y rol del estudiante. Por cada error en este ambito implicará un descuento de 30 puntos.
* El descuento por día de atraso será de $30$ puntos, con un máximo de 1 día de atraso. No se recibirán entregas después de este día.
* Debe citar toda fuente de código externo. 
* El trabajo es personal, no se permite compartir código ni utilizar código de otros, aunque sí se sugiere discutir aspectos generales con sus compañeros.
* En caso de sospecha de no cumplimiento de estas instrucciones, se solicitará al involucrado o la involucrada a aclarar la situación. Dependiendo de la justificación se decidirá su calificación, la cual podrá o no ser penalizada.
* El no seguir estas instrucciones, implica descuentos en su nota obtenida.

# Referencias
[1] https://docs.scipy.org/doc/scipy/reference/generated/scipy.sparse.csr_matrix.html#scipy.sparse.csr_matrix