# Métodos Numéricos 2025

## Guía 4: 2025-04-29 - Ajuste por Cuadrados Mínimos

In [None]:
using Plots
using LaTeXStrings
using DataFrames
using CSV
using LsqFit
using LinearAlgebra

### Problema 1 : Ajuste de modelo lineal

#### Teoría

Supongamos que tenemos una serie de datos $\{x_i,y_i:i=1,...,n\}$ y que queremos ajustar un modelo $f$ definido por

$$
f(x,p) = p_1f_1(x)+p_2f_2(x)+...+p_mf_m(x)
$$

donde $f_1,f_2,...,f_m$ son algunas funciones de $x$ predefinidas y $p=(p_1,...,p_m)'\in \mathbb{R}^{m\times 1}$ es un vector de parámetros $p_i$ a ajustar. 
Notar que $f$ depende linealmente de los parámetros $p_i$. 
En particular, conviene elegir $f_1(x)=1$.

Para ajustar $f$ a los datos, minimizaremos el Error Cuadrático (EC) definido por

$$
E(p) = \sum_{i=1}^n (f(x_i,p)-y_i)^2
$$

Las condiciones que determinan el valor de $p$ que minimiza $d$ pueden expresarse como un sistema lineal de $m$ ecuaciones para $m$ incógnitas. 
Más precisamente, en condiciones ideales deberíamos obtener el valor de $p$ tales que $E(p)\approx 0$. 
En otras palabras, los valores de $p_1,....,p_m$ tal que
\begin{eqnarray}
p_1f_1(x_1)+...+p_mf_m(x_1) &\approx& y_1 \\
... && \\
p_1f_1(x_n)+...+p_mf_m(x_n) &\approx& y_n \\
\end{eqnarray}
lo cual constituye en sistema de ecuaciones lineales para los $p_i$ que se satisface aproximadamente.
Desafortunadamente, la condición anterior raramente se satisface.
Sólo podremos aspirar a minimizar $E(p)$.
Entonces, surge la siguiente pregunta.
¿Cómo logramos minimizar el error cuadrático $E$ en función del vector de parámetros $p$?
Para ello, notar que el error cuadrático puede reescribirse de manera matricial como
\begin{eqnarray}
E(p) &=& (Fp-y)'(Fp-y) \\
&=& (p'F'-y')(Fp-y) \\
&=& p'F'Fp - p'F'y - y'Fp + y'y
\end{eqnarray}
donde $F$ es la matriz de entradas $F_{ij} = f_j(x_i)$ para $i=1,...,n$ y $j=1,...,m$, y donde $p'=(p_1,...,p_m)$, $F'$, $y'=(y_1,...,y_n)$ y $(Fp-y)'$ representan los vectores y matrices traspuestas de los vectores y matrices $p\in \mathbb{R}^{m\times 1}$, $F\in \mathbb{R}^{n\times m}$, $y\in \mathbb{R}^{n\times 1}$ y $(Fp-y)\in \mathbb{R}^{n\times 1}$, respectivamente.
Esto nos permite buscar la respuesta apelando a cálculo.
Es decir, buscamos el valor de $p$ para el cuál se anula la derivada direccional
$$
\partial_qE(p)
=
\lim_{\epsilon \to 0} \frac{E(p+\epsilon q)-E(p)}{\epsilon}
$$
para toda dirección de $q\in \mathbb{R}^{m\times 1}$.
Veamos cómo calcular dicha derivada.
Entonces
\begin{eqnarray}
\lim_{\epsilon\to 0}
\frac{E(p+\epsilon q)-E(p)}{\epsilon}
&=&
q'F'Fp + p'F'Fq - q'F'y - y'Fq
\\
&=&
q'(F'Fp-F'y) + (p'F'F-y'F)q
\\
&=&
q'c + c'q
\\
\end{eqnarray}
donde hemos introducido el vector $c = F'Fp-F'y\in \mathbb{R}^{n\times 1}$.
Luego, la condición extremal $0=\partial_qd(p)=q'c + c'q$ se satisface para toda dirección $q$ si y sólo si $c=0$, o equivalentemente, si y sólo si
$$
F'Fp=F'y
$$
Este es un sistema de ecuaciones lineales para $p$ dado por
$$
Ap=b
$$
donde $A:=F'F$ y $b:=F'y$.
Si las columnas de $F$ son linealmente independientes (típicamente lo son), luego $A=F'F$ es invertible y, por ende, $p=A^{-1}b=(F'F)^{-1}F'y$ es solución.
Si por alguna razón $F$ tiene columnas linealmente dependientes, luego el sistema $Ap=b$ es degenerado, es decir, tiene múltiple soluciones.
Aún así, $p^+=(F'F)^{-1}F'y = F^+y$ representa la solución $p$ que minimiza la norma $|p|$, donde reconocemos en $F^+:=(F'F)^{-1}F'$ a la pseudo-inversa de Moore-Penrose.

#### Estimación de errores

$\newcommand{\avrg}[1]{\langle #1 \rangle}$
Una estimación de la varianza del $i$-ésimo parámetro $p_i$ debido a los errores experimentales en las mediciones de los valores $y_j$ viene dada por (ver [4])

$$\mathrm{Var}(p_i) = \sigma^2 (F'F)^{-1}_{ii}$$

donde

$$\sigma^2 = \frac{1}{n-m}E(p)$$

es un estimador de la varianza del ruido en los valores de los $y_j$. Luego, una estimación del error asociado al $i$-ésimo parámetro $p_i$ es la raíz cuadrada de dicha varianza, $\sqrt{\mathrm{Var}(p_i)}$.

#### Referencias

[1] https://www.youtube.com/watch?v=jezAWd6GFRg

[2] https://math.stackexchange.com/questions/20694/vector-derivative-w-r-t-its-transpose-fracdaxdxt

[3] https://en.wikipedia.org/wiki/Moore%E2%80%93Penrose_inverse

[4] https://stats.stackexchange.com/questions/216335/standard-error-for-a-parameter-in-ordinary-least-squares

### Ejercicios 

1. Cargue los datos provistos en el archivo `cuadratica.txt` en dos vectores $x$ e $y$, y luego grafíquelos utilizando puntos.

2. Con dichos vectores, calcule la matriz $A$ y el vector $b$ para el caso particular en que $f_1(x) = 1$, $f_2(x) = x$ y $f_3(x) = x^2$.

3. Utilice $A$ y $b$ para encontrar el mejor ajuste $p$, y grafique el modelo ajustado junto a los datos.

4. Calcule la estimación de los errores de los parámetros ajustados (ver teoría abajo).

5. Repita el ajuste usando el paquete `LsqFit` y compare resultados.

**Ayuda:** Para cargar los datos, utilice los paquetes `CSV` y/o `DataFrames`.

In [None]:
# 1.1)

### Problema 2 : Ajuste no lineal

1. Utilizando el paquete `LsqFit`, ajuste un conjunto de mediciones almacenadas en el archivo de texto llamado `decaimiento.txt` con la función 
$$
f(x) = c_1 e^{-c_2x}
$$

2. Determine los valores de $a$ y $b$ ajustados.

3. Genere un gráfico que muestre tanto los datos medidos como la curva ajustada.

4. Transforme los valores de $y=f(x)$ a la escala logarítmica $z=\ln y = \ln a - bx$ para poder realizar un ajuste lineal de $z$ vs $x$. Utilice el método de ajuste lineal del Problema 1. para ajustar el modelo $f(x) = p_1+p_2x$ a los datos $z$ vs $x$. Calcule las estimaciones de los errores del ajuste de los parámetros.

In [None]:
# 2.1)