In [None]:
import numpy as np
import matplotlib.pyplot as plt

## **Introducción a los Mínimos Cuadrados**

### 1. **Ajuste de Modelos Cuadráticos a Datos Experimentales**

En este notebook exploraremos distintas aplicaciones a mínimos cuadrados. Empecemos con un ejemplo motivador.

#### Problema motivador 1

Una pelota es arrojada hacia arriba. Una cámara de fotos toma fotos cada 0.1 segundos y a partir de esas fotos se calcula la altura de la pelota en cada instante.
En el archivo `altura_pelota.csv` se encuentran las mediciones obtenidas.

Sabiendo que la altura de la pelota depende del tiempo en forma cuadrática 
$h(t) = c_0 + c_1 t + c_2 t^2,$ estimar los valores de $c_0, c_1, c_2$ ajustando los datos por mínimos cuadrados.

Resolvemos el problema mediante las ecuaciones normales
$
A^tA c = A^ty
$
para una matriz $A$ apropiada.


In [None]:
import pandas as pd   
# Los datos están en español! 
datos = pd.read_csv("altura_pelota.csv", sep=";", decimal=",")   # dataFrame
datos.head(3)

In [None]:
# Convertimos los datos a np.array
datosNP = datos.to_numpy()
print(datosNP.shape)

In [None]:
# Graficamos
plt.scatter(datosNP[:,0], datosNP[:,1])

Resolver a partir de aqui

**Ejercicios**

1. Obtener la matriz A.
2. Resolver por mínimos cuadrados utilizando la función de escalonamiento utilizada en el laboratorio de ALC (_no utilizar el solve de numpy o scipy, etc._)
3. Graficar la nube de puntos y la función encontrada.
4. Es posible saber en que punto la pelota toca el suelo para los valores encontrados?

### 2. **Mínimos cuadrados para sumas de funciones**

Para datos $(t_j, y_j)$, $1 \le j \le m$ queremos ajustar una función del tipo 
$$
y = c_1 f_1(t) + \dots + c_s f_s(t)
$$

Ejemplo: $y = a + b t + c t^2$.

**RECORDAR**: reemplazando los valores de $t$ e $y$ por los datos en la tabla obtenemos un sistema **lineal** de ecuaciones, donde las incógnitas son los $c_i$:

$$
\begin{align}
y_1 &= c_1 f_1(t_1) + \dots + c_s f_s(t_1) \\
&\vdots\\
y_m &= c_1 f_1(t_m) + \dots + c_s f_s(t_m)
\end{align}
$$

Cuando tenemos más datos (ecuaciones) que incógnitas, usamos mínimos cuadrados para obtener una solución aproximada.



#### Problema
Ajustar por mínimos cuadrados una función del tipo
$$
y = c_1 t^2 + c_2 e^t + c_3 t
$$
a los datos

|t|1|2|4|6|8|
| --- | --- | --- | --- | --- | --- |
|y|6|10|10|8|10|

In [None]:
# Vectores de datos
ti = np.array([1, 2, 4, 6, 8])
yi = np.array([6, 10, 10, 8, 10])

# a) Definimos las funciones
def f1(t):
    return(t**2)

def f2(t):
    return(np.e**t)

def f3(t):
    return(t)

**Ejercicios**
1. Construir la matriz $A$ a partir de la ecuación de $y$ y de los datos
2. Econtrar por mínimos cuadrados los coeficientes $c_1, c_2, c_3$
3. Verificar graficando los puntos $(t,y)$ y la función contínua obtenida por los mínimos cuadrados.


### 3. Estudiando escalas del cuerpo

En este punto la propuesta es que exploren las relaciones de escala entre distintas partes del cuerpo humano. Para eso, apoyense en el set de datos de ANSUR II que acompaña el notebook.

Como guía, empiecen considerando las variables Heightin, waistbreadth, weightkg, crotchheight, footlength, earbreadth. Pueden apoyarse en [esta página](https://ph.health.mil/topics/workplacehealth/ergo/Pages/Anthropometric-Database.aspx) para ver qué representa cada variable. 

Construyan un programa que tome un conjunto de variables del dataset, y una que represente la _escala_ del cuerpo. El programa debe computar la matriz de diseño para cada una de las variables (como función lineal de la variable _escala_) y reportar todos los coeficientes de escala obtenidos. Comparen para cada variable y discutan: ¿tiene sentido pensar al cuerpo como algo que se _infla_ o _desinfla_, manteniendo proporciones conforme crece?¿Alcanza esta información para responder esta pregunta?

### 4. Ecualización, Fourier y armónicos

Como último ejemplo, consideremos el sonido producido por una [nota fundamental y sus armónicos](https://en-m-wikipedia-org.translate.goog/wiki/Harmonic?_x_tr_sl=en&_x_tr_tl=es&_x_tr_hl=es&_x_tr_pto=tc). Mucha de la música se estructura bajo el concepto de que una nota _armoniza_ con otras que tiene frecuencias múltiplo de la primera. Pueden usar [este link](https://onlinetonegenerator.com/multiple-tone-generator.html) para apoyarse a lo largo del ejercicio (aunque quizá necesiten auriculares).

Para fijar ideas, podemos pensar en el sonido producido por una cuerda de guitarra al ser pulsada. El sonido, si bien tiene mayor preponderancia de la fundamental, se enriquece por los armónicos de la misma que suenan al pulsarla.

Matemáticamente, podemos modelar esto como una suma de funciones senoidales y cosenoidales a frecuencias múltiplo unas de las otras

$$S(t) = \sum^{\infty}_{i=1} a_i \sin(2 \pi i f t) + b_i \cos(2 \pi f t)$$

Donde $f$ es la frecuencia de la fundamental, $t$ es el tiempo y $S(t)$ la señal observada. Pueden buscar sobre [series de Fourier](https://es.wikipedia.org/wiki/Serie_de_Fourier), si quieren saber más.


Ahora, usando cuadrados mínimos, la propuesta es que encuentren los coeficientes $a_i$ y $b_i$ para algunas señales de ejemplo.

#### Ejemplo 1:

Una suma simple de senoidales, para calibrar. Como usar infinitos armónicos es computacionalmente imposible, consideren $i=1,\dots,6$ en la sumatoria anterior.

In [None]:
import numpy as np
t = np.linspace(0,10,50)
fundamental = 0.1
ai_real = [10,0,2,2]
bi_real = [0,1,0,0]
s_observada = 0
for i,ai in enumerate(ai_real):
    s_observada += ai*np.sin(2*np.pi*(i+1)*fundamental*t)
for i,bi in enumerate(bi_real):
    s_observada += bi*np.cos(2*np.pi*(i+1)*fundamental*t)

plt.plot(t,s_observada)

In [None]:
# Construyan la matriz de diseño usando i hasta 10, y comparen los coeficientes obtenidos con los reales


### Ejemplo 2:

Ahora probemos una función un poco menos "senoidal". Una señal cuadrada (como la que tendríamos de un amplificador con distorsión).

In [None]:
t = np.linspace(0,10,50)
s_observada = np.sign(np.cos(4*np.pi*fundamental*t))
plt.plot(t,s_observada)

In [None]:
# Construyan la matriz de diseño usando frecuencias hasta 5, 10 y 20 veces la fundamental. Comparen la señal observada con el resultado.

### Ejemplo 3:

La última propuesta es que exploren que pasa si no logramos identificar correctamente la fundamental. Para esto, ajusten nuevamente los datos del Ejemplo 1, pero usando como fundamental $1.1$ y $0.9$ veces el valor real. 