## Regresión de datos es una forma de minización (ya lo has hecho)


Cuando pensamos en regresión, lo que nos viene a la cabeza es encontrar algún parámetro de algún modelo que reproduzca de la mejor forma aglunos datos. Cuando decimos que "reproduzca de la mejor forma" nos referimos a que la suma de los errores entre el valor de predicción y el valor real es minimizada. 

Empezemos con un problema de reactores, esta vez de cinéticas de reacción tipo L-H-H-W:


La reacción catalítica $2A \rightarrow B$ se llevó a cabo a 6 atmósferas, se realizaron diferentes corridas variando la presión inicial de A, en prescencia de otro componente inertes. 

Los resultados fueron:

| $P_A$ | r     |
|------:|-------|
| 0.775 | 58.5  |
| 0.655 | 47.5  |
|  0.54 | 30.5  |
| 0.423 | 29.35 |
| 0.299 | 13.9  |
| 0.169 | 4.96  |


Demostrar la validez del modelo cinético de reacción propuesto:

$$r = \frac{k P_A^2}{(1+k_A P_A)^2}$$

encontrar los valores de $k$ y $k_A$

In [None]:
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

presiones_A = np.array([0.775,0.655,0.54,0.423,0.299,0.169])
r_ini= np.array([58.5,47.5,30.5,29.35,13.9,4.96])

plt.plot(presiones_A,r_ini,'bo')
plt.xlabel('P_A')
plt.ylabel('r inicial')

In [None]:
def lhhw(parametros,P_A):
    k,k_A = parametros
    r = (k*P_A**2)/(1+k_A*P_A)**2
    return r

In [None]:
lhhw((12,15),np.linspace(5,59))

Ahora necesitamos una función que nos proporcione la suma cuadrada de los errores.

In [None]:
def objetivo(params):
    err = r_ini - lhhw(params,presiones_A)
    return np.sum(err**2)

In [None]:
objetivo((12,15))

Entonces necesitamos un estimado inicial para los parámetros.

In [None]:
x0=[0.1,0.2]

from scipy.optimize import minimize
sol = minimize(objetivo, x0)
print(sol)

plt.plot(presiones_A,r_ini,'bo',label='Datos')
vfit = np.linspace(min(presiones_A), max(presiones_A))
plt.plot(vfit, lhhw(sol.x, vfit), label='fit')
plt.legend()
plt.xlabel('P_A')
plt.ylabel('r inicial')

## curve fitting



#### Veamos un ejemplo sencillo

Dados los datos realizar un "fit" o "fitting" con la siguiente curva: 

$$y(x)=\frac{ax}{b+x}$$

¿Qué significa hacer fit sobre los datos? ------>>>> estimar los parámetros $a$ y $b$ para representar lo mejor posible a $y$ dada una $x$.

|   y   |   x   |
|:-----:|:-----:|
| 1.255 |  0.5  |
|  1.25 | 0.387 |
| 1.189 |  0.24 |
| 1.124 | 0.136 |
| 0.783 |  0.04 |
| 0.402 | 0.011 |



¿Qué estimado inicial ocupamos para cada variable?

Vemos que la tendencia de los datos llegan asintóticamente a un valor cerca de $1.2$ y viendo la forma de la ecuación podemos decir que a un valor para $x$ grande tenemos $y = a$. 

¿Qué pasa con un valor de $x$ pequeño?, prácticamente la ecuación se vuelve: $y = \frac{a}{b} x$ entonces si "derivamos" o estimamos que tanto cambia con gradiente y respecto a x tendriamos $m=\frac{a}{b}$. Por lo tanto podemos "despejar" a $b$ de la forma siguiente: $b = \frac{a_0}{m}$

Ahora computemos el fitting

Siempre debemos verificar visualmente el resultado:

 **ejercicio de polímeros:**
 
 Estime los coeficientes de reactividad $r_1$ y $r_2$ a partir de los siguientes datos de la copolimerización del ácido metacrilico ($M_1$) con metacrilonitrilo($M_2$)
 
 | Composición molar del monómero $M_1$ (%) | Composición molar del monómero $M_1$ en el copolímero |
|:----------------------------------------:|:-----------------------------------------------------:|
|                     0                    |                           0                           |
|                    10                    |                          15.5                         |
|                    20                    |                          29.2                         |
|                    30                    |                          41.3                         |
|                    40                    |                          52.1                         |
|                    50                    |                           61                          |
|                    60                    |                          70.8                         |
|                    70                    |                           79                          |
|                    80                    |                          86.5                         |
|                    90                    |                          93.5                         |
|                    100                   |                          100                          |


Realiza el ajuste con la ecuación de Mayo-Lewis para copolimerización[https://en.wikipedia.org/wiki/Mayo%E2%80%93Lewis_equation](https://en.wikipedia.org/wiki/Mayo%E2%80%93Lewis_equation)

$$F_1 = \frac{(r_1-1)f_1^2+f_1}{(r_1+r_2-2)f_1^2+2(1-r_2)f_1+r_2}$$

Donde:

- F1 es la composición molar del monómero $M_1$ en el copolímero

- f1 es la composición molar del monómero $M_1$

## estimación de incertidumbre

No hemos analizado el segundo parámetro que regresa `curve_fit`:

pcov : 2d array
    The estimated covariance of popt. The diagonals provide the variance
    of the parameter estimate. To compute one standard deviation errors
    on the parameters use ``perr = np.sqrt(np.diag(pcov))``.
