# Pandas
---

## Lectura de datos con pandas
Pandas es una módulo que permite lectura y manipulación de datos de una manera práctica.

Para almacenar los datos en una variable se utilizan los métodos:
```py
- pandas.read_csv(<nombre-de-archivo>, sep=<tipo-de-separador>)
- pandas.read_excel(<archivo-excel>)
```

El nombre estándar para importar pandas es `pd` y el nombre de variable para un `DataFrame` es `df`, por lo que la línea típica de lectura de datos es:
`df = pd.read_csv`

In [None]:
import pandas as pd
df = pd.read_excel('data.xlsx')

In [None]:
df

# SciPy

---

SciPy es una librería que recopila múltiples funciones de interés en el ámbito científico. En este momento nos centramos en `scipy.optimize`

## scipy.optimize
`scipy.optimize` posee las funciones `minimize` y `curve_fit` que permiten el ajuste de funciones a datos reales.

### curve fit

`curve_fit` es una función que recibe:

- Una función estrucutrada como `f(x, *parametros)`
- Datos de $x$ experimentales.
- Datos de $y$ experimentales.
    - Otros parámetros opcionales.
    
 Y devuelve una tupla de dos elementos:
 
 - popt: Parámetros luego de optimizar.
 - pcov: Matriz de covarianza de parámetros ajustados. 
 
 
 > Utiliza los mínimos cuadrados ($\sum_i(y_i - f(x_i))^2$) como función objetivo para realizar el ajuste.

In [None]:
from scipy.optimize import curve_fit

# curve_fit

In [None]:
from numpy import exp

def f1(x, a, b):
    y = a*x + b
    return y

def f2(x, a, b, c):
    y = a*x**2 + b*x + c
    return y

def f3(x, a, b, c):
    y = a*exp(b*x) + c
    return y

In [None]:
curve_fit(f1, df["x"], df["y"])[0]

In [None]:
a, b = curve_fit(f1, df["x"], df["y"])[0]

In [None]:
plt.scatter(df["x"], df["y"])
plt.plot(x, f1(x, a, b), label="f1")

In [None]:
params1 = curve_fit(f1, df["x"], df["y"])[0]
params2 = curve_fit(f2, df["x"], df["y"])[0]
params3 = curve_fit(f3, df["x"], df["y"])[0]

In [None]:
import matplotlib.pyplot as plt

x = df["x"].values
y = df["y"].values

plt.scatter(df["x"], df["y"])
plt.plot(x, f1(x, *params1), label="f1")
plt.plot(x, f2(x, *params2), label="f2")
plt.plot(x, f3(x, *params3), label="f3")

plt.legend()
plt.ylim(0, 150)

### minimize

`minimize` es una función que, como claramente lo dice, minimiza. Recibe

- Una función estrcturuada como `f(X, *args)`
- Valores iniciales de X.
- Argumentos extra de la función.
    - Otros parámetros opcionales
    
A modo de ejemplo, se va a minimizar la función error en valor absoluto:

$\sum_i|y_i - f(x_i)|$

In [None]:
from scipy.optimize import minimize

# minimize

In [None]:
def f1(x, a, b):
    y = a*x + b
    return y


def f1_obj(X):
    a, b = X
    
    y = df["y"]
    x = df["x"]
    
    error = sum(abs(y - f1(x, a, b)))
    return error

In [None]:
minimize(f1_obj, x0=[1, 1])

#### Función objetivo genérica

En el caso anterior es necesario generar una función objetivo para cada función que se quiere ajustar.

Cómo se puede solucionar esto?

In [None]:
# Inyección de dependencia!

def f_obj(X, *args):
    """Función objetivo genérica
    X: Parámetros a ajustar.
    args: Set de argumentos de función objetivo
          [función_a_ajustar, valores_x, valores_y]
    """
    f = args[0]
    x = args[1]
    y = args[2]
    
    y_prediccion = f(x, *X)
    
    funcion_objetivo = sum(abs(y - y_prediccion))
    return funcion_objetivo

In [None]:
sol1 = minimize(f_obj, x0=[1, 2], args=(f1, df["x"], df["y"]))

sol2 = minimize(f_obj, x0=[1, 2, 3], args=(f2, df["x"], df["y"]))

In [None]:
sol1

In [None]:
sol3 = minimize(f_obj, x0=[1, 2, 4], args=(f3, df["x"], df["y"]))

In [None]:
plt.scatter(x, df.y)
plt.plot(x, f3(x, *sol3.x))

In [None]:
sol3 = minimize(f_obj, x0=[1, 2, 4], args=(f3, df["x"], df["y"]), method='COBYLA')

In [None]:
plt.scatter(x, df.y)
plt.plot(x, f3(x, *sol3.x))

Referencias

- [Pandas](https://pandas.pydata.org/docs/index.html)
- [read_excel](https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html?highlight=pandas%20read_excel#pandas.read_excel)
- [SciPy](https://docs.scipy.org/)
- [minimize](https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.minimize.html)
- [curve_fit](https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.curve_fit.html)