# Clase 6: Numpy y Scipy


**MDS7202: Laboratorio de Programación Científica para Ciencia de Datos**

**Profesor: Pablo Badilla**

Basadas en las clases de Nicolás Caro.


---

## NumPy y SciPy: Librerías Científicas 

`Numpy` y `SciPy` son módulos de código abierto para Python que proveen rutinas matemáticas precompiladas y de alto rendimiento. 

Ambos paquetes son estándar a la hora de trabajar con operaciones numéricas, siendo `Numpy` la base para el trabajo con vectores y matrices, mientras que `SciPy` extiende dichas rutinas al incorporar algoritmos de análisis numérico, optimización, transformadas de Fourier entre otras.



---

## Numpy

[NumPy (Numerical Python)](http://www.numpy.org/) es el módulo fundamental para la computación científica en Python. Numpy es un módulo que módulo que provee **arreglos multi-dimensionales homogeneos** (i.e., del mismo tipo de datos) y una gran gama de operaciones (extremadamente optimizadas) que aplican sobre estos, tales como álgebra lineal, E/S (I/O), estadística básica, simulaciones aleatorias y un gran etc.

Su uso se ha vuelto un estándar en computación científica, en particular en ciencia de datos y machine learning. Su uso es similar a otras herramientas matemáticas como MATLAB, pero esta es **Open Source 👍**. Si vienes de MATLAB, puedes encontrar una guia rápida de transción a python [aqui](https://numpy.org/devdocs/user/numpy-for-matlab-users.html).

### Ejemplos de aplicaciones

<img src="./resources/numpy_case_studies.jpg" alt="Casos de estudio" style="width: 800px;"/>

### Ecosistema

<img src="./resources/numpy_ecosistema.jpg" alt="Ecosistema de Numpy" style="width: 800px;"/>

### La clase ndarray

**Arreglo** (según wikipedia): 
> Es a una zona de almacenamiento contiguo (en la memoria RAM) que contiene una serie de elementos del mismo tipo.

<img src='http://www.mathcs.emory.edu/~cheung/Courses/170/Syllabus/09/FIGS/array02x.gif' width=400>



El núcleo de `numpy` es el objeto ndarray. Este objeto encapsula **arreglos n-dimensionales** de **tipos de datos homogeneos** e implementa **rutinas precompiladas** para el calculo de operaciones.

Algunas de las características de estos arreglos.

| Arreglos de tamaño fijo. | Arreglos del mismo tipo de datos.  | Provee operaciones matemáticas sobre largos conjuntos de datos. | Gran ecosistema basado en Numpy |
|-|-|-|-|
| A diferencia de las listas de python que pueden crecer dinámicamente, los arreglos de numpy son estáticos.  Modificar el tamaño de un arreglo implicará crear uno nuevo | Tipos de datos distintos tienen tamaños distintos. Al tener tipos de datos de igual tamaño, se puede manejar mejor la memoria RAM. | Los módulos precompilados ofrecen operaciones más eficientes sobre arreglos numpy que su equivalente de listas en python. | En general, la mayoría de librerías científicas están basadas en los arreglos de numpy. |

### Vectorización

La vectorización es la ausencia de cualquier ciclo o indexado explícito en el código. Todo se hace a través de funciones que operan "detrás de escenas".

Ventajas:

- El código vectorizado es mas consiso y facil de leer.

- Menos lineas de código = Menos bugs.

- La notación vectorizada "recuerda" en algo a la notación matemática. (Piensen en una suma de dos vectores implementado en for con respecto un `a + b`).


### Primeros Pasos

Importamos comunmente `numpy` usando el alias `np`.

In [None]:
# alias comun es np
import numpy as np

#### Creación de arrays

Existen varias formas de crear arreglos.

##### Inicializar a partir de listas

In [None]:
a = np.array([1, 2, 3])
a

![Ejemplo ndarray](./resources/np_array.png)

##### Crear _arrays_ llenos de ceros

In [None]:
b = np.zeros(10)
b

##### Crear _arrays_ de 1

In [None]:
c = np.ones(10)
c

##### Y usar un simil de la función range

In [None]:
d = np.arange(2, 15, 2)  # de 2 al 15 (sin incluir) con un salto de 2 en 2.
d

##### Y arreglos con valores aleatorios


Esto genera una matriz en donde cada elemento es un número $ \sim \text{unif}([0,1])$

In [None]:
np.random.rand(3)

##### También podemos crear matrices

In [None]:
e = np.ones((5, 5))
e

In [None]:
m = np.array([[1, 2, 3], 
              [4, 5, 6], 
              [7, 8, 9], 
              [10, 11, 12]])
m

> **Pregunta ❓** : ¿Qué sucede con el siguiente código?

```python
m2 = np.array([[1, 2, 3], [4, 5, 6], [7]])
```

In [None]:
m2 = np.array([[1, 2, 3], [4, 5, 6], [7]])
m2

> **Ejercicio ✏️**: Existen más alternativas para crear arreglos. Verifique las funciones `np.vstack` y `np.hstack` en la siguiente [referencia](https://numpy.org/devdocs/user/absolute_beginners.html#how-to-create-an-array-from-existing-data).

---

De aquí en adelante, definiremos la siguiente matriz como una secuencia de 4 puntos tridimensionales que describen algún objeto tridimensional, como por ejemplo, un tetraedro:

In [None]:
puntos = np.array([
    [0, 0, 0],
    [1, 0, 2],
    [2, 1, 0],
    [0, 2, 1]]
)
puntos

In [None]:
import plotly.graph_objects as go

def plot_tetraedro(puntos):
    fig = go.Figure(data=[go.Mesh3d(
        x=puntos[:, 0],
        y=puntos[:, 1],
        z=puntos[:, 2],
        opacity=0.5,
        # indices de los puntos donde se dibujan caras.
        # i=0, j=1, k=2 indica que se dibujará una
        # cara en [0, 0, 0] -> [1, 0, 2] -> [2, 1, 0]
        i=[0, 0, 0, 1],
        j=[1, 2, 3, 2],
        k=[2, 3, 1, 3],
    )])
    fig.show()
    
plot_tetraedro(puntos)

#### Axes

En `numpy`, las dimensiones son llamadas ***axes***.

Supongamos que la matriz que vimos antes (`puntos`) es un conjunto de cuatro puntos tridimensionales.
- Un punto `[0, 0, 0]` es un arreglo de una sola dimensión (un solo axe).
- Un conjunto de dos puntos `[[0, 0, 0], [1, 0, 2]],` es un arreglo de dos dimensiones (dos axes).

> **Pregunta ❓**: `[[0, 0, 0], [1, 0, 2], [2, 1, 0],` ¿Cuántos axes tiene?


#### Atributos de la clase ndarray 

In [None]:
puntos

##### `ndim`

Podemos acceder al número de dimensiones o axes a través del atributo `ndim`

In [None]:
puntos.ndim

##### `shape`

Shape es una tupla que indica el tamaño de cada dimension. Nota que la tupla tiene la misma cantidad de elementos que el número de dimensiones. 

En nuesto ejemplo, la dimensión 1 tiene tamaño 4 (4 puntos) y la segunda dimensión tiene 3 (coordenadas).

In [None]:
puntos.shape

##### `size`

Es el número de elementos totales en nuestro arreglo

In [None]:
puntos.size

##### `dtype`

El tipo de datos que tiene nuestro arreglo

In [None]:
puntos.dtype

#### Datos sobre múltiples dimensiones

Supongamos que el tetraedro va creciendo aleatoriamente según pasa el tiempo.

Es decir que tendrémos para cada $t$, un conjunto de cuatro puntos distintos. 

In [None]:
puntos_t1 = np.round(puntos + np.random.rand(4,3), 2)
puntos_t1

In [None]:
plot_tetraedro(puntos_t1)

In [None]:
puntos_t2 = np.round(puntos_t1 + np.random.rand(4, 3), 2)
puntos_t2

In [None]:
plot_tetraedro(puntos_t2)

In [None]:
puntos_t3 = np.round(puntos_t2 + np.random.rand(4, 3), 2)
puntos_t3

In [None]:
plot_tetraedro(puntos_t3)

In [None]:
puntos_t4 = np.round(puntos_t3 + np.random.rand(4, 3), 2)
puntos_t4

In [None]:
plot_tetraedro(puntos_t4)

> **Pregunta ❓**: ¿Cómo podemos agregar el tiempo a nuestro conjunto de datos?

La forma de agregar esta variable es agregar una nueva dimensión al arreglo. Es decir, ahora tener las dimensiones `(tiempo, puntos del tetraedro, valores)`

In [None]:
puntos_t = np.array([puntos, puntos_t1, puntos_t2, puntos_t3, puntos_t4])
puntos_t

In [None]:
puntos_t.ndim

In [None]:
puntos_t.shape

Comunmente, los arreglos de más de dos dimensiones son conocidos como **tensores**.

> **Pregunta ❓**: ¿Cómo podemos modelar datos como imágenes y videos en arreglos multidimensionales?

> Propongan algún otro tipo de dato para modelarlo en este momento.


Ejemplo de imagen 8x8 en blanco negro.

In [None]:
imagen = np.array([[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                   [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                   [0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0],
                   [0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0],
                   [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                   [0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0],
                   [0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0],
                   [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]],
                  dtype='uint8') * 255

In [None]:
import plotly.express as px
px.imshow(img1)

Por lo general, las imágenes tienen 3 canales: Rojo Verde y Azul (Red, Green and Blue = **RGB**).

In [None]:
imagen = [[0,0,0  ], [...], [...],
          [0,0,255], [...], [...],
         ]

In [None]:
['Rojo', 'Verde', 'Azul']

Los videos no son más que conjuntos de imágenes más audio. Si consideramos solo las imágenes, tendríamos:

In [None]:
#video = [img1, img2, img3, ...]

# El arreglo tendría las siguientes dimensiones: (tiempo, alto, ancho, canal)

### Indexado


El indexado es similar a las listas de python.

![Indexado](./resources/np_indexing.png)
<center>Fuente: https://numpy.org/devdocs/user/absolute_beginners.html </center>

In [None]:
data = np.array([1, 2, 3])

In [None]:
# indexador sin slice retorna solo un número
data[1]

In [None]:
# slice retorna arreglo
data[1:2]

In [None]:
# slice retorna arreglo
data[0:2]

In [None]:
# desde el índice 1 hacia adelante
data[1:]

Y multidimensional

In [None]:
puntos_t

In [None]:
# 3 indexadores
# el primero elige solo punto_t1 y punto_t2.
# el segundo elige todos los vértices.
# el tercero elige todas las coordenadas de los vertices.
puntos_t[1:3][:][:]

In [None]:
# La operación anterior ppodemos resumirla en un solo indexador

puntos_t[1:3, :, :]

In [None]:
# Podemos obtener de todos los tetraedros solo su primer vértice:
puntos_t[:, 0:1, :]

In [None]:
# Y solo la coordenada z de todos los vértices
puntos_t[:, :, -1]

> **Pregunta ❓**: ¿Qué obtenemos en este caso?


In [None]:
puntos_t[0:3, 1:2, 0]

> **Pregunta ❓**: ¿Y en este otro?


In [None]:
puntos_t[:, 0:1, 0:2]

### Operaciones básicas sobre arreglos


#### Ordenar y Concatenar

##### `sort`

Retorna una copia del arreglo original ordenado.

In [None]:
arr = np.array([2, 1, 5, 3, 7, 4, 6, 8])

np.sort(arr)

##### `concatenate`

Concatena arreglos (similar a la operación `+`)

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([5, 6, 7, 8])

np.concatenate((a, b))

In [None]:
x = np.array([[1, 2], 
              [3, 4]])

y = np.array([[5, 6]])

np.concatenate((x, y))

Se puede especificar la dimensión donde se desea concatenar

In [None]:
x = np.array([[1, 2], 
              [3, 4]])

z = np.array([[5, 6], 
              [7, 8]])

np.concatenate((x, z), axis=0)  # idea: concatenar a las filas

In [None]:
np.concatenate((x, y), axis=1)  # idea: concatenar a las columnas

#### Nota: Cómo leer documentación de python

https://numpy.org/devdocs/reference/generated/numpy.concatenate.html#numpy.concatenate


<img src="./resources/doc_1.jpg" alt="Definición de la función" width=600/>
<img src="./resources/doc_2.jpg" alt="Definición de la función" width=600/>
<img src="./resources/doc_3.jpg" alt="Definición de la función" width=600/>

**Todo esto se encuentra en el docstring de la función!!!**

In [None]:
help(np.concatenate)

#### Operaciones aritméticas y lógicas

Las operaciones aritméticas siempre operan elemento a elemento (**elementwise**).

In [None]:
a = np.array([20, 30, 40, 50])
b = np.array([0, 1, 2, 3])

In [None]:
a - b

In [None]:
a + b

In [None]:
b ** 2

In [None]:
10 * b

In [None]:
[10] * b

In [None]:
a * b

In [None]:
b ** 2

In [None]:
a

In [None]:
a <= 20

In [None]:
a > 20

In [None]:
a < b

In [None]:
a == 20

**Nota:** Para el caso del producto matricial, se ocupa `@`.



<img src="./resources/formula_prod_matricial.jpg" alt="Formula prod matricial" style="width: 700px;"/>

<img src="./resources/prod_matricial.jpg" alt="Producto Matricial" width=250/>

In [None]:
A = np.array([[1, 1],
              [0, 1]])

B = np.array([[2, 0],
              [3, 4]])

In [None]:
A * B  # elementwise product

In [None]:
A @ B  # producto punto

In [None]:
A.dot(B)  # another matrix product

#### Operaciones sobre los elementos

In [None]:
a = np.arange(0, 15, 1).reshape(3, 5)
a

In [None]:
a.sum()

In [None]:
a.sum(axis=0)

In [None]:
a.sum(axis=1)

In [None]:
a.min()

In [None]:
a.max()

In [None]:
a.max(axis=1)

> **Pregunta ❓**: ¿Qué sucede cuando hay más de 2 dimensiones?

In [None]:
puntos_t

In [None]:
# Idea: máximo sobre los vértices y los tetraedros que cambian en el tiempo
# entrega el tetraedro más grande.

m_a0 = puntos_t.max(axis=0, keepdims=True)
print(m_a0.shape)
print(m_a0)

In [None]:
# Idea: máximo sobre el tiempo y sobre las coordenadas en particular
# entrega el conjunto de coordenadas máximas por cada tetraedro
m_a1 = puntos_t.max(axis=1, keepdims=True)
print(m_a1.shape)
print(m_a1)

In [None]:
# Idea: máximo sobre el tiempo y el máximo de cada punto
# entrega la coordenada máxima de cada vértice para todos los tetraedros en el tiempo

m_a2 = puntos_t.max(axis=2, keepdims=True)
print(m_a2.shape)
print(m_a2)

### Funciones Universales

Operaciones elemento a elemento aplicadas a arreglos.

Ejemplo:`sen, cos, exp, sqrt, log, etc...`

In [None]:
B = np.arange(3)
B

In [None]:
np.exp(B)

In [None]:
np.sqrt(B)

### Reshape

Usando la función `reshape()` podemos darle un nuevo `shape` sin la necesidad de cambiar los datos.
Lo importante es que el nuevo arreglo tenga la misma cantidad de elemento que la antigua.


In [None]:
a = np.arange(6)
a

In [None]:
b = a.reshape(3, 2)
b

In [None]:
c = a.reshape(1, 3, 2)  # Agregamos un nuevo axis.
c

También podemos agregar nuevos axis usando `np.newaxis`

In [None]:
a = np.array([1, 2, 3, 4, 5, 6])

a.shape

In [None]:
a2 = a[np.newaxis, :]

a2.shape

In [None]:
a2

Y con `expand_dims`.

In [None]:
b = np.expand_dims(a, axis=0)
b.shape

In [None]:
b

In [None]:
c = np.expand_dims(a, axis=1)
c.shape

In [None]:
c

En cuanto a las **funcionalidades básicas de álgebra lineal**, se encuentra la inversa una matriz:

In [None]:
A = np.array([[1, -2, 2, 2], [0, 4, -2, 1], [1, -2, 4, 0], [1, -1, 2, 2]])
A_inv = np.linalg.inv(A)

print("A:\n", A, "\n")
print("Inversa de A:\n", A_inv)

La matriz identidad

In [None]:
# Identidad matricial

I1 = np.matmul(A, A_inv)
I2 = np.eye(4)  # Matriz identidad de dimension 4x4

print("I1:\n", I1, "\n")
print("I2:\n", I2)

### Stacks


Vertical stack: Se posiciona el arreglo de la izquierda por 
sobre el derecho. 



In [None]:
X = np.array([1, 2, 3])
Y = np.ones_like(X)

np.vstack([X, Y])

Usando esto podemos acomodar nuevos valores para, por ejemplo, aplicar regresión lineal.

In [None]:
Z = np.vstack([X,Y])
Z.T

por otra parte `.hstack()`, que opera de manera similar a `.vstack()` pero de manera horizontal.

In [None]:
Z = np.hstack([X,Y])
Z

###  Queries

Selección de datos por medio de consultas, en este caso lógicas.

In [None]:
a = np.array([[1, 2, 3, 4], 
              [5, 6, 7, 8], 
              [9, 10, 11, 12]])

In [None]:
a > 3

In [None]:
mayor3 = a[a > 3]
mayor3

> **Pregunta ❓**: ¿Qué implicancia podría tener esta funcionalidad a futuro?

### Vistas y Copias

Recuerden que los nombres son referencias!

In [None]:
a = np.array([[0, 1, 2, 3], 
              [4, 5, 6, 7], 
              [8, 9, 10, 11]])

b = a  
b is a

In [None]:
b[0,0] = 999
a

**View**

View crea un nuevo arreglo con los mismos datos, pero no le pertenecen

In [None]:
a = np.array([[0, 1, 2, 3], 
              [4, 5, 6, 7], 
              [8, 9, 10, 11]])

c = a.view()

c is a        

In [None]:
c.base is a     

In [None]:
c.flags.owndata

In [None]:
c[0,0] = 1234         
a

**Copy**

In [None]:
a = np.array([[0, 1, 2, 3], 
              [4, 5, 6, 7], 
              [8, 9, 10, 11]])

d = a.copy()         

In [None]:
d is a 

In [None]:
d[0,0] = 999
d

In [None]:
a

### Broadcasting

El Broadcasting es como numpy trata las operaciones entre arreglos con diferentes tamaños, como por ejemplo, un escalar por una matriz. A continuación un ejemplo sencillo:


In [None]:
a = np.array([1.0, 2.0, 3.0])
b = np.array([2.0, 2.0, 2.0])
a * b

In [None]:
[(1.0 * 2.0), (2.0 * 2.0), (3.0 * 2.0)]

In [None]:
2 * a

Si bien hicimos la misma operación, estas se diferencian en que en la primera operación hicimos un arreglo del mismo tamaño para multiplicar elemento a elemento y en la segunda ocupamos el escalar directamente. 

Ahora imagínense un arreglo de miles de millones de elementos y tener que multiplicarlos por dos de la primera forma. Obviamente la segúnda forma será mas eficiente y esto es lo que numpy implementa eficientemente a través del *broadcasting*.

![Broadcasting en el ejemplo anterior](./resources/boradcasting_1.gif)


El broadcasting no se limita solo a escalares, si no también que podemos usarlos con arreglos. A continuación, un ejemplo de aquello:

![Broadcasting en el ejemplo anterior](./resources/boradcasting_2.gif)


En este ejemplo, un caso en donde el broadcasting no funciona, ya que no calzan las dimensiones:

![Broadcasting en el ejemplo anterior](./resources/boradcasting_3.gif)


> **Pregunta ❓**: ¿Qué habría que hacer aquí para que esta operación funcione?

In [None]:
a = np.ones((4,3))* 10
a

In [None]:
b = np.ones(4)
b

In [None]:
a + b

In [None]:
a + b.reshape(4, -1)

Más información en el siguiente [link](https://numpy.org/doc/stable/user/theory.broadcasting.html#array-broadcasting-in-numpy).

## Scipy

SciPy es una colección de algoritmos y funciones comunes implementadas sobre NumPy. Agrega comandos de alto nivel y clases para la manipulación e incluso visualización de datos. Es posible encontrar información relevante para el curso [aqui](https://docs.scipy.org/doc/scipy/reference/tutorial/index.html).

A diferencia de las librerías ya trabajadas, se recomienda cargar las funcionalidades de SciPy a través de sus sub-módulos, estos son:

* `cluster`: Algoritmos de aglomeración (clustering)
* `constants`: Constantes matemáticas y físicas
* `fftpack`: rutinas de transformada de Fourier rápida
* `integrate`: Integración y solvers de EDO's
* `interpolate`: Interpolación y splines
* `io`: Input - output
* `linalg`: Álgebra lineal
* `ndimage`: Procesamiento de imágenes N-dimensionales
* `odr`: Regresión de distancias ortogonal
* `optimize`: Módulo de optimización 
* `signal`: Procesamiento de señales
* `sparse`: Manejo de matrices sparse
* `spatial`: Estructuras de datos espaciales
* `special`: Funciones especiales
* `stats`: Distribuciones y funciones estadísticas

A continuación veremos brevemente algunos ejemplos con los módulos de estadística, interpolación y optimización. 

En primer lugar, el modulo de distribuciones y funciones estadísticas se importa por medio de:

In [None]:
from scipy import stats

En este módulo se pueden encontrar clases dedicadas a variables aleatorias tanto discretas como continuas. Cada variable aleatoria de SciPy esta provista de métodos públicos como:
- `.rvs()` para la obtención de muestras aleatorias
- `.pdf()` que contiene su función de densidad de probabilidad asociada
- `.cdf()` que contiene su función de distribución acumulada, 
- `.stats()` que retorna estadísticos como la media y varianza, entre otros métodos.

**Ejemplo**

Cómo generar una variable aleatoria $\mathcal{N}(0,1)$:

<img src="./resources/norm_01_pdf.jpg" alt="Función de densidad de probabilidad" style="width: 500px;"/>
<center>Función de densidad de probabilidad </center>

<img src="./resources/norm_01_cdf.jpg" alt="Función de distribución acumulada" style="width: 500px;"/>
<center>Función de distribución acumulada </center>

In [None]:
normal = stats.norm()

# Estadisticos
print("('media','varianza'):", normal.stats())

In [None]:
# Algunas muestras
print('4 muestras: ', normal.rvs(size=4))

#### Ajuste de distribuciones

Como método adicional una distribución de probabilidad de SciPy posee los métodos `.fit()` para ajustar parámetros de la distribución objetivo mediante máxima verosimilitud. `.fit_loc_scale()` para estimar los parámetros de traslación y escalamiento. `.nnlf()` la función de log versimilutd negativa y `.expect()` el valor esperado de cierta función contra la `pdf` (o `pmf` en el caso discreto).


> **Ejemplo** Ajustar una distribución de la estatura en Chile

In [None]:
sample = [
    163.445, 155.388, 162.915, 189.496, 170.786, 143.99, 169.676, 165.638,
    183.385, 154.783, 158.739, 149.224, 150.83, 187.672, 154.716, 176.548,
    164.658, 158.191, 209.785, 171.219, 172.579, 142.78, 178.892, 192.484,
    208.407
]  # numeros aleatorios...

In [None]:
param_fit = stats.norm.fit(sample)

print('Se estima que la media es :', param_fit[0])
print('Se estima que la varianza es :', param_fit[1])

### Interpolación

Existen distintas opciones de interpolación para datos. La función más básica en este apartado es `interp1d` se puede acceder a esta por medio de

In [None]:
from scipy import interpolate

`interp1d` es un método conveniente para la obtención de una función dado un conjunto de datos unidimensional y fijo. Esta función puede ser evaluada en cualquier punto dentro del soporte (o dominio) que ofrece el rango de los datos. Este método es más bien una clase con el método `__call__` sobrecargado, por tal motivo, pueder se utilizado como una función. 

**Ejemplo**

Se genera una malla de puntos en el intervalo $[0,10]$, sobre estos puntos se evalúa una función coseno compuesta con una transformación cuadrática en los puntos.

In [None]:
x = np.arange(0, 11)
x

In [None]:
def f(x):
    return np.cos(-5 * x**2)
y = f(x)
y

Se interpolan los puntos de `y` por medio de un interpolador lineal y uno cúbico

In [None]:
f_linear = interpolate.interp1d(x, y)
f_cubic = interpolate.interp1d(x, y, kind='cubic')

Se hace más fina el mallado de x

In [None]:
x_new = np.linspace(0, 10, num=50, endpoint=True)

Se evalúan $f(x) = cos(-5x^2)$, `f_linear` y `f_cubic`. Para observar el comportamiento de de estas interpolaciones, es preciso graficar  sus acciones sobre `x_new`. Para ello, se hace uso de la librería `matplotlib` esta librería se estudiará con mayor detenimiento en una cátedra posterior. 

In [None]:
import matplotlib.pyplot as plt

plt.plot(x, y, 'o', x_new, f_linear(x_new), '-', x_new, f_cubic(x_new), '--')
plt.legend(['real', 'linear', 'cubic'], loc='best')
plt.show()

Una **función base radial** (RBF) es una función real $\phi(\cdot)$ cuyo valor depende solo da la distancia entre su input y algún punto fijo, en un espacio vectorial normado, esto toma la forma $\phi(\cdot) = \phi(|| \cdot - c||)$ para algún $c$ fijo. Sin perdida de generalidad, se puede considerar que una función RBF es una función que depende de la norma de su input, es decir, cumple $\phi(x) = \phi(||x||)$. Por le general, este tipo de funciones se denota por $\phi(r)$. Dentro de las funciones radiales se encuentran:

* Gaussiana: $\phi(r) = \exp({-(r/\varepsilon)^2})$
* Lineal: $\phi(r) = r$
* Cúbica: $\phi(r) = r^3$
* Multicuadrática = $\sqrt{(r/\varepsilon)^2 +1}$

SciPy ofrece un método de interpolación basado en funciones de base radial para datos N-dimensionales. 

**Ejemplo**

Se estudia un ejemplo en 2 dimensiones y se visualiza su resultado. Primero, se genera una malla de puntos según la función $x \cdot  exp(-x^2 - y^2)$

In [None]:
# Puntos aleatorios entre -2 y 2 para los ejes x,y

x = np.random.rand(1000) * 4.0 - 2.0
y = np.random.rand(1000) * 4.0 - 2.0

# Función a interpolar
def func_2d(x, y):
    return x * np.exp(-x**2 - y**2)


# Datos con los cuales se interpola
z = func_2d(x, y)

# grilla 2-d regular entre -2 y 2
axis = np.linspace(-2.0, 2.0, 100)
'''
np.meshgrid(x,y) genera un iterable por medio del producto cartesiano 
entre x,y, se puede comprobar al ejecutar print((X[0,0],Y[0,0])).
'''

X, Y = np.meshgrid(axis, axis)

Visualizamos en primer lugar el valor de la función en los puntos de la malla aleatoria generada.

In [None]:
from matplotlib import cm

plt.figure(figsize=[15, 5])
plt.subplot(1, 2, 1)
plt.scatter(x, y, s=15, c=z, cmap=cm.jet)
plt.title('Función en malla aleatoria')
plt.xlim(-2, 2)
plt.ylim(-2, 2)
plt.colorbar()

Se instancia el objeto RBF para que interpole los valores de `z` en los nodos dados por `(x,y)`. La función base a usar será la gaussiana.

In [None]:
'''
Se escohe el parámetro epsilon = 2, este controla 
la suavidad de la interpolacion
'''
eps = 2
rbf = interpolate.Rbf(x, y, z, epsilon=eps)

Finalmente se evalúa el interpolador obtenido en los puntos de la malla regular dada por `X` y `Y`.

In [None]:
Z = rbf(X, Y)

A continuación se muestra la interpolación en la malla regular

In [None]:
plt.figure(figsize=[15, 5])
plt.subplot(1, 2, 1)
plt.pcolor(X, Y, Z, cmap=cm.jet)
plt.title('Interpolación RBF gaussiana eps=2')
plt.xlim(-2, 2)
plt.ylim(-2, 2)