<img src="../files/misc/logo.gif" width=300/>
<img src="../files/misc/itam.JPG" width=300/>
<h1 style="color:#872325"> Numpy: Arrreglos Matriciales </h1>

In [None]:
#Forma más común de import numpy, utilizando el alias np
import numpy as np

El principal objeto de la Librería Numpy son arreglos homogéneos multidimensionales. Es decir, es una tabla de elementos, todos con el mismo tipo e indexados por un *tuple* de enteros positivos. 

La dimensiones en numpy se llaman **ejes** (axes); el número de ejes se llama el **rango** (rank).

La clase de arreglos en NumPy se conocen como **ndarray**s o, más comunmente, **arrays**.

In [None]:
arr1 = np.array( [ [1, 2, 3], [4, 5, 1] ] )
arr1

In [None]:
help(np.array)

In [None]:
#Los ndarrays tienen una gran variedad de métodos
#que pueden ser aplicados a cada uno de los ejes
arr1.sum(axis = 0)

In [None]:
arr1.sum(axis = 1)

Una de las principales ventajas de usar `numpy` es el poder de usar vectorización de funciones aplicadas a un `numpy.array`. Esto implica poder aplicar una función a cada `numpy.array` sin necesidad de expresar un *for loop*, lo cuál hace trabajar con este tipo de funciónes más eficientemente.

In [None]:
print(arr1)
print(arr1 * 2)

### Propiedas Principales de `ndarray`

In [None]:
arr1 = numpy.array([[1,2,3, 4], [4,5, 1, 6], [4,4, 4, 1]])

In [None]:
arr1

In [None]:
arr1.ndim

In [None]:
arr1.shape

In [None]:
arr1.dtype

## Operaciones y Propiedades de Numpy Arrays

In [None]:
a1 = np.array([
     [2, 4, 6],
     [3, 5, 1]
])

In [None]:
a1 + 1

In [None]:
# Elevar al cuadrado cada entrada
a1 ** 2

In [None]:
# ¿Qué cree que ocurra con la siguiente operación?
a1 * a1

In [None]:
a1 += 1 
a1

In [None]:
# Comparación entrada a entrada
x = a1 <= 3
x

### np.arange, np.linspace
Podemos crear rangos de números $[a, b)$ usando la funcion `arange` (análogo a `range` en Python)

In [None]:
np.arange(10)

In [None]:
np.arange(2, 11, 2)

In [None]:
# A diferencia de range, np.arange nos permite tomar pasos fraccionarios
np.arange(1, 11, 0.5)

Usamos la función `linspace` cuando deseamos un arreglo de $n$ elementos entre $a$ y $b$ (inclusivo); $a < b$

In [None]:
a, b = 2, 10
x = np.linspace(a, b, 20)
print(x)

In [None]:
help(np.linspace)

In [None]:
x = np.arange(100)
y = (x + 100) * x
print(y[99])
print(y[10])

<h2 style="color:crimson">Ejercicio</h2>

Crea un numpy array con 100 elementos $\{x_i\}_{i=0}^{99}$ donde
$$
    x_i = i (i + 100) \ \forall \ i \in \{0, \ldots, 99\}
$$

e.g., $x_{99} = 19701$; $x_{10} = 1100$ 

## Índices

In [None]:
arr = np.arange(25).reshape(5, 5)
arr

In [None]:
fila, columna = 1, 2
arr[fila, columna]

In [None]:
filas, columnas = [-2, -1], [0, 3]
arr[filas, columnas]

Podemos seleccionar múltiples filas usando ```:```.
También es posible modificarlas (los arrays son mutables)

In [None]:
arr[[0, -1],:]

In [None]:
arr[[0, -1], :] = 0

In [None]:
arr

In [None]:
arr[[0, -1]] # equiv. arr[[0, -1], :]

In [None]:
np.random.randint(-100, -1, size=(2, 5))

In [None]:
# podemos asignar varios valores de la misma
# dimension a la que se le hizo la selección
x = np.random.randint(-100, -1, size=(3, 5))
print(x)
arr[[0, -1, 3]] = x
arr

In [None]:
# Al igual que una lista en Python, podemos
# revertir el orden de un numpy array con índices
arr[1][::-1]

## Broadcasting
**Broadcasting** (difusión) es la manera en que numpy manipula *arrays* con diferentes dimensiones durante operaciones aritméticas.
Para $A$, $B$, dos dimensiones son compatibles cuando

1. Son iguales;
2. Una dimensión es igual a 1.

In [None]:
A = np.arange(25).reshape(5, 5)
B = np.arange(5).reshape(1, 5)

print(A)
print(B)

In [None]:
A * B

In [None]:
A + B

## Métodos comunes 

### np.zeros

In [None]:
np.zeros(shape=10)

In [None]:
np.zeros(shape=(5,5))

In [None]:
x = np.zeros(shape=(2, 5, 5))
x

In [None]:
x[0,:,:] += 1
x[1,:,:] += 2
y = x.sum(axis = 0)
print(x)
print(y)

### np.ones

In [None]:
np.ones(shape=10)

In [None]:
np.ones(shape=(3,5,5))

### np.triu, np.tril

In [None]:
np.triu([1, 2, 4, 6], k=0)

In [None]:
print(np.tril([1,2,4, 6], k=0))
print('-'*10)
print(np.tril([1,2,4, 6], k=1))

In [None]:
help(np.tril)

### np.identity

In [None]:
# np.eye(5) regresa el mismo resultado
np.identity(5)

In [None]:
np.eye(5)

<h2 style="color:crimson">Ejercicio</h2>
Crea un numpy array en $\mathbb{R}^{10\times 10}$ tal que

$$
x_{i,j} = 
\begin{cases}
    2i & \forall \ i = j \\
    0 & \forall \ i \neq j
\end{cases}
$$

Considera $i, j \in \{1, \ldots, 10\}$

**Sugerencia**

```python
help(np.nonzero)
```

### Dimensiones de numpy arrays
Los `ndarray`s son $n$ dimensionales, lo que significa que podemos crear una arreglo $n$-dimensional siguiendo la misma lógica.

In [None]:
# Dim: 1
np.arange(12)

In [None]:
# Dim: 2. Arreglamos una matriz con 4 filas y 3 columnas
np.arange(12).reshape(3, 4)

In [None]:
# Dim: 3. Arreglamos dos matrices, cada una con 2 filas y 3 columnas
# (Tensor de segundo orden)
np.arange(12).reshape(2, 2, 3)

### Métodos de un Numpy Array

In [None]:
a2 = np.random.randint(-100, 100, 10)
a2

In [None]:
a2.min(axis)

In [None]:
a2.max()

In [None]:
a2.argmax()

In [None]:
a2.sum()

In [None]:
a2.cumsum()

In [None]:
#Manejando más de dos ejes (axis)
from numpy.random import seed, randint
seed(42)

#'Cubo'
a3 = randint(-100, 100, size=(2, 5, 10))
a3

In [None]:
print(a3.sum(axis=0))
print('-'*60)

print(a3.sum(axis=1))
print('-'*60)

print(a3.sum(axis=2))
print('-'*60)

## Funciones en Numpy

In [None]:
a3

In [None]:
np.unique(a3, return_counts=False)

In [None]:
help(np.unique)

In [None]:
unicos, conteo = np.unique(a3, return_counts=True)
print(unicos)
print('--'*20)
print(conteo)

In [None]:
# Podemos encontrar los índices dentro de un 
# numpy array usando np.where
a4 = np.array([-1, 0,  1, -2, 1, 0, -4])
print(a4[np.where(a4 > 0)])

#Equivalente
print(a4[a4 > -1])

In [None]:
a5 = np.array([
    [-1, 0,   1, -2,  1,  0, -4],
    [1,  1,  -1,  2,  2, -3,  4],
])
np.where(a5 > 0)

#(array([0, 0, 1, 1, 1, 1, 1]), array([2, 4, 0, 1, 3, 4, 6]))
       #INDICE DE LA LISTA      ÍNDICE ADENTRO DE LA LISTA

In [None]:
help(np.where)

Numpy nos permite aplicar una función a un eje en particular usando la función `np.apply_along_axis(func1d, axis, arr, *args, **kwargs)`; donde `func1d` es una función. $f:\mathbb{R}^n \to \mathbb{R}^m$, `axis` es el eje a ejecutar: *0* para cada fila de una columna dada y *1* para cada columna de una fila y; `arr` es el numpy array a manipular.

In [None]:
help(np.apply_along_axis)

In [None]:
from numpy.random import randint, seed
seed(1643)
a3 = randint(-10, 10, size=(5,4))
a3

In [None]:
def mi_funcion(x, *args):
    print(type(x))
    print(x)


In [None]:
resultado = np.apply_along_axis(mi_funcion, axis=1, arr=a3)

In [None]:
from math import sin, cos
def mi_funcion2(x):
    return np.sin(x) + np.cos(x)

resultado = np.apply_along_axis(mi_funcion2, axis=1, arr=a3)
resultado

In [None]:
# Ordenando cada renglón de una fila
np.apply_along_axis(sorted, 1, a3)

**Nota**

Al usar la función `np.apply_along_axis`, numpy aplica implicitamente un for loop en python sobre el eje que decidamos. Usar `np.apply_along_axis` **no** es la manera más eficiente de realizar este tipo de operaciones. Siempre que exista una operación equivalente de python en numpy, es recomendable usar la función dentro de numpy.

Por ejemplo, el equivalente de `sorted` en python es `np.sort` en numpy

In [None]:
a3 = randint(0, 10, size=(10_000, 10_000))

In [None]:
#%%timeit -n 5
np.apply_along_axis(sorted, 0, a3);

In [None]:
%%timeit -n 5
# Ordenando cada fila de una columna
np.sort(a3, 0);

### Ejemplo: Series tiempo AAPL

In [None]:
aapl = np.loadtxt("../files/lec08/AAPL.txt")
aapl

In [None]:
help(np.loadtxt)

In [None]:
np.where(np.diff(aapl) > 0)[0]

In [None]:
for num, val in zip(*np.histogram(np.diff(aapl), bins="auto")):
    print(round(val), "*" * num)