

# Arreglos y operaciones vectoriales con [NumPy](http://www.numpy.org/)


NumPy es un paquete de computación científica con Python que provee:

- Un objecto contenedor muy versatil: arreglo N-dimensional `ndarray`
- Funciones capaces de hacer *broadcasting*
- Módulos para algebra lineal, Transformada de Fourier, generación de número aleatorios, entre otros
- Herramientas para integrar código C/C++


In [None]:
import numpy as np
# Contenidos del namespace np:
np?

### Tipo ndarray (alias array)

Arreglo n-dimensional de tipo fijo. Se puede almacenar y operar de manera eficiente

Podemos crearlo a partir de una lista o una tupla

In [None]:
L = [x for x in range(100000)]
print(type(L))
A = np.array(L)
print(type(A))

Podemos especificar el tipo del arreglo

In [None]:
L = [x for x in range(10)]
np.array(L, dtype=np.float32)

Podemos construir arreglos con más de una dimensión

Los atributos `ndim` y `shape` nos indican las dimensiones y el tamaño del arreglo, respectivamente

In [None]:
L = [[i-j for i in range(5)] for j in range(5)]
print(L)
A = np.array(L)
print(A)
print(A.ndim)
print(A.shape)

### Indexación

Podemos indexar y asignar valores a nuestros arreglos de diversas formas

In [None]:
print(L[3][1]) 
print(A[3, 1]) # Cuarta fila y segunda columna
print(A[:, 1])  # Segunda columna
print(A[2, :]) # Tercera fila 
print(A[::2, 1]) # Elementos pares de la segunda columna

Podemos usar un arreglo de enteros para indexar otro arreglo

In [None]:
ix = np.array([2, 0, 1])
iy = np.array([0, 2, 1])
A[ix, iy] = 10
print(A)

También podemos indexar usando un arreglo de booleanos

In [None]:
A = np.array([0, 2, 1, 3, 4])
B = [True, False, False, True, True]
print(A[B])

### Creación de arreglos

Se pueden crear arreglos directamente desde Numpy:

In [None]:
print(np.zeros(shape=(3, 3), dtype=np.int))  # Lleno de ceros
print(np.ones(shape=(3, 3), dtype=np.float32))  # Lleno de unos
print(np.full(shape=(3, 3), fill_value=2.1))  # Lleno de 2.1
print(np.eye(3))  # Matriz identidad
print(np.random.randn(3, 3))  # Matriz aleatoria con distribución N(0, 1)
# np.empty((3, 3))

Existen versiones de estas funciones que copian el tamaño de otro ndarray

In [None]:
print(np.zeros_like(A))

Funciones para crear rangos:

In [None]:
print(np.arange(start=0, stop=10, step=0.5))  
print(np.linspace(start=0, stop=10, num=21)) 
print(np.logspace(start=-1, stop=1, num=21))

Ojo con los tamaños de los arreglos. 

Un arreglo unidimensional puese ser vector fila, vector columna o ninguno!

In [None]:
A = np.array([0, 1, 2, 3, 4])
print(A.shape)
A = np.array([[0], [1], [2], [3], [4]])
print(A.shape)
A = np.array([[0, 1, 2, 3, 4]])
print(A.shape)

Se puede agregar una dimensión a un arreglo usando `newaxis`

In [None]:
A = np.array([0, 1, 2, 3, 4])
print(A.shape)
print(A[:, np.newaxis].shape)
print(A[np.newaxis, :].shape)

### Manipulación de matrices y vectores

Operaciones para modificar la forma de un arreglo: `reshape`, `tile`, `repeat`

In [None]:
A = np.arange(6)
print(A)
# Crea nuevas dimensiones pero se debe preservar el tamaño
print(np.reshape(A, (3, 2)))  # in-place: A.reshape(3, 2)
print(np.reshape(A, (2, 3)))
# Repite el arreglo en una dirección dada
print(np.tile(A, (6, 1)))
print(np.tile(A, (1, 6)))
# Repite cada elemento en una dirección dada
print(np.repeat(A, 2))
print(np.repeat(A.reshape(3, 2), 2, axis=0))
# Aplana una matriz
print(np.ravel(np.zeros(shape=(5, 5))))

Se puede crear una matriz diagonal a partir de un vector con `diag`

También sirve para extraer la diagonal de una matriz 

In [None]:
A = np.arange(5)
print(np.diag(A))
B = np.random.randn(3, 3)
print(B)
print(np.diag(B))

Trasposición de una matriz con `transpose`

In [None]:
A = np.arange(9).reshape(3, 3)
print(A)
print(np.transpose(A)) # Equivalente a A.transpose() o A.T
A = np.arange(27).reshape(3, 3, 3)
print(A)
print(np.transpose(A, axes=(0, 2, 1)))  # Equivalente a: np.swapaxes(A, 2, 1)

Operaciones para juntar dos o más arreglos: `concatenate`, `vstack`, `hstack`

In [None]:
A = np.arange(6).reshape(1, 6)
B = np.ones(shape=(1,6))
print(np.concatenate((A, B), axis=0))
print(np.concatenate((A, B), axis=1))
print(np.vstack((A, B)))
print(np.hstack((A, B)))

### Operaciones aritméticas básicas entre arreglos



In [None]:
N = 5
A = np.eye(N)
B = np.ones(shape=(N, N))
print(A + B)
# Multiplicación punto a punto:
print(A*B)  
# Multiplicación matricial
print(np.dot(A, B))  #  Equivalente a A.dot(B) y A@B

Cuando los términos no son del mismo tamaño se hace un `broadcast`

In [None]:
A - 1

In [None]:
C = np.arange(N)
print(C)
print(B + C)

In [None]:
C.reshape(1, N) + C.reshape(N, 1)

Reglas de broadcasting

1. Si dos arreglos son de dimensiones distintas la dimensión del más pequeño se agranda con "1"s por la izquierda
1. Si dos arreglos tienen tamaños ditintos, el que tiene tamaño "1" se estira en dicha dimensión
1. Si en cualquier dimensión los tamaños son distintos y ninguno es igual a "1" ocurre un error


![index.png](attachment:index.png)

Ref: https://jakevdp.github.io/PythonDataScienceHandbook/06.00-figure-code.html#Broadcasting

In [None]:
A = np.arange(6).reshape(2, 3)
print(A.shape)
print(A)
B = np.arange(3)
print(B.shape)
print(B)
print(B.reshape(1, -1))
A + B

### Operaciones vectorizadas 

Tal vez la mayor ventaja de NumPy son sus funciones vectorizadas. Funciones altamente eficientes que trabajan sobre los `ndarray`

Hagamos una pequeña prueba de desempeño sumando un vector


In [None]:
A = np.arange(100000)

def suma_loop(arreglo):
    suma = 0.
    for elemento in arreglo:
        suma += elemento
    return suma

L = list(A)
%timeit -n10 suma_loop(A)
%timeit -n10 sum(A)
%timeit -n10 sum(L)
%timeit -n10 np.sum(A)

Reducciones eficientes con NumPy: `sum`, `prod`, `amax`, `amin`, `argmax`, `argmin`, `mean`, `std`, `var`, `percentile`, `median`

In [None]:
A = np.tile(np.arange(3), (3, 1))
print(A)
print(np.sum(A, axis=0))
print(np.sum(A, axis=1))
print(np.sum(A))
A = np.random.randn(3, 3)
print(A)
print(np.amax(A, axis=0))
print(np.argmax(A, axis=0))

Muchas de estas funciones están implementadas como métodos de la clase arreglo

In [None]:
print(A.sum())
print(A.max(axis=0))
print(A.min())

También cuenta con versiones seguras contra NaNs

In [None]:
A = np.array([1., 10., 2., np.nan])
print(np.sum(A))
print(np.nansum(A))

Valor absoluto de un arreglo

In [None]:
A = np.random.randn(3, 3)
print(A)
np.absolute(A) # Equivalente a np.abs(A)

Exponentes y raices

In [None]:
x = np.arange(10)
print(np.power(x, 2))
print(np.sqrt(x))
print(x**2)

Función exponencial, logaritmo y funciones trigonométricas

In [None]:
x = np.array([0.1, 1., 10.0])
print(np.log(x))
print(np.exp(x))
print(np.sin(x))
print(np.cos(x))

### Operaciones booleanas 

NumPy soporta operaciones booleanas sobre ndarray

In [None]:
A = np.arange(6).reshape(2, 3)
print(A)
print(A == 4)
print(np.equal(A, 4))

In [None]:
~(A % 2 == 0) & (A > 2)

In [None]:
(ixs, iys) = np.where(~(A % 2 == 0) & (A > 2))

for i, j in zip(ixs, iys):
    print("Fila {0} Columna {1} Valor {2}".format(i, j, A[i, j]))

Funciones `any` y `all`

In [None]:
x = np.random.randn(3, 3)
print(x)
b = (x > 0) & (x**2 > 0.5)
print(b)
print(np.any(b))
print(np.all(b))

### Ordenando arreglos

NumPy provee la función `np.sort` para ordernar ndarray (implementa quicksort)

In [None]:
np.sort?

In [None]:
A = np.random.randn(5)
print(A)
print(np.sort(A))
print(np.sort(A, kind='heapsort'))
print(np.argsort(A))

In [None]:
A = np.random.randn(3, 3)
print(A)
print(np.sort(A))
print(np.sort(A, axis=0))
print(np.sort(A, axis=None))

### Copias en memoria
Algunas operaciones sobre arreglos no hacen copias (usan referencias)

In [None]:
A = np.arange(100).reshape(10, 10)
B = A
B is A

In [None]:
A[0, 0] = 100
print(B[0])

Se puede forzar la creación de una copia con el método `copy()`

In [None]:
B = A.copy()
A[0, 0] = 0
print(B[0])

### Modulos de NumPy