

# Arreglos y operaciones vectoriales con [NumPy](http://www.numpy.org/)


NumPy es un paquete de computación científica con Python que provee:

- Un objecto contenedor muy versatil: arreglo N-dimensional `ndarray`
- Funciones capaces de hacer *broadcasting*
- Módulos para algebra lineal, Transformada de Fourier, generación de número aleatorios, entre otros
- Herramientas para integrar código C/C++


In [None]:
import numpy as np
# Contenidos del namespace np:
np??

### Tipo ndarray (alias array)

Arreglo n-dimensional de tipo fijo. Se puede almacenar y operar de manera eficiente

Podemos crearlo a partir de una lista o una tupla

In [None]:
L = [x for x in range(100000)]
print(type(L))
A = np.array(L)
print(type(A))

Python incorpora los modulos [math](https://docs.python.org/3/library/math.html) y cmath que proveen funciones matemáticas. Existen otras operaciones como `sum`, `abs`, `min` y `max` que vienen como parte del estándar. 

NumPy provee versiones de estas funciones que son más eficientes siempre que se usen sobre un `ndarray`

In [None]:
%timeit -n 10 sum(L)
%timeit -n 10 np.sum(A)

In [None]:
%timeit -n 10 [abs(x) for x in L]
%timeit -n 10 np.abs(A)

Podemos especificar el tipo del arreglo

In [None]:
L = [x for x in range(10)]
np.array(L, dtype=np.float32)

Podemos construir arreglos con más de una dimensión

Los atributos `ndim` y `shape` nos indican las dimensiones y el tamaño del arreglo, respectivamente

In [None]:
L = [[i-j for i in range(5)] for j in range(5)]
print(L)
A = np.array(L)
print(A)
print(A.ndim)
print(A.shape)

Podemos indexar y asignar valores a nuestros arreglos de diversas formas

In [None]:
print(L[3][1])
print(A[3, 1])
print(A[:, 1])
print(A[2, :])
print(A[::2, 1])
print(A[[2, 0, 1], 1])

In [None]:
A[[2, 0, 1], [0, 2, 1]] = 10
print(A)

Se pueden crear arreglos directamente desde Numpy:

In [None]:
print(np.zeros(shape=(3, 3), dtype=np.int))  # Lleno de ceros
print(np.ones(shape=(3, 3), dtype=np.float32))  # Lleno de unos
print(np.full(shape=(3, 3), fill_value=2.1))  # Lleno de 2.1
print(np.eye(3))  # Matriz identidad
print(np.random.randn(3, 3))  # Matriz aleatoria con distribución N(0, 1)
# np.empty((3, 3))

Existen versiones de estas funciones que copian el tamaño de otro ndarray

In [None]:
print(np.zeros_like(A))

Funciones para crear rangos:

In [None]:
print(np.arange(start=0, stop=10, step=0.5))  
print(np.linspace(start=0, stop=10, num=21)) 
print(np.logspace(start=-1, stop=1, num=21))

### Operaciones aritméticas básicas entre arreglos



In [None]:
N = 5
A = np.eye(N)
B = np.ones(shape=(N, N))
print(A + B)
# Multiplicación punto a punto:
print(A*B)  
# Multiplicación matricial
print(np.dot(A, B))  #  Equivalente a A.dot(B) y A@B

Cuando los términos no son del mismo tamaño se hace un `broadcast`

In [None]:
print(2*A - 1)
print(A[:, 0] + 1)
C = np.arange(N)
print(A + C)

Ojo con los tamaños de los arreglos

In [None]:
A = np.array([0, 1, 2, 3, 4])
print(A.shape)
A = np.array([[0], [1], [2], [3], [4]])
print(A.shape)
A = np.array([[0, 1, 2], [1, 1, 2], [2, 1, 2], [3, 1, 2], [4, 1, 2]])
print(A.shape)

### Manipulación de matrices y vectores

Operaciones para modificar la forma de un arreglo: `reshape`, `tile`, `repeat`

In [None]:
A = np.arange(6)
print(A)
# Crea nuevas dimensiones pero se debe preservar el tamaño
print(np.reshape(A, (3, 2)))  # in-place: A.reshape(3, 2)
print(np.reshape(A, (2, 3)))
# Repite el arreglo en una dirección dada
print(np.tile(A, (6, 1)))
print(np.tile(A, (1, 6)))
# Repite cada elemento en una dirección dada
print(np.repeat(A, 2))
print(np.repeat(A.reshape(3, 2), 2, axis=0))
# Aplana una matriz
print(np.ravel(np.zeros(shape=(5, 5))))

Se puede crear una matriz diagonal a partir de un vector con `diag`

También sirve para extraer la diagonal de una matriz 

In [None]:
A = np.arange(5)
print(np.diag(A))
B = np.random.randn(3, 3)
print(B)
print(np.diag(B))

Trasposición de una matriz con `transpose`

In [None]:
A = np.arange(9).reshape(3, 3)
print(A)
print(np.transpose(A))
print(A.T)
A = np.arange(27).reshape(3, 3, 3)
print(A)
print(np.transpose(A, axes=(0, 2, 1)))  # Equivalente a: np.swapaxes(A, 2, 1)

Operaciones para juntar dos o más arreglos: `concatenate`, `vstack`, `hstack`

In [None]:
A = np.arange(6).reshape(1, 6)
B = np.ones(shape=(1,6))
print(np.concatenate((A, B), axis=0))
print(np.concatenate((A, B), axis=1))
print(np.vstack((A, B)))
print(np.hstack((A, B)))

### Operaciones de reducción

Tales como `sum`, `amax`, `amin`, `argmax`, `argmin`

In [None]:
A = np.tile(np.arange(3), (3, 1))
print(A)
print(np.sum(A, axis=0))
print(np.sum(A, axis=1))
print(np.sum(A))
A = np.random.randn(3, 3)
print(A)
print(np.amax(A, axis=0))
print(np.argmax(A, axis=0))

https://www.numpy.org/devdocs/user/quickstart.html


Lectura y manipulación de datos usando Numpy y Pandas

Serialización

Visualización de datos usando matplotlib 

Jupyter widgets

Manteniendo un repositorio en github

https://www.analyticsvidhya.com/blog/2017/01/the-most-comprehensive-data-science-learning-plan-for-2017/

# Manejador de versiones

https://happygitwithr.com/credential-caching.html

https://github.com/IACS-CS-207/cs207-F18/blob/master/lectures/L02/L2.ipynb

