# Introducción/repaso de NumPy

- Objetivo:
    - Conceptos y uso básico de Numpy.
    - Preparación para Pandas

# Introducción/repaso de NumPy

- Plan:
    1. Arrays de NumPy.
    2. Vistas vs copias
    3. Inicialización
    4. Manipulación de arrays
    5. Indexado y máscaras de selección
    6. Broadcasting

# 1. Arrays de NumPy

In [None]:
# Idiom típico para importar Numpy
import numpy as np 

- La estructura básica de NumPy es el array n-dimensional. 
- Los arrays tienen:
    - una forma (cantidad de dimensiones y tamaño de cada una y 
    - un tipo de (int32, float32, int64, etc.).

In [None]:
# Creación de un array de 10 floats (32bit).
a = np.ndarray( shape=(10), dtype=np.float32 )
a

Podemos ver la forma de un array con el atributo shape.

In [None]:
a.shape

Podemos crear arrays n-dimensionales y con distintos tipos. Por ejemplo, un array (4,3) de números complejos.

In [None]:
z = np.ndarray( shape=(4,3), dtype=np.complex )
z

In [None]:
z.shape

In [None]:
z[0] = 2 + 3j
z

- Es común que querramos crear arrays con valores iniciales.
- Por ejemplo, con una secuencia de números. 
    - La función arange puede verse como el equivalente en NumPy de range() de Python.

In [None]:
a = np.arange(10)
a

Indexación y slicing.

In [None]:
a[0],a[1],a[-1]

In [None]:
a[0:5]

# 2.  Vistas vs. copias

- En la sección anterior se mostró como en Python cada variable asignada recibe un nuevo objeto. 
- En NumPy el comportamiento por defecto es no crear un nuevo objeto, sino devolver una referencia a un objeto existente. 

In [None]:
a = np.arange(10)
a

In [None]:
b = a # Importante! b apunta a a
print(id(a),id(b))
assert(id(a)==id(b))

In [None]:
a[0],b[0]

In [None]:
a[0] = 99

- Es importante tener cuidado con esto! 
- Un error común cuando se trabaja con variables para cálculos intermedios es modificar el dato original.

In [None]:
b[0]

In [None]:
a = np.arange(10)
a

In [None]:
b = a.copy()
b

In [None]:
a[0] = 99

In [None]:
a[0],b[0]

# 3. Inicialización de arrays

Muestreo con interpolación lineal.

In [None]:
a = np.linspace(0,1,10)
a

Inicilizar una matriz de ceros.

In [None]:
a = np.zeros(shape=(2,2))
a

Inicilizar una matriz de unos.

In [None]:
a = np.ones(shape=(2,3))
a

Crear una matriz identidad.

In [None]:
a = np.eye(4)
a

# 4. Manipulación de arrays

Operación transpuesta.

In [None]:
a.T

In [None]:
a = np.arange(10,20)
b = np.arange(20,30)

Vertical Stacking.

In [None]:
c = np.vstack([a,b])
c.shape

In [None]:
c

Horizontal Stacking

In [None]:
c = np.hstack([a,b])
c.shape

In [None]:
c

Flatten y Reshaping

In [None]:
a = np.random.randint(4, size=(6, 3))
a.shape

In [None]:
a_flattened = a.ravel()
a_flattened

In [None]:
a_flattened.shape

In [None]:
a.reshape(2,9)

# 5. Indexado y máscaras de selección

A menudo es útil seleccionar los elementos de un array que verifiquen alguna condición para realizar acciones sólo con esos elementos.

In [None]:
a = np.random.randint(4, size=(6, 3))
print(a.shape)
a

In [None]:
# Fila 0
a[0,:]

In [None]:
# Si no se indica una selección de elementos en una dimensión
# por defecto es ::1 (todos los elementos recorridos de a 1)
a[0] # a[0,::1]

In [None]:
a[0,0]

In [None]:
a[0,2]

In [None]:
a[1]

In [None]:
a[-1]

In [None]:
# Todas las filas, sólo la última columna
a[:,-1]

In [None]:
# Acceso aleatorio filas 0,3 y 4
random_access_indexes = [ 0, 3, 4 ]

a[random_access_indexes,:]

In [None]:
# Aplicar una expresión con arrays 
# devuelve un array del mismo tamaño 
# con el resultado de la evaluación element-wise
condition_is_greater_than_2 = a > 2
condition_is_greater_than_2

In [None]:
condition_is_less_than_3 = a < 3
condition_is_less_than_3

In [None]:
condition_is_even = a & 1 == 0
condition_is_even

In [None]:
condition_is_odd = a & 1 == 1
condition_is_odd

In [None]:
# Composición de condiciones
(condition_is_greater_than_2 & condition_is_less_than_3) & (condition_is_even)

In [None]:
# Para alguna operación puedo necesitar conocer los índices (i,j,..) de un elemento
rows = np.arange(3)
cols = np.arange(3)

a = (rows,cols)
a

In [None]:
# Lo anterior es equivalente a esto: 
grid = np.indices((3,3))

i = 0
k = 0
grid[:,i,k]

In [None]:
# Y para qué sirve? Ejemplo. i == j
diag_mask = grid[0,:,:] == grid[1,:,:]
diag_mask

In [None]:
# i >= j
lower_diag_mask = grid[0,:,:] >= grid[1,:,:]
lower_diag_mask

In [None]:
# i <= j
upper_diag_mask = grid[0,:,:] <= grid[1,:,:]
upper_diag_mask

In [None]:
a = np.random.rand(3,3)
a

In [None]:
a[diag_mask]

In [None]:
a[upper_diag_mask]

In [None]:
a[lower_diag_mask]

In [None]:
np.sum(a[diag_mask])

In [None]:
a_diag = a
a_diag

In [None]:
a_diag[0][0] = 1

In [None]:
a[0]

# 6. Broadcasting

> The term broadcasting describes how numpy treats arrays with different shapes during arithmetic operations. 
> Subject to certain constraints, the smaller array is “broadcast” across the larger array so that they have 
> compatible shapes.

Fuente: Broadcasting, SciPy.org.

> In the context of deep learning, we also use some less conventional notation. 
> We allow the addition of matrix and a vector, yielding another matrix:
> C = A + b, where Ci,j = Ai,j + bj. 
> In other words, the vector b is added to each row of the matrix. 
> This shorthand eliminates the need to define a matrix with b copied into each 
> row before doing the addition. This implicit copying of b to many locations 
> is called broadcasting.

Fuente: Deep Learning (Adaptive Computation and Machine Learning series)

## Regla de broadcasting

> In order to broadcast, the size of the trailing axes for both arrays in an operation 
> must either be the same size or one of them must be one.

In [None]:
a = np. array([[ 0.0, 0.0, 0.0],
            [10.0,10.0,10.0],
            [20.0,20.0,20.0],
            [30.0,30.0,30.0]])

In [None]:
b = np.array([1.0,2.0,3.0])
a + b

## Bibliografía y Referencias

- Sci-Py Lectures https://scipy-lectures.org/. Accedido: 25/01/2021
- A Visual Intro to NumPy and Data Representation. http://jalammar.github.io/visual-numpy/. Accedido: 25/01/2021
- [Array Broadcasting in numpy](https://scipy.github.io/old-wiki/pages/EricsBroadcastingDoc)