# NumPy: La herramienta central para cómputo numérico en Python

## NumPy y NumPy arrays:

NumPy es un paquete que extiende el lenguaje Python para arreglos multi-dimensionales. Provee:
- Eficiencia ("acercamiento al hardware")
- Conveniencia. Diseñado para cómputo científico
    - También conocido como *array oriented computing*
- Objetos de Python:
    - Contenedores listas y diccionarios más eficientes que los de nativos (costless insertion and append, fast lookup)
    - Objetos de alto nivel: Int y float con rangos extendidos del core de Python
    
Por convención, se recomienda importa el paquete de la siguiente manera:

In [None]:
import numpy as np

Hola, Mundo! en NumPy:

In [None]:
hola_mundo = np.array([0, 1, 2, 3])

In [None]:
hola_mundo

In [None]:
type(hola_mundo)

Este arreglo (nunpy array) podría contenner:
- valores de un experimento o simulación
- señales medidas por un sensor (ondas de sonido, PWM, Analog-to-digital_converter, etc)
- Pixeles de una imagen
- Datos de modelos 3D en posiciones X-Y-X (MRI scan, LIDAR)


Por qué es útil?

Disponemos de contenedores de datos eficientes en consumo de memoria y con operaciones numéricas bastante rápidas.

Documentación de ndarray: https://docs.scipy.org/doc/numpy-1.14.0/reference/arrays.ndarray.html

In [None]:
# Python
L = range(1000)

In [None]:
%timeit [i**2 for i in L]

In [None]:
# NumPy
a = np.arange(1000)

In [None]:
%timeit a**2

## Creando Arrays

```
np.array(n)
np.array(n,m)
```
### 1D:

In [None]:
array_1d = np.array([0, 1, 2, 3])

In [None]:
array_1d

In [None]:
array_1d.ndim

In [None]:
array_1d.shape

In [None]:
len(array_1d)

### 2D/3D:

In [None]:
array_2d =  np.array([[0, 1, 2], [3, 4, 5]])    # 2 x 3 array

In [None]:
array_2d

In [None]:
array_2d.ndim

In [None]:
array_2d

In [None]:
len(array_2d)

In [None]:
array_3d = np.array([[[1], [2]], [[3], [4]]])

In [None]:
array_3d

In [None]:
array_3d.ndim

In [None]:
len(array_3d)

En la práctica, rara vez creamos arreglos escribiendo elemento por elemento.
Cargamos los elementos de alguna fuente de datos o de archivos propios de NumPy.

Usualmente, usamos `arange`, `linspace`, `diag`, o `eye`.
NumPy también provee otras cinco formas para crear arreglos aparte de `array()`:

1. `arange()`
1. `zeros()`
1. `ones()`
1.  `empty()`
1. `random()`

Ejercicio: **Qué arreglos regresa cada función?**

#### Atributos de ndarray

- data
- dtype
- base
- ndim
- shape 
- size
- itemsize
- nbytes
- strides
- flags

Ejercicio: **De qué nos informa cada atributo?**

---
Ejercicios:

- Crea un arreglo bidimensional con las siguientes propiedades: números pares en el primer renglón, y pares en el segundo. Bonus points, si lo generas usando listas.
- Cómo se relacionan la función `len()` de Python cony `numpy.shape()` y el atributo `ndim`?
- Para qué funciona la *semilla aleatoria* (`np.random.seed()`)?
- Qué hace la función `np.emtpy`? Cuándo seria útil?

## Tipos de dato básicos
Quizá ya notaste que hay alguna diferencia entre los arreglos con punto flotante y enteros. Esto se debe al tipo de dato usado:

In [None]:
a = np.array([1, 2, 3])
a.dtype

In [None]:
b = np.array([1., 2., 3.])
b.dtype

Diferentes tipos de dato permiten almacenar datos de una forma más compacta en memoria, aunque la mayoria del tiempo trabajamos con números de punto flotante. **NumPy detecta de forma automática el tipo de dato según el input**.

Aunque se puede especificar si lo deseas:

In [None]:
c = np.array([1, 2, 3], dtype=float)
c.dtype

c

El tipo de dato por **default** es el de entero de punto flotante:

In [None]:
a = np.ones((3, 3))
a.dtype

Qué otros tipos tenemos?

- Complex:

In [None]:
d = np.array([1+2j, 3+4j, 5+6*1j])
d.dtype

Bool:

In [None]:
e = np.array([True, False, False, True])
e.dtype

Strings:

In [None]:
f = np.array(['Bonjour', 'Hello', 'Hallo',])
f.dtype 

Todos los dtypes! :O
![](img/numpy/1.png)
![](img/numpy/2.png)
![](img/numpy/3.png)

*Effective Computation in Physics. P. 205. Table 9.2: Basic NumPy dtypes*

-----

### DataViz de un ndarray

In [None]:
%matplotlib inline 

In [None]:
import matplotlib.pyplot as plt

**1D**

In [None]:
x = np.linspace(0, 3, 20)
y = np.linspace(0, 9, 20)

In [None]:
plt.plot(x, y, 'o')

In [None]:
plt.plot(x, y)

In [None]:
plt.plot(x, y, '*')

**2D arrays**

In [None]:
image = np.random.rand(30, 30)

In [None]:
image

In [None]:
plt.imshow(image, cmap=plt.cm.hot)    
plt.colorbar()  

Ejercicio: Prueba otros mapas de color para tu arreglo bidimensional


----

## Indexing y Slicing

Indexing

Podemos acceder a los elementos de un arreglo de la misma forma que otros contenedores en Python:

In [None]:
a = np.arange(10)
a

In [None]:
a[0], a[4], a[9]

Y podemos usar la forma usual de Python para invertir una secuencia:

In [None]:
a[::-1]

Para arreglos multidimensionales, los indices son tuplas de enteros:

In [None]:
a = np.diag(np.arange(3))
a

In [None]:
a[1,1]

In [None]:
a[2,1]

In [None]:
a[2,2]

**Qué pasa si solo especificamos un entero?**

Slicing:

`ndarray[start:end:step]`

https://www.kdnuggets.com/2016/06/intro-scientific-python-numpy.html

In [None]:
a = np.arange(10)
a

In [None]:
a[:4]

In [None]:
a[1:3]

In [None]:
a[::2]

In [None]:
a[3:]

Pequeño resumen de indexing y slicing en NumPY:

![](img/numpy/numpy_indexing.png)

**Ejercicio: Prueba a reproducir matriz y las operaciones de slice representadas**


🛑 Es importante mencionar, que cada operación de slice es solo una vista del arreglo original. Es una forma de acceder a los datos y no se copia en memoria. **Si modificamos el arreglo original, la vista también cambiara (y viceversa)**.
Eso se puede evitar con la función `.copy()` al generar una vista.

👀👀👀



## Fancy indexing

También podemos acceder a los elementos de un arreglo usando expresiones booleanas o con arreglos de números (*masking*). Estos indices también son dinámicos y tienen las siguientes propiedades:

- Los indices pueden ser arbitrarios
- Se pueden repetir
- Pueden estar fuera del orden del ndarray
- La forma definida en el indice puede no empatar a la forma del arreglo
- También puede tener más o menos dimensiones que el arreglo
- Se pueden integrar con operaciones Slice

La principal desventaja de usar Fancy Indexing, es que requiere crear una copia en memoria de los datos obtenidos.

**Qué hace el siguiente código?**

In [None]:
a = 2*np.arange(8)**2 + 1
a

In [None]:
a[[3, -1, 1]]

In [None]:
fib = np.array([0, 1, 1, 2, 3, 5])

In [None]:
a[fib]

In [None]:
a[[[[2, 7], [4, 2]]]]

Boolean Masks.

**Qué pasa ahora?**

In [None]:
np.random.seed(42)
a = np.random.randint(0, 21, 15)
a

In [None]:
(a % 3 == 0)

In [None]:
mask = (a % 3 == 0)

In [None]:
mask

In [None]:
extract_from_a = a[mask]

In [None]:
extract_from_a

![](img/numpy/numpy_fancy_indexing.png)

**Ejercicio: Prueba a reproducir matriz y las operaciones de fancy-indexing representadas**

---


## Operaciones (elementwise)

Con escalares:

In [None]:
a = np.array([1, 2, 3, 4])

a

In [None]:
a + 1

In [None]:
2 ** a

Todas estas operaciones aritmeticas siguen siendo elementwise:

In [None]:
b = np.ones(4) + 1

b

In [None]:
a - b

In [None]:
a * b

In [None]:
j = np.arange(5)
j

In [None]:
2**(j + 1) - j

Y sigue siendo más rápido que en Python puro:

In [None]:
a = np.arange(10000)
%timeit a + 1  

l = range(10000)
%timeit [i+1 for i in l] 

Aunque funciona, no es lo más *eficiente*. Un ejemplo es la multiplicación de matrices:

In [None]:
c = np.ones((3, 3))
c

In [None]:
c * c # Qué pasa aquí?

In [None]:
c.dot(c) # Ahora si

Otros operadores.

Comparación:

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])
a == b

In [None]:
a > b

## Funciones universales

Las *ufuns* son funciones o interfaces para transformar arreglos completos (y de forma más eficiente que hacerlo elementwise).

Comparaciones array-wise:

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])
c = np.array([1, 2, 3, 4])


np.array_equal(a,b)

In [None]:
np.array_equal(a,c)

In [None]:
np.sin(a)

Hay 60 funciones universales disponibles!
https://docs.scipy.org/doc/numpy-1.14.0/reference/ufuncs.html#available-ufuncs

Y también vale la pena conocer todos los métodos de un ndarray: https://docs.scipy.org/doc/numpy-1.14.0/reference/generated/numpy.ndarray.html
    
    
**Cuál es la diferencia entre a.sum() y np.add(a,b)?**

In [None]:
np.exp2(a)

In [None]:
%timeit a ** 2

In [None]:
%timeit np.power(a, 2)

## Reshaping y Flattening

Flattening:

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6]])
a


In [None]:
a.ravel()

In [None]:
a.T

In [None]:
a.T.ravel()

Reshaping. La operación  inversa a flattening:

In [None]:
a.shape

In [None]:
b = a.ravel()

b

In [None]:
b = b.reshape((2, 3))
b

## Dimensiones y Resizing

Añadiendo una dimensión:

In [None]:
z = np.array([1, 2, 3])
z

In [None]:
z = z[:, np.newaxis]
z

Dimension shuffling

In [None]:
a = np.arange(4*3*2).reshape(4, 3, 2)
a.shape


In [None]:
a

In [None]:
b = a.transpose(1, 2, 0)
b.shape

In [None]:
b

In [None]:
a = np.arange(4)
a.resize((8,))
a

## Ordenando registros

In [None]:
a = np.array([[4, 3, 5], [1, 2, 1]])
b = np.sort(a, axis=1) # out-of-place
b

In [None]:
a.sort(axis=1) # in-place sort
a

In [None]:
a = np.array([4, 3, 1, 2]) # fancy-indexing
j = np.argsort(a)
j

Ejercicios:


- Prueba y explica las diferencias entre out-of-place y de in-place
- Combina `ravel`, `sort` y `reshape`.


---

Ejercicio: Manipulación de imagénes con NumPy

In [None]:
from scipy import misc
face = misc.face(gray=True) 

In [None]:
type(face)

In [None]:
face = misc.face(gray=True)
plt.imshow(face)   

In [None]:
plt.imshow(face, cmap=plt.cm.gray) 

In [None]:
crop_face = face[100:-100, 100:-100]


In [None]:
plt.imshow(crop_face)

In [None]:
# Tu turno, completa el siguiente codigo:


sy, sx = # Shape del ndarray
y, x = np.ogrid[0:, 0:] # x and y indices of pixels
y.shape, x.shape

centerx, centery = (660, 300) # center of the image
mask = ((y - centery)**2 + (x - centerx)**2) > 230**2




face[mask] = 0
# Plot