 # Arreglos y operaciones vectoriales con [NumPy](http://www.numpy.org/)


NumPy es un paquete de computación científica con Python que provee:

- Un objecto contenedor muy versatil: arreglo N-dimensional `ndarray`
- Funciones capaces de hacer *broadcasting*
- Módulos para algebra lineal, Transformada de Fourier, generación de número aleatorios, entre otros
- Herramientas para integrar código C/C++


**Instalación**
    
Con nuestro ambiente conda activado:

    conda install numpy
    
Esto instalará numpy y las librerías de bajo nivel BLAS y MKL

Luego importamos usando

In [2]:
import numpy as np
print("Version: ", np.__version__)

Version:  1.19.2


In [13]:
import numpy as np

In [14]:
print(numpy.__version__)

1.19.2


In [17]:
np.array(lista)

array([[1, 2, 3],
       [2, 3, 4]])

## Objeto ndarray (alias array)

Una lista `lista` de Python es un tipo de arreglo donde cada elemento puede ser de tipo diferente

En general es muy ineficiente hacer cálculos numéricos usando listas

Como reemplazo usaremos el objeto `ndarray` de NumPy, que corresponde a un **arreglo n-dimensional de tipo fijo**

A diferencia de una lista, las operaciones matemáticas y reducciones sobre ndarray son eficientes

Podemos crear un ndarray a partir de 

- una lista o tupla usando `np.array`
- un fichero, por ejemplo usando `np.genfromtxt`
- funciones generadoras de NumPy, por ejemplo `np.linspace`, `np.zeros`, etc

### Ndarray a partir de listas y atributos básicos

In [3]:
# Supongamos que tenemos la siguiente lista de listas
L = [[0, 1, 2], [3, 4, 5]]
print("L es un", type(L))
# Podemos transformarla a ndarray con
A = np.array(L)
print("A es un", type(A))
display(A)

L es un <class 'list'>
A es un <class 'numpy.ndarray'>


array([[0, 1, 2],
       [3, 4, 5]])

In [8]:
lista = [[1,2,3], [2,3,4]]

print(type(lista))

array = numpy.array(lista)

print(type(array))

<class 'list'>
<class 'numpy.ndarray'>


Los tipos de dato estándar de NumPy son:

- Enteros: int8, int16, int32, int64
- Enteros sin signo: uint8, uint16, uint32, uint64
- Flotantes (reales): float16, float32, float64, float128
- Números complejos: complex64, complex128, complex256
- Booleanos: Bool

Podemos forzar el tipo usando el argumento `dtype`

In [4]:
display(np.array(L, dtype=np.int16))
display(np.array(L, dtype=np.float32))

array([[0, 1, 2],
       [3, 4, 5]], dtype=int16)

array([[0., 1., 2.],
       [3., 4., 5.]], dtype=float32)

Además el atributo `dtype` nos permite ver el tipo de un arreglo NumPy

In [5]:
x = np.array([1. + 2j])
print("x es de tipo", x.dtype)

x es de tipo complex128



- El atributo `ndim` es un entero que nos indica el número de dimensiones o ejes del arreglo
- El atributo `shape` es una tupla de entero que nos indica el tamaño del arreglo en cada una de sus dimensiones

Por ejemplo:

In [6]:
display(A)
print("A tiene ", A.ndim, "dimensiones/ejes")
display(A.shape)
print("El eje 0 tiene largo", A.shape[0])
print("El eje 1 tiene largo", A.shape[1])

array([[0, 1, 2],
       [3, 4, 5]])

A tiene  2 dimensiones/ejes


(2, 3)

El eje 0 tiene largo 2
El eje 1 tiene largo 3


In [11]:
array.shape

(2, 3)

### Funciones generadoras de arreglos

Se pueden crear arreglos directamente desde Numpy

Algunos ejemplos útiles

In [23]:
display(np.zeros(shape=(3, 3), dtype=np.int))  # Lleno de ceros
display(np.ones(shape=(3, 3), dtype=np.float32))  # Lleno de unos
display(np.full(shape=(3, 3), fill_value=2.2))  # Lleno de PI
display(np.eye(3))  # Matriz identidad
display(np.random.randn(3, 3))  # Matriz aleatoria con distribución N(0, 1)

array([[0, 0, 0],
       [0, 0, 0],
       [0, 0, 0]])

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]], dtype=float32)

array([[2.2, 2.2, 2.2],
       [2.2, 2.2, 2.2],
       [2.2, 2.2, 2.2]])

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

array([[-0.58474101,  1.37374249, -0.0044715 ],
       [-0.56975999, -0.05336542,  1.9254769 ],
       [-0.55707586,  0.85306711,  1.29985829]])

In [24]:
np.full(shape = (4, 3), fill_value = 0.020)

array([[0.02, 0.02, 0.02],
       [0.02, 0.02, 0.02],
       [0.02, 0.02, 0.02],
       [0.02, 0.02, 0.02]])

## Manipulación de matrices y vectores

Es usual que antes de operar un ndarray necesitemos cambiar su tamaño o número de dimensiones

Algunas operaciones típicas para modificar la forma de un arreglo son: `reshape`, `tile`, `repeat`, `ravel` y `transpose`

`reshape` reorganice las dimensiones de un arreglo pero debe preservar el tamaño

In [8]:
A = np.arange(6)
display(A)
# Convierte 6 a 3x2
display(np.reshape(A, (3, 2)))  
# Convierte 6 a 2x3
display(np.reshape(A, (2, 3)))

array([0, 1, 2, 3, 4, 5])

array([[0, 1],
       [2, 3],
       [4, 5]])

array([[0, 1, 2],
       [3, 4, 5]])

`transpose` puede utilizarse para intercambiar la posición de los ejes/dimensiones de un ndarray

Tiene el mismo significado de la trasposición matricial

<img src="img/transpose.jpg" width="400">

Por ejemplo:

In [9]:
A = np.arange(9).reshape(3, 3)
display(A)
display(np.transpose(A)) # Equivalente a A.transpose() o A.T

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

array([[0, 3, 6],
       [1, 4, 7],
       [2, 5, 8]])

## Indexación y *slicing*

Al igual que otros contenedores de Python los ndarray soportan *slicing*

> Slicing es crear una arreglo a partir de una indexación sobre otro arreglo

Sea por por ejemplo:

In [12]:
L = [[0, 1, 2], [3, 4, 5]]
A = np.array(L)
display(A)

array([[0, 1, 2],
       [3, 4, 5]])

Para acceder al elemento en la segunda fila y primera columna usaríamos

In [13]:
display(L[1][0], # Con la lista
        A[1, 0]) # Con el ndarray

3

3

El ndarray nos da mucha flexibilidad para hacer slicing

In [14]:
display(A[:, 1])  # Retorna la segunda columna
display(A[0, :]) # Retorna la primera fila 
display(A[1, ::2]) # Retorna los elementos de la primera fila y columnas pares
display(A[-1, -2]) # Retorna los elementos de la ultima fila y penultima columna

array([1, 4])

array([0, 1, 2])

array([3, 5])

4

También podemos indexar usando un arreglo de booleanos

In [16]:
A = np.array([0, 2, 1, 3, 4])
B = np.array([True, False, False, True, True])
display(A[B])

array([0, 3, 4])

```{note}
Algunas operaciones sobre arreglos no hacen copias (usan referencias)
```

En particular cuando hacemos un slice, estamos modificando el arreglo original

In [17]:
A = np.arange(100).reshape(10, 10)
B = A
B is A

True

Si modifico A se ve reflejado en B

In [18]:
A[:5, :5] = 100
display(B)

array([[100, 100, 100, 100, 100,   5,   6,   7,   8,   9],
       [100, 100, 100, 100, 100,  15,  16,  17,  18,  19],
       [100, 100, 100, 100, 100,  25,  26,  27,  28,  29],
       [100, 100, 100, 100, 100,  35,  36,  37,  38,  39],
       [100, 100, 100, 100, 100,  45,  46,  47,  48,  49],
       [ 50,  51,  52,  53,  54,  55,  56,  57,  58,  59],
       [ 60,  61,  62,  63,  64,  65,  66,  67,  68,  69],
       [ 70,  71,  72,  73,  74,  75,  76,  77,  78,  79],
       [ 80,  81,  82,  83,  84,  85,  86,  87,  88,  89],
       [ 90,  91,  92,  93,  94,  95,  96,  97,  98,  99]])

Modificaciones en subarreglos (vistas) también son referenciadas

Si queremos evitar este comportamiento se puede forzar la creación de una copia con el método `copy()`

In [20]:
B = A.copy()
A[0, 0] = 0
display(B[0])

array([100, 100, 100, 100, 100,   5,   6,   7,   8,   9])

## Operaciones sobre ndarray

### Operaciones aritméticas y *Broadcasting* 

Los ndarray soportan las operaciones aritméticas básicas

- Suma:  +, +=
- Resta: -, -=
- Multiplicación:  *,*= 
- División: /, /=
- División entera: //, //=
- Exponenciación: ** , **=

Estas operaciones tienen un comportamiento element-wise (elemento a elemento), es decir

$$
\pmatrix{0 & 1 \\2 & 3 } \cdot \pmatrix{1 & 5 \\2 & 2 } = \pmatrix{0 & 5 \\4 & 6 }
$$

Note que no corresponde a la multiplicación usual de matrices

Veamos algunos ejemplos:

In [21]:
N = 3
A = np.eye(N)
B = np.ones(shape=(N, N))
display(A)
display(B)
display(A + B)
display(A*B)  

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

array([[2., 1., 1.],
       [1., 2., 1.],
       [1., 1., 2.]])

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

Cuando los términos no son del mismo tamaño se hace un *broadcast*

Por ejemplo si operamos una constante con un arreglo, la constante se opera con cada elemento del arreglo

In [22]:
A - 1

array([[ 0., -1., -1.],
       [-1.,  0., -1.],
       [-1., -1.,  0.]])

### Operaciones matriciales

Antes dijimos que la multiplicación con `*` se realiza elemento a elemento

Para realizar una multiplicación matricial propiamente tal podemos usar `dot` o el operador `@`

In [None]:
A = np.arange(4).reshape(2, 2)
B = np.arange(4)[::-1].reshape(2, 2)
display(A, B)  

Note la diferencia:

In [None]:
display(A*B)  
display(np.dot(A, B))

Otras operaciones matricionales útiles son:

- `np.inner` que calcula el producto escalar o producto interno
- `np.outer` que calcula el producto externo
- `np.cross` que calcula  cruz

In [None]:
display(np.inner(A, B))
display(np.outer(A, B))

El módulo  [`linalg`](https://numpy.org/doc/stable/reference/routines.linalg.html) de NumPy contiene muchas más funciones de álgebra lineal que nos permiten 

- Calcular matriz inversa, determinantes y trazas
- Resolver sistemas lineales
- Factorizar matrices
- Calcular valores y vectores propios

entre otros. Este módulo será estudiando en detalle en lecciones más avanzadas

### Operaciones de reducción

Llamamos **reducción** a una operación que **agrega** los valores de un arreglo entregando un único valor como respuesta

La reducción más básica es la **suma agregada**

$$
[0, 1, 2, 4, 3] \rightarrow 0 + 1 + 2 + 4 + 3 = 10 
$$

> Las operaciones de reducción se usan ampliamente para resumir datos y hacer estadística


Algunas de las reducciones disponibles en NumPy son:
- `sum`, `prod`
- `amax`, `amin`, `argmax`, `argmin`
- `mean`, `std`, `var`, `percentile`, `median`
- `cumsum`, `cumprod`

Diferencia entre sumar en el eje de filas, columnas y suma total:

In [None]:
A = np.tile(np.arange(3), (3, 1))
display(A)
display(np.sum(A, axis=0))
display(np.sum(A, axis=1))
display(np.sum(A))

Encontrar el valor y posición del máximo en un arreglo es también un tipo de reducción

In [None]:
A = np.random.randn(3, 3)
display(A)
display(np.amax(A, axis=0))
display(np.argmax(A, axis=0))

Las operaciones de reducción de NumPy son altamente eficientes

Hagamos una pequeña prueba de desempeño sumando  un vector

Usaremos la magia de IPython `@timeit` que nos permite medir tiempo de cómputo

Muchas de estas funciones están implementadas como métodos de la clase arreglo, por ejemplo

In [24]:
display(A.sum())
display(A.max(axis=0))
display(A.min())

4999950000

99999

0

También cuentan con versiones seguras contra NaNs

In [25]:
A = np.array([1., 10., 2., np.nan])
display(np.sum(A))
display(np.nansum(A))

nan

13.0

**Nota:** Si queremos encontrar los NaN en un arreglo podemos usar `isnan` 

In [26]:
np.isnan(A)

array([False, False, False,  True])

### Operaciones vectorizadas

Son funciones que operan de forma *element-wise* o elemento a elemento

Ya vimos las operaciones aritméticas elemento a elemento pero existen muchas más

Por ejemplo para calcular el valor absoluto de los elementos de un arreglo

In [27]:
A = np.random.randn(3, 3)
display(A)
np.absolute(A) # Equivalente a np.abs(A)

array([[ 0.28961562, -0.56805486, -1.31019913],
       [ 1.16631071,  0.0043343 , -0.12937753],
       [-0.89656396,  1.40139291,  0.74452004]])

array([[0.28961562, 0.56805486, 1.31019913],
       [1.16631071, 0.0043343 , 0.12937753],
       [0.89656396, 1.40139291, 0.74452004]])

Exponenciar un arreglo

In [28]:
x = np.arange(10)
display(np.power(x, 2)) # Equivalente a x**2
display(np.sqrt(x))

array([ 0,  1,  4,  9, 16, 25, 36, 49, 64, 81])

array([0.        , 1.        , 1.41421356, 1.73205081, 2.        ,
       2.23606798, 2.44948974, 2.64575131, 2.82842712, 3.        ])

Calcular funciones exponencial, logaritmo y trigonométricas  a partir de una arreglo

In [29]:
x = np.array([0.1, 1., 10.0])
display(np.log(x)) # También está log2, log10
display(np.exp(x)) 
display(np.sin(x)) # También está arcsin, sinh
display(np.cos(x)) # También está arccos, cosh
display(np.tan(x)) #También está arctan, tanh

array([-2.30258509,  0.        ,  2.30258509])

array([1.10517092e+00, 2.71828183e+00, 2.20264658e+04])

array([ 0.09983342,  0.84147098, -0.54402111])

array([ 0.99500417,  0.54030231, -0.83907153])

array([0.10033467, 1.55740772, 0.64836083])

Otras funciones útiles: 

- Para obtener el signo de cada elemento de un arreglo: `sign`
- Para obtener un arreglo de 1 dividido los elementos del mismo: `reciprocal`
- Para redondear hacia abajo o hacia arriba: `round`, `floor` y `ciel`
- Para obtener la parte real o imaginaria de un número complejo: `real`, `imag`
- O el conjugado de un número complejo: `conj`, 

### Operaciones booleanas 

NumPy soporta operaciones booleanas sobre ndarray

In [30]:
A = np.arange(6).reshape(2, 3)
display(A)
display(A == 4)
display(np.equal(A, 4))

array([[0, 1, 2],
       [3, 4, 5]])

array([[False, False, False],
       [False,  True, False]])

array([[False, False, False],
       [False,  True, False]])

Como vimos antes podemos crear una máscara booleana para indexar un arreglo

In [31]:
mask = ~(A % 2 == 0) & (A > 2)
display(mask)
display(A[mask])

array([[False, False, False],
       [ True, False,  True]])

array([3, 5])

La función `where` sirve para recuperar el índice de los elementos que cumplen una cierta condición

In [32]:
(ixs, iys) = np.where(~(A % 2 == 0) & (A > 2))

for i, j in zip(ixs, iys):
    display("Fila {0} Columna {1} Valor {2}".format(i, j, A[i, j]))

'Fila 1 Columna 0 Valor 3'

'Fila 1 Columna 2 Valor 5'

Funciones `any` y `all`

In [33]:
x = np.random.randn(3, 3)
display(x)
b = (x > 0) & (x**2 > 0.5)
display(b)

display(np.any(b))
display(np.all(b))

array([[ 0.14193603, -0.72705269, -1.24669521],
       [-1.07672289, -0.50882656, -0.65657527],
       [-0.40478851,  0.15480019, -1.04635225]])

array([[False, False, False],
       [False, False, False],
       [False, False, False]])

False

False