## 10. Librería Numpy

**NumPy** es la librería fundamental para la computación científica usando Python. Contiene entre otras cosas:

- Un objeto que permite representar matrices n-dimensionales.
- Funciones para paralelizar el cálculo matricial.
- Herramientas para la integración con C/C++ y Fortran.
- Soporte para álgebra lineal, transoformaciones de Fourier y números aleatorios.

Se puede instalar en nuestro entorno virtual con el siguiente comando:

```
pipenv install numpy
```

In [None]:
import numpy as np

Se utiliza el alias `np` como estándar de facto par el uso de **NumPy**.

### El objeto `ndarray`

El objeto principal de NumPy es una matriz multidimensional homogénea. Es una tabla de elementos (normalmente números), todos del mismo tipo, indexado por una tupla de enteros positivos.

En NumPy se las dimensiones se llaman `axis`.



Por ejemplo, las coordenadas de un punto en un espacio tridimensional `[1, 2, 1]` tienen un `axis`. Este tiene tres elementos en él, por lo que decimos que tiene una longitud de `3`. 

En el ejemplo siguiente, la matriz tiene dos dimensiones, el primero tiene una longitud de 2 y el segundo de 3:

```
[[ 1., 0.]
 [ 0., 1., 2.]]
```


In [None]:
import numpy as np

x = np.array([[1,2],[3,4]], dtype=np.float64)
y = np.array([[5,6],[7,8]], dtype=np.float64)

print(x)
print(y)

La clase de NumPy que representa la matriz se llama `ndarray`. También tiene el alias `array`.

Los atributos más importantes de esta clase son:

`ndarray.ndim`

El número de `axex`(dimensiones) de la matriz.

`ndarray.shape`

Las dimensiones de la matriz. Es una tupla de enteros, indicando el tamaño de cada dimensión.

`ndarray.size`

El número total de elementos de la matriz.

`ndarray.dtype`

Un objeto que describe el tipo de elemenos de la matriz. Se pueden crear matrices con los tipos estándares de Python, pero NumPy también aporta tipos propios, como por ejemplo `numpy.int32`, `numpy.int16`, y `numpy.float64`.

`ndarray.itemsize`

El tamaño en bytes de cada elemento de la matriz.

`ndarray.data`

El buffer que contiene los elementos de la matriz.

In [None]:
a = np.arange(15).reshape(3, 5)
a

In [None]:
a.shape

In [None]:
a.ndim

In [None]:
a.dtype.name

In [None]:
a.itemsize

In [None]:
a.size

In [None]:
b = np.array([6, 7, 8])
print(type(a))
print(type(b))

### Creación de `arrays`

Hay diferentes formas de crear un `array`:

- Usando una tupla o lista de Python
- Usando funciones de inicialización de NumPy

In [None]:
a = np.array([2,3,4])
print(a)

b = np.array([(1.5,2,3), (4,5,6)])
print(b)

c = np.array( [ [1,2], [3,4] ], dtype=complex )
print(c)

Con la función `zeros` inicializamos el array con ceros.

In [None]:
np.zeros( (3,4) )

Con la función `ones` inicializamos el array con unos.

In [None]:
np.ones( (2,3,4), dtype=np.int16 )    

Con la función `empty` inicializamos el array con valores aleatorios que dependen del estado de la memoria.

In [None]:
np.empty( (2,3) )

Para cerar secuencias de números, NumPy proporciona una función análoga a `range` llamada `arange` que genera un `array` en vez de una lista

In [None]:
np.arange( 10, 30, 5 )

### Operaciones con `arrays`

`numpy` implementa operaciones básicas con los objetos `array` calculadas elemento a elemento.

#### Suma 

In [None]:
print(x + y)
print(np.add(x, y))


#### Resta

In [None]:
print(x - y)
print(np.subtract(x, y))

#### Producto

In [None]:
print(x * y)
print(np.multiply(x, y))

#### División

In [None]:
print(x / y)
print(np.divide(x, y))

#### Raiz cuadrada

In [None]:
print(np.sqrt(x))

### Operaciones matriciales

A diferencia de otros entornos de cálculo númerico, con `numpy` el operador `*` realiza la multiplicación elemento a elemento, no la multiplicación matricial.

Para realizar la multiplicación matricial se utiliza la función `dot`.

In [None]:
x = np.array([[1,2],[3,4]])
y = np.array([[5,6],[7,8]])

v = np.array([9,10])
w = np.array([11, 12])

In [None]:
# Producto de vectores
print(v.dot(w))
print(np.dot(v, w))

In [None]:
# Producto de matriz y vector
print(x.dot(v))
print(np.dot(x, v))

In [None]:
# Producto de matrices
print(x.dot(y))
print(np.dot(x, y))

Además de estas funciones, `numpy` proporciona otras que son de utilidad para operar con matrices, por ejemplo `sum`.

In [None]:
x = np.array([[1,2],[3,4]])

print(np.sum(x))  # Calcula la suma de todos los elementos
print(np.sum(x, axis=0))  # Calcula la suma para cada columna
print(np.sum(x, axis=1))  # Calcula la suma para cada fila

Otras funciones de utilidad son `min` y `max`, que pueden calcular el valor mínimo y máximo del array, o aplicar la operación por alguna de las dimensiones,

In [None]:
a = np.random.random((2,3))
print(a.min())
print(a.max())
print(a.max(axis=1))
print(a.max(axis=0))

Otra función interesante es `cumsum`, que calcula la suma acumulativa de los elementos del array, o por alguna de sus dimensiones.

In [None]:
a = np.arange(12).reshape(3,4)
a

In [None]:
a.cumsum()

In [None]:
a.cumsum(axis=1)

### Acceso a elementos, partición e iteración

Los arrays de una dimensión pueden ser accedidos y particionados igual que otras secuencias de Python.


In [None]:
a = np.arange(10)**3
a

In [None]:
a[2]

In [None]:
a[2:5]

In [None]:
a[:6:2] = -1000
a

 Los array que son multidimensionales tienen un índice por cada dimensión, y se accede a cada uno de ellos sepandando por `,` dentro del operador `[]`.

In [None]:
b = np.fromfunction(lambda x, y: 10 * x + y, (5,4),dtype=int)
b

In [None]:
 b[2,3]

In [None]:
b[0:5, 1] 

In [None]:
b[ : ,1]

In [None]:
b[1:3, : ]

La expresión `b[i]` se trata como si `i` estuviera seguida de tantos `:` como fueran necesarios para representar las dimensiones restantes.

NumPy también permite usar `...` para representar este concepto.

Por ejemplo, si `x` es un array de 5 dimensiones:

- `x[1,2,...]` es equivalente a `x[1,2,:,:,:]`,
- `x[...,3]` a `x[:,:,:,:,3]` y
- `x[4,...,5,:]`a `x[4,:,:,5,:]`.

In [None]:
c = np.arange(12).reshape(2,2,3)
c[1,...]

In [None]:
 c[...,2]

#### Iteraciones

La iteración sobre arrays multidimensionales se realiza con respecto a la primera dimensión:

In [None]:
for row in b:
    print(row)

Se puede realizar la operación elemento a elemento del array, usando `flat`, que devuelve un iterador sobre todos los elementos del array

In [None]:
for element in b.flat:
    print(element)

### Broadcasting

En `numpy` el **broadcasting** es una herramienta que permite a la librería trabajar con matrices de diferentes tamaños cuando se realizan operaciones aritméticas.

Normalmente, hay una matriz pequeña y una más grande, y se usa la matriz pequeña varias veces para ralizar alguna operación con la más grande.

In [None]:
a = np.array([1.0, 2.0, 3.0])
b = np.array([2.0, 2.0, 2.0])
a * b

In [None]:
a = np.array([1.0, 2.0, 3.0])
b = 2.0
a * b

El código que usa el *broadcasting* es más eficiente porque mueve menos memoria durante la operación de multiplicación.

Cuando NumPy opera con dos arrays, compara sus `shapes` elemento a elemento, empezando *por la dimensión del final* hasta la primera. Dos dimensiones son compatibles cuando:

- Son iguales, o
- Una de ellas es 1

Cuando una de las dimensiones comparada es uno, se usa la otra. Es decir, la dimensión de valor 1 se copia para igualar a la otra.

```
A         (4d array):  8 x 1 x 6 x 1
B         (3d array):      7 x 1 x 5
Resultado (4d array):  8 x 7 x 6 x 5
```