
# Trabajo con NumPy

Sinonimo de *Numerical Python*, `numpy` es una librería que proporciona herramientas para trabajar con alto rendimiento sobre arreglos multidimensionales. 


## Características
Dentro de las principales características de `numpy` se encuentran:
- Ofrece un poderoso objeto para manipular arreglos multidimensionales: `ndarray`.
- Posee herramientas para realizar operaciones matemáticas y lógicas sobre arreglos, operaciones relacionadas con algebra lineal, transformadas de Fourier, entre otras.

Para importar los módulos de la librería `numpy`, por convención se utiliza:

In [None]:
#importamos Numpy con el alias np
import numpy as np


## Arrays


Las funcionalidades de `numpy` se basan en en el objeto `ndarray`.

Un `ndarray`, también conocido por el alias de `array`, es un arreglo N-dimensional con elementos del mismo tipo e indexado por una tupla de enteros positivos.


```python
a = numpy.array(data, dtype = None, ndmin = 0, ...)
```
- data: datos de mismo tipo en forma de matriz o una secuencia anidada.
- dtype (opcional): tipos de datos deseados en el arreglo. 
- ndmin: especifica el número mínimo de dimensiones del arreglo resultante.

Crea una lista y conviértela en una matriz numpy:

In [None]:
a = np.array([[0,1,2,3],[4,5,6,7],[1,2,3,4]])  
a

O simplemente pasa una lista directamente:

In [None]:
y = np.array([4, 5, 6])
y

Pasa una lista de listas para crear una matriz multidimensional:

In [None]:
m = np.array([[0,1,2,3],[4,5,6,7],[1,2,3,4]])
m

Dentro de los principales atributos del objeto `ndarray`, se encuentran:
- `ndarray.shape`: tupla con las dimensiones del arreglo. 
- `ndarray.ndim`: numero de dimensiones del arreglo.
- `ndarray.size`: número de elementos del arreglo.
- `ndarray.dtype`: tipo de dato de los elementos del arreglo. 

In [None]:
m.shape

In [None]:
m.ndim

In [None]:
m.size

In [None]:
m.dtype

Numpy cuenta con funciones especiales para crear arreglos con valores definidos por defecto, por ejemplo:
- **zeros**: crea arreglo solamente con 0's.
- **ones**: crea arreglo solamente con 1's.
- **eye**: crea una matriz identidad de tamaño n.
- **full**: crea un arreglo con un valor constante especificado.

In [None]:
np.zeros((3,3))

In [None]:
np.ones((5,1))

In [None]:
np.eye(4)

<br>`reshape` devuelve una matriz con los mismos datos en una nueva forma:

In [None]:
n = np.ones((6, 3))
n

In [None]:
n = n.reshape(2, 9) # reshape array to be 2x9
n

In [None]:
n = n.reshape(3, 6) # reshape array to be 1x18
n

<br>`arange` devuelve valores espaciados uniformemente dentro de un intervalo dado.

In [None]:
n = np.arange(0, 30, 2) # start at 0 count up by 2, stop before 30
n

<br>`linspace` devuelve números espaciados uniformemente en un intervalo especificado:

In [None]:
o = np.linspace(0, 4, 9) # Devuelve 9 valores espaciados uniformemente de 0 a 4
o

<br> `resize` cambia la forma y el tamaño de la matriz de forma definitiva:

In [None]:
o.resize(3, 3)
o

<br>**diag** extrae una diagonal o construye una matriz diagonal:

In [None]:
np.diag([4,5,6,7])

<br>Crea una matriz usando la lista de repetición (o ver `np.tile`):

In [None]:
np.array([1, 2, 3] * 3)

In [None]:
np.tile(np.arange(1,4),(1,5))


<br>Repite elementos de un array usando `repeat`.

In [None]:
np.repeat([1, 2, 3], 3)

### Vector aleatorio

In [None]:
np.random.seed(123)  #si defino la semilla, se reproducen los mismo números aleatorios


In [None]:
w = np.random.rand(10) #vector aleatorio de elementos uniformes entre 0 y 1
print(w)

In [None]:
x = np.random.randn(10) #vector aleatorio de elementos normales estandar
print(x)

In [None]:
y = np.random.randint(0,10,10) #vector aleatorio de elementos enteros
print(y)

## Matrices

In [None]:
a = np.array([[0,1,2,3], [4,5,6,7], [8,9,10,11] , [3,5,6,9]])
print(np.shape(a))
print(a)

In [None]:
#Creación de una matriz diagonal

#Primero un rango lineal
a = np.arange(5)
print(a)

#Y ahora lo convertimos en diagonal
diagonal = np.diag(a)
print(diagonal)

In [None]:
#Matriz a base de "tiles" (baldosas)
ar = np.array([[6,7],[8,9]])
print(ar)
tiles = np.tile(ar,(2,3))
print(tiles)

In [None]:
#Cambio de forma de un vector

#Creamos un vector lineal y lo reorganizamos como matriz 3x3
x = np.arange(9)
print(x)
x = x.reshape(3,3)
print(x)

### Trabajo con matrices

In [None]:
p = np.ones([2, 3], int)
p

<br> Utiliza `vstack` para apilar las matrices o arrays en secuencia verticalmente (en sentido de fila):

In [None]:
np.vstack((p, 2*p))

<br>Usa `hstack` para apilar las matrices en secuencia horizontalmente (en sentido de columna):

In [None]:
np.hstack((p, 2*p))

<br>Usa `column_stack` para concatenar por matrices horizontalmente (permite concatenar una matriz con un array unidimensional):

In [None]:
np.column_stack((p,[3,5]))

### Operaciones con arrays

Usa `+`, `-`,` * `,` / `y` ** `para realizar sumas, restas, multiplicaciones, divisiones y potencias por elementos:

In [None]:
x = np.array([1,2,3])
y = np.array([4,5,6])

In [None]:
print(x + 3) # adición por un escalar
print(x - 3) # resta por un escalar
print(x * 3) # multiplicación por un escalar
print(x / 3) # división por un escalar 

In [None]:
print(x + y) # adición por elementos     [1 2 3] + [4 5 6] = [5  7  9]
print(x - y) # resta por elementos      [1 2 3] - [4 5 6] = [-3 -3 -3]

In [None]:
print(x * y) # multiplicación por elementos  [1 2 3] * [4 5 6] = [4  10  18]
print(x / y) # división por elementos        [1 2 3] / [4 5 6] = [0.25  0.4  0.5]

In [None]:
print(x**2) # potenciación por elementos  [1 2 3] ^2 =  [1 4 9]

<br>**Dot Product:**  

$ \begin{bmatrix}x_1 \ x_2 \ x_3\end{bmatrix}
\cdot
\begin{bmatrix}y_1 \\ y_2 \\ y_3\end{bmatrix}
= x_1 y_1 + x_2 y_2 + x_3 y_3$

In [None]:
x.dot(y) # dot product  1*4 + 2*5 + 3*6

In [None]:
np.dot(x,y)

Por otro lado, hay funciones universales que realizan operaciones con 2 arrays y regresan un array como salida.

In [None]:
np.add(x,y)

In [None]:
np.multiply(x,y)

In [None]:
np.power(x,y)

<br>
Veamos las matrices de transposición. La transposición permuta las dimensiones de la matriz.

In [None]:
y

In [None]:
z = np.array([y, y**2])
z

<br>La forma de la matriz `z` es` (2,3) `antes de la transposición:

In [None]:
z.shape

<br>Usa `.T` para transponer una matriz:

In [None]:
z.T

<br>El número de filas se ha intercambiado con el número de columnas.

In [None]:
z.T.shape

Probando la multiplicación dot en matrices (producto matricial)

In [None]:
np.dot(z,z.T)

In [None]:
np.dot(z.T,z)

#### Determinante e inversa de una matriz

In [None]:
w = np.random.randint(0, 50, (4,4))
w

In [None]:
#Determinante: sobre matrices cuadradas
np.linalg.det(w)

In [None]:
#Inversa: sobre matrices cuadradas con determinante diferente de cero
np.linalg.inv(w)

## Funciones sobre arrays

*Numpy* tiene muchas funciones matemáticas integradas que se pueden realizar sobre arrays.

In [None]:
a = np.array([12, 13, 9, 3, 5])
a

In [None]:
a.sum()  #suma

In [None]:
# alternativamente
np.sum(a)

In [None]:
a.prod()  #productoria

In [None]:
a.max()  #maximo

In [None]:
a.min()  #mínimo


In [None]:
a.mean()  #promedio

In [None]:
np.median(a)  #mediana

In [None]:
a.std()   #desviación estándar

<br>`argmax` y` argmin` devuelven el índice del valor máximo y mínimo en la matriz:

In [None]:
a.argmax()

In [None]:
a.argmin()

Usar funciones trigonomértricas:

In [None]:
np.exp(a)

In [None]:
np.log(a)

In [None]:
np.sqrt(a)

## Indexar/Seleccionar elementos

In [None]:
s = np.arange(13)**2
s

Usa la notación de corchetes para obtener el valor de un índice específico. Recuerda que la indexación comienza en 0:

In [None]:
s[0], s[4], s[-1]

<br>Usa `:` para indicar un rango. `array[start:stop]`


Si se deja vacío `start` o `stop`, el inicio/final de la matriz será predeterminado:

In [None]:
s[1:5]

<br>
Usa negativos para contar desde el final:

In [None]:
s[-4:]

<br>Se puede usar un segundo `:` para indicar la magnitud del paso en el que se van a tomar los elmentos: `array[start:stop:stepsize]`

Aquí estamos comenzando en el quinto elemento desde el final, y contando en 2 hacia atrás hasta llegar al comienzo de la matriz:

In [None]:
s[-5::-2]

In [None]:
s[-5::2]

<br> **Para matrices:** Usa la notación de paréntesis para dividir: `matriz [fila, columna]`

In [None]:
r = np.random.randint(0, 50, (10,10))
r

In [None]:
r[2, 2]

<br>Y usa `:` para seleccionar un rango de filas o columnas. ¡Ten en cuenta que el índice 6 no existe!

In [None]:
r[3, 3:6]

In [None]:
r[0:2,0:3]

In [None]:
r[1:2, 2:]

<br>Aquí estamos seleccionando todas las filas hasta (y sin incluir) la fila 2, y todas las columnas hasta (y sin incluir) la última columna:

In [None]:
r[:2, :-1]

In [None]:
r[0:2, 0:-1]



Esta es una porción de la última fila, y solo los elementos pares:

In [None]:
r[-1, ::2]

<br>También podemos realizar indexación condicional. Aquí estamos seleccionando valores de la matriz que son mayores que 30:

In [None]:
r[r > 28]

<br>Aquí estamos asignando el valor 30 a todos los valores de la matriz que son mayores que 30.

In [None]:
r[r > 30] = 30
r

### Slicing

In [None]:
x = np.array([1,2,3])
x[1:]

In [None]:
r[1:2, 2:]

In [None]:
r[0:2,0:3]

In [None]:
# Numpy permite crear máscaras fácilmente usando condiciones booleanas
r>25

In [None]:
# Extraer los valores de x que satisfacen la condición booleana. Para ello usamos la máscara
r[r>25]

In [None]:
# Sumar los valores de un arreglo 2D a lo largo del eje Y (columnas)
np.sum(r, axis=0)

In [None]:
# Sumar los valores de un arrego 2D a lo largo del eje X (filas)
np.sum(r, axis=1)

### Copiando arrays

<br>Para evitar esto, use `r.copy` para crear una copia que no afecte la matriz original:

In [None]:
copia_r = r.copy()
copia_r

### Iterando sobre matrices

Creamos una nueva matriz de 4 por 3 con números aleatorios de 0-9:

In [None]:
test = np.random.randint(0, 1000, (4,3))
test

Iterar por fila:

In [None]:
for row in test:
    print(row)



Iterar por índice y por fila con **enumerate**:

In [None]:
for i, row in enumerate(test):
    print('row', i, 'is', row)

## Filtros en Arrays

Suponga que desea tomar el valor de una matriz `X` cuando el valor correspondiente en una condición es True, y de lo contrario tome el valor de la matriz `Y`. Dentro de *Numpy* hay una función llamada **np.where** que resuelve la situación anterior.

```python
result = np.where(cond, xarr, yarr)
```

In [None]:
xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
cond = np.array([True, False, True, True, False])
np.where(cond,xarr,yarr)

In [None]:
np.where(xarr>1.3,0,1)