
# <u>Trabajo con NumPy</u>

Sinonimo de *Numerical Python*, `numpy` es una librería que proporciona herramientas para trabajar con alto rendimiento sobre arreglos multidimensionales. 


## Características
Dentro de las principales características de `numpy` se encuentran:
- Ofrece un poderoso objeto para manipular arreglos multidimensionales: `ndarray`.
- Posee herramientas para realizar operaciones matemáticas y lógicas sobre arreglos, operaciones relacionadas con algebra lineal, transformadas de Fourier, entre otras.

Para importar los módulos de la librería `numpy`, por convención se utiliza:

In [None]:
#importamos Numpy con el alias np
import numpy as np
print('numpy version',np.__version__)


## Arrays


Las funcionalidades de `numpy` se basan en en el objeto `ndarray`.

Un `ndarray`, también conocido por el alias de `array`, es un arreglo N-dimensional con elementos del mismo tipo e indexado por una tupla de enteros positivos.


```python
a = numpy.array(data, dtype = None, ndmin = 0, ...)
```
- data: datos de mismo tipo en forma de matriz o una secuencia anidada.
- dtype (opcional): tipos de datos deseados en el arreglo. 
- ndmin: especifica el número mínimo de dimensiones del arreglo resultante.

Crea una lista y conviértela en una matriz numpy:

In [None]:
a = np.array([[0,1,2,3],[4,5,6,7],[1,2,3,4]])  
a

O simplemente pasa una lista directamente:

In [None]:
y = np.array([4, 5, 6])
y

Pasa una lista de listas para crear una matriz multidimensional:

In [None]:
m = np.array([[0,0,0,0],range(4,8),range(1,5)])
m

Dentro de los principales atributos del objeto `ndarray`, se encuentran:
- `ndarray.shape`: tupla con las dimensiones del arreglo. 
- `ndarray.ndim`: numero de dimensiones del arreglo.
- `ndarray.size`: número de elementos del arreglo.
- `ndarray.dtype`: tipo de dato de los elementos del arreglo. 

In [None]:
m.shape

In [None]:
# columna
m.shape[1]

In [None]:
y.shape

In [None]:
m.ndim

In [None]:
y.ndim

In [None]:
m.size

In [None]:
m.dtype

<br>`arange` devuelve valores espaciados uniformemente dentro de un intervalo dado.

In [None]:
n = np.arange(0, 30, 2) # start at 0 count up by 2, stop before 30
n

<br>`linspace` devuelve números espaciados uniformemente en un intervalo especificado:

In [None]:
o = np.linspace(0, 4, 9) # Devuelve 9 valores espaciados uniformemente de 0 a 4
o

### Arrays aleatorios

In [None]:
np.random.seed(12345)  #si defino la semilla, se reproducen los mismo números aleatorios
w = np.random.rand(10) #vector aleatorio de elementos uniformes entre 0 y 1
# es igual a la función ALEATORIO del Excel
print(w)

In [None]:
x = np.random.randn(10) #vector aleatorio de elementos normales estandar
print(x)

In [None]:
y = np.random.randint(0,100,20) #vector aleatorio de elementos enteros
# similar a la función ALEATORIO.ENTRE del Excel
print(y)

### Operaciones con arrays

Usa `+`, `-`,` * `,` / `y` ** `para realizar sumas, restas, multiplicaciones, divisiones y potencias por elementos:

In [None]:
x = np.array([1,2,3])
y = np.array([4,5,6])

In [None]:
print(x + 3) # adición por un escalar
print(x - 3) # resta por un escalar
print(x * 3) # multiplicación por un escalar
print(x / 3) # división por un escalar 

In [None]:
print(x + y) # adición por elementos     [1 2 3] + [4 5 6] = [5  7  9]
print(x - y) # resta por elementos      [1 2 3] - [4 5 6] = [-3 -3 -3]

In [None]:
print(x * y) # multiplicación por elementos  [1 2 3] * [4 5 6] = [4  10  18]
print(x / y) # división por elementos        [1 2 3] / [4 5 6] = [0.25  0.4  0.5]

In [None]:
print(x**2) # potenciación por elementos  [1 2 3] ^2 =  [1 4 9]

In [None]:
print(x**y)

<br>**Dot Product:**  

$ \begin{bmatrix}x_1 \ x_2 \ x_3\end{bmatrix}
\cdot
\begin{bmatrix}y_1 \\ y_2 \\ y_3\end{bmatrix}
= x_1 y_1 + x_2 y_2 + x_3 y_3$

In [None]:
x.dot(y) # dot product  1*4 + 2*5 + 3*6

In [None]:
np.dot(x,y)

Por otro lado, hay funciones universales que realizan operaciones con 2 arrays y regresan un array como salida.

In [None]:
np.add(x,y)  # x+y

In [None]:
np.multiply(x,y) # x*y

In [None]:
np.power(x,y)  # x**y

### Funciones sobre arrays

*Numpy* tiene muchas funciones matemáticas integradas que se pueden realizar sobre arrays.

In [None]:
a = np.array([12, 13, 9, 3, 5])
a

In [None]:
a.sum()  #suma

In [None]:
# alternativamente
np.sum(a)

In [None]:
a.prod()  #productoria

In [None]:
a.max()  #maximo

In [None]:
a.min()  #mínimo

In [None]:
a.mean()  #promedio

In [None]:
np.median(a)  #mediana

In [None]:
a.std()   #desviación estándar

In [None]:
np.e   #constante numérica

In [None]:
np.pi

In [None]:
np.exp(a)  

In [None]:
np.log(a)  # logaritmo natural, ln, logaritmo neperiano, a la base e

In [None]:
np.log(np.exp(a))

In [None]:
np.log10(a)

In [None]:
np.log2(a)

In [None]:
np.sqrt(a)

In [None]:
pow(a,1/2)  # raiz cuadrada

In [None]:
# alternativamente
np.power(a,1/2)

In [None]:
pow(a,1/10) 

<br>`argmax` y` argmin` devuelven el índice del valor máximo y mínimo en un array:

In [None]:
a

In [None]:
a.max()

In [None]:
a.argmax()

In [None]:
a.min()

In [None]:
a.argmin()

## Arrays bidimensionales (Matrices)

In [None]:
a = np.array([[0,1,2,3], [4,5,6,7], [8,9,10,11] , [3,5,6,9]])
print(np.shape(a))
print(a)

In [None]:
y2 = np.random.randint(0,100,20) 
print(y2)

In [None]:
# p = np.array(y2)
p = y2.reshape(5,4)
p

In [None]:
#Matriz a base de "tiles" (baldosas)
ar = np.array([[6,7],[8,9]])
print(ar)
print("--------------------------------")
tiles = np.tile(ar,(4,5))
print(tiles)

In [None]:
#Cambio de forma de un vector

#Creamos un vector lineal y lo reorganizamos como matriz 3x3
x = np.arange(9)
print(x)
print("--------------------------------")
x = x.reshape(3,3)
print(x)

### Matrices especiales:

Numpy cuenta con funciones especiales para crear arreglos con valores definidos por defecto, por ejemplo:
- **zeros**: crea arreglo solamente con 0's.
- **ones**: crea arreglo solamente con 1's.
- **eye**: crea una matriz identidad de tamaño n.
- **full**: crea un arreglo con un valor constante especificado.

In [None]:
np.zeros((3,3))

In [None]:
a =np.zeros((3,3))
a.dtype

In [None]:
np.ones((5,5))

In [None]:
np.ones((5,5))*2

In [None]:
np.eye(10)

In [None]:
np.full((6,6),1500)

<br>**diag** extrae una diagonal o construye una matriz diagonal:

In [None]:
#Creación de una matriz diagonal

#Primero un rango lineal
a = np.arange(5)
print(a)
print("--------------------------------")
#Y ahora lo convertimos en diagonal
diagonal = np.diag(a)
print(diagonal)

In [None]:
np.diag([4,5,6,7])  #construye una matriz diagonal

In [None]:
np.diag(diagonal)  # extrae la diagonal de una matriz (solo cuadradas NxN)

<br>Crea una matriz usando la lista de repetición (o ver `np.tile`):

In [None]:
np.array([1, 2, 3] * 3)

In [None]:
np.tile(np.arange(1,4),(1,3))

In [None]:
np.tile(np.arange(1,4),(3,4))

<br>Repite elementos de un array usando `repeat`.

In [None]:
np.repeat([1, 2, 3, 4], 5)

<br>
Veamos las matrices de transposición. La transposición permuta las dimensiones de la matriz.

In [None]:
z = np.array([y, y**2])
z

In [None]:
# con la función transpose()
z.transpose()

In [None]:
# con la función T
z.T

<br>La forma de la matriz `z` es` (2,3) `antes de la transposición:

In [None]:
z.shape

In [None]:
z.T.shape

#### Diferencia entre RESHAPE Y RESIZE

<br>`reshape` devuelve una matriz con los mismos datos en una nueva forma:

In [None]:
n = np.ones((6, 3))
n

In [None]:
n.reshape(2, 9)

In [None]:
n

In [None]:
n = n.reshape(2, 9) # reshape array to be 2x9
n

In [None]:
n = n.reshape(1, 18) # reshape array to be 1x18
n

In [None]:
n = n.reshape(3, 5)   # cuidado con las dimensiones
n

<br> `resize` cambia la forma y el tamaño de la matriz de forma definitiva:

In [None]:
n.resize(2, 9)
n

In [None]:
o

In [None]:
o.resize(3, 3)
o

Otro ejemplo:

In [None]:
t = np.random.randint(0, 1000, 10)
t

In [None]:
print(t.reshape(2,5))
print(t)

In [None]:
t.resize(2,5)
print(t)

<br>Usa `.T` para transponer una matriz:

In [None]:
z.T

<br>El número de filas se ha intercambiado con el número de columnas.

In [None]:
z.T.shape

Probando la multiplicación dot en matrices (producto matricial)

In [None]:
z.shape

In [None]:
# para que se se pueda realizar las matriz 1 tiene que ser nxm y la matriz 2 mxp
np.dot(z,z.T)

In [None]:
np.dot(z.T,z)

#### Determinante e inversa de una matriz

In [None]:
w = np.random.randint(0, 50, (4,4))
w

In [None]:
#Determinante: sobre matrices cuadradas
np.linalg.det(w)

In [None]:
#Inversa: sobre matrices cuadradas con determinante diferente de cero
np.linalg.inv(w)

In [None]:
#multilicando una matriz con su inversa resulta la matriz identidad
np.dot(w,np.linalg.inv(w)).round()

#### Aplicación sobre un sistema de ecuaciones
![image.png](attachment:image.png)

In [None]:
A = np.array([[2,3,3],[4,1,2],[1,6,1]])
b = np.array([10,11,9])

In [None]:
# x = A**(-1) * b

np.dot(np.linalg.inv(A),b)

In [None]:
res = np.dot(np.linalg.inv(A),b)
np.dot(A,res)

## Concatenación de matrices

In [None]:
p = np.ones([2, 3], int)
p

<br> Utiliza `vstack` para apilar las matrices o arrays en secuencia verticalmente (en sentido de fila):

In [None]:
np.vstack((p, 2*p))

<br>Usa `hstack` para apilar las matrices en secuencia horizontalmente (en sentido de columna):

In [None]:
np.hstack((p, 2*p))

<br>Usa `column_stack` para concatenar por matrices horizontalmente (permite concatenar una matriz con un array unidimensional):

In [None]:
np.column_stack((p,[3,5]))

Otro ejemplo:

In [None]:
a = np.random.randint(0, 10, (3,3))
b = np.random.randint(0, 10, (3,3))
c = np.random.randint(0, 10, 3)

print(a)
print('-----------------------')
print(b)
print('-----------------------')
print(c)

In [None]:
#concatenando por fila 2 matrices o arrays
m1 = np.vstack((a,b))
print(m1)

print('-----------------------')
#concatenando por columna 2 matrices o arrays 
#(no funciona para una matriz con un array)
m3 = np.hstack((a,b))
print(m3)

print('-----------------------')
#concatenando por columna 2 matrices (previamente vuelve columnas a los arrays)
m5 = np.column_stack((a,c))
print(m5)

## Seleccionar elementos

### Indexing y Slicing:

In [None]:
s = np.arange(13)**2
s

Usa la notación de corchetes para obtener el valor de un índice específico. Recuerda que la indexación comienza en 0:

In [None]:
s[0], s[4], s[-1]    #esta salida seguida de comas se almacena por defecto en una tupla

<br>Usa `:` para indicar un rango. `array[start:stop]`


Si se deja vacío `start` o `stop`, el inicio/final de la matriz será predeterminado:

In [None]:
s[1:5]

<br>
Usa negativos para contar desde el final:

In [None]:
s[-4:]

<br>Se puede usar un segundo `:` para indicar la magnitud del paso en el que se van a tomar los elmentos: `array[start:stop:stepsize]`

Aquí estamos comenzando en el quinto elemento desde el final, y contando en 2 hacia atrás hasta llegar al comienzo de la matriz:

In [None]:
s[-5::-2]

In [None]:
s[-5::2]

<br> **Para matrices:** Usa la notación de paréntesis para dividir: `matriz [fila, columna]`

In [None]:
r = np.random.randint(0, 50, (10,10))
r

In [None]:
r[2, 2]

<br>Y usa `:` para seleccionar un rango de filas o columnas.

In [None]:
r[3, 3:6]

In [None]:
r[0:2,0:3]

In [None]:
r[1:2, 2:]

<br>Aquí estamos seleccionando todas las filas hasta (y sin incluir) la fila 2, y todas las columnas hasta (y sin incluir) la última columna:

In [None]:
r[:2, :-1]

In [None]:
r[0:2, 0:-1]



Esta es una porción de la última fila, y solo los elementos pares:

In [None]:
r[-1, ::2]

### Indexación condicional

<br>También podemos realizar indexación condicional. Aquí estamos seleccionando valores de la matriz que son mayores que 30:

In [None]:
r[r > 28]

<br>Aquí estamos asignando el valor 30 a todos los valores de la matriz que son mayores que 30.

In [None]:
r[r > 30] = 30
r

In [None]:
# Numpy permite crear máscaras fácilmente usando condiciones booleanas
r>25

In [None]:
# Extraer los valores de x que satisfacen la condición booleana. Para ello usamos la máscara
r[r>25]

In [None]:
# Condicionales múltiples: AND
np.logical_and(r>15,r<25)

In [None]:
r[np.logical_and(r>15,r<25)]   #adicionalmente hay np.logical_or

In [None]:
# Sumar los valores de un arreglo 2D a lo largo del eje Y (columnas)
np.sum(r, axis=0)

In [None]:
# Sumar los valores de un arrego 2D a lo largo del eje X (filas)
np.sum(r, axis=1)

## Iterando sobre matrices

Creamos una nueva matriz de 4 por 3 con números aleatorios de 0-9:

In [None]:
test = np.random.randint(0, 1000, (4,3))
test

Iterar por fila:

In [None]:
for row in test:
    print(row)
    print("--------------")



Iterar por índice y por fila con **enumerate**:

In [None]:
for i, row in enumerate(test):
    print('row', i, 'is', row)
    print("-------------------")

## Filtros condicionales con Arrays

Suponga que desea tomar el valor de una matriz `X` cuando el valor correspondiente en una condición es True, y de lo contrario tome el valor de la matriz `Y`. Dentro de *Numpy* hay una función llamada **np.where** que resuelve la situación anterior.

```python
result = np.where(cond, xarr, yarr)
```

In [None]:
xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
cond = np.array([True, False, True, True, False])
np.where(cond,xarr,yarr)

In [None]:
np.where(xarr>1.3,0,1)

### Ejemplos adicionales:

Encuentre índices de elementos distintos de cero en [1,2,0,0,4,0]:

In [None]:
nz = np.nonzero([1,2,0,0,4,0])
print(nz)

Crea una matriz de 10x10 con valores aleatorios y encuentre el valor mínimo y máximo:

In [None]:
Z = np.random.random((10,10))
Zmin, Zmax = Z.min(), Z.max()
print(Zmin, Zmax)

¿Cómo encontrar valores comunes entre dos arrays?

In [None]:
Z1 = np.random.randint(0,10,10)
Z2 = np.random.randint(0,10,10)
print(Z1)
print(Z2)
print(np.intersect1d(Z1,Z2))

¿Cómo encontrar el valor más frecuente en un array?

In [None]:
Z = np.random.randint(0,10,50)
print(Z)

In [None]:
print(list(set(Z)))
print(np.bincount(Z))

In [None]:
print(np.bincount(Z).max())
print(np.bincount(Z).argmax())

In [None]:
print(np.bincount(Z).min())
print(np.bincount(Z).argmin())