# <span style="color:gold">**Numpy**</span>
***

### **Editado por: Kevin Alexander Gómez**
#### Contacto: kevinalexandr19@gmail.com | [Linkedin](https://www.linkedin.com/in/kevin-alexander-g%C3%B3mez-2b0263111/) | [Github](https://github.com/kevinalexandr19)
***

### **Descripción**

En este tutorial, le daremos un vistazo a <span style="color:gold">Numpy</span>, la librería de álgebra lineal y matemática en Python.

Este Notebook es parte del proyecto [**Python para Geólogos**](https://github.com/kevinalexandr19/manual-python-geologia), y ha sido creado con la finalidad de facilitar el aprendizaje en Python para estudiantes y profesionales en el campo de la Geología.
***

## **1. ¿Qué es Numpy?**
***
Numpy (abreviación de `Numeric Python`) es un paquete fundamental para computación científica en Python a través del uso de objetos en arreglos multidimensionales.\
Contiene herramientas para álgebra lineal, matemática, variables aleatorias y estadística básica.

### **1.1. ¿Cómo usar Numpy?**
La base de Numpy es el `ndarray`, también nos podemos referir a este objeto como un **arreglo**.\
Los arreglos agrupan datos homogéneos en una o más dimensiones, tienen un tamaño fijo, y son más rápidos y eficientes en comparación a las listas o tuplas.

Una de las ventajas más importantes de Numpy es el `broadcast`, que consiste en la habilidad de procesar arreglos de diferente tamaño como si todos tuvieran el mismo tamaño.

Podemos considerar que un **vector** es un arreglo de 1 dimensión, mientras que una **matriz** es un arreglo de 2 dimensiones.

Para usar Numpy dentro de Python, debemos importar la librería con el mismo nombre: 
> Usaremos `np` como una referencia abreviada de la librería.\
> Para usar una función de Numpy, debemos anteponer su referencia (ejemplo: la función `np.log` calcula el logaritmo de un número).

In [None]:
import numpy as np

## **2. Vectores**
***
Usaremos la función `array` para crear un vector:

In [None]:
vector = np.array([0, 1, 2, 3, 4, 5])

In [None]:
print(vector)

Este **vector** contiene el mismo tipo de información en cada posición. Lo verificamos usando el atributo `dtype`:

In [None]:
vector.dtype

Para transformar los valores del vector de **integer** a **float**, usaremos la función `astype`:

In [None]:
vector.astype(float)

De manera similar a una lista o tupla, podemos seleccionar partes de un arreglo haciendo **slicing**:

In [None]:
# Primer elemento
vector[0]

In [None]:
# Del tercer al quinto elemento
vector[2:5]

También podemos reemplazar valores dentro del vector:

In [None]:
vector[-1] = 10

In [None]:
vector

Podemos crear una copia del arreglo usando el método `copy`:

In [None]:
copia = vector.copy()

De esta forma, si modificamos un valor de la copia, el original permanecerá igual:

In [None]:
copia[0] = -1

In [None]:
print(vector)
print(copia)

Podemos ordenar los elementos en un arreglo con `sort`:

In [None]:
x = np.array([3, 1, 4, 6, 2, 5, 0])

In [None]:
np.sort(x)

## **3. Matrices**
***
Usaremos la función `array` y una **lista de listas** para crear una matriz:

In [None]:
matriz = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

In [None]:
print(matriz)

Para obtener el número de dimensiones, usaremos el atributo `ndim`:

In [None]:
matriz.ndim

Para obtener el número de elementos en un arreglo, usaremos el atributo `size`:

In [None]:
matriz.size

Para obtener la forma de un arreglo, usaremos el atributo `shape`:

In [None]:
matriz.shape

Para hacer **slicing** a una matriz, debemos señalar la posición de la fila y columna en el siguiente orden: `arreglo[fila, columna]`

In [None]:
# Primera fila, primera columna
matriz[0, 0]

In [None]:
# Primera fila, todas las columnas
matriz[0, :]

In [None]:
# A partir de la segunda fila, escoge todas las columnas
matriz[1:, :]

Podemos usar el método `reshape` para cambiar la forma del arreglo:

In [None]:
matriz.reshape((1, 9))

La transpuesta de una matriz se calcula usando el atributo `T`:

In [None]:
print(matriz.T)

Para reordenar los elementos de una matriz en un solo vector, podemos utilizar la función `flatten`:

In [None]:
matriz.flatten()

Para el siguiente ejemplo, tenemos dos matrices de 2 x 2, llamadas A y B:

In [None]:
A = np.array([[1, 1], [1, 1]])
B = np.array([[-1, 0], [0, -1]])

In [None]:
print(A)

In [None]:
print(B)

Podemos agrupar las matrices horizontalmente usando la función `hstack`:

In [None]:
np.hstack([A, B])

O verticalmente usando `vstack`:

In [None]:
np.vstack([A, B])

También podemos usar la función `concatenate` para agruparlos de acuerdo a un eje (0 para vertical y 1 para horizontal).

In [None]:
np.concatenate([A, B], axis=0)

In [None]:
np.concatenate([A, B], axis=1)

Podemos crear matrices de valores 0 o 1 con las funciones `zeros` y `ones` respectivamente:

In [None]:
np.zeros(shape=(3, 3))

In [None]:
np.ones(shape=(3, 3))

## **4. Álgebra lineal en Numpy**
***
Tenemos dos vectores $v_{1}$ y $v_{2}$:

In [None]:
v1 = np.array([1, 2, 3, 4])
v2 = np.array([5, 6, 7, 8])

Podemos sumar y restar los vectores:

In [None]:
print(v1 + v2)

In [None]:
print(v1 - v2)

Multiplicar y dividirlos:

In [None]:
print(v1 * v2)

In [None]:
print(v1 / v2)

Calcular el producto escalar:

In [None]:
np.dot(v1, v2)

### **Arreglo de valores booleanos**
Si establecemos una condición sobre un arreglo, obtenemos un arreglo de valores booleanos. A este tipo de arreglos se les conoce como **máscaras** o **mask** en inglés:

In [None]:
x = np.array([1, 2, 3, 4, 5])
print(x)

In [None]:
mask = (x > 2)
print(mask)

También podemos establecer condiciones y devolver resultados en base a estos usando la función `where`.\
Por ejemplo, reemplazaremos los valores de `x` mayores a 2 por el valor de 0 y los menores por el valor de 1:

In [None]:
np.where(x > 2, 0, 1)

### **Funciones básicas para un arreglo**

También podemos calcular la suma de componentes, máximo, mínimo, media, varianza y desviación estándar de cada vector:

In [None]:
print(v1)

In [None]:
v1.sum()

In [None]:
v1.max()

In [None]:
v1.min()

In [None]:
v1.mean()

In [None]:
v1.var()

In [None]:
v1.std()

### **Constantes**

In [None]:
# Infinito
np.inf

In [None]:
# Valor nulo o vacío
np.nan

In [None]:
# Número de Euler
np.e

In [None]:
# Pi
np.pi

### **Espacios lineales**

Podemos crear espacios lineales usando la función `arange`:

In [None]:
np.arange(1, 10, 1)

Y también usando `linspace`:

In [None]:
np.linspace(1, 10, 10)

### **Valores aleatorios**
Podemos obtener valores aleatorios usando el módulo `random`. El resultado es un arreglo cuyo tamaño se indica como parámetro de la función.\
Para crear un **RNG (Random Number Generator)** que genera valores aleatorios, usaremos la función `default_rng`:

In [None]:
rng = np.random.default_rng()

Por ejemplo, eligiremos un número aleatorio entre 0 y 1:

In [None]:
rng.random()

Un número aleatorio de una distribución uniforme entre 0 y 5:

In [None]:
rng.uniform(0, 5)

Un número entero aleatorio entre 0 y 5:

In [None]:
rng.integers(0, 5)

Una matriz de tamaño 2 $\times$ 2 compuesta por valores aleatorios de una distribución normal de media 0 y varianza 1

In [None]:
rng.normal(size=(2, 2))

### **Simulación de valores aleatorios**

Podemos crear conjuntos de datos aleatorios usando distribuciones aleatorias.\
Por ejemplo, crearemos 100 números aleatorios que se aproximen a la recta `y = 3x + 1`

In [None]:
x = rng.normal(size=(10, 10))
y = 3*x + rng.normal(size=(10, 10)) + 1

Usaremos `matplotlib` para graficar los datos:

In [None]:
import matplotlib.pyplot as plt
plt.scatter(x, y);

### **Reproduciendo la aleatoriedad en Numpy**
Podemos establecer un estado de aleatoriedad fijo a través del parámetro `seed`:

In [None]:
rng = np.random.default_rng(seed=42)

El primer resultado obtenido con la función `random` luego de establecer el estado aleatorio debe ser 0.7739560485559633:

In [None]:
rng.random()

De esta forma, nos aseguramos de que nuestro trabajo pueda ser reproducido por otras personas usando diferentes entornos.

### **Sobre la aleatoriedad**

El módulo `random` de Numpy no genera valores verdaderamente aleatorios, por lo cual no puede ser usado en aplicaciones de ciberseguridad o criptografía.\
El uso principal de este módulo se encuentra en la **simulación** para computación científica.