# NumPy

Es una librería dedicada al análisis numérico en Python. Se invoca a partir de la siguiente línea de código.

In [2]:
import numpy as np

## Creando arrays

Con la librería NumPy se pueden crear diferentes tipos de arreglos de diferentes dimensiones, tal como si fueran matrices.

Para crear un array de 0 dimensiones, lo que podríamos conocer como un escalar, se realiza de la forma siguiente:

$A_{0} = 0$

In [41]:
A0 = np.array(0)
print("A =", A0)

A = 0


Este array tiene 0 filas y 0 columnas. Esto se puede conocer con el método `shape`.

In [28]:
A0.shape

()

Para crear un array de 1 dimensión, se deberá contener su valor entre corchetes. Esta matriz tendrá un renglón y una columna.

$A_1 = [1]$

In [46]:
A1 = np.array([1])
print("A =", A1)

print("\nEste arreglo tiene " + str(A1.ndim) + " dimensión.")

A = [1]

Este arreglo tiene 1 dimensión.


Pero se puede crear un arreglo de 1 dimensión, con más elementos. Al final podemos observar que las dimensiones corresponderían a las filas y las columnas no afectan la cantidad de dimensiones.

In [51]:
A1 = np.array([1, 2, 3])
print("A =", A1)

print("\nEste arreglo tiene " + str(A1.ndim) + " dimensiones.")

A = [1 2 3]

Este arreglo tiene 1 dimensiones.


Así, cada arreglo que se genere se limita a la cantidad de corchetes que se pueden tener dentro de otro par de corchetes.

$A_n = \begin{pmatrix} 
       n_{11} & n_{12} & n_{13} & \cdots & n_{1C} \\
       n_{21} & n_{22} & n_{23} & \cdots & n_{2C} \\
       n_{31} & n_{32} & n_{33} & \cdots & n_{3C} \\
       \vdots & \vdots & \vdots & \ddots & \vdots \\
       n_{R1} & n_{R2} & n_{R3} & \cdots & n_{RC} \\
\end{pmatrix}$
Por ejemplo: 
$A = \begin{pmatrix} 
       1 & 2 & 3\\
       4 & 5 & 6\\
       7 & 8 & 9\\
\end{pmatrix}$

In [76]:
A = np.array([
#eje 0  1  2
    [1, 2, 3], # 0
    [4, 5, 6], # 1
    [7, 8, 9]  # 2
])
print(A)
print("\nEste arreglo tiene " + str(A.ndim) + " dimensiones.")

[[1 2 3]
 [4 5 6]
 [7 8 9]]

Este arreglo tiene 2 dimensiones.


También se puede obtener el tamaño de la matriz, es decir, la cantidad de elementos que contiene. Esto se realiza con el método `size`.

In [59]:
print("El arreglo anterior contiene " + str(A.size) + " elementos.")

El arreglo anterior contiene 9 elementos.


En los arreglos de NumPy se puede acceder a los elementos de igual forma que en las listas de Python. Mediante notación de índices.

In [64]:
B = np.array([0,1,2,3,4,5])
print("B =", B)

print("\nB[0] =", B[0])
print("B[:] =", B[:])
print("B[0:-1] =", B[0:-1])
print("B[::2] =", B[::2])

B = [0 1 2 3 4 5]

B[0] = 0
B[:] = [0 1 2 3 4 5]
B[0:-1] = [0 1 2 3 4]
B[::2] = [0 2 4]


Además de esto, se pueden acceder a los elementos de una matriz de más dimensiones. Esto se hace con varios índices entre corchetes que van seguidos.

*A[dimN][elementMdeN]*

O bien, usando una coma para especificar cada índice de cada dimensión.

*A[dim1, dim2, dim3, ..., dimN]*

In [70]:
print(A)
print("\nA[1][0] =", A[1][0])
print("A[1, 0] =", A[1, 0])

[[1 2 3]
 [4 5 6]
 [7 8 9]]

A[1][0] = 4
A[1, 0] = 4


In [75]:
print(A[:, :2])   #Se toman todos los elementos de la primer dimensión y se escogen los elementos desde el primero hasta uno antes del índice 2.

[[1 2]
 [4 5]
 [7 8]]


In [78]:
print(A[:2, :2])

[[1 2]
 [4 5]]


In [79]:
print(A[:2, 2:])

[[3]
 [6]]


También, se pueden modificar los valores que contiene un arreglo a través de su indexación.

In [81]:
A[1] = np.array([0, 0, 0])
print(A)

[[1 2 3]
 [0 0 0]
 [7 8 9]]


O bien, sólo colocando un número, el cual NumPy resolverá para colocar a todos los miembros del índice que se seleccione.

In [82]:
A[2] = 1
print(A)

[[1 2 3]
 [0 0 0]
 [1 1 1]]


## Estadística con arrays en NumPy

NumPy viene con un montón de otros métodos incluidos, como la suma de todos los elementos del array o algunos otros utilizados en estadística también.

In [85]:
B.sum() # Suma de todos los elementos.

15

In [86]:
B.mean() # La media aritmética de los elementos.

2.5

In [87]:
B.std() # La desviación estándar de los elementos.

1.707825127659933

In [88]:
B.var() # La varianza asociada a estos elementos.

2.9166666666666665

In [94]:
A = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
])
print(A)

print("\nSuma =", A.sum())
print("Media artimética =", A.mean())
print("Desviación estándar =", A.std())
print("Varianza =", A.var())

[[1 2 3]
 [4 5 6]
 [7 8 9]]

Suma = 45
Media artimética = 5.0
Desviación estándar = 2.581988897471611
Varianza = 6.666666666666667


Algo útil, es que se pueden realizar estas mismas operaciones a los *ejes* del arreglo.

In [102]:
print("suma del eje 0:", A.sum(axis=0)) # Se suman los valores de las columnas y se obtiene un arreglo con la cantidad de resultados igual a la de columnas.
print("suma del eje 1:", A.sum(axis=1))

suma del eje 0: [12 15 18]
suma del eje 1: [ 6 15 24]


In [97]:
A.mean(axis=0)

array([4., 5., 6.])

In [98]:
A.std(axis=1)

array([0.81649658, 0.81649658, 0.81649658])

## Operaciones vectorizadas

Algunas de las operaciones que se pueden realizar con los arrays de NumPy son vectorizadas, al manejar escalares y arrays en las mismas operaciones esto se debe realizar de manera que cada elemento de un array sea afectado de manera igual para cada uno de ellos.

In [19]:
a = np.arange(4) # Este metodo generará un array con la cantidad de elementos que se le pasa por argumento, comenzando por 0.
a

array([0, 1, 2, 3])

In [20]:
a + 10

array([10, 11, 12, 13])

In [25]:
# Es lo mismo que realizar:
a = np.arange(4) # Se reinicializa la variable "a" al array original
a += 10
a

array([10, 11, 12, 13])

Como se observa la operación se realiza para cada elemento del array _a_.

In [28]:
b = np.arange(5)
b

array([0, 1, 2, 3, 4])

In [27]:
b * 10

array([ 0, 10, 20, 30, 40])

Del mismo modo, se realiza la multiplicación a cada elemento, esto corresponde con las matemáticas plasmadas del álgebra lineal.

Sea $A$ una matriz cualquiera de $m, n$ renglones y columnas, respectivamente y $c$ un escalar, se cumple que la _multiplicación escalar_ está dada por:

$c \cdot A = c \cdot \begin{pmatrix} 
        a_{11} & a_{12} & \cdots & a_{1n} \\
        a_{21} & a_{22} & \cdots & a_{2n} \\
        \vdots & \vdots & \ddots & \vdots \\
        a_{m1} & a_{m2} & \cdots & a_{mn}
     \end{pmatrix} = 
     \begin{pmatrix} 
        c\cdot a_{11} & c\cdot a_{12} & \cdots & c\cdot a_{1n} \\
        c\cdot a_{21} & c\cdot a_{22} & \cdots & c\cdot a_{2n} \\
        \vdots & \vdots & \ddots & \vdots \\
        c\cdot a_{m1} & c\cdot a_{m2} & \cdots & c\cdot a_{mn}
     \end{pmatrix}$

Esto sería similar a lo que conocemos en Python de manera nativa como _comprensión de listas_.

In [29]:
lista = [0, 1, 2, 3, 4]
[i*10 for i in lista]

[0, 10, 20, 30, 40]

Se pueden realizar estas operaciones entre arrays, siempre y cuando estos sean del mismo tamaño.

In [30]:
a = np.arange(5)
a
b = np.array([10, 10, 10, 10, 10])
b

array([10, 10, 10, 10, 10])

In [31]:
a + b

array([10, 11, 12, 13, 14])

In [32]:
a * b

array([ 0, 10, 20, 30, 40])

## Arrays booleanos

Se pueden utilizar algunos de los comandos típicos de Python para los tipos de datos booleanos.

In [4]:
a = np.arange(5)
print("a =", a)

a = [0 1 2 3 4]


In [8]:
a[0], a[-1]

(0, 4)

In [9]:
a[[0, -1]]

array([0, 4])

Esta manera de acceder a ciertos datos de un array, es similar a si se usaran expresiones booleanas.

In [10]:
a[[True, False, False, False, True]]

array([0, 4])

Esta forma de acceder a los datos sólo nos brindará los elementos cuyo valor booleano sea `True`.También, se pueden usar expresiones booleanas para seleccionar los datos a los que se requiere acceder.

In [17]:
a >= 3

array([False, False, False,  True,  True])

La expresión anterior, aunque es una expresión booleana, aplicada a un array se aplica a todos sus elementos y devuelve otro array con cada uno de los resultados.

In [22]:
a[a >= 3]

array([3, 4])

Se pueden aplicar expresiones comparativas booleanas también para acceder a los elementos de un array. Aunque, en _NumPy_ algunos operadores lógicos difieren a los de Python.



In [9]:
a[(a == 0) | (a >= 4)]      # Aquí se realiza la comparación lógica "Or".

array([0, 4])

In [11]:
a[(a == 2) & (a % 2 == 0)]     # Aquí se realiza la comparación lógica "And".

array([2])

In [6]:
a[a > a.mean()]

array([3, 4])

In [8]:
a[~(a > a.mean())]      # Aquí se realiza una negación ("Not", ~) del argumento lógico.

array([0, 1, 2])

Esto nos permite acceder más fácilmente a datos de una manera filtrada, cumpliendo ciertas condiciones particulares y manejando mejor los datos.

## Álgebra Lineal

La librería de _NumPy_ contiene muchas funciones útiles para el manejo del álgebra lineal, las cuales pueden ser de gran utilidad en los análisis de datos, machine learning y demás ciencias.

In [13]:
A = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
])
B = np.array([
    [6, 5],
    [4, 3],
    [2, 1]
])

In [14]:
A.dot(B)        # Operación del producto punto A . B

array([[20, 14],
       [56, 41],
       [92, 68]])

In [15]:
A @ B           # Operación del producto cruz A x B

array([[20, 14],
       [56, 41],
       [92, 68]])

In [17]:
B.T             # Se obtiene la matriz traspuesta de B.

array([[6, 4, 2],
       [5, 3, 1]])

In [19]:
B.T @ A

array([[36, 48, 60],
       [24, 33, 42]])

## Ejercicios

In [22]:
print(np.__version__)

1.19.2


Utilizar la librería de _NumPy_ genera archivos con menor uso de memoria y tiempo de procesamiento más rápido que el que se tendría con Python únicamente.

## Ejercicios

Crea un array de tamaño 10, lleno de ceros.

In [23]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

Crea un array con valores que vayan desde 10 hasta 49.

In [25]:
np.arange(10, 50)

array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26,
       27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43,
       44, 45, 46, 47, 48, 49])

Crea una matriz 2*2 de enteros, llena de unos.

In [29]:
np.ones([2,2], dtype=np.int)

array([[1, 1],
       [1, 1]])