# Saturdays.AI Guadalajara 4a Ed. 
### Numpy

#### Luis Román

### Agosto de 2022

Numpy es una de las mejores librerías para cómputo científico en Python. Tiene como objeto principal los arreglos multidimensionales entre otros objetos derivados. A los cuales se les pueden aplicar operaciones eficientes con un desempeño mayor al de python nativo.

Documentación:
https://numpy.org/doc/stable/

In [1]:
"""
Instalación de la librería
Comentar si ya se cuenta con ella
"""
!pip install numpy



#### Dimensiones

![imagen.png](attachment:imagen.png)

In [2]:
# Importación
import numpy as np

In [3]:
# Generar un numpy array 
# Partiendo de una lista de python

lista = [0,2,4,6,3,9,15]
print(type(lista))

arr = np.array(lista, dtype="int32")
print(type(arr))

<class 'list'>
<class 'numpy.ndarray'>


In [4]:
# Generar una matriz partiendo de una lista de listas
matriz = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(type(matriz))
matriz


<class 'numpy.ndarray'>


array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [5]:
# Acceder a los valores de un array y matriz 
# Array
print(arr[0])

# Array 2 dimensiones Matriz
print(matriz[0][2])

# Slicing de filas a columnas
print(matriz[1:,0:2])

0
3
[[4 5]
 [7 8]]


### Atributos de un array

In [6]:
print("Dimensión del array: ", arr.ndim) 

print("Forma del array: ", arr.shape)

print("Tamaño del array: ", arr.size)

print("Tipo de dato del array: ", arr.dtype)

Dimensión del array:  1
Forma del array:  (7,)
Tamaño del array:  7
Tipo de dato del array:  int32


### Tipos de datos

In [7]:
"""
np.int64
np.float32 
np.complex
np.bool
np.object
np.string_
np.unicode_
"""

'\nnp.int64\nnp.float32 \nnp.complex\nnp.bool\nnp.object\nnp.string_\nnp.unicode_\n'

In [8]:
# Obtener el tipo de dato del array
# arr = [0,1,2,3,4,5]
arr.dtype

dtype('int32')

In [9]:
# Definir el tipo de dato del array
nuevo_arr = np.array([1,2,3,4,5,6], dtype="float64")
# Cambiar el tipo de dato del array usando el método astype
arr.astype(np.float64)
arr.dtype

dtype('int32')

### Generación de arrays

In [10]:
# Generar un array de ceros
np.zeros((3,2), dtype="int32")

array([[0, 0],
       [0, 0],
       [0, 0]])

In [11]:
# Generar un array cuadrado con una diagonal de 1s 
np.identity(3, dtype="int32")

array([[1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]])

In [12]:
# Generar un array tomando como base un rango numérico
np.arange(1, 10, 2)

array([1, 3, 5, 7, 9])

In [52]:
# Generar un array de valores equiespaciados
np.linspace(0,100,10)

array([  0.        ,  11.11111111,  22.22222222,  33.33333333,
        44.44444444,  55.55555556,  66.66666667,  77.77777778,
        88.88888889, 100.        ])

In [14]:
# Generar un array de valores aleatorios
np.random.rand(5, 3)

array([[0.1093288 , 0.81993912, 0.15407091],
       [0.04701284, 0.73015741, 0.31745368],
       [0.25553796, 0.90631122, 0.37586889],
       [0.19162847, 0.46038302, 0.11516524],
       [0.82252041, 0.34039781, 0.88791935]])

### Operaciones con arrays

In [15]:
a = np.array([[1, 2, 3], [4, 5, 6]])
b = np.array([[9, 8, 7], [6, 5, 4]])

# Suma a + b
print(np.subtract(a,b) )

# División
print(np.divide(a,b))

# Elevar al cuadrado
print(np.exp(a))


[[-8 -6 -4]
 [-2  0  2]]
[[0.11111111 0.25       0.42857143]
 [0.66666667 1.         1.5       ]]
[[  2.71828183   7.3890561   20.08553692]
 [ 54.59815003 148.4131591  403.42879349]]


### Transformación de arrays

In [16]:
# Agregar una dimensión a la matriz
matriz.ndim
tensor = np.expand_dims(matriz, axis=0)
# axis=0, nivel de filas
# axis=1, nivel de columnas
print("La dimensión final es: ", tensor.ndim)
print(tensor)

La dimensión final es:  3
[[[1 2 3]
  [4 5 6]
  [7 8 9]]]


In [17]:
# Eliminar las dimensiones no usadas
array_corregido = np.squeeze(tensor)
print(np.ndim(array_corregido))
print(array_corregido)

2
[[1 2 3]
 [4 5 6]
 [7 8 9]]


### Reacomodo de arrays

In [18]:
# Cambiar la forma del array dado un orden objetivo
# Por defecto se cambia la forma utilizando el orden del lenguaje "C"
matriz = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(matriz)
nueva_matriz = matriz.reshape(1,9)
print(nueva_matriz)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1 2 3 4 5 6 7 8 9]]


### Funciones principales de los arrays

In [48]:
# Valor Máximo
print(matriz.max(1))

# Obtener el índice de valor en el que se encuentra el valor mayor
print("El índice del valor máximo es: ",nueva_matriz.argmax())

# Valor Mínimo
print(nueva_matriz.min(1))

# Obtener el índice de valor en el que se encuentra el valor menor
print("El índice del valor mínimo es: ",nueva_matriz.argmin())

# Ordenar un array
arr.sort()
print(arr)

# Encontrar valores únicos en un array
a = np.array([[3,8], [12,9]])
arr_repetidos = np.repeat(a, 5)
print(f'El array con valores repetidos es: {arr_repetidos}')

valores_unicos = np.unique(arr_repetidos)
print(f'El array con valores únicos es: {valores_unicos}')

[3 6 9]
El índice del valor máximo es:  8
[1]
El índice del valor mínimo es:  0
[ 1  1  1  1  6  9 15]
El array con valores repetidos es: [ 3  3  3  3  3  8  8  8  8  8 12 12 12 12 12  9  9  9  9  9]
El array con valores únicos es: [ 3  8  9 12]


### Funciones estadísticas

In [20]:
print(arr)
# Mediana
print(np.median(arr))

# Desviación estándar
print(np.std(arr))

# Varianza
print(np.var(arr))

# Promedio
print(np.mean(arr))

[ 0  2  3  4  6  9 15]
4.0
4.686062704816208
21.95918367346939
5.571428571428571


### Copiar Arrays

In [26]:
# arr = [0,2,4,6,3,9,15]
# Crear un array "Temporal" utilizando slicing
arr_temporal = arr[0:4]
print(arr_temporal)

arr_temporal[:] = 1
print(f"Los valores del arr temporal son {arr_temporal}")

print(f"Los valores del arr original son {arr}")

[1 1 1 1]
Los valores del arr temporal son [1 1 1 1]
Los valores del arr original son [ 1  1  1  1  6  9 15]


In [21]:
# Crear una vista del array
vista_array = arr.view()

# Crear una copia del array
#np.copy(a)
copia_arr = arr.copy()

### Filtrar valores en arrays

In [29]:
nuevo_arr = np.arange(10,78,4)
nuevo_arr

array([10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 50, 54, 58, 62, 66, 70, 74])

In [31]:
# La condición aplicada a un array regresa un array de valores booleanos
# nuevo_arr > 20
nuevo_arr[(nuevo_arr > 20) & (nuevo_arr < 60)]

array([22, 26, 30, 34, 38, 42, 46, 50, 54, 58])

In [49]:
# Transformar los valores si el array cumple una condición
nuevo_arr = np.where(nuevo_arr > 30, 1 ,0)

In [50]:
nuevo_arr

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1])