## Numpy

NumPy es la librería central para computación científica en Python. Proporciona un objeto de matriz multidimensional de alto rendimiento y herramientas para trabajar con estas matrices.

#### Matrices

Una matriz NumPy es una colección de valores de tipos de datos similares y está indexada por una tupla de números no negativos. El rango de la matriz es el número de dimensiones, y la forma de una matriz es una tupla de números que dan el tamaño de la matriz a lo largo de cada dimensión.


In [None]:
import numpy as np

In [None]:
# Ejemplo
from __future__ import division
import time
import numpy as np


tam_vec = 1000
def lista_python():
    '''Tiempo de demora en ejecutar una suma de listas'''
    t1 = time.time()
    X = range(tam_vec)
    Y = range(tam_vec)
    Z = []
    for i in range(len(X)):
        Z.append(X[i] + Y[i])
    return time.time() - t1

def matriz_numpy():
    '''Tiempo de demora en ejecutar una suma de matrices numpy'''
    t1 = time.time()
    X = np.arange(tam_vec)
    Y = np.arange(tam_vec)
    Z = X + Y
    return time.time() - t1

print('El menor tiempo esta en la funcion:', 'lista_python' if lista_python() < matriz_numpy()
else 'matriz_numpy')
print('La funcion de matriz es {} mas rapido que la funcion lista'.format(lista_python()/matriz_numpy()))

El menor tiempo esta en la funcion: lista_python
La funcion de matriz es 13.272727272727273 mas rapido que la funcion lista


In [None]:
import numpy
numpy.__version__

print('Se esta usando la version {}'.format(numpy.__version__))

Se esta usando la version 1.22.4


Podemos inicializar matrices NumPy a partir de listas de Python anidadas y acceder a los elementos mediante corchetes.

In [None]:
import numpy as np

# Creamos una matriz de rango 1
a = np.array([0, 1, 2])
print(type(a))

# Imprimimos la dimension de la matriz
print(a.shape)
print(a[0])
print(a[1])
print(a[2])

# Cambiamos un elemento de un array
a[0] = 5
print(a)

<class 'numpy.ndarray'>
(3,)
0
1
2
[5 1 2]


In [None]:
def matriz_np():
    '''Matriz con valores aleatorios'''
    a = np.empty([3, 3], dtype=np.int8)
    return a

def type_np():
    '''Devuelve el tipo de dato del objeto'''
    print(matriz_np())
    print(type(matriz_np()))

type_np()

[[-128  -32  -95]
 [   2    0    0]
 [   0    0    0]]
<class 'numpy.ndarray'>


In [None]:
# Creamos una matriz de rango 2
b = np.array([[0,1,2],[3,4,5]])
print(b.shape)
print(b)
print(b[0, 0], b[0, 1], b[1, 0])

(2, 3)
[[0 1 2]
 [3 4 5]]
0 1 3


In [None]:
import numpy as np

def matriz():
    '''Matriz con una secuencia de elementos establecida'''
    m = np.array([[0,1,2],[3,4,5]])
    return m

def shape_np():
    '''Devuelve la forma de una matriz'''
    print(matriz())
    print('Shape: {}'.format(matriz().shape))

def acceso_elem():
    '''Acceder a los elemnetos de la matriz'''
    print('m[0,0] = {}'.format(matriz()[0, 0]))
    print('m[0,1] = {}'.format(matriz()[0, 1]))
    print('m[1,0] = {}'.format(matriz()[1, 0]))

shape_np()
acceso_elem()

[[0 1 2]
 [3 4 5]]
Shape: (2, 3)
m[0,0] = 0
m[0,1] = 1
m[1,0] = 3


### Creación de una matriz NumPy

NumPy también proporciona muchas funciones integradas para crear matrices. La mejor manera de aprender esto es a través de ejemplos, así que pasemos al código.

In [None]:
# Creamos una matriz 3x3 de todos ceros
a = np.zeros((3,3))
print (a)

[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]


In [None]:
#Funcion de np.zeros con tamaño de matriz aleatorio
import numpy as np
import random

def matriz():
    '''Devuelve una nueva matriz de forma y tipo dados, llena de ceros'''
    a, b = random.randint(1, 4), random.randint(1, 4)
    a = np.zeros((a,b))
    return a

print(matriz())

[[0. 0.]
 [0. 0.]
 [0. 0.]]


In [None]:
# Creamos una matriz 2x2 de todos 1
b = np.ones((2,2))
print (b)

[[1. 1.]
 [1. 1.]]


In [None]:
#Funcion de np.ones con tamaño de matriz aleatorio
import numpy as np
import random

def matriz():
    '''Devuelve una nueva matriz de forma y tipo dados, llena de unos'''
    a, b = random.randint(1, 3), random.randint(1, 4)
    c = np.ones((a,b))
    print(c.shape)
    return c

print(matriz())

(1, 4)
[[1. 1. 1. 1.]]


In [None]:
# Creamos una matriz 3x3 constantes
c = np.full((3,3), 7)
print(c)

[[7 7 7]
 [7 7 7]
 [7 7 7]]


In [None]:
#Funcion de np.full con tamaño de matriz aleatorio
import numpy as np
import random

def matriz():
    '''Retorna un arreglo NumPy con un valor específico repetido en todas sus entradas'''
    a1, a2 = random.randint(1, 3), random.randint(1, 3)
    num = random.randint(0, 10)
    m = np.full((a1, a2), num)
    print(m.shape)
    return m

print(matriz())

(2, 2)
[[5 5]
 [5 5]]


In [None]:
# Creamos una matriz 3x3 con valores aleatorios
d = np.random.random((3,3))
print(d)

[[0.00104496 0.42621622 0.15733299]
 [0.1237618  0.5817823  0.16642056]
 [0.41076508 0.93741593 0.31023947]]


In [None]:
#Funcion de np.random.random con tamaño de matriz aleatorio
import numpy as np
import random

def matriz():
    '''Devuelve flotantes aleatorios en el intervalo semiabierto'''
    a1, a2 = random.randint(1, 3), random.randint(1, 3)
    m = np.random.random((a1, a2))
    print(m)

matriz()

[[0.18389256 0.34322895]
 [0.6359025  0.33766815]
 [0.26798582 0.2976397 ]]


In [None]:
# Creamos una matriz identidad 3x3
e = np.eye(3)
print(e)

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


In [None]:
#Funcion de np.eye con tamaño de matriz aleatorio
import numpy as np
import random

def matriz():
    '''Devuelve una matriz bidimensional con unos en la diagonal y ceros en el resto'''
    f = random.randint(1, 3) #fila
    c = random.randint(1, f) #columna
    m = np.eye(f, c)
    print(m)
    print(m.shape)

matriz()

[[1.]
 [0.]
 [0.]]
(3, 1)


In [None]:
# Convertir una lista en una matriz
f = np.array([2, 3, 1,0])
print(f)

[2 3 1 0]


In [None]:
# arange() crea matrices con valores que se incrementan regularmente
n = np.arange(0, 6, 2, dtype=np.float32)
print(n)

[0. 2. 4.]


In [None]:
import numpy as np
import random

def matriz():
    '''Devuelve valores espaciados uniformemente dentro de un intervalo dado'''
    b = random.randint(2, 12)
    m = np.arange(1, b, random.randint(1, b//2))
    print(m)

matriz()

[1 3 5 7]


In [None]:
# Mezcla de tupla y listas
import numpy as np
import random

def matriz():
    '''Mezcla de lista y tuplas en una matriz, ten en cuenta que debe tener el mismo tamaño (long)'''
    l1 = [random.randint(1, 10) for i in range(2)]
    l2 = [random.randint(1, 5) for i in range(2)]
    #t = tuple(random.randint(1, 8) for i in range(2))
    t = (1, 8)
    m = np.array([l1, t, l2])
    print(m)

matriz()

[[ 8 10]
 [ 1  8]
 [ 4  3]]


In [None]:
# Crear una matriz de rango con tipo de datos flotante
i = np.arange(1, 8, dtype=np.float64)
print(i)

[1. 2. 3. 4. 5. 6. 7.]


In [None]:
import numpy as np
import random

def datos_flotantes():
    '''Crear una matriz de rango con tipo de datos flotante'''
    b = random.randint(2, 12)
    options = [np.float32, np.float64]
    m = np.arange(1, b, random.randint(1, b//2), dtype=random.choice(options))
    print(m)

datos_flotantes()

[ 1.  4.  7. 10.]


`linspace()`  crea matrices con un numero especifico de elementos que están espaciados por igual entre los valores inicial y final especificados

In [None]:
r = np.linspace(1, 9, num=5)
print(r)

[1. 3. 5. 7. 9.]


In [None]:
import numpy as np
import random

def matriz():
    '''Devuelve números espaciados uniformemente en un intervalo específico'''
    a1, a2 = 1, random.randint(2, 10)
    a3 = random.randint(1, a2//2)
    flag = [True, False]
    endpoint = random.choice(flag) if a3 > 1 else True
    m = np.linspace(a1, a2, num=a3, endpoint=endpoint)
    print(m)

matriz()

[ 1.  4.  7. 10.]


### Tipos de datos
Una matriz es una colección de elementos del mismo tipo de datos y NumPy admite y proporciona funciones integradas para construir matrices con argumentos opcionales para especificar explícitamente los tipos de datos requeridos.

In [None]:
# Numpy escoge el tipo de datos
x = np.array([0, 1])
y = np.array([2.0, 3.0])

# Fuerza un tipo de datos en particular
z = np.array([5, 6], dtype=np.int64)
print (x.dtype, y.dtype, z.dtype)

int64 float64 int64


**Ejercicio** Completa el siguiente  código.

In [None]:
import numpy as np
np.random.seed(0)

x1 = np.random.randint(10, size=6)  # matriz 1-d
x2 = np.random.randint(10, size=(5, 4))  # matriz-2d
x3 = np.random.randint(10, size=(2, 4, 5)) # matriz-3d

# Imprime los atributos : dim, shape, size, dtype, itemsize y nbytes
# Completar
print('Ndimensional--> x1:{}, x2:{}, x3:{}'.format(x1.ndim, x2.ndim, x3.ndim))
print('Dimensiones del arreglo--> x1:{}, x2:{}, x3:{}'.format(x1.shape, x2.shape, x3.shape))
print('Numero de elementos del array--> x1:{}, x2:{}, x3:{}'.format(x1.size, x2.size, x3.size))
print('Tipo de datos de los elmentos del array--> x1:{}, x2:{}, x3:{}'.format(x1.dtype, x2.dtype, x3.dtype))
print('Tamaño en bytes--> x1:{}, x2:{}, x3:{}'.format(x1.itemsize, x2.itemsize, x3.itemsize))
print('Numero total de bytes usados--> x1:{}, x2:{}, x3:{}'.format(x1.nbytes, x2.nbytes, x3.nbytes))
print('-'*65)
print(x1)
print('!'*60)
print(x2)
print('!'*60)
print(x3)

Ndimensional--> x1:1, x2:2, x3:3
Dimensiones del arreglo--> x1:(6,), x2:(5, 4), x3:(2, 4, 5)
Numero de elementos del array--> x1:6, x2:20, x3:40
Tipo de datos de los elmentos del array--> x1:int64, x2:int64, x3:int64
Tamaño en bytes--> x1:8, x2:8, x3:8
Numero total de bytes usados--> x1:48, x2:160, x3:320
-----------------------------------------------------------------
[5 0 3 3 7 9]
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
[[3 5 2 4]
 [7 6 8 8]
 [1 6 7 7]
 [8 1 5 9]
 [8 9 4 3]]
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
[[[0 3 5 0 2]
  [3 8 1 3 3]
  [3 7 0 1 9]
  [9 0 4 7 3]]

 [[2 7 2 0 0]
  [4 5 5 6 8]
  [4 1 4 9 8]
  [1 1 7 9 9]]]


In [None]:
#se usa for para agurpar los print
for cont, matriz in enumerate([np.random.randint(10, size=6), np.random.randint(10, size=(5, 4)), np.random.randint(10, size=(2, 4, 5))], 1):
  print('X{}'.format(cont))
  print('-'*55)
  print('Ndimensional--> {}'.format(matriz.ndim))
  print('Dimensiones del arreglo--> {}'.format(matriz.shape))
  print('Numero de elementos del array--> {}'.format(matriz.size))
  print('Tipo de datos de los elmentos del array--> {}'.format(matriz.dtype))
  print('Tamaño en bytes--> {}'.format(matriz.itemsize))
  print('Numero total de bytes usados--> {}'.format(matriz.nbytes))
  print('-'*55)


X1
-------------------------------------------------------
Ndimensional--> 1
Dimensiones del arreglo--> (6,)
Numero de elementos del array--> 6
Tipo de datos de los elmentos del array--> int64
Tamaño en bytes--> 8
Numero total de bytes usados--> 48
-------------------------------------------------------
X2
-------------------------------------------------------
Ndimensional--> 2
Dimensiones del arreglo--> (5, 4)
Numero de elementos del array--> 20
Tipo de datos de los elmentos del array--> int64
Tamaño en bytes--> 8
Numero total de bytes usados--> 160
-------------------------------------------------------
X3
-------------------------------------------------------
Ndimensional--> 3
Dimensiones del arreglo--> (2, 4, 5)
Numero de elementos del array--> 40
Tipo de datos de los elmentos del array--> int64
Tamaño en bytes--> 8
Numero total de bytes usados--> 320
-------------------------------------------------------


### Indexación de matrices

NumPy ofrece varias formas de indexar en matrices. La sintaxis estándar de Python `x[obj]` se puede usar para indexar la matriz NumPy, donde `x` es la matriz y `obj` es la selección.

Hay tres tipos de indexación disponibles:

* Acceso al campo

* Recorte básico

* Indexación avanzada

#### Acceso al campo

Si el objeto ndarray es una matriz estructurada, se puede acceder a los campos de la matriz indexando la matriz con cadenas, como un diccionario. La indexación de `x['field-name']` devuelve una nueva vista de la matriz, que tiene la misma dimensión que `x`, excepto cuando el campo es una submatriz  que contiene sólo la parte de los datos en el campo especificado. Los tipos de datos se obtienen con `x.dtype['field-name']`.

In [None]:
x = np.zeros((3,3), dtype=[('a', np.int32), ('b', np.float64, (3,3))])
print(x)

[[(0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])]
 [(0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])]
 [(0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])]]


In [None]:
for index, array in enumerate([np.zeros((3,3), dtype=np.int32), np.ones((3,3,3,3), dtype=np.float64)], 1):
  print('M{}'.format(index))
  print('-'* 30)
  print(matriz)
  print('-'* 30)
  print ("shape:", matriz.shape)
  print ("dtype:", matriz.dtype)
  print('-'* 30)

M1
------------------------------
[[[[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]]


 [[[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]]


 [[[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]]]
------------------------------
shape: (3, 3, 3, 3)
dtype: float64
------------------------------
M2
------------------------------
[[[[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]]


 [[[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]]


 [[[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]

  [[1. 1. 1.]
   [1. 1. 1.]
   [1. 1. 1.]]]]
------------------------------
sh

#### Recorte básico

Las matrices NumPy se pueden dividir, de forma similar a las listas. Debe especificar un segmento para cada dimensión de la matriz, ya que las matrices pueden ser multidimensionales.

La sintaxis de división básica es `i: j: k`, donde `i` es el índice inicial, `j` es el índice final, `k` es el paso y `k` no es igual a 0. Esto selecciona los elementos `m` en la dimensión correspondiente, con valores de índice `, i + k, ...,i + (m - 1)k` donde `m = q + (r distinto de 0)`,  `q` y `r` son el cociente y el resto se obtiene dividiendo `j - i` entre `k`: `j - i = qk + r`, de modo que `i + (m - 1) k < j`.

In [None]:
x = np.array([5, 6, 7, 8, 9])
x[1:7:2]

array([6, 8])

In [None]:
def recorte():
    x = np.array([5, 6, 7, 8, 9])
    return x[1:7:2] #no toma al 5 porque empieza en el indice 1 x[1]

print(recorte())

[6 8]


La `k` negativa hace que los pasos vayan hacia índices más pequeños. Los `i` y `j` negativos se interpretan como `n + i` y `n + j` donde `n` es el número de elementos en la dimensión correspondiente.

In [None]:
print(x[-2:5]) #-2 es 8 y continua en adelante incluyendo al 9
print(x[-1:1:-1]) #-1 es 9 y va hasta el 1, osea 6, bajando en 1

[8 9]
[9 8 7]


Si `n` es el número de elementos en la dimensión que se está recortando. Entonces, si no se proporciona `i`, el valor predeterminado es `0` para  `k > 0` y `n-1` para `k < 0`. Si no se proporciona `j`, el valor predeterminado es `n` para `k > 0` y `-1` para `k < 0`. Si no se proporciona `k`, el valor predeterminado es `1`. Ten en cuenta que `::` es lo mismo que `:` y significa seleccionar todos los índices a lo largo de este eje.

In [None]:
x[4:]

array([9])

Si el número de objetos en la tupla de selección es menor que N , entonces se asume `:` para cualquier dimensión subsiguiente.

In [None]:
# Completar
def recorte():
    x = np.array([5, 6, 7, 8, 9])
    print(x[2:12])

recorte()

[7 8 9]


Los puntos suspensivos se expanden al número de : objetos necesarios para hacer una tupla de selección de la misma longitud que `x.ndim`. Solo puede haber una sola elipsis presente.

In [None]:
print(x)

[5 6 7 8 9]


In [None]:
x[...,0] #se usa en arreglos multidimensionales para seleccionar una parte específica del arreglo en dimensiones subsiguientes

array(5)

In [None]:
x[2,...]

array(7)

#### Ejercicio

1. Crea una matriz de rango `2` con dimension `(3, 4)`

2. Usa el recorte para extraer la submatriz que consta de las primeras `2` filas y las columnas `1` y `2`.

3. Una parte de una matriz es solo una vista de los mismos datos, comprueba quecualquier modificación modificará la matriz original.



In [None]:
import numpy as np

def m():
    m = np.empty([3, 4], dtype=np.int8)
    return m

def espaciado():
  print('-'*25)

def rango_dimension():
  print('Rango: ', m().ndim)
  print('Dimension: ', m().shape)

def recorte():
  print('Recorte: ', end='\n')
  print((m()[:2, 1:3])) #se pone 2 es porque es 1 despues

def modificacion():
  copia = m().copy()
  m()[1, 2] = 16
  print('Copia de la matriz: ', end='\n')
  print(copia)
  print('-'*60)
  print('Cambio de un elemento en la matriz: ', end='\n')
  print(m())
  print('-'*60)
  print('Comprobar que cambio en la matriz: ', end='\n')
  print(copia == m())

print(m())
espaciado()
rango_dimension()
espaciado()
recorte()
espaciado()
modificacion()

[[   0    0    0    0]
 [   0    0    0   64]
 [   0    0 -128   64]]
-------------------------
Rango:  2
Dimension:  (3, 4)
-------------------------
Recorte: 
[[0 0]
 [0 0]]
-------------------------
Copia de la matriz: 
[[   0    0    0    0]
 [   0    0    0   64]
 [   0    0 -128   64]]
------------------------------------------------------------
Cambio de un elemento en la matriz: 
[[   0    0    0    0]
 [   0    0   16   64]
 [   0    0 -128   64]]
------------------------------------------------------------
Comprobar que cambio en la matriz: 
[[ True  True  True  True]
 [ True  True False  True]
 [ True  True  True  True]]


In [None]:
m = np.array([[0, 3, 6, 9], [8, 4, 2, 0], [6, 5, 12, 13]])
print(m)

[[ 0  3  6  9]
 [ 8  4  2  0]
 [ 6  5 12 13]]


In [None]:
m[:2, 1:3] #primeras 2 filas y columna 1 y 2

array([[3, 6],
       [4, 2]])

In [None]:
m[1, 2] = 16
print(m)

[[ 0  3  6  9]
 [ 8  4 16  0]
 [ 6  5 12 13]]


Se puede acceder a la matriz de la fila central de dos maneras.

* Las partes junto con la indexación de enteros darán como resultado una matriz de rango inferior.

* El uso de solo recortes dará como resultado el mismo rango matriz.

In [None]:
# Creamos una matriz de rango 2 array con dimensión (3, 4)
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print (a)

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]


Dos formas de acceder a los datos en la fila central de la matriz. La combinación de la indexación de enteros con recortes produce una matriz de menor rango, mientras que el uso de solo recortes produce una matriz del mismo rango que la matriz original:

In [None]:
fila_r1 = a[1, :]    # Vista de rango 1 de la segunda fila de a
fila_r2 = a[1:2, :]  # Vista de rango 2 de la segunda fila de a
fila_r3 = a[[1], :]  # Vista de ranfo 2 de la segunda fila de a
print(fila_r1, fila_r1.shape)
print(fila_r2, fila_r2.shape)
print(fila_r3, fila_r3.shape)

[5 6 7 8] (4,)
[[5 6 7 8]] (1, 4)
[[5 6 7 8]] (1, 4)


Podemos hacer la misma distinción al acceder a las columnas de una matriz.

In [None]:
col_r1 = a[:, 1]
col_r2 = a[:, 1:2]
print(col_r1, col_r1.shape)
print(col_r2, col_r2.shape)

[ 2  6 10] (3,)
[[ 2]
 [ 6]
 [10]] (3, 1)


### Indexación avanzada


In [None]:
a = np.array([[1,2], [3, 4]])
print(a)

[[1 2]
 [3 4]]


In [None]:
print(a[[0, 1], [0, 1]]) #[0,0] fila 0, columna 0 y [1,1] f1, c1 -->asi se interpreta
# El ejemplo de indexacion de una matriz entera es equivalente a esto:
index = np.array([[0, 1], [0, 1]])
print(a[index[0], index[1]])

[1 4]
[1 4]


Al usar la indexacion de un matriz de enteros, puede reutilizar el mismo elemento de la matriz de origen:

In [None]:
print(a[[0, 0], [1, 1]])
# Equivalente al ejemplo de indexacion de matriz de enteros
index = np.array([[0, 0], [1, 1]])
print(a[index[0], index[1]])

[2 2]
[2 2]


Un asunto  importante y extremadamente útil acerca de los recortes de una  matriz es que devuelven  *vistas (`views`)* en lugar de *copias (`copies`)*  de los datos de la matriz. Este es un área en la que NumPy  difiere de la lista de Python:  en las listas, estas son copias.

In [None]:
np.random.seed(0)
x2 = np.random.randint(10, size=(5, 4))
x2

array([[5, 0, 3, 3],
       [7, 9, 3, 5],
       [2, 4, 7, 6],
       [8, 8, 1, 6],
       [7, 7, 8, 1]])

In [None]:
x2_sub = x2[:2, :2] #hasta fila 1 y columna 1
print(x2_sub)

[[5 0]
 [7 9]]


In [None]:
x2_sub[0, 0] = 99
print(x2_sub)

[[99  0]
 [ 7  9]]


Este comportamiento predeterminado es realmente muy útil: significa que cuando trabajamos con grandes conjuntos de datos, podemos acceder y procesar partes de estos conjuntos de datos sin necesidad de copiar el búfer de datos.

A pesar de las características  de las `vistas` de una  matriz, a veces es útil copiar de forma explícita los datos dentro de una matriz o una submatriz. Esto se puede hacer  con el método `copy()`:

In [None]:
x2_sub_copy = x2[:2, :2].copy()
print(x2_sub_copy)

[[99  0]
 [ 7  9]]


In [None]:
x2_sub_copy[0, 0] = 42
print(x2_sub_copy)

[[42  0]
 [ 7  9]]


In [None]:
print(x2)

[[99  0  3  3]
 [ 7  9  3  5]
 [ 2  4  7  6]
 [ 8  8  1  6]
 [ 7  7  8  1]]


In [None]:
print(x2_sub_copy)

[[42  0]
 [ 7  9]]


### Reshaping

In [None]:
x4 = np.arange(1, 10).reshape((3, 3))
print(x4)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


Ten en cuenta que para que esto funcione, el tamaño de la matriz inicial debe coincidir con el tamaño de la matriz rediseñada. Siempre que sea posible, el método `reshape` utilizará una `vista` sin copia de la matriz inicial.

Otro patrón de `reshaping `, es la conversión de una matriz unidimensional en una fila o columna de una matriz bidimensional. Esto se puede hacer con el método `reshape`  o más fácilmente haciendo uso de `newaxis` dentro de una operación de división:

In [None]:
x5 = np.array([1, 2, 3])
x5

array([1, 2, 3])

In [None]:
# vector fila via reshape
print(x5.reshape(1, 3))
print(x5.reshape(1, -1))

[[1 2 3]]
[[1 2 3]]


In [None]:
# vector fila con newaxis
x5[np.newaxis, :]

array([[1, 2, 3]])

In [None]:
# vector columna via reshape
print(x5.reshape(3, 1))
print(x5.reshape(-1, 1))

[[1]
 [2]
 [3]]
[[1]
 [2]
 [3]]


In [None]:
# vector columna con newaxis
x5[: , np.newaxis]

array([[1],
       [2],
       [3]])

### Concatenación y  separación


In [None]:
x = np.array([4, 5, 6])
y = np.array([7, 8, 9])
np.concatenate([x, y])

array([4, 5, 6, 7, 8, 9])

In [None]:
# concatenacion de dos o mas matrices
z = [99, 99, 99]
print(np.concatenate([x, y, z]))

[ 4  5  6  7  8  9 99 99 99]


In [None]:
# concatendo una matriz dos veces
grid = np.array([[1, 2, 3],
                 [4, 5, 6]])
np.concatenate([grid, grid])

array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3],
       [4, 5, 6]])

Para trabajar con matrices de distintas dimensiones, se usan las funciones `vstack` y `hstack`:

In [None]:
x = np.array([0, 1, 2])
grid = np.array([[3, 4, 5],
                 [6, 5, 4]])
#para saber su dimension
for index, array in enumerate([np.array([0, 1, 2]), np.array([[3, 4, 5],
                 [6, 5, 4]])], 1):
  print('Matriz {}'.format(index))
  print('Ndim: {}'.format(array.ndim))
  print('-' * 20)
# Se junta la matriz de manera vertical
print(np.vstack((x, grid)))

Matriz 1
Ndim: 1
--------------------
Matriz 2
Ndim: 2
--------------------
[[0 1 2]
 [3 4 5]
 [6 5 4]]


In [None]:
print(np.array([0, 1, 2]))

[0 1 2]


In [None]:
# Se junta la matriz de manera horizontal
y = np.array([[23],
              [23]])
y_rz = np.resize(y, (x.shape[0], y.shape[1]))

grid = np.array([[3, 4, 5],
                 [6, 5, 4]])

grid_rz = np.resize(grid, (x.shape[0], grid.shape[1]))

x = np.array([0, 1, 2])
x_rz = x[:, np.newaxis]

#para saber su tamaño
for index, array in enumerate([x_rz, grid_rz, y_rz], 1):
  print('Matriz {}'.format(index))
  print('Shape: {}'.format(array.shape))
  print('-' * 20)
# Se junta la matriz de manera horizontal
print('Matriz juntada de forma horizontal: ', end='\n')
print(np.hstack((x_rz, grid_rz, y_rz)))

Matriz 1
Shape: (3, 1)
--------------------
Matriz 2
Shape: (3, 3)
--------------------
Matriz 3
Shape: (3, 1)
--------------------
Matriz juntada de forma horizontal: 
[[ 0  3  4  5 23]
 [ 1  6  5  4 23]
 [ 2  3  4  5 23]]


Lo contrario de la concatenación es la división o separación, que es implementado por las funciones `np.split`, `np.hsplit` y `np.vsplit`. Para cada uno de estas funciones , podemos pasar una lista de índices que dan los puntos de división.

Ver:[https://numpy.org/doc/stable/reference/generated/numpy.split.html](https://numpy.org/doc/stable/reference/generated/numpy.split.html)

In [None]:
x = [1, 2, 3, 44, 95, 3, 2, 1]
x1, x2, x3 = np.split(x, [3, 5])
print(x1, x2, x3)

[1 2 3] [44 95] [3 2 1]


In [None]:
# en bucle
divisiones = np.split(x, [3, 5])

for index, division in enumerate(divisiones, 1):
  print(f'x{index} = {division}')

x1 = [1 2 3]
x2 = [44 95]
x3 = [3 2 1]


In [None]:
grid = np.arange(16).reshape((4, 4))
grid

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

In [None]:
grid1, grid2 = np.vsplit(grid, [2]) #fila
print(grid1)
print(grid2)

[[0 1 2 3]
 [4 5 6 7]]
[[ 8  9 10 11]
 [12 13 14 15]]


In [None]:
# en bucle
ds = np.vsplit(grid, [2]) #fila

for i, d in enumerate(ds, 1):
  print(f'grid{i} = {d}')

grid1 = [[0 1 2 3]
 [4 5 6 7]]
grid2 = [[ 8  9 10 11]
 [12 13 14 15]]


In [None]:
grid3, grid4 = np.hsplit(grid,[2]) #columna
print(grid3)
print(grid4)

[[ 0  1]
 [ 4  5]
 [ 8  9]
 [12 13]]
[[ 2  3]
 [ 6  7]
 [10 11]
 [14 15]]


In [None]:
# en bucle
gs = np.hsplit(grid,[2])

for index, g in enumerate(gs, 3):
  print(f'grid{index} = {g}')

grid3 = [[ 0  1]
 [ 4  5]
 [ 8  9]
 [12 13]]
grid4 = [[ 2  3]
 [ 6  7]
 [10 11]
 [14 15]]


### Fancy


In [None]:
rand = np.random.RandomState(42)
x = rand.randint(100, size=10)
print(x)

[51 92 14 71 60 20 82 86 74 74]


In [None]:
# Accedemos a tres elementos diferentes
[x[1], x[5], x[2]]

[92, 20, 14]

Alternativamente, podemos pasar una sola lista o matriz de índices para obtener el mismo resultado:

In [None]:
# Completar
print(x[[1, 5, 2]])

[92 20 14]


Cuando se utiliza fancy, la forma del resultado refleja la forma de las matrices de índice en lugar de la forma de la matriz que se indexa y trabaja  en múltiples  dimensiones:

In [None]:
# Completar
lista = [1, 5, 2]
print(x[lista])

[92 20 14]


In [None]:
X = np.arange(12).reshape((3, 4))
X

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

Al igual que con la indexación estándar, el primer índice se refiere a la fila, y el segundo a la columna:

In [None]:
X

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [None]:
fila = np.array([0, 1, 2])
col = np.array([2, 1, 3])
X[fila, col]

array([ 2,  5, 11])

Observa que el primer valor en el resultado es `X[0, 2]`, el segundo es `X[1, 1]`  y el tercero es `X[2, 3]`. El emparejamiento de índices en la indexación fancy  sigue todas las reglas del broadcasting, por ejemplo, si combinamos un vector de columna y un vector de fila dentro de los índices, obtenemos un resultado bidimensional:

In [None]:
X

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [None]:
# Completar
fil = np.array([[0],
                [2]])
col = np.array([[2, 1]])
X[fil, col]

array([[ 2,  1],
       [10,  9]])

Aquí, cada valor de fila se empareja con cada vector de columna, exactamente como se hace en broadcasting  de operaciones aritméticas. Por ejemplo:

In [None]:
# Completar
print(f'Broadcasting fila-columna:', end='\n')
print(fil + col)

a = np.array([5, 6, 8, 9])
b = 6
print(f'Broadcasting array-escalar:', end='\n')
print(a + b)


c = np.array([[6, 2],
               [7, 3]])

d = np.array([8, 4])
d = d[:, np.newaxis]

print(f'Broadcasting array 2D - fila:', end='\n')
print(c * d)

Broadcasting fila-columna:
[[2 1]
 [4 3]]
Broadcasting array-escalar:
[11 12 14 15]
Broadcasting array 2D - fila:
[[48 16]
 [28 12]]


Siempre es importante recordar que en  la indexación fancy, el valor de retorno refleja la forma del broadcasting  de los índices, en lugar de la forma de la matriz que se indexa.

Para operaciones  más potentes, la indexación adornada se puede combinar con los otros esquemas de indexación que existen:

In [None]:
import numpy as np

In [None]:
print(X)

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]


In [None]:
# Combinando el indexado fancy y indices simples
indexado_fancy =[0, 2]
indexado_simple = 2

X[indexado_fancy, indexado_simple]

array([ 2, 10])

In [None]:
i_f = [0, 1]
i_c = [1, 3]
i_s = 1

X[i_f, i_c[i_s]]

array([3, 7])

In [None]:
# Combinando el indexado fancy y el recorte
idx_fancy = [1, 0, 2]
idx_rect = [1, 3]

X[idx_fancy][:, idx_rect]

array([[ 5,  7],
       [ 1,  3],
       [ 9, 11]])

Así como el fancy  se puede utilizar para acceder a partes de una matriz, también se puede utilizar para modificar partes de una matriz. Por ejemplo, si  tenemos una matriz de índices y nos gustaría establecer los elementos correspondientes en una matriz a algún valor, podemos hacer lo siguiente:

In [None]:
x = np.arange(10)
i = [2, 1, 8, 4]
x[i] = 99
print(x)

[ 0 99 99  3 99  5  6  7 99  9]


Los índices repetidos con estas operaciones pueden causar algunos resultados potencialmente inesperados. Considera lo siguiente:

In [None]:
import numpy as np

In [None]:
x = np.zeros(10) #toma el ultimo valor que se le asigna
x[[0, 0]] = [4, 6]
print(x)

[6. 0. 0. 0. 0. 0. 0. 0. 0. 0.]


El resultado de esta operación es asignar primero  `x[0] = 4`, seguido por `x[0] = 6`. Pero el resultado es que `x[0]` contiene el valor 6.

Considera la siguiente operación:

In [None]:
i = [2, 3, 3, 4, 4, 4]
x[i] += 1
x

array([6., 0., 1., 1., 1., 0., 0., 0., 0., 0.])

En este caso algún resultado inesperado se debe conceptualmente  a que `x[i] +=1` se entiende como una abreviatura de `x[i] = x [i] + 1`. Cuando `x[i] + 1` es evaluado el resultado es asignado  a los índices en `x` . Con esto en mente, no es que el aumento que ocurre varias veces, sino la asignación, que conduce a los resultados  no intuitivos.

Si quieremos  el otro comportamiento donde se repite la operación, se puede utilizar el método `at()` de `ufuncs`:

In [None]:
# Completar
np.add.at(x, i, 1)
x

array([6., 0., 3., 5., 7., 0., 0., 0., 0., 0.])

El método `at()` realiza una aplicación  del operador dado en los índices especificados (aquí, `i`) con el valor especificado (aquí, `1`).

###  Expresiones vectorizadas

### Agregaciones


In [None]:
L = np.random.random(100)
sum(L)

50.51675880087349

La sintaxis es bastante similar a la función de `sum` de  `NumPy`  y el resultado es el mismo en el caso más simple:

In [None]:
np.sum(L)

50.51675880087348

Sin embargo, debido a que la operación se ejecuta  en código compilado, la versión `NumPy` de la operación se calcula mucho más rápidamente:

In [None]:
matriz_grande = np.random.rand(1000000)
%timeit sum(matriz_grande)
%timeit np.sum(matriz_grande)

107 ms ± 29.3 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
379 µs ± 17.1 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


La función `sum` y la función `np.sum` no son idénticas, lo que a veces puede conducir a la confusión.  En particular, sus argumentos opcionales tienen significados diferentes  y `np.sum` es válido a  varias dimensiones de una matriz.

In [None]:
# Otras funciones min y max
min(matriz_grande), max(matriz_grande)

(4.286587862445401e-09, 0.9999953888516966)

In [None]:
%timeit min(matriz_grande)
%timeit np.min(matriz_grande)

83.2 ms ± 25.5 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
433 µs ± 15 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


Todas estas funciones también están disponibles como métodos en la clase `ndarray`. Por ejemplo, `np.mean(data)` y `data.mean()` en el ejemplo siguiente son equivalentes:

In [None]:
data = np.random.normal(size=(15, 15)) #numeros aleatorios que siguen distribucion gaussiana
np.mean(data)

0.009783707628099745

In [None]:
data.mean()

0.009783707628099745

Un tipo común de operación de agregación es un agregado a lo largo de una fila o columna.

In [None]:
M = np.random.random((5, 6))
print(M)

[[0.90298545 0.14088297 0.5917086  0.70893869 0.98159162 0.92234769]
 [0.00809705 0.70115318 0.48965874 0.62241932 0.96731826 0.53739967]
 [0.9778988  0.98257232 0.67130734 0.61550802 0.58534567 0.56102179]
 [0.61285909 0.23246197 0.64776992 0.30939069 0.31262232 0.8368049 ]
 [0.59505039 0.01393542 0.90862302 0.79341373 0.09294848 0.90522625]]


De forma predeterminada, cada función de agregación de  `NumPy`  devolverá el agregado sobre toda la matriz:

In [None]:
M.sum()

18.229261371292896

Las funciones de agregación toman un argumento adicional que especifica el eje a lo largo del cual se calcula el agregado. Por ejemplo, podemos encontrar el valor de la suma y el  mínimo de cada columna especificando `axis = 0`:

In [None]:
M.sum(axis= 0) #columnas

array([3.09689077, 2.07100586, 3.30906763, 3.04967045, 2.93982636,
       3.7628003 ])

In [None]:
data = np.random.normal(size=(5, 10, 15))
data.sum(axis=0).shape

(10, 15)

In [None]:
data.sum(axis=(0, 2)).shape

(10,)

In [None]:
data.sum()

27.068276856679617

Algunas funciones de agregación en `Numpy ` son :


|Nombre de funcion  | VersionNaN-safe     | Descripcion                                   |
|-------------------|---------------------|-----------------------------------------------|
| ``np.sum``        | ``np.nansum``       | Calcula suma de elementos                     |
| ``np.prod``       | ``np.nanprod``      | Calcula el producto de elementos              |
| ``np.mean``       | ``np.nanmean``      | Calcula la media de elementos                 |
| ``np.std``        | ``np.nanstd``       | Calcula la desviacion estandar                |
| ``np.var``        | ``np.nanvar``       | Calcula la  varianza                          |
| ``np.min``        | ``np.nanmin``       | Encuentra el minimo valor                     |
| ``np.max``        | ``np.nanmax``       | Encuentra el maximo valor                     |
| ``np.argmin``     | ``np.nanargmin``    | Encuenta el index del minimo valor            |
| ``np.argmax``     | ``np.nanargmax``    | Encuentra el index del maximo valor           |
| ``np.median``     | ``np.nanmedian``    | Calcula la mediana de elementos               |
| ``np.percentile`` | ``np.nanpercentile``| Calcula el rango estatistico de elementos     |
| ``np.any``        | N/A                 | Evalua si algun elemento es true              |
| ``np.all``        | N/A                 | Evalua si todos los elementos son true        |



#### Broadcasting


In [None]:
a = np.array([0, 1, 2])
b = np.array([2, 6, 1])
a + b

array([2, 7, 3])

El  `broadcasting` permite que estos tipos de operaciones binarias se realicen en matrices de diferentes tamaños; por ejemplo, podemos añadir  un escalar (una matriz de dimensión cero) a una matriz:

In [None]:
a + 5


array([5, 6, 7])

Podemos extender de manera similar esto a matrices de mayor dimensión. Veamos el resultado cuando agregamos una matriz unidimensional a una matriz bidimensional:

In [None]:
A = np.arange(16).reshape(4, 4)
b = np.arange(4)
A

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

In [None]:
b

array([0, 1, 2, 3])

In [None]:
A + b

array([[ 0,  2,  4,  6],
       [ 4,  6,  8, 10],
       [ 8, 10, 12, 14],
       [12, 14, 16, 18]])

Podemos aplicar el  `broadcasting` en dos matrices. Considere el siguiente ejemplo:

Broadcasting necesita de la misma cantidad de filas, sino haras T

In [None]:
# Completar
M1 = np.array([[2, 3, 5],
              [8, 2, 1]])

In [None]:
# Completar
M2 = np.array([[1, 1],
               [5, 4],
               [2, 0]])

In [None]:
# Completar
M3 = M1.T + M2
M1.T

array([[2, 8],
       [3, 2],
       [5, 1]])

In [None]:
# Completar
M3

array([[3, 9],
       [8, 6],
       [7, 1]])

###  Regla del broadcasting

El `broadcasting` en `NumPy` sigue un estricto conjunto de reglas para determinar la interacción entre dos matrices :

* Regla 1: Si las dos matrices difieren en su número de dimensiones, la forma de la matriz que tiene menos dimensiones se rellena con unos en el lado principal (izquierdo).

* Regla 2: Si la forma de los dos matrices no coincide con ninguna dimensión, la matriz con la forma igual a 1 en esa dimensión se estira para que coincida con la otra dimensión.

* Regla 3: Si en cualquier dimensión los tamaños son distintos y ninguno es igual a 1, se genera un error.

### Un útil truco:

In [1]:
import numpy as np

In [2]:
J = np.arange(0, 40, 10)
print(J)
print(J.shape)

[ 0 10 20 30]
(4,)


In [3]:
J = J[:, np.newaxis]  # agregamos un nuevo eje ->  matriz 2D, cambio columnas
J.shape

(4, 1)

In [4]:
J

array([[ 0],
       [10],
       [20],
       [30]])

In [5]:
J + 3

array([[ 3],
       [13],
       [23],
       [33]])

### Comparaciones, máscaras y lógica Booleana


In [2]:
a1 = np.array([1, 2, 3, 4])
b1 = np.array([4, 3, 2, 1])
a1 < b1

array([ True,  True, False, False])

In [7]:
np.all(a1 < b1) #todos

False

In [8]:
np.any(a1 < b1) #cualquiera

True

In [9]:
if np.all(a1 < b1):
    print(" Todos los elementos en a1 son menores que los elementos en b1 ")
elif np.any(a1 < b1):
    print("Algunos elementos en a1 son menores que los elementos de b1")
else:
    print("Todos los elementos en b1 son menores que los elementos de a1")

Algunos elementos en a1 son menores que los elementos de b1


Al aparecer en una expresión aritmética junto con un número escalar, u otra matriz `NumPy` con un tipo de datos numéricos, una matriz booleana se convierte en una matriz numérica con valores `0` y `1` en lugar de `False` y `True`, respectivamente.

In [15]:
# Completar
(a1 < b1)

array([ True,  True, False, False])

In [16]:
# Completar
(a1 < b1) + 6

array([7, 7, 6, 6])

In [9]:
# Completar
rest = (a1 > b1) + np.resize(np.array([2, 8, 3]), (4, ))
print(rest)

[2 8 4 3]


Esta es una propiedad útil para la computación condicional, como cuando se definen funciones.

In [18]:
def pulso(t, posicion, altura, ancho):
    return altura * (t >= posicion) * (t <= (posicion + ancho))
# Completar
t = np.arange(5)
print(pulso(t, 2, 5, 4))

[0 0 5 5 5]


### Matrices booleanas como máscaras

Revisar: [masked array](https://docs.scipy.org/doc/numpy/reference/maskedarray.html).

In [19]:
k = np.array([1, 3, -1, 5, 7, -1])
mask = (k < 0)
mask

array([False, False,  True, False, False,  True])

In [20]:
# Un ejemplo bidimensional
rng = np.random.RandomState(0)
z1 = rng.randint(10, size=(3, 4))
z1

array([[5, 0, 3, 3],
       [7, 9, 3, 5],
       [2, 4, 7, 6]])

In [23]:
# Completar
mask2 = (z1 >= 1)
mask2

array([[ True, False,  True,  True],
       [ True,  True,  True,  True],
       [ True,  True,  True,  True]])

Ahora, para seleccionar estos valores de la matriz, podemos simplemente indexar en esta matriz booleana, esto se conoce como una operación de `enmascaramiento`:

In [25]:
# Completar
z1[mask2]

array([5, 3, 3, 7, 9, 3, 5, 2, 4, 7, 6])

El siguiente ejemplo muestra cómo sumar la matriz de enmascaramiento,  donde `True` representa uno y `False` representa 0.

In [26]:
# Completar
np.sum(mask2)

11

### Lectura recomendada: [Numpy Reference](https://docs.scipy.org/doc/numpy/reference/).