## Numpy

NumPy es la librería central para computación científica en Python. Proporciona un objeto de matriz multidimensional de alto rendimiento y herramientas para trabajar con estas matrices.

#### Matrices

Una matriz NumPy es una colección de valores de tipos de datos similares y está indexada por una tupla de números no negativos. El rango de la matriz es el número de dimensiones, y la forma de una matriz es una tupla de números que dan el tamaño de la matriz a lo largo de cada dimensión.


In [2]:
from __future__ import division
import time
import numpy as np

tam_vec = 1000

def lista_python():
    t1 = time.time()
    X = range(tam_vec)
    Y = range(tam_vec)
    Z = []
    for i in range(len(X)):
        Z.append(X[i] + Y[i])
    return time.time() - t1

def matriz_numpy():
    t1 = time.time()
    X = np.arange(tam_vec)
    Y = np.arange(tam_vec)
    Z = X + Y
    return time.time() - t1

# Llamar a la función lista_python()
tiempo_lista = lista_python()
print("Tiempo de ejecución con lista de Python:", tiempo_lista)

# Llamar a la función matriz_numpy()
tiempo_matriz = matriz_numpy()
print("Tiempo de ejecución con matriz de NumPy:", tiempo_matriz)


Tiempo de ejecución con lista de Python: 0.0003654956817626953
Tiempo de ejecución con matriz de NumPy: 0.0053064823150634766


In [4]:
import numpy
numpy.__version__

'1.22.4'

Podemos inicializar matrices NumPy a partir de listas de Python anidadas y acceder a los elementos mediante corchetes.

In [5]:
import numpy as np

# Creamos una matriz de rango 1
a = np.array([0, 1, 2])
print (type(a))

# Imprimimos la dimension de la matriz
print (a.shape)
print (a[0])
print (a[1])
print (a[2])

# Cambiamos un elemento de un array
a[0] = 5
print (a)

<class 'numpy.ndarray'>
(3,)
0
1
2
[5 1 2]


In [6]:
# Creamos una matriz de rango 2
b = np.array([[0,1,2],[3,4,5]])
print (b.shape)
print (b)
print (b[0, 0], b[0, 1], b[1, 0])

(2, 3)
[[0 1 2]
 [3 4 5]]
0 1 3


In [7]:
print ( b.shape)
print ( b[0, 0], b[0, 1], b[1, 0])

(2, 3)
0 1 3


### Creación de una matriz NumPy

NumPy también proporciona muchas funciones integradas para crear matrices. La mejor manera de aprender esto es a través de ejemplos, así que pasemos al código.

In [None]:
# Creamos una matriz 3x3 de todos ceros
a = np.zeros((3,3))
print (a)

In [None]:
# Creamos una matriz 2x2 de todos 1
b = np.ones((2,2))
print (b)

In [None]:
# Creamos una matriz 3x3 constantes
c = np.full((3,3), 7)
print(c)

In [None]:
# Creamos una matriz 3x3 con valores aleatorios
d = np.random.random((3,3))
print (d)

In [None]:
# Creamos una matriz identidad 3x3
e = np.eye(3)
print(e)

In [None]:
# Convertir una lista en una matriz
f = np.array([2, 3, 1,0])
print(f)

In [8]:
import numpy as np

# Crear una matriz con valores que se incrementan regularmente
start = 0      # Valor inicial
stop = 10      # Valor final (exclusivo)
step = 2       # Incremento entre valores
array = np.arange(start, stop, step)

# Imprimir la matriz creada
print(array)


[0 2 4 6 8]


In [9]:
# Crear una tupla y una lista
tupla = (1, 2, 3)
lista = [4, 5, 6]

# Convertir la tupla en una lista
tupla_convertida = list(tupla)

# Mezclar la lista y la tupla
mezcla = tupla_convertida + lista

# Imprimir el resultado
print(mezcla)


[1, 2, 3, 4, 5, 6]


In [None]:
# Crear una matriz de rango con tipo de datos flotante
i = np.arange(1, 8, dtype=np.float64)
print(i)

`linspace()`  crea matrices con un numero especifico de elementos que están espaciados por igual entre los valores inicial y final especificados

In [10]:
import numpy as np

# Crear una matriz con valores espaciados uniformemente
start = 0       # Valor inicial
stop = 10       # Valor final
num_elements = 5  # Número de elementos deseados
array = np.linspace(start, stop, num_elements)

# Imprimir la matriz creada
print(array)


[ 0.   2.5  5.   7.5 10. ]


### Tipos de datos
Una matriz es una colección de elementos del mismo tipo de datos y NumPy admite y proporciona funciones integradas para construir matrices con argumentos opcionales para especificar explícitamente los tipos de datos requeridos.

In [None]:
# Numpy escoge el tipo de datos
x = np.array([0, 1])
y = np.array([2.0, 3.0])

# Fuerza un tipo de datos en particular
z = np.array([5, 6], dtype=np.int64)
print (x.dtype, y.dtype, z.dtype)

**Ejercicio** Completa el siguiente  código.

In [11]:
import numpy as np

np.random.seed(0)

x1 = np.random.randint(10, size=6)  # matriz 1-d
x2 = np.random.randint(10, size=(5, 4))  # matriz-2d
x3 = np.random.randint(10, size=(2, 4, 5)) # matriz-3d

# Imprimir los atributos de las matrices
print("Matriz x1:")
print("Dimensión:", x1.ndim)
print("Forma:", x1.shape)
print("Tamaño:", x1.size)
print("Tipo de dato:", x1.dtype)
print("Tamaño de cada elemento:", x1.itemsize)
print("Número total de bytes:", x1.nbytes)
print()

print("Matriz x2:")
print("Dimensión:", x2.ndim)
print("Forma:", x2.shape)
print("Tamaño:", x2.size)
print("Tipo de dato:", x2.dtype)
print("Tamaño de cada elemento:", x2.itemsize)
print("Número total de bytes:", x2.nbytes)
print()

print("Matriz x3:")
print("Dimensión:", x3.ndim)
print("Forma:", x3.shape)
print("Tamaño:", x3.size)
print("Tipo de dato:", x3.dtype)
print("Tamaño de cada elemento:", x3.itemsize)
print("Número total de bytes:", x3.nbytes)


Matriz x1:
Dimensión: 1
Forma: (6,)
Tamaño: 6
Tipo de dato: int64
Tamaño de cada elemento: 8
Número total de bytes: 48

Matriz x2:
Dimensión: 2
Forma: (5, 4)
Tamaño: 20
Tipo de dato: int64
Tamaño de cada elemento: 8
Número total de bytes: 160

Matriz x3:
Dimensión: 3
Forma: (2, 4, 5)
Tamaño: 40
Tipo de dato: int64
Tamaño de cada elemento: 8
Número total de bytes: 320


### Indexación de matrices

NumPy ofrece varias formas de indexar en matrices. La sintaxis estándar de Python `x[obj]` se puede usar para indexar la matriz NumPy, donde `x` es la matriz y `obj` es la selección.

Hay tres tipos de indexación disponibles:

* Acceso al campo

* Recorte básico

* Indexación avanzada

#### Acceso al campo

Si el objeto ndarray es una matriz estructurada, se puede acceder a los campos de la matriz indexando la matriz con cadenas, como un diccionario. La indexación de `x['field-name']` devuelve una nueva vista de la matriz, que tiene la misma dimensión que `x`, excepto cuando el campo es una submatriz  que contiene sólo la parte de los datos en el campo especificado. Los tipos de datos se obtienen con `x.dtype['field-name']`.

In [12]:
x = np.zeros((3,3), dtype=[('a', np.int32), ('b', np.float64, (3,3))])
print(x)

[[(0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])]
 [(0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])]
 [(0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
  (0, [[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])]]


In [13]:
print ("x['a'].shape: ",x['a'].shape)
print ("x['a'].dtype: ", x['a'].dtype)

print ("x['b'].shape: ", x['b'].shape)
print ("x['b'].dtype: ", x['b'].dtype)

x['a'].shape:  (3, 3)
x['a'].dtype:  int32
x['b'].shape:  (3, 3, 3, 3)
x['b'].dtype:  float64


#### Recorte básico

Las matrices NumPy se pueden dividir, de forma similar a las listas. Debe especificar un segmento para cada dimensión de la matriz, ya que las matrices pueden ser multidimensionales.

La sintaxis de división básica es `i: j: k`, donde `i` es el índice inicial, `j` es el índice final, `k` es el paso y `k` no es igual a 0. Esto selecciona los elementos `m` en la dimensión correspondiente, con valores de índice `, i + k, ...,i + (m - 1)k` donde `m = q + (r distinto de 0)`,  `q` y `r` son el cociente y el resto se obtiene dividiendo `j - i` entre `k`: `j - i = qk + r`, de modo que `i + (m - 1) k < j`.

In [14]:
x = np.array([5, 6, 7, 8, 9])
x[1:7:2]

array([6, 8])

La `k` negativa hace que los pasos vayan hacia índices más pequeños. Los `i` y `j` negativos se interpretan como `n + i` y `n + j` donde `n` es el número de elementos en la dimensión correspondiente.

In [15]:
print (x[-2:5])
print (x[-1:1:-1])

[8 9]
[9 8 7]


Si `n` es el número de elementos en la dimensión que se está recortando. Entonces, si no se proporciona `i`, el valor predeterminado es `0` para  `k > 0` y `n-1` para `k < 0`. Si no se proporciona `j`, el valor predeterminado es `n` para `k > 0` y `-1` para `k < 0`. Si no se proporciona `k`, el valor predeterminado es `1`. Ten en cuenta que `::` es lo mismo que `:` y significa seleccionar todos los índices a lo largo de este eje.

In [16]:
x[4:]

array([9])

Si el número de objetos en la tupla de selección es menor que N , entonces se asume `:` para cualquier dimensión subsiguiente.

In [17]:
import numpy as np

np.random.seed(0)

x = np.random.randint(10, size=(2, 3, 4))

print(x)


[[[5 0 3 3]
  [7 9 3 5]
  [2 4 7 6]]

 [[8 8 1 6]
  [7 7 8 1]
  [5 9 8 9]]]


Los puntos suspensivos se expanden al número de : objetos necesarios para hacer una tupla de selección de la misma longitud que `x.ndim`. Solo puede haber una sola elipsis presente.

In [18]:
print(x)

[[[5 0 3 3]
  [7 9 3 5]
  [2 4 7 6]]

 [[8 8 1 6]
  [7 7 8 1]
  [5 9 8 9]]]


In [19]:
x[...,0]

array([[5, 7, 2],
       [8, 7, 5]])

#### Ejercicio

1. Crea una matriz de rango `2` con dimension `(3, 4)`

2. Usa el recorte para extraer la submatriz que consta de las primeras `2` filas y las columnas `1` y `2`.

3. Una parte de una matriz es solo una vista de los mismos datos, comprueba quecualquier modificación modificará la matriz original.



In [20]:
import numpy as np

# Crear la matriz de rango 2
matriz = np.array([[1, 2, 3, 4],
                   [5, 6, 7, 8],
                   [9, 10, 11, 12]])

# Extraer la submatriz
submatriz = matriz[:2, 1:3]

# Imprimir la submatriz
print("Submatriz:")
print(submatriz)
print()

# Modificar la submatriz
submatriz[0, 0] = 999

# Imprimir la matriz original
print("Matriz original:")
print(matriz)


Submatriz:
[[2 3]
 [6 7]]

Matriz original:
[[  1 999   3   4]
 [  5   6   7   8]
 [  9  10  11  12]]


Se puede acceder a la matriz de la fila central de dos maneras.

* Las partes junto con la indexación de enteros darán como resultado una matriz de rango inferior.

* El uso de solo recortes dará como resultado el mismo rango matriz.

In [None]:
# Creamos una matriz de rango 2 array con dimensión (3, 4)
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print (a)

Dos formas de acceder a los datos en la fila central de la matriz. La combinación de la indexación de enteros con recortes produce una matriz de menor rango, mientras que el uso de solo recortes produce una matriz del mismo rango que la matriz original:

In [None]:
fila_r1 = a[1, :]    # Vista de rango 1 de la segunda fila de a
fila_r2 = a[1:2, :]  # Vista de rango 2 de la segunda fila de a
fila_r3 = a[[1], :]  # Vista de ranfo 2 de la segunda fila de a
print (fila_r1, fila_r1.shape)
print (fila_r2, fila_r2.shape)
print (fila_r3, fila_r3.shape)

Podemos hacer la misma distinción al acceder a las columnas de una matriz.

In [None]:
col_r1 = a[:, 1]
col_r2 = a[:, 1:2]
print (col_r1, col_r1.shape)
print (col_r2, col_r2.shape)

### Indexación avanzada


In [21]:
import numpy as np

a = np.array([[1, 2], [3, 4]])

# Indexación avanzada para obtener elementos específicos
indices = [0, 1]   # Índices para las filas
a_seleccionados = a[[0, 1], [0, 1]]

print("Elementos seleccionados:")
print(a_seleccionados)


Elementos seleccionados:
[1 4]


Al usar la indexacion de un matriz de enteros, puede reutilizar el mismo elemento de la matriz de origen:

In [22]:
import numpy as np

a = np.array([[1, 2], [3, 4]])

# Indexación avanzada para obtener elementos específicos
indices = [0, 0]   # Índices para las filas
a_seleccionados = a[[0, 0], [1, 1]]

print("Elementos seleccionados:")
print(a_seleccionados)


Elementos seleccionados:
[2 2]


Un asunto  importante y extremadamente útil acerca de los recortes de una  matriz es que devuelven  *vistas (`views`)* en lugar de *copias (`copies`)*  de los datos de la matriz. Este es un área en la que NumPy  difiere de la lista de Python:  en las listas, estas son copias.

In [None]:
np.random.seed(0)
x2 = np.random.randint(10, size=(5, 4))
x2

In [None]:
x2_sub = x2[:2, :2]
print(x2_sub)

In [None]:
x2_sub[0, 0] = 99
print(x2_sub)

Este comportamiento predeterminado es realmente muy útil: significa que cuando trabajamos con grandes conjuntos de datos, podemos acceder y procesar partes de estos conjuntos de datos sin necesidad de copiar el búfer de datos.

A pesar de las características  de las `vistas` de una  matriz, a veces es útil copiar de forma explícita los datos dentro de una matriz o una submatriz. Esto se puede hacer  con el método `copy()`:

In [None]:
x2_sub_copy = x2[:2, :2].copy()
print(x2_sub_copy)

In [None]:
x2_sub_copy[0, 0] = 42
print(x2_sub_copy)

In [None]:
print(x2)

### Reshaping

In [None]:
x4 = np.arange(1, 10).reshape((3, 3))
print(x4)

Ten en cuenta que para que esto funcione, el tamaño de la matriz inicial debe coincidir con el tamaño de la matriz rediseñada. Siempre que sea posible, el método `reshape` utilizará una `vista` sin copia de la matriz inicial.

Otro patrón de `reshaping `, es la conversión de una matriz unidimensional en una fila o columna de una matriz bidimensional. Esto se puede hacer con el método `reshape`  o más fácilmente haciendo uso de `newaxis` dentro de una operación de división:

In [None]:
x5 = np.array([1, 2, 3])
x5

In [25]:
import numpy as np

# Vector fila
vector = np.array([1, 2, 3, 4])

# Convertir el vector en una matriz de una fila
matriz = vector.reshape(1, -1)

print("Matriz:")
print(matriz)


Matriz:
[[1 2 3 4]]


In [24]:
import numpy as np

# Vector fila
vector = np.array([1, 2, 3, 4])

# Convertir el vector en una matriz de una fila
matriz = vector[np.newaxis, :]

print("Matriz:")
print(matriz)


Matriz:
[[1 2 3 4]]


In [23]:
import numpy as np

# Vector columna
vector = np.array([1, 2, 3, 4])

# Convertir el vector en una matriz de una columna
matriz = vector.reshape(-1, 1)

print("Matriz:")
print(matriz)


In [26]:
import numpy as np

# Vector columna
vector = np.array([1, 2, 3, 4])

# Convertir el vector en una matriz de una columna
matriz = vector[:, np.newaxis]

print("Matriz:")
print(matriz)


Matriz:
[[1]
 [2]
 [3]
 [4]]


### Concatenación y  separación


In [None]:
x = np.array([4, 5, 6])
y = np.array([7, 8, 9])
np.concatenate([x, y])

In [None]:
# concatenacion de dos o mas matrices
z = [99, 99, 99]
print(np.concatenate([x, y, z]))

In [None]:
# concatendo una matriz dos veces
grid = np.array([[1, 2, 3],
                 [4, 5, 6]])
np.concatenate([grid, grid])

Para trabajar con matrices de distintas dimensiones, se usan las funciones `vstack` y `hstack`:

In [27]:
import numpy as np

x = np.array([0, 1, 2])
grid = np.array([[3, 4, 5],
                 [6, 5, 4]])

# Unir la matriz verticalmente con el vector
resultado = np.vstack((x, grid))

print("Resultado:")
print(resultado)


Resultado:
[[0 1 2]
 [3 4 5]
 [6 5 4]]


In [28]:
import numpy as np

y = np.array([[23],
              [23]])
grid = np.array([[3, 4, 5],
                 [6, 5, 4]])

# Unir la matriz horizontalmente con la matriz y
resultado = np.hstack((grid, y))

print("Resultado:")
print(resultado)


Resultado:
[[ 3  4  5 23]
 [ 6  5  4 23]]


Lo contrario de la concatenación es la división o separación, que es implementado por las funciones `np.split`, `np.hsplit` y `np.vsplit`. Para cada uno de estas funciones , podemos pasar una lista de índices que dan los puntos de división.

Ver:[https://numpy.org/doc/stable/reference/generated/numpy.split.html](https://numpy.org/doc/stable/reference/generated/numpy.split.html)

In [None]:
x = [1, 2, 3, 44, 95, 3, 2, 1]
x1, x2, x3 = np.split(x, [3, 5])
print(x1, x2, x3)

In [None]:
grid = np.arange(16).reshape((4, 4))
grid

In [None]:
grid1, grid2 = np.vsplit(grid, [2])
print(grid1)
print(grid2)

In [None]:
grid3, grid4 = np.hsplit(grid,[2])
print(grid3)
print(grid4)

### Fancy


In [None]:
rand = np.random.RandomState(42)
x = rand.randint(100, size=10)
print(x)

In [None]:
# Accedemos a tres elementos diferentes
[x[1], x[5], x[2]]

Alternativamente, podemos pasar una sola lista o matriz de índices para obtener el mismo resultado:

In [None]:
# Completar

Cuando se utiliza fancy, la forma del resultado refleja la forma de las matrices de índice en lugar de la forma de la matriz que se indexa y trabaja  en múltiples  dimensiones:

In [None]:
# Completar

In [None]:
X = np.arange(12).reshape((3, 4))
X

Al igual que con la indexación estándar, el primer índice se refiere a la fila, y el segundo a la columna:

In [None]:
fila = np.array([0, 1, 2])
col = np.array([2, 1, 3])
X[fila, col]

Observa que el primer valor en el resultado es `X[0, 2]`, el segundo es `X[1, 1]`  y el tercero es `X[2, 3]`. El emparejamiento de índices en la indexación fancy  sigue todas las reglas del broadcasting, por ejemplo, si combinamos un vector de columna y un vector de fila dentro de los índices, obtenemos un resultado bidimensional:

In [30]:
import numpy as np

X = np.array([[0, 1, 2],
              [3, 4, 5],
              [6, 7, 8]])

# Vector de columna
indices_filas = np.array([[0],
                          [1],
                          [2]])

# Vector de fila
indices_columnas = np.array([[2, 1, 2]])

# Indexación fancy combinando el vector de columna y el vector de fila
resultado = X[indices_filas, indices_columnas]

print("Resultado:")
print(resultado)


Resultado:
[[2 1 2]
 [5 4 5]
 [8 7 8]]


Aquí, cada valor de fila se empareja con cada vector de columna, exactamente como se hace en broadcasting  de operaciones aritméticas. Por ejemplo:

In [32]:
import numpy as np

X = np.array([[0, 1, 2],
              [3, 4, 5],
              [6, 7, 8]])

# Vector de fila
indices_filas = np.array([0, 1, 2])

# Vector de columna
indices_columnas = np.array([2, 1, 2])

# Indexación fancy combinando el vector de fila y el vector de columna
resultado = X[indices_filas[:, np.newaxis], indices_columnas]

print("Resultado:")
print(resultado)


Resultado:
[[2 1 2]
 [5 4 5]
 [8 7 8]]


Siempre es importante recordar que en  la indexación fancy, el valor de retorno refleja la forma del broadcasting  de los índices, en lugar de la forma de la matriz que se indexa.

Para operaciones  más potentes, la indexación adornada se puede combinar con los otros esquemas de indexación que existen:

In [None]:
# print(X)

In [33]:
import numpy as np

X = np.array([[0, 1, 2],
              [3, 4, 5],
              [6, 7, 8]])

# Índices simples
indices_filas = np.array([0, 2])
indices_columnas = np.array([1, 2])

# Indexación fancy combinando índices simples
resultado = X[indices_filas[:, np.newaxis], indices_columnas]

print("Resultado:")
print(resultado)


Resultado:
[[1 2]
 [7 8]]


In [34]:
import numpy as np

X = np.array([[0, 1, 2],
              [3, 4, 5],
              [6, 7, 8]])

# Recorte
recorte_filas = slice(0, 2)
recorte_columnas = slice(1, 3)

# Indexación fancy combinando el recorte
resultado = X[recorte_filas, recorte_columnas]

print("Resultado:")
print(resultado)


Resultado:
[[1 2]
 [4 5]]


Así como el fancy  se puede utilizar para acceder a partes de una matriz, también se puede utilizar para modificar partes de una matriz. Por ejemplo, si  tenemos una matriz de índices y nos gustaría establecer los elementos correspondientes en una matriz a algún valor, podemos hacer lo siguiente:

In [None]:
x = np.arange(10)
i = np.array([2, 1, 8, 4])
x[i] = 99
print(x)

Los índices repetidos con estas operaciones pueden causar algunos resultados potencialmente inesperados. Considera lo siguiente:

In [None]:
x = np.zeros(10)
x[[0, 0]] = [4, 6]
print(x)

El resultado de esta operación es asignar primero  `x[0] = 4`, seguido por `x[0] = 6`. Pero el resultado es que `x[0]` contiene el valor 6.

Considera la siguiente operación:

In [None]:
i = [2, 3, 3, 4, 4, 4]
x[i] += 1
x

En este caso algún resultado inesperado se debe conceptualmente  a que `x[i] +=1` se entiende como una abreviatura de `x[i] = x [i] + 1`. Cuando `x[i] + 1` es evaluado el resultado es asignado  a los índices en `x` . Con esto en mente, no es que el aumento que ocurre varias veces, sino la asignación, que conduce a los resultados  no intuitivos.

Si quieremos  el otro comportamiento donde se repite la operación, se puede utilizar el método `at()` de `ufuncs`:

In [None]:
# Completar

El método `at()` realiza una aplicación  del operador dado en los índices especificados (aquí, `i`) con el valor especificado (aquí, `1`).

###  Expresiones vectorizadas

### Agregaciones


In [None]:
L = np.random.random(100)
sum(L)

La sintaxis es bastante similar a la función de `sum` de  `NumPy`  y el resultado es el mismo en el caso más simple:

In [None]:
np.sum(L)

Sin embargo, debido a que la operación se ejecuta  en código compilado, la versión `NumPy` de la operación se calcula mucho más rápidamente:

In [None]:
matriz_grande = np.random.rand(1000000)
%timeit sum(matriz_grande)
%timeit np.sum(matriz_grande)

La función `sum` y la función `np.sum` no son idénticas, lo que a veces puede conducir a la confusión.  En particular, sus argumentos opcionales tienen significados diferentes  y `np.sum` es válido a  varias dimensiones de una matriz.

In [None]:
# Otras funciones min y max
min(matriz_grande), max(matriz_grande)

In [None]:
%timeit min(matriz_grande)
%timeit np.min(matriz_grande)

Todas estas funciones también están disponibles como métodos en la clase `ndarray`. Por ejemplo, `np.mean(data)` y `data.mean()` en el ejemplo siguiente son equivalentes:

In [None]:
data = np.random.normal(size=(15, 15))
np.mean(data)

In [None]:
data.mean()

Un tipo común de operación de agregación es un agregado a lo largo de una fila o columna.

In [None]:
M = np.random.random((5, 6))
print(M)

De forma predeterminada, cada función de agregación de  `NumPy`  devolverá el agregado sobre toda la matriz:

In [None]:
M.sum()

Las funciones de agregación toman un argumento adicional que especifica el eje a lo largo del cual se calcula el agregado. Por ejemplo, podemos encontrar el valor de la suma y el  mínimo de cada columna especificando `axis = 0`:

In [None]:
M.sum(axis= 0)

In [None]:
data = np.random.normal(size=(5, 10, 15))
data.sum(axis=0).shape

In [None]:
data.sum(axis=(0, 2)).shape

In [None]:
data.sum()

Algunas funciones de agregación en `Numpy ` son :


|Nombre de funcion  | VersionNaN-safe     | Descripcion                                   |
|-------------------|---------------------|-----------------------------------------------|
| ``np.sum``        | ``np.nansum``       | Calcula suma de elementos                     |
| ``np.prod``       | ``np.nanprod``      | Calcula el producto de elementos              |
| ``np.mean``       | ``np.nanmean``      | Calcula la media de elementos                 |
| ``np.std``        | ``np.nanstd``       | Calcula la desviacion estandar                |
| ``np.var``        | ``np.nanvar``       | Calcula la  varianza                          |
| ``np.min``        | ``np.nanmin``       | Encuentra el minimo valor                     |
| ``np.max``        | ``np.nanmax``       | Encuentra el maximo valor                     |
| ``np.argmin``     | ``np.nanargmin``    | Encuenta el index del minimo valor            |
| ``np.argmax``     | ``np.nanargmax``    | Encuentra el index del maximo valor           |
| ``np.median``     | ``np.nanmedian``    | Calcula la mediana de elementos               |
| ``np.percentile`` | ``np.nanpercentile``| Calcula el rango estatistico de elementos     |
| ``np.any``        | N/A                 | Evalua si algun elemento es true              |
| ``np.all``        | N/A                 | Evalua si todos los elementos son true        |



#### Broadcasting


In [None]:
a = np.array([0, 1, 2])
b = np.array([2, 6, 1])
a + b

El  `broadcasting` permite que estos tipos de operaciones binarias se realicen en matrices de diferentes tamaños; por ejemplo, podemos añadir  un escalar (una matriz de dimensión cero) a una matriz:

In [36]:
a + 5


array([[6, 7],
       [8, 9]])

Podemos extender de manera similar esto a matrices de mayor dimensión. Veamos el resultado cuando agregamos una matriz unidimensional a una matriz bidimensional:

In [35]:
A = np.arange(16).reshape(4, 4)
b = np.arange(4)
A

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

In [37]:
A + b

array([[ 0,  2,  4,  6],
       [ 4,  6,  8, 10],
       [ 8, 10, 12, 14],
       [12, 14, 16, 18]])

Podemos aplicar el  `broadcasting` en dos matrices. Considere el siguiente ejemplo:

In [38]:
import numpy as np

A = np.array([[1, 2, 3],
              [4, 5, 6]])

B = np.array([10, 20, 30])

# Aplicando broadcasting en la suma entre A y B
resultado = A + B

print("Resultado:")
print(resultado)


Resultado:
[[11 22 33]
 [14 25 36]]


###  Regla del broadcasting

El `broadcasting` en `NumPy` sigue un estricto conjunto de reglas para determinar la interacción entre dos matrices :

* Regla 1: Si las dos matrices difieren en su número de dimensiones, la forma de la matriz que tiene menos dimensiones se rellena con unos en el lado principal (izquierdo).

* Regla 2: Si la forma de los dos matrices no coincide con ninguna dimensión, la matriz con la forma igual a 1 en esa dimensión se estira para que coincida con la otra dimensión.

* Regla 3: Si en cualquier dimensión los tamaños son distintos y ninguno es igual a 1, se genera un error.

### Un útil truco:

In [None]:
J = np.arange(0, 40, 10)
J.shape

In [None]:
J = J[:, np.newaxis]  # agregamos un nuevo eje ->  matriz 2D
J.shape

In [None]:
J

In [None]:
J + 3

### Comparaciones, máscaras y lógica Booleana


In [42]:
a1 = np.array([1, 2, 3, 4])
b1 = np.array([4, 3, 2, 1])
a1 < b1

array([ True,  True, False, False])

In [43]:
np.all(a1 < b1)

False

In [44]:
np.any(a1 < b1)

True

In [45]:
if np.all(a1 < b1):
    print(" Todos los elementos en a1 son menores que los elementos en b1 ")
elif np.any(a1 < b1):
    print("Algunos elementos en a1 son menores que los elementos de b1")
else:
    print("Todos los elementos en b1 son menores que los elementos de a1")

Algunos elementos en a1 son menores que los elementos de b1


Al aparecer en una expresión aritmética junto con un número escalar, u otra matriz `NumPy` con un tipo de datos numéricos, una matriz booleana se convierte en una matriz numérica con valores `0` y `1` en lugar de `False` y `True`, respectivamente.

In [46]:
import numpy as np

A = np.array([True, False, True])
B = np.array([1, 2, 3])

# Multiplicación de una matriz booleana con una matriz numérica
resultado = A * B

print("Resultado:")
print(resultado)


Resultado:
[1 0 3]


Esta es una propiedad útil para la computación condicional, como cuando se definen funciones.

In [47]:
def pulso(t, posicion, altura, ancho):
    return altura * (t >= posicion) * (t <= (posicion + ancho))


### Matrices booleanas como máscaras

Revisar: [masked array](https://docs.scipy.org/doc/numpy/reference/maskedarray.html).

In [48]:
k = np.array([1, 3, -1, 5, 7, -1])
mask = (k < 0)
mask

array([False, False,  True, False, False,  True])

In [49]:
# Un ejemplo bidimensional
rng = np.random.RandomState(0)
z1 = rng.randint(10, size=(3, 4))
z1

array([[5, 0, 3, 3],
       [7, 9, 3, 5],
       [2, 4, 7, 6]])

Ahora, para seleccionar estos valores de la matriz, podemos simplemente indexar en esta matriz booleana, esto se conoce como una operación de `enmascaramiento`:

In [50]:
import numpy as np

# Crear una matriz de valores
valores = np.array([1, 2, 3, 4, 5])

# Crear una matriz booleana de máscara
mascara = np.array([True, False, True, False, True])

# Aplicar el enmascaramiento para seleccionar los valores correspondientes
valores_seleccionados = valores[mascara]

print("Valores seleccionados:")
print(valores_seleccionados)


Valores seleccionados:
[1 3 5]


El siguiente ejemplo muestra cómo sumar la matriz de enmascaramiento,  donde `True` representa uno y `False` representa 0.

In [51]:
import numpy as np

# Crear una matriz de valores
valores = np.array([1, 2, 3, 4, 5])

# Crear una matriz booleana de máscara
mascara = np.array([True, False, True, False, True])

# Sumar la matriz de enmascaramiento
suma_enmascaramiento = np.sum(mascara)

print("Suma de la matriz de enmascaramiento:")
print(suma_enmascaramiento)


Suma de la matriz de enmascaramiento:
3
