# Operaciones sobre arreglos

Veamos cuál es la ventaja de trabajar de forma "vectorizada" con los arreglos (o matrices)

In [None]:
import numpy as np
rng = np.random.default_rng(seed=1701)

# Esta función computa 1/N para cada valor de una secuencia
def compute_reciprocals(values):
    output = np.empty(len(values))
    for i in range(len(values)):
        output[i] = 1.0 / values[i]
    return output

values = rng.integers(1, 10, size=5)

print(values)
print(compute_reciprocals(values))

Típicamente, las librerías de matrices y vectores nos permiten hacer esto:

In [None]:
1 / values

¿Qué diferencia habrá entre hacerlo de una forma u otra?

In [None]:
big_array = rng.integers(1, 100, size=1000000)
%timeit compute_reciprocals(big_array)

In [None]:
%timeit (1.0 / big_array)

## Operaciones Vectorizadas

In [None]:
x = np.arange(4)
print("x      =", x)
print("x + 5  =", x + 5)
print("x - 5  =", x - 5)
print("x * 2  =", x * 2)
print("x / 2  =", x / 2)
print("x // 2 =", x // 2)  # division entera
print("-x     = ", -x)
print("x ** 2 = ", x ** 2)
print("x % 2  = ", x % 2)

In [None]:
-(0.5*x + 1) ** 2

In [None]:
# Además de los operadores, también están definidas como funciones.
np.add(x, 2)

## Otras operaciones

In [None]:
# Valor absoluto
x = np.array([-2, -1, 0, 1, 2])
np.abs(x)

In [None]:
# ops. trigonométricas

theta = np.linspace(0, np.pi, 3)
print("theta      = ", theta)
print("sin(theta) = ", np.sin(theta))
print("cos(theta) = ", np.cos(theta))
print("tan(theta) = ", np.tan(theta))

In [None]:
# exponenciales y logarítmicas

x = [1, 2, 3]
print("x   =", x)
print("e^x =", np.exp(x))
print("2^x =", np.exp2(x))
print("3^x =", np.power(3., x))

x = [1, 2, 4, 10]
print("x        =", x)
print("ln(x)    =", np.log(x))
print("log2(x)  =", np.log2(x))
print("log10(x) =", np.log10(x))

## Operaciones de reducción

In [None]:
x = np.arange(1, 6)
np.sum(x)

In [None]:
print(np.min(big_array))
print(np.max(big_array))

Están definidas como métodos de la clase ndarray.

In [None]:
print(big_array.min(), big_array.max(), big_array.sum())

## Reducciones por dimensión

In [None]:
M = rng.integers(0, 10, (3, 4))
print(M)

Por defecto, las operaciones de reducción trabajarán sobre todos los elementos del arreglo.

In [None]:
M.sum()

Las funciones de agregación, toman un parámtro opcional para especificar sobre que dimensión hacer la reducción.

In [None]:
M.min(axis=0)

La operación retorna un arreglo de una dimensión con los resultados

De la misma manera, podemos calcular el maximo en cada fila:

In [None]:
M.max(axis=1)

The following table provides a list of useful aggregation functions available in NumPy:

|Función    |   Versión Nan-Safe| Descripción                                   |
|-----------------|-------------------|-----------------------------------------------|
| `np.sum`        | `np.nansum`       | Compute sum of elements                       |
| `np.prod`       | `np.nanprod`      | Compute product of elements                   |
| `np.mean`       | `np.nanmean`      | Compute mean of elements                      |
| `np.std`        | `np.nanstd`       | Compute standard deviation                    |
| `np.var`        | `np.nanvar`       | Compute variance                              |
| `np.min`        | `np.nanmin`       | Find minimum value                            |
| `np.max`        | `np.nanmax`       | Find maximum value                            |
| `np.argmin`     | `np.nanargmin`    | Find index of minimum value                   |
| `np.argmax`     | `np.nanargmax`    | Find index of maximum value                   |
| `np.median`     | `np.nanmedian`    | Compute median of elements                    |
| `np.percentile` | `np.nanpercentile`| Compute rank-based statistics of elements     |
| `np.any`        | N/A               | Evaluate whether any elements are true        |
| `np.all`        | N/A               | Evaluate whether all elements are true        |

<font color='#ff4d00'>Ejercicio: Una forma elemental de convertir una imagen RGB en escala de grises es promediar los valores de R,G,B de cada pixel. Implementar este método. </font>

<font color='#ff4d00'>Ejercicio: implementar una expresión que compute si existe un pixel blanco (255, 255, 255) en una imagen</font>

## Operaciones lógicas y máscaras

Asi como vimos operaciones aritméticas vectorizadas, también tenemos implementados de esta manera a los operadores lógicos

In [None]:
x = np.array([1, 2, 3, 4, 5])

print(x < 3)
print(x > 3)
print(x >= 3)
print(x != 3)
print(x == 3)

In [None]:
rng = np.random.default_rng(seed=1701)
x = rng.integers(10, size=(3, 4)) - 5
x

In [None]:
x > 0

Si queremos saber si todos, o algunos, de los valores son True podemos usar:


In [None]:
np.any(x > 8)

In [None]:
np.all(x < 10)

In [None]:
# importamos un dataset
import numpy as np
from vega_datasets import data

rainfall_mm = np.array(
    data.seattle_weather().set_index('date')['precipitation']['2015'])

print(rainfall_mm.shape)
print(rainfall_mm)


Queremos responder a la pregunta: "¿Cuántos días durante el mes de enero llovío entre 10 y 20 mm?

In [None]:
enero = rainfall_mm[:31]
enero

In [None]:
enero > 10

In [None]:
enero < 20

In [None]:
(enero > 10) & (enero < 20)

Respuesta a la pregunta:

In [None]:
np.sum((enero > 10) & (enero < 20))

| Operator    | Equivalent ufunc  | Operator    | Equivalent ufunc  |
|-------------|-------------------|-------------|-------------------|
|`&`          |`np.bitwise_and`   |&#124;       |`np.bitwise_or`    |
|`^`          |`np.bitwise_xor`   |`~`          |`np.bitwise_not`   |

## Arreglos lógicos como máscaras

In [None]:
x

In [None]:
x < 0

In [None]:
x[x < 0]

In [None]:
# Máscara con los días que hubo lluvia
rainy = (rainfall_mm > 0)

# Máscara con los días del verano ( hemisf. norte :) )
days = np.arange(365)
summer = (days > 172) & (days < 262)

print("Median precip on rainy days in 2015 (mm):   ", np.median(rainfall_mm[rainy]))

print("Median precip on summer days in 2015 (mm):  ", np.median(rainfall_mm[summer]))

print("Avg precip on summer days in 2015 (mm):  ",    np.mean(rainfall_mm[summer]))

print("Maximum precip on summer days in 2015 (mm): ", np.max(rainfall_mm[summer]))

print("Median precip on non-summer rainy days (mm):", np.median(rainfall_mm[rainy & ~summer]))

### Observación: Tener cuidado al usar los operadores lógicos del lenguaje

In [None]:
bool(42), bool(0)

In [None]:
bool([]), bool([2])

In [None]:
bool(42 and 0)

In [None]:
bool(42 or 0)

In [None]:
A = np.array([1, 0, 1, 0, 1, 0], dtype=bool)
B = np.array([1, 1, 1, 0, 1, 1], dtype=bool)
A | B

In [None]:
A or B

In [None]:
bool(A)

Lo que está sucediendo es que al utilizar los operadores lógicos del lenguaje, el intérprete trata de computar un valor de verdad a partir de un arreglo de numpy.
En general, lo que nosotros queremos es computar la operación entre los elementos de 2 arreglos. Recuerden que para operaciones lógicas de reducción tenemos any() y all().

<font color='#ff4d00'>Ejercicio: Buscar una imagen con un color de fondo constante y combinarla con otra</font>