# 2.- Operaciones sobre ndarrays

NumPy pone a nuestra disposición un amplio conjunto de **funciones optimizadas** para aplicar sobre ndarrays de forma global **evitando** así la necesidad de utilizar **bucles (mucho más costosos)**.

In [1]:
import numpy as np

# Métodos de numpy

## Arange

In [2]:
np.arange(0,10) #Genera un array en forma de secuencia

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

## Zeros, ones

In [3]:
np.zeros(9) #Secuencia de ceros

array([0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [4]:
np.zeros((3,5)) #Matriz bidimensional

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [5]:
np.ones(3) #secuencia

array([1., 1., 1.])

In [6]:
np.ones((5,4))

array([[1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.]])

## linspace

In [7]:

'''
secuencia en el intervalo [1,10]
secuencia con 5 elementos

'''
np.linspace(1,10,5)

array([ 1.  ,  3.25,  5.5 ,  7.75, 10.  ])

## eye

In [8]:
np.eye(9)#matriz identidad de dimensión 9x9

array([[1., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 1., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 1., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 1., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 1.]])

# Métodos de los arrays

## reshape

In [9]:
array=np.ones(6)
array

array([1., 1., 1., 1., 1., 1.])

In [10]:
array.reshape(3,2) #Reorganización en dimensión 3x2

array([[1., 1.],
       [1., 1.],
       [1., 1.]])

# Operaciones elemento a elemento - Universal functions

El primero de los conjuntos de funciones ofrecido por NumPy son las llamadas **"funciones universales"** (o ufuncs) que permiten la realización de **operaciones elemento a elemento de un array**. En función del número de parámetros encontramos **dos tipos de funciones universales**.

## Funciones unarias

Son aquellas funciones que reciben **como parámetro un único ndarray**.<br/>
<ul>
<li><b>abs, fabs:</b> Valor absoluto.</li>
<li><b>sqrt:</b> Raíz cuadrada.</li>
<li><b>square:</b> Potencia al cuadrado (equivalente a array ** 2).</li>
<li><b>exp:</b> Potencia de e.</li>
<li><b>log, log10, log2, log1p:</b> Logaritmos en distintas bases.</li>
<li><b>sign:</b> Signo (+ = 1 / - = -1 / 0 = 0).</li>
<li><b>ceil:</b> Techo.</li>
<li><b>floor:</b> Suelo.</li>
<li><b>rint:</b> Redondeo al entero más cercano.</li>
<li><b>modf:</b> Devuelve dos arrays uno con la parte fraccionaria y otro con la parte entera.</li>
<li><b>isnan:</b> Devuelve un array booleano indicando si el valor es NaN o no.</li>
<li><b>isfinite, isinf:</b> Devuelve un array booleano indicando si el valor es finito o infinito.</li>
<li><b>cos, cosh, sin, sinh, tan, tanh:</b> Funciones trigonométricas.</li>
<li><b>arccos, arccosh, arcsin, arcsinh, arctan, arctanh:</b> Funciones trigonométricas inversas.</li>
<li><b>logical_not:</b> Inverso booleano de todos los valores del array (equivalente a ~(array)).</li>
</ul>

In [11]:
# Devuelve el valor absoluto de cada valor del ndarray
array = np.array([[1,-2,3,-4,0,1],[1,-2,0,3,-4,9]])
np.abs(array)

array([[1, 2, 3, 4, 0, 1],
       [1, 2, 0, 3, 4, 9]])

In [12]:
#Devuelve el sigo de cada elemento del ndarray (devuelve cero si el elemento es cero)
np.sign(array)

array([[ 1, -1,  1, -1,  0,  1],
       [ 1, -1,  0,  1, -1,  1]])

## Funciones binarias

Son aquellas funciones que reciben como **parámetro dos arrays**.
<ul>
<li><b>add:</b> Adición de los elementos de los dos arrays (equivalente a array1 + array2).</li>
<li><b>subtract:</b> Resta de los elementos de los dos arrays (equivalente a array1 - array2).</li>
<li><b>multiply:</b> Multiplica los elementos de los dos arrays (equivalente a array1 \* array2).</li>
<li><b>divide, floor_divide:</b> Divide los elementos de los dos arrays (equivalente a array1 / (o //) array2).</li>
<li><b>power:</b> Eleva los elementos del primer array a las potencias del segundo (equivalente a array1 ** array2).</li>
<li><b>maximum, fmax:</b> Calcula el máximo de los dos arrays (elemento a elemento). fmax ignora NaN.</li>
<li><b>minimum, fmin:</b> Calcula el mínimo de los dos arrays (elemento a elemento). fmax ignora NaN.</li>
<li><b>mod:</b> Calcula el resto de la división de los dos arrays (equivalente a array1 % array2).</li>
<li><b>greater, greater_equal, less, less_equal, equal, not_equal:</b> Comparativas sobre los elementos de ambos ndarrays (elemento a elemento).</li>
<li><b>logical_and, logical_or, logical_xor:</b> Operaciones booleanas sobre los elementos de ambos ndarrays (elemento a elemento).</li>
</ul>

In [13]:
array1 = np.random.randn(5, 5)
array1

array([[ 0.33957289,  0.52412502,  0.5851435 , -1.90594524,  0.87850254],
       [ 0.04131088, -0.45347547, -0.3862531 ,  0.64523678, -1.01122609],
       [-0.61128141,  0.94126247, -0.50441988,  1.55037574,  0.06243109],
       [-2.10959813, -0.40647949, -0.46893699, -0.90286771,  0.14118441],
       [-0.58581454, -0.42491221, -1.53661918,  0.34564122,  1.38055115]])

In [14]:
array2 = np.random.randn(5, 5)
array2

array([[ 0.04294416,  1.16691577, -0.84308365,  0.42575207, -1.89094581],
       [ 1.20862346,  1.47258927,  1.56244335,  1.52092364,  0.44597909],
       [ 0.90595774, -0.28548704, -0.30503369, -0.94013077, -1.12490763],
       [-0.50305804,  0.84793147,  1.58208309,  0.38356277, -0.27297372],
       [ 0.64198295, -0.19326802, -1.55409915,  0.8239052 , -1.34310145]])

In [15]:
np.minimum(array1, array2)

array([[ 0.04294416,  0.52412502, -0.84308365, -1.90594524, -1.89094581],
       [ 0.04131088, -0.45347547, -0.3862531 ,  0.64523678, -1.01122609],
       [-0.61128141, -0.28548704, -0.50441988, -0.94013077, -1.12490763],
       [-2.10959813, -0.40647949, -0.46893699, -0.90286771, -0.27297372],
       [-0.58581454, -0.42491221, -1.55409915,  0.34564122, -1.34310145]])

In [16]:
np.divide(array1,array2)

array([[ 7.90731303,  0.44915411, -0.69405153, -4.47665524, -0.46458367],
       [ 0.03418011, -0.3079443 , -0.24721095,  0.42424009, -2.26742937],
       [-0.67473502, -3.29704096,  1.65365303, -1.64910647, -0.05549886],
       [ 4.19354817, -0.47937776, -0.29640478, -2.35389815, -0.5172088 ],
       [-0.91250794,  2.19856451,  0.98875234,  0.41951576, -1.027883  ]])

# Fusión condicional: np.where()

**np.where(condición, resultado si condición=True, resultado si else)**

NumPy pone a nuestra disposición, a través de la función <b>np.where</b> la posibilidad de generar un array de salida a partir de dos de entrada, estableciendo una máscara booleana que indique si (elemento a elemento) debemos enviar a la salida el elemento del primer ndarray (valor True) o del segundo (valor False).

In [17]:
array1 = np.random.randn(5, 5)
array1

array([[ 0.71532683, -0.47284162, -1.580647  , -0.71550138,  0.88898119],
       [ 0.1834141 , -0.45842022, -1.32206251, -0.57512324, -1.34615754],
       [ 0.24095389, -0.14064785, -0.6531077 ,  1.47014163,  0.48960099],
       [ 1.24733717, -0.38222887, -2.14250228, -0.86579383,  0.49720904],
       [ 0.4566564 , -0.91774455,  0.61178084, -0.91548878, -0.13177547]])

In [18]:
array2 = np.random.randn(5, 5)
array2

array([[ 0.613549  , -0.77115226, -0.30134117,  0.19485715,  0.19015337],
       [-1.9428287 ,  0.44436736,  0.35590267,  1.16627106, -1.71181641],
       [-0.88343113,  0.49176817,  0.13698454, -0.24711291, -0.57771972],
       [ 0.38770636, -0.92555502, -1.50873929,  1.20953026, -1.31312245],
       [-1.81829423, -2.24771963, -0.98985523, -0.29586026,  0.11879862]])

In [20]:
# Fusión condicional
resultado=np.where(array1 < array2, 0, array2) 
'''
Si se cumple la condición array1<array2 el array resultante 
se rellena con la componente de array3. Si no se cumple se
rellena con la componente de array2.

'''
resultado

array([[ 0.613549  , -0.77115226,  0.        ,  0.        ,  0.19015337],
       [-1.9428287 ,  0.        ,  0.        ,  0.        , -1.71181641],
       [-0.88343113,  0.        ,  0.        , -0.24711291, -0.57771972],
       [ 0.38770636, -0.92555502,  0.        ,  0.        , -1.31312245],
       [-1.81829423, -2.24771963, -0.98985523,  0.        ,  0.        ]])

# Funciones matemáticas y estadísticas

NumPy ofrece un amplio conjunto de funciones matemáticas y estadísticas que se pueden aplicar sobre ndarrays. A continuación se pueden encontrar los ejemplos más típicos (hay algunas más que pueden consultarse en la documentación oficial de NumPy).<br/>
<ul>
<li><b>sum:</b> Suma de elementos.</li>
<li><b>mean:</b> Media aritmética de los elementos.</li>
<li><b>median:</b> Mediana de los elementos.</li>
<li><b>std:</b> Desviación estándar de los elementos.</li>
<li><b>var:</b> Varianza de los elementos.</li>
<li><b>min:</b> Valor mínimo de los elementos.</li>
<li><b>max:</b> Valor máximo de los elementos.</li>
<li><b>argmin:</b> Índice del valor mínimo.</li>
<li><b>argmax:</b> Índice del valor máximo.</li>
<li><b>cumsum:</b> Suma acumulada de los elementos.</li>
<li><b>cumprod:</b> Producto acumulado de los elementos.</li>
</ul>

Todas estas funciones pueden recibir, además del ndarray sobre el que se aplicarán, un segundo parámetro llamado <b>axis</b>. <b>Si no se recibe este parámetro las funciones se aplicarán sobre el conjunto global</b> de los elementos del ndarray, pero si se incluye, podrá tomar dos valores:
<ul>
<li>Valor <b>0</b>: Aplicará la función por <b>columnas</b></li>
<li>Valor <b>1</b>: Aplicará la función por <b>filas</b></li>

In [21]:
array = np.random.randn(5, 4)
array

array([[ 0.45837242, -0.70523456,  0.97156234,  0.72183846],
       [-0.03468171, -0.5822575 , -0.27402399,  0.33955167],
       [ 0.83805862,  1.98531456,  0.69584774, -0.48556214],
       [-3.08558877, -0.66620127, -0.59603732,  0.04278613],
       [ 0.70773239, -0.53215089, -0.06429846,  0.42899544]])

In [22]:
# Operación global
np.sum(array)

0.16402315567447368

In [23]:
# Operación por columnas
np.sum(array, axis=0)

array([-1.11610706, -0.50052966,  0.73305031,  1.04760956])

In [24]:
# Operación por filas
np.sum(array, axis=1)

array([ 1.44653866, -0.55141152,  3.03365877, -4.30504123,  0.54027847])

Adicionalmente **algunas de estas funciones pueden ser utilizadas como "métodos" de los ndarray y no sólo como funciones sobre los mismos**. **En este caso** la sintáxis cambiará y se utilizará la notación "**ndarray.funcion()**" 

In [25]:
array.sum()

0.16402315567447368

In [26]:
np.argmax(array)

9

In [27]:
np.argmin(array)

12

In [28]:
np.cumsum(array)

array([ 0.45837242, -0.24686214,  0.7247002 ,  1.44653866,  1.41185695,
        0.82959945,  0.55557547,  0.89512714,  1.73318575,  3.71850031,
        4.41434805,  3.92878591,  0.84319714,  0.17699587, -0.41904145,
       -0.37625532,  0.33147707, -0.20067382, -0.26497228,  0.16402316])

In [29]:
np.cumprod(array)

array([ 4.58372420e-01, -3.23260072e-01, -3.14067314e-01, -2.26705866e-01,
        7.86254738e-03, -4.57802716e-03,  1.25448926e-03,  4.25963925e-04,
        3.56982738e-04,  7.08723026e-04,  4.93163315e-04, -2.39461434e-04,
        7.38879513e-04, -4.92242468e-04,  2.93394881e-04,  1.25532328e-05,
        8.88432938e-06, -4.72780379e-06,  3.03990515e-07,  1.30410544e-07])

# Operaciones sobre ndarrays booleanos

**Una condición booleana** aplicada sobre un ndarray **devuelve una máscara booleana**. **Sobre esa máscara se pueden aplicar funciones** que solo **afectarán a las posiciones con 'True'** en la máscara

**Son operaciones que se aplican directamente sobre las condiciones** (en realidad la condición devuelve un mapa booleano y la función se aplica sobre dicho mapa.)

Dado que, internamente, Python trata los valores booleanos True como 1 y los False como 0, es muy sencillo realizar operaciones matemáticas sobre estos valores booleanos de forma que se puedan hacer diferentes chequeos. Por ejemplo...

In [30]:
array = np.random.randn(5, 5)
array

array([[ 1.01957982,  0.0561974 , -0.37144366,  1.54730612,  0.30437544],
       [ 0.50756032, -0.80793355, -0.93816019, -0.94805797, -1.03638659],
       [-0.29722663,  0.3908111 , -1.10056743, -1.09079642,  0.57499037],
       [-1.1667977 ,  0.9722185 ,  0.63317929, -0.74099644,  1.14182224],
       [ 0.09385405, -1.85194982,  0.42970218, -0.86686721, -1.16990565]])

In [31]:
array>0 # Esta condición aplicada sobre un array devuelve una máscara booleana

array([[ True,  True, False,  True,  True],
       [ True, False, False, False, False],
       [False,  True, False, False,  True],
       [False,  True,  True, False,  True],
       [ True, False,  True, False, False]])

In [32]:
# Elementos mayores que 0
(array > 0).sum()

12

In [33]:
# Elementos menores que la media
(array < array.mean()).sum()

13

NumPy también pone a nuestra disposición dos funciones de chequeo predefinidas sobre ndarrays booleanos:<br/>
<ul>
<li><b>any:</b> Para <b>comprobar si alguno de los elementos es True</b>.</li>
<li><b>all:</b> Para <b>comprobar si todos los elementos son True</b>.</li>
</ul>

In [34]:
# Alguno de los elementos cumple la condición
(array == 0).any()

False

In [35]:
# Todos los elementos cumplen la condición
((array >= -2) & (array <= 2)).all()

True

# Multiplicación matricial algebraica (arrays bi-dimensionales)

**Hasta ahora habíamos visto multiplicación de matrices elemento a elemento**

In [36]:
A=np.array([[1,2,3],[-1,2,4],[2,2,2]])
B=np.array([[1,1],[2,-3],[1,0]])
print(A)
print()
print(B)

[[ 1  2  3]
 [-1  2  4]
 [ 2  2  2]]

[[ 1  1]
 [ 2 -3]
 [ 1  0]]


In [37]:
print('Dimensión de A,B',A.shape,B.shape)

Dimensión de A,B (3, 3) (3, 2)


In [38]:
np.dot(A,B)

array([[ 8, -5],
       [ 7, -7],
       [ 8, -4]])

In [39]:
A*B 
'''
Da error porque sus dimensiones no son iguales y no se puede realizar
la operación elemento a elemento
'''

ValueError: operands could not be broadcast together with shapes (3,3) (3,2) 

Recuerda que en **multiplicación de matrices en álgebra A*B, siendo (a,b) las dimensiones de A y (c,d) las dimensiones de B, se tiene que cumplir 
que b=c para que sean multiplicables.**

# Ordenación de ndarrays

In [40]:
array = np.random.randn(5, 5)
array

array([[ 0.82760876,  0.89265651, -1.0135815 ,  3.25884134, -1.33626558],
       [-0.72670861, -0.5343137 , -0.54183641, -0.83985888, -0.07632965],
       [ 1.38338263,  0.30242521,  0.74859037, -0.42570643, -0.23351388],
       [ 1.91199045,  1.1230574 , -0.20425702, -0.30376459,  0.81293979],
       [ 0.36819655, -0.39993636, -0.48737635,  0.17005276,  0.18897096]])

In [41]:
# Datos ordenados
np.sort(array) 


array([[-1.33626558, -1.0135815 ,  0.82760876,  0.89265651,  3.25884134],
       [-0.83985888, -0.72670861, -0.54183641, -0.5343137 , -0.07632965],
       [-0.42570643, -0.23351388,  0.30242521,  0.74859037,  1.38338263],
       [-0.30376459, -0.20425702,  0.81293979,  1.1230574 ,  1.91199045],
       [-0.48737635, -0.39993636,  0.17005276,  0.18897096,  0.36819655]])

In [42]:
# Datos ordenados según el primer eje
np.sort(array, axis=0)

array([[-0.72670861, -0.5343137 , -1.0135815 , -0.83985888, -1.33626558],
       [ 0.36819655, -0.39993636, -0.54183641, -0.42570643, -0.23351388],
       [ 0.82760876,  0.30242521, -0.48737635, -0.30376459, -0.07632965],
       [ 1.38338263,  0.89265651, -0.20425702,  0.17005276,  0.18897096],
       [ 1.91199045,  1.1230574 ,  0.74859037,  3.25884134,  0.81293979]])

# Funciones de conjunto

NumPy permite realizar <b>tratamientos sobre un ndarray asumiendo que el total de los elementos del mismo forman un conjunto</b>.<br/>
<ul>
<li><b>unique:</b> Calcula el conjunto único de elementos sin duplicados.</li>
<li><b>intersect1d:</b> Calcula la intersección de los elementos de dos arrays.</li>
<li><b>union1d:</b> Calcula la unión de los elementos de dos arrays.</li>
<li><b>in1d:</b> Calcula un array booleano que indica si cada elemento del primer array está contenido en el segundo.</li>
<li><b>setdiff1d:</b> Calcula la diferencia entre ambos conjuntos.</li>
<li><b>setxor1d:</b> Calcula la diferencia simétrica entre ambos conjuntos.</li>
</ul>

In [43]:
array1 = np.array([6, 0, 0, 0, 3, 2, 5, 6])
array1

array([6, 0, 0, 0, 3, 2, 5, 6])

In [44]:
array2 = np.array([7, 4, 3, 1, 2, 6, 5])
array2

array([7, 4, 3, 1, 2, 6, 5])

In [45]:
np.unique(array1) #Conjunto único de elementos no repetidos

array([0, 2, 3, 5, 6])

In [46]:
np.union1d(array1, array2) #Unión de dos vectores

array([0, 1, 2, 3, 4, 5, 6, 7])

In [47]:
np.in1d(array1, array2) #Devuelve si cada elemento del primer array está contenido en el segundo

array([ True, False, False, False,  True,  True,  True,  True])