# Numpy -  revisión de arrays multidimensionales

In [1]:
#esta es otra manera de importar el módulo en la que se cargan todas las funciones en la base
from numpy import *

#### arange

In [2]:
# create a range

x = arange(0, 10, 1) # arguments: start, stop, step

x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [3]:
x = arange(-1, 1, 0.1)

x

array([ -1.00000000e+00,  -9.00000000e-01,  -8.00000000e-01,
        -7.00000000e-01,  -6.00000000e-01,  -5.00000000e-01,
        -4.00000000e-01,  -3.00000000e-01,  -2.00000000e-01,
        -1.00000000e-01,  -2.22044605e-16,   1.00000000e-01,
         2.00000000e-01,   3.00000000e-01,   4.00000000e-01,
         5.00000000e-01,   6.00000000e-01,   7.00000000e-01,
         8.00000000e-01,   9.00000000e-01])

#### linspace and logspace

In [4]:
# al usar linspace y logspace, el inicio y el final están incluidos
linspace(0, 10, 25)

array([  0.        ,   0.41666667,   0.83333333,   1.25      ,
         1.66666667,   2.08333333,   2.5       ,   2.91666667,
         3.33333333,   3.75      ,   4.16666667,   4.58333333,
         5.        ,   5.41666667,   5.83333333,   6.25      ,
         6.66666667,   7.08333333,   7.5       ,   7.91666667,
         8.33333333,   8.75      ,   9.16666667,   9.58333333,  10.        ])

In [5]:
logspace(0, 10, 10, base=e)

array([  1.00000000e+00,   3.03773178e+00,   9.22781435e+00,
         2.80316249e+01,   8.51525577e+01,   2.58670631e+02,
         7.85771994e+02,   2.38696456e+03,   7.25095809e+03,
         2.20264658e+04])

#### mgrid

In [6]:
x, y = mgrid[0:5, 0:5] # generador de mallas parecido a MESHGRID en Matlab

In [7]:
x

array([[0, 0, 0, 0, 0],
       [1, 1, 1, 1, 1],
       [2, 2, 2, 2, 2],
       [3, 3, 3, 3, 3],
       [4, 4, 4, 4, 4]])

In [8]:
y

array([[0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4]])

#### datos aleatorios

In [9]:
from numpy import random

In [10]:
# números aleatorios en [0,1]
random.rand(5,5)

array([[ 0.25131646,  0.0218872 ,  0.7880724 ,  0.18852996,  0.54684902],
       [ 0.71040399,  0.36199992,  0.44857969,  0.07190989,  0.88117436],
       [ 0.28096692,  0.69519001,  0.79299759,  0.19813886,  0.94136426],
       [ 0.86312491,  0.46812415,  0.16079657,  0.29320073,  0.52391472],
       [ 0.03347784,  0.76163357,  0.66124085,  0.92364079,  0.52179842]])

In [11]:
# números aleatorios distribuídos como una normal
random.randn(5,5)

array([[ 0.35373068, -0.72466005, -0.34783893, -0.14523759, -0.33686509],
       [-0.98567081,  0.25888917,  1.20889693, -0.19617658, -2.27069527],
       [-1.03011397, -0.44021334,  0.20616561,  0.42026879,  0.37770823],
       [ 1.17831552, -1.08965233, -0.97861253, -0.3787454 , -1.03613017],
       [-0.7948299 , -0.58569676, -0.61692009,  0.51414309, -0.87267431]])

#### diag

In [12]:
# matriz diagonal generada a partir de una lista
diag([1,2,3])

array([[1, 0, 0],
       [0, 2, 0],
       [0, 0, 3]])

In [13]:
# matriz diagonal trasladada en una posición hacia arriba
diag([1,2,3], k=1) 

array([[0, 1, 0, 0],
       [0, 0, 2, 0],
       [0, 0, 0, 3],
       [0, 0, 0, 0]])

#### ceros y unos

In [14]:
zeros((3,3))

array([[ 0.,  0.,  0.],
       [ 0.,  0.,  0.],
       [ 0.,  0.,  0.]])

In [15]:
ones((3,3))

array([[ 1.,  1.,  1.],
       [ 1.,  1.,  1.],
       [ 1.,  1.,  1.]])

### salvando arrays en formato .csv

In [17]:
M = random.rand(3,3)

M

array([[ 0.98518583,  0.18731185,  0.46829494],
       [ 0.73818776,  0.35228302,  0.72530287],
       [ 0.97619101,  0.18088667,  0.02251857]])

In [18]:
savetxt("random-matrix.csv", M)

## Formato nativo de Numpy

Es útil cuando tenemos que salvar y cargar numpy arrays con frecuencia.
Se usan las funciones **numpy.save** y **numpy.load**

In [22]:
save("random-matrix.npy", M)

In [24]:
load("random-matrix.npy")

array([[ 0.98518583,  0.18731185,  0.46829494],
       [ 0.73818776,  0.35228302,  0.72530287],
       [ 0.97619101,  0.18088667,  0.02251857]])

## Más propiedades de los arrays

In [25]:
M.itemsize # bytes por elemento

8

In [26]:
M.nbytes # número de bytes

72

In [27]:
M.ndim # número de dimensiones

2

## Manipulando arrays

### Indexando

Se pueden indexar elementos en un array usando [] e índices

In [29]:
# v es un vector, y tiene sólo una dimensión, estamos tomando un índice
v=array([1,2,3,4,5,6,7])
v[0]

1

In [30]:
# M es una matriz ó un array bidimensional, podemos tomar una posición indicando dos índices 
M[1,1]

0.35228302377058807

Si sólo escribimos un índice en un array multidimensional devuelve la fila completa

In [33]:
M

array([[ 0.98518583,  0.18731185,  0.46829494],
       [ 0.73818776,  0.35228302,  0.72530287],
       [ 0.97619101,  0.18088667,  0.02251857]])

In [34]:
M[1]

array([ 0.73818776,  0.35228302,  0.72530287])

Se puede obtener lo mismo poniendo **:** donde queremos obtener todos los elementos

In [35]:
M[1,:] # fila 1

array([ 0.73818776,  0.35228302,  0.72530287])

In [36]:
M[:,1] # columna 1

array([ 0.18731185,  0.35228302,  0.18088667])

Podemos asignar nuevos valores a los elementos en el array usando la indexación

In [37]:
M[0,0] = 1

In [38]:
M

array([[ 1.        ,  0.18731185,  0.46829494],
       [ 0.73818776,  0.35228302,  0.72530287],
       [ 0.97619101,  0.18088667,  0.02251857]])

In [39]:
# también sirve para filas y columnas
M[1,:] = 0
M[:,2] = -1

In [40]:
M

array([[ 1.        ,  0.18731185, -1.        ],
       [ 0.        ,  0.        , -1.        ],
       [ 0.97619101,  0.18088667, -1.        ]])

### Selección de índices

Se trata de la selección de una serie de índices del array `M[lower:upper:step]`

In [41]:
A = array([1,2,3,4,5])
A

array([1, 2, 3, 4, 5])

In [42]:
A[1:3]

array([2, 3])

La selección por índices es *mutable*, si se le asignan nuevos valores el array original del que se extrayeron será modificado

In [43]:
A[1:3] = [-2,-3]

A

array([ 1, -2, -3,  4,  5])

Se pueden omitir cualquier de los tres parámetros `M[lower:upper:step]`

In [44]:
A[::] # lower, upper, step toman valores por defecto

array([ 1, -2, -3,  4,  5])

In [45]:
A[::2] # step vale 2, lower y upper por defecto son el inicio y final del array

array([ 1, -3,  5])

In [46]:
A[:3] # primeros tres elementos

array([ 1, -2, -3])

In [47]:
A[3:] # elementos desde el índice 3

array([4, 5])

Los índices negativos cuentan desde el final del array (indexación positiva desde el principio):

In [48]:
A = array([1,2,3,4,5])

In [49]:
A[-1] # el último elemento en un array

5

In [50]:
A[-3:] # los últimos tres elementos

array([3, 4, 5])

La extracción de índices funciona exactamente igual para arrays multidimensionales

In [51]:
A = array([[n+m*10 for n in range(5)] for m in range(5)])

A

array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

In [52]:
# un bloque del array original
A[1:4, 1:4]

array([[11, 12, 13],
       [21, 22, 23],
       [31, 32, 33]])

In [53]:
# franjas cada dos elementos
A[::2, ::2]

array([[ 0,  2,  4],
       [20, 22, 24],
       [40, 42, 44]])

### Indexación sofisticada (fancy indexing)

Es el nombre que se usa cuando un array ó lista es usado como índice

In [54]:
row_indices = [1, 2, 3]
A[row_indices]

array([[10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34]])

In [55]:
col_indices = [1, 2, -1] # recordatorio: índice -1 indica el último elemento
A[row_indices, col_indices]

array([11, 22, 34])

También se pueden usar máscaras de índice: si el índice es un array booleano, entonces se seleccionan los elementos que corresponden con las posiciones <code> True <code/>

In [56]:
B = array([n for n in range(5)])
B

array([0, 1, 2, 3, 4])

In [57]:
row_mask = array([True, False, True, False, False])
B[row_mask]

array([0, 2])

In [59]:
# análogamente se pueden usar 1 y 0 
row_mask = array([1,0,1,0,0], dtype=bool)
B[row_mask]

array([0, 2])

Esta característica es muy útil para seleccionar condicionalmente elementos de un array, usando por ejemplo operadores de comparación

In [60]:
x = arange(0, 10, 0.5)
x

array([ 0. ,  0.5,  1. ,  1.5,  2. ,  2.5,  3. ,  3.5,  4. ,  4.5,  5. ,
        5.5,  6. ,  6.5,  7. ,  7.5,  8. ,  8.5,  9. ,  9.5])

In [61]:
mask = (5 < x) * (x < 7.5)

mask

array([False, False, False, False, False, False, False, False, False,
       False, False,  True,  True,  True,  True, False, False, False,
       False, False], dtype=bool)

In [62]:
x[mask]

array([ 5.5,  6. ,  6.5,  7. ])

## Funciones para extraer los datos de arrays y crear arrays

### where

La máscara índice puede ser convertida a índice por posición usando `where`

In [63]:
indices = where(mask)

indices

(array([11, 12, 13, 14], dtype=int64),)

In [64]:
x[indices] # equivalente a x[mask]

array([ 5.5,  6. ,  6.5,  7. ])

### diag

Con `diag` se puede extraer la diagonal y subdiagonal de un array

In [66]:
A

array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

In [65]:
diag(A)

array([ 0, 11, 22, 33, 44])

In [75]:
diag(A, -1)

array([10, 21, 32, 43])

### take

La función `take`es similar al fancy indexing descrito arriba:

In [67]:
v2 = arange(-3,3)
v2

array([-3, -2, -1,  0,  1,  2])

In [68]:
row_indices = [1, 3, 5]
v2[row_indices] # fancy indexing

array([-2,  0,  2])

In [69]:
v2.take(row_indices)

array([-2,  0,  2])

Pero `take` también funciona en listas y otros objetos:

In [70]:
take([-3, -2, -1,  0,  1,  2], row_indices)

array([-2,  0,  2])

### choose

Construye un array seleccionando elementos de diversos arrays

In [71]:
which = [1, 0, 1, 0]
choices = [[-2,-2,-2,-2], [5,5,5,5]]

choose(which, choices)

array([ 5, -2,  5, -2])

## Álgebra lineal

Vectorizar el código es el camino para escribir cálculos numéricos eficientes con Python y Numpy. Eso significa que en la medida de lo posible un programa debe ser formulado en términos de operaciones matriciales y vectoriales, como multiplicación matriz-matriz

### Operaciones array-número

Se pueden usar los operadores aritméticos usuales para multiplicar, sumar, restar y dividir arrays con números `float` e `int`

In [72]:
v1 = arange(0, 5)

In [73]:
v1 * 2

array([0, 2, 4, 6, 8])

In [74]:
v1 + 2

array([2, 3, 4, 5, 6])

In [75]:
A * 2, A + 2

(array([[ 0,  2,  4,  6,  8],
        [20, 22, 24, 26, 28],
        [40, 42, 44, 46, 48],
        [60, 62, 64, 66, 68],
        [80, 82, 84, 86, 88]]), array([[ 2,  3,  4,  5,  6],
        [12, 13, 14, 15, 16],
        [22, 23, 24, 25, 26],
        [32, 33, 34, 35, 36],
        [42, 43, 44, 45, 46]]))

### Operaciones elemento por elemento en array-array

Si operamos arrays con dimensiones compatibles, las operaciones se harán elemento por elemento

In [76]:
A * A # element-wise multiplication

array([[   0,    1,    4,    9,   16],
       [ 100,  121,  144,  169,  196],
       [ 400,  441,  484,  529,  576],
       [ 900,  961, 1024, 1089, 1156],
       [1600, 1681, 1764, 1849, 1936]])

In [77]:
v1 * v1

array([ 0,  1,  4,  9, 16])

In [78]:
A.shape, v1.shape

((5, 5), (5,))

In [79]:
A * v1

array([[  0,   1,   4,   9,  16],
       [  0,  11,  24,  39,  56],
       [  0,  21,  44,  69,  96],
       [  0,  31,  64,  99, 136],
       [  0,  41,  84, 129, 176]])

### Álgebra matricial

Para hacer productos matriciales tenemos la función `dot`, que hace las operaciones algebraicas matriz-matriz ó matriz-vector

In [80]:
dot(A, A)

array([[ 300,  310,  320,  330,  340],
       [1300, 1360, 1420, 1480, 1540],
       [2300, 2410, 2520, 2630, 2740],
       [3300, 3460, 3620, 3780, 3940],
       [4300, 4510, 4720, 4930, 5140]])

In [81]:
dot(A, v1)

array([ 30, 130, 230, 330, 430])

In [82]:
dot(v1, v1)

30

Alternativamente podemos usar el tipo `matrix` , que identifica directamente el array como una matriz y establece por defecto las operaciones `+,-,*,/ ` dentro del álgebra matricial

In [83]:
M = matrix(A)
v = matrix(v1).T # lo transpone a un vector columna

In [84]:
v

matrix([[0],
        [1],
        [2],
        [3],
        [4]])

In [85]:
M * M

matrix([[ 300,  310,  320,  330,  340],
        [1300, 1360, 1420, 1480, 1540],
        [2300, 2410, 2520, 2630, 2740],
        [3300, 3460, 3620, 3780, 3940],
        [4300, 4510, 4720, 4930, 5140]])

In [86]:
M * v

matrix([[ 30],
        [130],
        [230],
        [330],
        [430]])

In [87]:
# producto escalar
v.T * v

matrix([[30]])

In [88]:
# con los objetos matrix, se aplican los estándares básicos de álgebra lineal
v + M*v

matrix([[ 30],
        [131],
        [232],
        [333],
        [434]])

Si se intentan sumar, restar o multiplicar objetos con dimensiones incompatibles se obteine un error:

In [89]:
v = matrix([1,2,3,4,5,6]).T

In [90]:
shape(M), shape(v)

((5, 5), (6, 1))

In [91]:
M * v

ValueError: shapes (5,5) and (6,1) not aligned: 5 (dim 1) != 6 (dim 0)

Ver también funciones relacionadas: `inner`, `outer`, `cross`, `kron`, `tensordot`.
La ayuda se obtiene escribiendo, por ejemplo: `help(kron)`.

### Transformaciones array-matriz

Antes hemos usado el comandp `.T` para transponer el objeto matricial `v`. Podíamos haber usado también la función `transpose` .

Otras funciones matemáticas que transforman objetos matriciales son:

In [92]:
C = matrix([[1j, 2j], [3j, 4j]])
C

matrix([[ 0.+1.j,  0.+2.j],
        [ 0.+3.j,  0.+4.j]])

In [93]:
conjugate(C)

matrix([[ 0.-1.j,  0.-2.j],
        [ 0.-3.j,  0.-4.j]])

Hermítica conjugada: transponer y conjugar

In [94]:
C.H

matrix([[ 0.-1.j,  0.-3.j],
        [ 0.-2.j,  0.-4.j]])

Se pueden extrar las partes real e imaginaria de un array con valores complejos usando `real`e `imag`:

In [95]:
real(C) # equivalente a  C.real

matrix([[ 0.,  0.],
        [ 0.,  0.]])

In [96]:
imag(C) # equivalente a C.imag

matrix([[ 1.,  2.],
        [ 3.,  4.]])

O el argumento complejo y valor absoluto

In [98]:
angle(C+1) 

array([[ 0.78539816,  1.10714872],
       [ 1.24904577,  1.32581766]])

In [99]:
abs(C)

matrix([[ 1.,  2.],
        [ 3.,  4.]])

### Cálculos matriciales

#### Inverse

In [108]:
linalg.inv(C) # equivalente a C.I 

matrix([[ 0.+2.j ,  0.-1.j ],
        [ 0.-1.5j,  0.+0.5j]])

In [109]:
C.I * C

matrix([[  1.00000000e+00+0.j,   4.44089210e-16+0.j],
        [  0.00000000e+00+0.j,   1.00000000e+00+0.j]])

#### Determinante

In [100]:
linalg.det(C)

(2.0000000000000004+0j)

In [101]:
linalg.det(C.I)

(0.49999999999999967+0j)

### Cálculos con arrays de mayor dimensión

Cuando funciones como `min`, `max`, etc. son aplicadas a arrays multidimensionales, es a veces útil aplicar los cálculos al array completo, y a veces sólo a una fila ó columna. Usando el argumento `axis` podemos especificar cómo debe comportarse.

In [102]:
m = random.rand(3,3)
m

array([[ 0.87620219,  0.2388754 ,  0.05417455],
       [ 0.45089985,  0.96321174,  0.77020434],
       [ 0.87948209,  0.9212229 ,  0.51546411]])

In [103]:
# máximo global
m.max()

0.96321174057637482

In [104]:
# máximo por columna
m.max(axis=0)

array([ 0.87948209,  0.96321174,  0.77020434])

In [105]:
# máximo por fila
m.max(axis=1)

array([ 0.87620219,  0.96321174,  0.9212229 ])

Hay muchas otras funciones y métodos en las clases `array`y `matrix` que aceptan el argumento opcional `axis`. 

## Redimensionamiento y apilamiento de arrays

Las dimensiones de un numpy array pueden ser modificadas sin copiar los datos del mismo, esto lo hace una operación rápida y asequible incluso para arrays enormes

In [106]:
A

array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

In [107]:
n, m = A.shape

In [108]:
B = A.reshape((1,n*m))
B

array([[ 0,  1,  2,  3,  4, 10, 11, 12, 13, 14, 20, 21, 22, 23, 24, 30, 31,
        32, 33, 34, 40, 41, 42, 43, 44]])

In [109]:
B[0,0:5] = 5 # modificamos el array

B

array([[ 5,  5,  5,  5,  5, 10, 11, 12, 13, 14, 20, 21, 22, 23, 24, 30, 31,
        32, 33, 34, 40, 41, 42, 43, 44]])

In [110]:
A # la variable original es también modificada. B es sólo una representación distinta del mismo conjunto de datos

array([[ 5,  5,  5,  5,  5],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

También podemos usar la función `flatten` para crear un array de dimensión superior en un vector. Esta función **crea una copia de los datos**.

In [111]:
B = A.flatten()

B

array([ 5,  5,  5,  5,  5, 10, 11, 12, 13, 14, 20, 21, 22, 23, 24, 30, 31,
       32, 33, 34, 40, 41, 42, 43, 44])

In [112]:
B[0:5] = 10

B

array([10, 10, 10, 10, 10, 10, 11, 12, 13, 14, 20, 21, 22, 23, 24, 30, 31,
       32, 33, 34, 40, 41, 42, 43, 44])

In [113]:
A #ahora A no ha sido modificado porque B es una copia de A, no una variable apuntando a los mismos datos

array([[ 5,  5,  5,  5,  5],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

## Añadir una nueva dimensión: `newaxis`

Con `newaxis` podemos insertar nuevas dimensiones en un array, por ejemplo convirtiendo un vector en una columna ó en una matriz columna

In [114]:
v = array([1,2,3])

In [115]:
shape(v)

(3,)

In [116]:
# creamos una matriz columna del vector v
v[:, newaxis]

array([[1],
       [2],
       [3]])

In [117]:
# matriz columna
v[:,newaxis].shape

(3, 1)

In [118]:
# matriz fila
v[newaxis,:].shape

(1, 3)

## Apilando y repitiendo arrays

Usando la función `repeat`,`tile`,`vstack`,`hstack`, y `concatenate`podemos crear vectores y matrices más grandes a partir de otras


### tile y repeat

In [119]:
a = array([[1, 2], [3, 4]])

In [120]:
# repite cada elemento 3 veces
repeat(a, 3)

array([1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4])

In [121]:
# apila la matriz 3 veces 
tile(a, 3)

array([[1, 2, 1, 2, 1, 2],
       [3, 4, 3, 4, 3, 4]])

### concatenate

In [122]:
b = array([[5, 6]])

In [123]:
concatenate((a, b), axis=0)

array([[1, 2],
       [3, 4],
       [5, 6]])

In [124]:
concatenate((a, b.T), axis=1)

array([[1, 2, 5],
       [3, 4, 6]])

### hstack and vstack

In [125]:
vstack((a,b))

array([[1, 2],
       [3, 4],
       [5, 6]])

In [126]:
hstack((a,b.T))

array([[1, 2, 5],
       [3, 4, 6]])

## Copy y "deep copy"

Para conseguir alto rendimiento, las asignaciones en Python habitualmente no copian los objetos. Esto es  importante por ejemplo cuando se aplican funciones a los objetos, para evitar una excesiva cantidad de copiado de memoria cuando no es necesario (**pass by reference**)

In [127]:
A = array([[1, 2], [3, 4]])

A

array([[1, 2],
       [3, 4]])

In [128]:
# B se refiere al mismo array que A
B = A 

In [129]:
# cambiar B afecta a A
B[0,0] = 10

B

array([[10,  2],
       [ 3,  4]])

In [130]:
A

array([[10,  2],
       [ 3,  4]])

Si queremos evitar este efecto, obteniendo una variable `B` copiada de `A`, entonces necesitamos hacer una *deep-copy* usando la función `copy`:

In [131]:
B = copy(A)

In [132]:
# ahora las modificaciones sobre B no afectan a A
B[0,0] = -5

B

array([[-5,  2],
       [ 3,  4]])

In [133]:
A

array([[10,  2],
       [ 3,  4]])

## Iterar sobre los elementos del array

Generalmente, queremos evitar iterar sobre los elementos de los arrays a toda costa, debido a que en un lenguaje interpretado como Python, las iteraciones son mucho más lentas que las operaciones vectorizadas.

Sin embargo, a veces es inevitable realizar iteraciones. Para esos casos el bucle `for` es la manera más conveniente de iterar sobre un array

In [134]:
v = array([1,2,3,4])

for element in v:
    print(element)

1
2
3
4


In [135]:
M = array([[1,2], [3,4]])

for row in M:
    print("row", row)
    
    for element in row:
        print(element)

row [1 2]
1
2
row [3 4]
3
4


Cuando necesitamos iterar sobre cada elemento de un array y modificar sus elementos, es conveniente usar la función `enumerate` para obtener tanto el elemento como su índice en el bucle `for`:

In [138]:
for row_idx, row in enumerate(M):
    print("row_idx", row_idx, "row", row)
    
    for col_idx, element in enumerate(row):
        print("col_idx", col_idx, "element", element)
       
        # actualizamos la matriz M elevando cada elemento al cuadrado
        M[row_idx, col_idx] = element ** 2

row_idx 0 row [1 4]
col_idx 0 element 1
col_idx 1 element 4
row_idx 1 row [ 9 16]
col_idx 0 element 9
col_idx 1 element 16


In [137]:
# cada elemento de M ahora está elevado al cuadrado
M

array([[ 1,  4],
       [ 9, 16]])

## Vectorizar funciones

Como hemos mencionado antes, para obtener buen rendimiento debemos evitar hacer iteraciones sobre los elementos de vectores y matrices, y usar en su lugar algoritmos vectorizados. El primer paso para  convertir un algoritmo escalar a un algoritmo vectorizado es asegurarse de que las funciones que escribimos funcionan con entradas vectoriales

In [139]:
def Theta(x):
    """
    Scalar implemenation of the Heaviside step function.
    """
    if x >= 0:
        return 1
    else:
        return 0

In [140]:
Theta(array([-3,-2,-1,0,1,2,3]))

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

Esta definición no ha funcionado porque no hemos escrito la función `Theta` de modo que pueda admitir un input vectorial.

Para obtener una versión vectorizada de Theta podemos usar la función `vectorize` en numpy. En muchos casos funcionará para vectorizar automáticamente una función:

In [141]:
Theta_vec = vectorize(Theta)

In [142]:
Theta_vec(array([-3,-2,-1,0,1,2,3]))

array([0, 0, 0, 1, 1, 1, 1])

También podemos implementar la función de modo que acepte un input vectorial desde la definición, esto requiere mayor esfuerzo pero puede dar un rendimiento mejor:

In [143]:
def Theta(x):
    """
    Vector-aware implemenation of the Heaviside step function.
    """
    return 1 * (x >= 0)

In [144]:
Theta(array([-3,-2,-1,0,1,2,3]))

array([0, 0, 0, 1, 1, 1, 1])

In [145]:
# sigue funcionando en escalares también
Theta(-1.2), Theta(2.6)

(0, 1)

## Usando arrays en condicionales

Cuando usamos arrays dentro de condicionales, por ejemplo dentro de sentencias `if` y otras expresiones booleanas, necesitamos usar los comandos `any`ó `all`, que requieren que ninguno ó todos los elementos en el array sean evaluados como `True`:

In [146]:
M

array([[  1,  16],
       [ 81, 256]])

In [147]:
if (M > 5).any():
    print("at least one element in M is larger than 5")
else:
    print("no element in M is larger than 5")

at least one element in M is larger than 5


In [148]:
if (M > 5).all():
    print("all elements in M are larger than 5")
else:
    print("all elements in M are not larger than 5")

all elements in M are not larger than 5


## Trabajando con `type`

Como los numpy arrays son *estáticamente tipados*, el tipo de un array no cambia una vez creado. Sin embargo se puede llamar a un array explícitamente como un tipo usando el comando `astype`. Esto siempre creará arrays de un tipo nuevo:

In [151]:
M.dtype

dtype('int32')

In [152]:
M2 = M.astype(float)

M2

array([[   1.,   16.],
       [  81.,  256.]])

In [153]:
M2.dtype

dtype('float64')

In [154]:
M3 = M.astype(bool)

M3

array([[ True,  True],
       [ True,  True]], dtype=bool)

## Lecturas adicionales

* http://numpy.scipy.org
* http://scipy.org/Tentative_NumPy_Tutorial
* http://scipy.org/NumPy_for_Matlab_Users - A Numpy guide for MATLAB users.