# Más información sobre **Numpy** <a class="tocSkip">

## Creación y operación sobre **Numpy** arrays
Vamos a ver algunas características de los `arrays` de Numpy en un poco más de detalle

### Funciones para crear arrays

Vimos varios métodos que permiten crear e inicializar arrays

In [43]:
import numpy as np
import matplotlib.pyplot as plt

In [48]:
a= {}
a['empty unid'] = np.empty(10)    #  Creación de un array de 10 elementos
a['zeros unid'] = np.zeros(10)    #  Creación de un array de 10 elementos inicializados en cero
a['zeros bidi'] = np.zeros((5,2)) #  Array bidimensional 10 elementos con *shape* 5x2
a['ones bidi'] = np.ones((5,2)) #  Array bidimensional 10 elementos con *shape* 5x2, inicializado en 1
a['arange'] = np.arange(10)  # Array inicializado con una secuencia
a['lineal'] = np.linspace(0,10,5)  # Array inicializado con una secuencia equiespaciada
a['log'] = np.logspace(0,2,10)  # Array inicializado con una secuencia con espaciado logarítmico
a['diag'] = np.diag(np.arange(5)) # Matriz diagonal a partir de un vector

for k,v in a.items():
  print('Array {}:\n {}\n'.format(k,v), 80*"*")

Array empty unid:
 [1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]
 ********************************************************************************
Array zeros unid:
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 ********************************************************************************
Array zeros bidi:
 [[0. 0.]
 [0. 0.]
 [0. 0.]
 [0. 0.]
 [0. 0.]]
 ********************************************************************************
Array ones bidi:
 [[1. 1.]
 [1. 1.]
 [1. 1.]
 [1. 1.]
 [1. 1.]]
 ********************************************************************************
Array arange:
 [0 1 2 3 4 5 6 7 8 9]
 ********************************************************************************
Array lineal:
 [ 0.   2.5  5.   7.5 10. ]
 ********************************************************************************
Array log:
 [  1.           1.66810054   2.7825594    4.64158883   7.74263683
  12.91549665  21.5443469   35.93813664  59.94842503 100.        ]
 ****************************************************

La función `np.tile(A, reps)` permite crear un array repitiendo el patrón `A` las veces indicada por `reps` a lo largo de cada eje

In [49]:
a = np.arange(1,6,2)
a

array([1, 3, 5])

In [50]:
np.tile(a, 2)

array([1, 3, 5, 1, 3, 5])

In [51]:
a1=np.tile(a, (1,2))

In [52]:
a1.shape

(1, 6)

In [53]:
a1

array([[1, 3, 5, 1, 3, 5]])

In [54]:
b = [[1,2],[3,4]]

In [55]:
print(b)

[[1, 2], [3, 4]]


In [56]:
np.tile(b,(1,2))

array([[1, 2, 1, 2],
       [3, 4, 3, 4]])

In [57]:
np.tile(b, (2,1))

array([[1, 2],
       [3, 4],
       [1, 2],
       [3, 4]])

En general, el argumento `reps = (nrows, ncols)` indica el número de repeticiones en filas (hacia abajo) y columnas (hacia la derecha), creando nuevas dimensiones si es necesario

In [58]:
a

array([1, 3, 5])

In [59]:
np.tile(a, (3,2))

array([[1, 3, 5, 1, 3, 5],
       [1, 3, 5, 1, 3, 5],
       [1, 3, 5, 1, 3, 5]])

### Funciones que actúan sobre arrays

Numpy incluye muchas funciones matemáticas que actúan sobre arrays completos (de una o más dimensiones). La lista completa se encuentra en la [documentación](http://docs.scipy.org/doc/numpy/reference/ufuncs.html#available-ufuncs) e incluye:

In [60]:
x = np.linspace(np.pi/180, np.pi,7)
y = np.geomspace(10,100,7)

In [61]:
print(x)
print(y)
print(x+y)                      # Suma elemento a elemento
print(x*y)                      # Multiplicación elemento a elemento
print(y/x)                      # División elemento a elemento
print(x//2)                     # División entera elemento a elemento

[0.01745329 0.53814319 1.05883308 1.57952297 2.10021287 2.62090276
 3.14159265]
[ 10.          14.67799268  21.5443469   31.6227766   46.41588834
  68.12920691 100.        ]
[ 10.01745329  15.21613586  22.60317998  33.20229957  48.5161012
  70.75010967 103.14159265]
[1.74532925e-01 7.89886174e+00 2.28118672e+01 4.99489021e+01
 9.74832459e+01 1.78560026e+02 3.14159265e+02]
[572.95779513  27.27525509  20.34725522  20.02046006  22.10056375
  25.99455727  31.83098862]
[0. 0. 0. 0. 1. 1. 1.]


In [62]:
print('x =', x)
print('square\n', x**2)              # potencias
print('sin\n',np.sin(x))             # Seno (np.cos, np.tan)
print("tanh\n",np.tanh(x))           # tang hiperb (np.sinh, np.cosh)
print('exp\n', np.exp(-x))           # exponenciales
print('log\n', np.log(x))            # logaritmo en base e (np.log10)
print('abs\n',np.absolute(x))        # Valor absoluto
print('resto\n', np.remainder(x,2))  # Resto

x = [0.01745329 0.53814319 1.05883308 1.57952297 2.10021287 2.62090276
 3.14159265]
square
 [3.04617420e-04 2.89598089e-01 1.12112749e+00 2.49489282e+00
 4.41089408e+00 6.86913128e+00 9.86960440e+00]
sin
 [1.74524064e-02 5.12542501e-01 8.71784414e-01 9.99961923e-01
 8.63101882e-01 4.97478722e-01 1.22464680e-16]
tanh
 [0.01745152 0.49158114 0.78521683 0.91852736 0.97046433 0.9894743
 0.99627208]
exp
 [0.98269813 0.58383131 0.34686033 0.20607338 0.12243036 0.07273717
 0.04321392]
log
 [-4.04822697 -0.61963061  0.05716743  0.45712289  0.7420387   0.96351882
  1.14472989]
abs
 [0.01745329 0.53814319 1.05883308 1.57952297 2.10021287 2.62090276
 3.14159265]
resto
 [0.01745329 0.53814319 1.05883308 1.57952297 0.10021287 0.62090276
 1.14159265]


### Productos entre arrays y productos vectoriales

In [63]:
# Creamos arrays unidimensionales (vectores) y bidimensionales (matrices)
v1 = np.array([2, 3, 4])
v2 = np.array([1, 1, 1])
A = np.arange(1,13,2).reshape(2, 3)
B = np.linspace(0.5,11.5,12).reshape(3, 4)

In [64]:
print(A)

[[ 1  3  5]
 [ 7  9 11]]


In [65]:
print(B)

[[ 0.5  1.5  2.5  3.5]
 [ 4.5  5.5  6.5  7.5]
 [ 8.5  9.5 10.5 11.5]]


In [66]:
print(v1*v2)

[2 3 4]


In [67]:
print(A*v1)

[[ 2  9 20]
 [14 27 44]]


Los productos se realizan "elemento a elemento", si queremos obtener "productos internos" o productos entre matrices (o matrices y vectores)

In [68]:
print(v1, '.', v2, '=', np.dot(v1, v2))

[2 3 4] . [1 1 1] = 9


In [69]:
print( A, 'x', v1, '=', np.dot(A, v1))


[[ 1  3  5]
 [ 7  9 11]] x [2 3 4] = [31 85]


In [70]:
print(A.shape, B.shape)

(2, 3) (3, 4)


In [71]:
print( 'A x B = \n',np.dot(A, B) )

A x B = 
 [[ 56.5  65.5  74.5  83.5]
 [137.5 164.5 191.5 218.5]]


In [72]:
print( 'B^t x A^t =\n ',np.dot(B.T, A.T))

B^t x A^t =
  [[ 56.5 137.5]
 [ 65.5 164.5]
 [ 74.5 191.5]
 [ 83.5 218.5]]


Además, el módulo numpy.linalg incluye otras funcionalidades como determinantes, normas, determinación de autovalores y autovectores, descomposiciones, etc.

### Comparaciones entre arrays

La comparación, como las operaciones y aplicación de funciones se realiza "elemento a elemento".

|Funciones                                           |  Operadores    |
|:---------------------------------------------------|:--------------:|
|greater(x1, x2, /[, out, where, casting, ...])      |    (x1 > x2)   |
|greater_equal(x1, x2, /[, out, where, ...]) 	     |    (x1 >= x2)  |
|less(x1, x2, /[, out, where, casting, ...]) 	     |    (x1 < x2)   |
|less_equal(x1, x2, /[, out, where, casting, ...])   |    (x1 =< x2)  |
|not_equal(x1, x2, /[, out, where, casting, ...])    |    (x1 != x2)  |
|equal(x1, x2, /[, out, where, casting, ...]) 	     |    (x1 == x2)  |


In [73]:
z = np.array((-1,3,4,0.5,2,9,0.7))

In [74]:
print(x)
print(y)
print(z)

[0.01745329 0.53814319 1.05883308 1.57952297 2.10021287 2.62090276
 3.14159265]
[ 10.          14.67799268  21.5443469   31.6227766   46.41588834
  68.12920691 100.        ]
[-1.   3.   4.   0.5  2.   9.   0.7]


In [75]:
c1 = x <= z
c2 = np.less_equal(z,y)
c3 = np.less_equal(x,y)
print(c1)
print(c2)
print(c3)


[False  True  True False False  True False]
[ True  True  True  True  True  True  True]
[ True  True  True  True  True  True  True]


In [76]:
c1                              # Veamos que tipo de array es:

array([False,  True,  True, False, False,  True, False])

In [77]:
np.sum(c1), np.sum(c2), c3.sum()

(3, 7, 7)

Como vemos, las comparaciones nos dan un vector de variables lógicas.
Cuando queremos combinar condiciones no funciona usar las palabras `and` y `or` de *Python* porque estaríamos comparando los dos elementos (arrays completos).

In [79]:
print(np.logical_and(c1, c2))
print(c1 & c2)
print(np.logical_and(c2, c3))
print(c2 & c3)

[False  True  True False False  True False]
[False  True  True False False  True False]
[ True  True  True  True  True  True  True]
[ True  True  True  True  True  True  True]


In [80]:
print(np.logical_or(c1, c2))
print(c1 | c2)
print(np.logical_or(c2, c3))
print(c2 | c3)

[ True  True  True  True  True  True  True]
[ True  True  True  True  True  True  True]
[ True  True  True  True  True  True  True]
[ True  True  True  True  True  True  True]


In [81]:
print(np.logical_xor(c1, c2))
print(np.logical_xor(c2, c3))

[ True False False  True  True False  True]
[False False False False False False False]


## Atributos de *arrays*

Los array tienen otras propiedades, que pueden explorarse apretando `<TAB>` en una terminal o notebook de **IPython** o leyendo la documentación de [Numpy](http://docs.scipy.org/doc/numpy/user), o utilizando la función `dir(arr)` (donde `arr` es una variable del tipo array) o `dir(np.ndarray)`.

En la tabla se muestra una lista de los atributos de los numpy array 

![](figuras/array_atr.png)


Exploremos algunas de ellas

### reshape

In [82]:
arr= np.arange(12)                         # Vector
print("Vector original:\n", arr)
arr2= arr.reshape((3,4))                   # Le cambiamos la forma a matriz de 3x4
print("Cambiando la forma a 3x4:\n", arr2)
arr3= np.reshape(arr,(4,3))                # Le cambiamos la forma a matriz de 4x3
print("Cambiando la forma a 4x3:\n", arr3)

Vector original:
 [ 0  1  2  3  4  5  6  7  8  9 10 11]
Cambiando la forma a 3x4:
 [[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
Cambiando la forma a 4x3:
 [[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]


In [83]:
arr2[0,0] = 5
arr2[2,1] = -9

In [84]:
print(arr2)

[[ 5  1  2  3]
 [ 4  5  6  7]
 [ 8 -9 10 11]]


In [85]:
print(arr)

[ 5  1  2  3  4  5  6  7  8 -9 10 11]


In [86]:
print(arr3)

[[ 5  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [-9 10 11]]


In [88]:
arr.reshape((3,3))   # Si la nueva forma no es adecuada, falla

ValueError: cannot reshape array of size 12 into shape (3,3)

### transpose

In [90]:
print('Transpose:\n', arr2.T)
print('Transpose:\n', np.transpose(arr3))

Transpose:
 [[ 5  4  8]
 [ 1  5 -9]
 [ 2  6 10]
 [ 3  7 11]]
Transpose:
 [[ 5  3  6 -9]
 [ 1  4  7 10]
 [ 2  5  8 11]]


### min, max

Las funciones para encontrar mínimo y máximo pueden aplicarse tanto a vectores como a arrays` con más dimensiones. En este último caso puede elegirse si se trabaja sobre uno de los ejes:

In [91]:
print(arr2)
print(np.max(arr2))
print(np.max(arr2,axis=0))
print(np.max(arr2,axis=1))


[[ 5  1  2  3]
 [ 4  5  6  7]
 [ 8 -9 10 11]]
11
[ 8  5 10 11]
[ 5  7 11]


In [92]:
np.max(arr2[1,:])

7

El primer eje `(axis=0)` corresponde a las columnas (convención del lenguaje `C`), y por lo tanto dará un valor por cada columna.

Si no damos el argumento opcional `axis` ambas funciones nos darán el mínimo o máximo de todos los elementos. Si le damos un eje nos devolverá el mínimo a lo largo de ese eje. 

### argmin, argmax

Estas funciones trabajan de la misma manera que `min` y `max` pero devuelve los índices en lugar de los valores.

In [93]:
print(np.argmax(arr2))
print(np.argmax(arr2,axis=0))
print(np.argmax(arr2,axis=1))


11
[2 1 2 2]
[0 3 3]


### sum, prod, mean, std



In [94]:
print(arr2)
print('sum', np.sum(arr2))
print('sum, 0', np.sum(arr2,axis=0))
print('sum, 1', np.sum(arr2,axis=1))


[[ 5  1  2  3]
 [ 4  5  6  7]
 [ 8 -9 10 11]]
sum 53
sum, 0 [17 -3 18 21]
sum, 1 [11 22 20]


In [95]:
print(np.prod(arr2))
print(np.prod(arr2,axis=0))
print(np.prod(arr2,axis=1))

-199584000
[160 -45 120 231]
[   30   840 -7920]


In [96]:
print(arr2.mean(), '=', arr2.sum()/arr2.size)
print(np.mean(arr2,axis=0))
print(np.mean(arr2,axis=1))
print(np.std(arr2))
print(np.std(arr2,axis=1))


4.416666666666667 = 4.416666666666667
[ 5.66666667 -1.          6.          7.        ]
[2.75 5.5  5.  ]
4.9742391936411305
[1.47901995 1.11803399 8.15475322]


### cumsum, cumprod, trapz

Las funciones `cumsum` y `cumprod` devuelven la suma y producto acumulativo recorriendo el array, opcionalmente a lo largo de un eje

In [97]:
print(arr2)

[[ 5  1  2  3]
 [ 4  5  6  7]
 [ 8 -9 10 11]]


In [98]:
# Suma todos los elementos anteriores y devuelve el array unidimensional
print(arr2.cumsum())

[ 5  6  8 11 15 20 26 33 41 32 42 53]


In [99]:
# Para cada columna, en cada posición suma los elementos anteriores
print(arr2.cumsum(axis=0))

[[ 5  1  2  3]
 [ 9  6  8 10]
 [17 -3 18 21]]


In [100]:
# En cada fila, el valor es la suma de todos los elementos anteriores de la fila
print(arr2.cumsum(axis=1))

[[ 5  6  8 11]
 [ 4  9 15 22]
 [ 8 -1  9 20]]


In [101]:
# Igual que antes pero con el producto
print(arr2.cumprod(axis=0))

[[  5   1   2   3]
 [ 20   5  12  21]
 [160 -45 120 231]]


La función trapz evalúa la integral a lo largo de un eje, usando la regla de los trapecios (la misma que nosotros programamos en un ejercicio)

In [102]:
print(np.trapz(arr2,axis=0))
print(np.trapz(arr2,axis=1))

[10.5  1.  12.  14. ]
[ 7.  16.5 10.5]


In [103]:
# el valor por default de axis es -1
print(np.trapz(arr2))

[ 7.  16.5 10.5]


### nonzero

Devuelve una *tupla* de arrays, una por dimensión, que contiene los índices de los elementos no nulos

In [104]:
# El método copy() crea un nuevo array con los mismos valores que el original
arr4 = arr2.copy()
arr4[1,:2] = arr4[2,2:] = 0
arr4

array([[ 5,  1,  2,  3],
       [ 0,  0,  6,  7],
       [ 8, -9,  0,  0]])

In [105]:
# Vemos que arr2 no se modifica al modificar arr4.
arr2

array([[ 5,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8, -9, 10, 11]])

In [106]:
np.nonzero(arr4)

(array([0, 0, 0, 0, 1, 1, 2, 2]), array([0, 1, 2, 3, 2, 3, 0, 1]))

In [107]:
np.transpose(arr4.nonzero())

array([[0, 0],
       [0, 1],
       [0, 2],
       [0, 3],
       [1, 2],
       [1, 3],
       [2, 0],
       [2, 1]])

In [108]:
arr4[arr4.nonzero()]

array([ 5,  1,  2,  3,  6,  7,  8, -9])

## Convertir un array a unidimensional (ravel)


In [109]:
a = np.array([[1,2],[3,4]])

In [110]:
print(a)

[[1 2]
 [3 4]]


In [111]:
b= np.ravel(a)

In [112]:
print(a.shape, b.shape)
print(b)

(2, 2) (4,)
[1 2 3 4]


In [113]:
b.base  is a

True

`ravel` tiene un argumento opcional 'order'

In [114]:
np.ravel(a, order='C')          # order='C' es el default 

array([1, 2, 3, 4])

In [115]:
np.ravel(a, order='F')

array([1, 3, 2, 4])

El método `flatten` hace algo muy parecido a `ravel`, la diferencia es que `flatten` siempre crea una nueva copia del array, mientras que `ravel` puede devolver una nueva vista del mismo array.

In [116]:
a.flatten()

array([1, 2, 3, 4])

Ejercicios 10 (a)

1. Dado un array `a` de números, creado por ejemplo usando:
   ```python
   a = np.random.uniform(size=100)
   ```
   Encontrar el número más cercano a un número escalar dado (por ejemplo x=0.5). Utilice los métodos discutidos.

## Copias de arrays y vistas

Para poder controlar el uso de memoria y su optimización, **Numpy** no siempre crea un nuevo vector al realizar operaciones. Por ejemplo cuando seleccionamos una parte de un array usando la notación con ":" (*slicing*) devuelve algo que parece un nuevo array pero que en realidad es una nueva vista del mismo array. Lo mismo ocurre con el método `reshape`

In [None]:
x0 = np.linspace(1,24,24)
print(x0)

In [None]:
y0 = x0[::2]
print(y0)

El método `base` nos da acceso al objeto que tiene los datos. Por ejemplo, en este caso


In [None]:
print(x0.base)

In [None]:
print(y0.base)

In [None]:
y0.base is x0

In [None]:
type(x0), type(y0)

In [None]:
y0.size, x0.size

In [None]:
y0[1] = -1
print(x0)

En este ejemplo, el array `y0` está basado en `x0`, o --lo que es lo mismo-- el objeto base de `y0` es `x0`. Por lo tanto, al modificar uno, se modifica el otro.

Las funciones `reshape` y `transpose` también devuelven **vistas** del array original en lugar de una nueva copia

In [None]:
x0 = np.linspace(1,24,24)
print(x0)
x1 = x0.reshape(6,-1)

In [None]:
print(x1)

In [None]:
print(x1.base is x0)

In [None]:
x2 = x1.transpose()
print(x2.base is x0)

Las "vistas" son referencias al mismo conjunto de datos, pero la información respecto al objeto puede ser diferente. Por ejemplo en el anterior `x0`, `x1` y `x` son diferentes objetos pero con los mismos datos (no sólo iguales)

In [None]:
print(x1.base is x0)
print(x2.base is x0)
print(x0.shape, x0.strides, x0.dtype)
print(x1.shape, x1.strides, x1.dtype)
print(x2.shape, x2.strides, x2.dtype)

Los datos en los tres objetos están compartidos:

In [None]:
print('original')
print('x2 =',x2)
x0[-1] =-1
print('x0 =',x0)

In [None]:
print('cambiado')
print('x2 =',x2)

In [None]:
print('x1 =',x1)


## Indexado avanzado 


### Indexado con secuencias de índices

Consideremos un vector simple, y elijamos algunos de sus elementos

In [None]:
x = np.linspace(0,3,7)
x

In [None]:
# Standard slicing
v1=x[1::2]
v1

Esta es la manera simple de seleccionar elementos de un array, y como vimos lo que se obtiene es una vista del mismo array. **Numpy** permite además seleccionar partes de un array usando otro array de índices:

In [None]:
# Array Slicing con índices ind
i1 = np.array([1,3,-1,0])        
v2= x[i1]

In [None]:
print(v2)

In [None]:
print(v1.base is x)
print(v2.base is x)

In [None]:
x[[1,2,-1]]

Los índices negativos funcionan en exactamente la misma manera que en el caso simple. 

Es importante notar que cuando se usan arrays índices, lo que se obtiene es un nuevo array (no una vista), y este nuevo array tiene las dimensiones (`shape`) del array de índices

In [None]:
i2 = np.array([[1,0],[2,1]])
v3= x[i2]
print(v3)
print('x  shape:', x.shape)
print('v3 shape:', v3.shape)

### Índices de arrays multidimensionales

In [None]:
y = np.arange(12,0,-1).reshape(3,4)+0.5
y

In [None]:
print(y[0])                     # Primera fila
print(y[2])                     # Última fila


In [None]:
i = np.array([0,2])
print(y[i])       # Primera y última fila

Si usamos más de un array de índices para seleccionar elementos de un array multidimensional, cada array de índices se refiere a una dimensión diferente. Consideremos el array `y`

In [None]:
print(y)

![](figuras/adv_index.png)
Si queremos elegir los elementos en los lugares `[0,1], [1,2], [0,3], [1,1]` (en ese orden) 
podemos crear dos array de índices con los valores correspondientes a cada dimensión

In [None]:
i = np.array([0,1,0,1])
j = np.array([1,2,3,1])
print(y[i,j])

### Indexado con condiciones

Además de usar notación de *slices*, e índices también podemos seleccionar partes de arrays usando una matriz de condiciones. Primero creamos una matriz de coniciones `c`

In [None]:
c = False*np.empty((3,4), dtype='bool')
print(c)

In [None]:
False*np.empty((3,4))

In [None]:
c[i,j]= True                    # Aplico la notación de índice avanzado
print(c)

Como vemos, `c` es una matriz con la misma forma que `y`. Esto permite seleccionar los valores donde el array de condiciones es verdadero:

In [None]:
y[c]

Esta es una notación  potente. Por ejemplo, si en el array anterior queremos seleccionar todos los valores que sobrepasan cierto umbral (por ejemplo, los valores mayores a 7)

In [None]:
print(y)
c1 = (y > 7)
print(c1)

El resultado de una comparación es un array donde cada elemento es un variable lógica (`True` o `False`). Podemos utilizarlo para seleccionar los valores que cumplen la condición dada. Por ejemplo

In [None]:
y[c1]

De la misma manera, si queremos todos los valores entre 4 y 7 (incluidos), podemos hacer

In [None]:
y[(y >= 4) & (y <= 7)]

Como mostramos en este ejemplo, no es necesario crear la matriz de condiciones previamente.

**Numpy** tiene funciones especiales para analizar datos de array que sirven para quedarse con los valores que cumplen ciertas condiciones. La función `nonzero` devuelve los índices donde el argumento no se anula:

In [None]:
c1 = (y>=4) & (y <=7)
np.nonzero(c1)


Esta es la notación de avanzada de índices, y nos dice que los elementos cuya condición es diferente de cero (`True`) están en las posiciones: `[1,2], [1,3], [2,0]`. 

In [None]:
indx, indy = np.nonzero(c1)
print('indx =', indx)
print('indy =', indy)

In [None]:
for i,j in zip(indx, indy):
  print('y[{},{}]={}'.format(i,j,y[i,j]))

In [None]:
print(np.nonzero(c1))
print(np.transpose(np.nonzero(c1)))
print(y[np.nonzero(c1)])

El resultado de `nonzero()` se puede utilizar directamente para elegir los elementos con la notación de índices avanzados, y su transpuesta es un array  donde cada elemento es un índice donde no se anula.

Existe la función `np.argwhere()` que es lo mismo que ``np.transpose(np.nonzero(a))``.

Otra función que sirve para elegir elementos basados en alguna condición es `np.compress(condition, a, axis=None, out=None)` que acepta un array unidimensional como condición

In [None]:
c2 = np.ravel(c1)
print(c2)
print(np.compress(c2,y))

La función `extract` es equivalente a convertir los dos vectores (condición y datos) a una dimensión (`ravel`) y luego aplicar `compress`

In [None]:
np.extract(c1, y)

### Función where

La función `where` permite operar condicionalmente sobre algunos elementos.  Por ejemplo, si queremos convolucionar el vector `y` con un escalón localizado en la región `[2,8]`:

In [None]:
np.where((y > 2) &  (y < 8) , y, 0)

Por ejemplo, para implementar la función de Heaviside

In [None]:
import matplotlib.pyplot as plt

def H(x):
  return np.where(x < 0, 0, 1)
x = np.linspace(-1,1,11)
H(x)

In [None]:
plt.plot(x,H(x), 'o')

## Extensión de las dimensiones (*Broadcasting*)

Vimos que en **Numpy** las operaciones (y comparaciones) se realizan "elemento a elemento". Sin embargo usamos expresiones del tipo `y > 4` donde comparamos un `ndarray` con un escalar. En este caso, lo que hace **Numpy** es extender automáticamente el escalar a un array de las mismas dimensiones que `y`

```python
  4 -> 4*np.ones(y.shape)
  ```

Hagamos esto explícitamente

In [None]:
y4 = 4*np.ones(y.shape)
np.all((y > y4) == (y > 4)) # np.all devuelve True si **TODOS** los elementos son iguales

De la misma manera, hay veces que podemos operar sobre arrays de distintas dimensiones

In [None]:
y

In [None]:
y + 3

Como vemos eso es igual a `y + 3*np.ones(y.shape)`. En general, si Numpy puede transformar los arreglos para que todos tengan el mismo tamaño, lo hará en forma automática. 

Las reglas de la extensión automática son:

1. La extensión se realiza por dimensión. Dos dimensiones son compatibles si son iguales o una de ellas es 1.
2. Si los dos `arrays` difieren en el número de dimensiones, el que tiene menor dimensión se llena con `1` (unos) en el primer eje.

Veamos algunos ejemplos:


In [None]:
x = np.arange(0,40,10)
xx = x.reshape(4,1)
y = np.arange(3)

In [None]:
print(x.shape, xx.shape, y.shape)

In [None]:
print(xx)

In [None]:
print(y)

In [None]:
print(xx+y)

Lo que está pasando es algo así como:

  * xx -> xxx
  * y ->  yyy
  * xx + y -> xxx + yyy

  ![](figuras/numpy_broadcasting.png)

donde `xxx`, `yyy` son versiones extendidas de los vectores originales:

In [None]:
xxx = np.tile(xx, (1, y.size))
yyy = np.tile(y, (xx.size, 1))

In [None]:
print(xxx)

In [None]:
print(yyy)

In [None]:
print(xxx + yyy)

## Unir (o concatenar) *arrays*

Si queremos unir dos *arrays* para formar un tercer *array* **Numpy** tiene una función llamada `concatenate`, que recibe una secuencia de arrays y devuelve su unión a lo largo de un eje.

### Apilamiento vertical

In [None]:
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8], [9,10]])
print('a=\n',a)
print('b=\n',b)

In [None]:
# El eje 0 es el primero, y corresponde a apilamiento vertical
np.concatenate((a, b), axis=0)

In [None]:
np.concatenate((a, b))          # axis=0 es el default

In [None]:
np.vstack((a, b))               # Une siempre verticalmente (primer eje)

Veamos cómo utilizar esto cuando tenemos más dimensiones. 

In [None]:
c = np.array([[[1, 2], [3, 4]],[[-1,-2],[-3,-4]]])
d = np.array([[[5, 6], [7, 8]], [[9,10], [-5, -6]], [[-7, -8], [-9,-10]]])
print('c: shape={}\n'.format(c.shape),c)
print('\nd: shape={}\n'.format(d.shape),d)


Como tienen todas las dimensiones iguales, excepto la primera, podemos concatenarlos a lo largo del eje 0 (verticalmente)

In [None]:
np.vstack((c,d))

In [None]:
e=np.concatenate((c,d),axis=0)

In [None]:
print(e.shape)
print(e)

### Apilamiento horizontal

Si tratamos de concatenar `a`y `b` a lo largo de otro eje vamos a recibir un error porque la forma de los `arrays` no es compatible.

In [None]:
b.T

In [None]:
print(a.shape, b.shape, b.T.shape)

In [None]:
np.concatenate((a, b.T), axis=1)

In [None]:
np.hstack((a,b.T))              # Como vstack pero horizontalmente

## Enumerate para `ndarrays`

Para iterables en **Python** existe la función enumerate que devuelve una tupla con el índice y el valor. En **Numpy** existe un iterador multidimensional llamado `ndenumerate()`

In [None]:
print(b)

In [None]:
for (i,j), x in np.ndenumerate(b):
  print('x[{},{}]->{}'.format(i,j,x))

## Generación de números aleatorios

**Python** tiene un módulo para generar números al azar, sin embargo vamos a utilizar el módulo de **Numpy** llamado `random`. Este módulo tiene funciones para generar números al azar siguiendo varias distribuciones más comunes. Veamos que hay en el módulo

In [None]:
dir(np.random)

### Distribución uniforme

Si elegimos números al azar con una distribución de probabilidad uniforme, la probabilidad de que el número elegido caiga en un intervalo dado es simplemente proporcional al tamaño del intervalo. 

In [None]:
x= np.random.random((4,2))
y = np.random.random(8)
print(x)

In [None]:
y

In [None]:
np.random.random is np.random.random_sample

Como se infiere de este resultado, la función `random` (o `random_sample`) nos da una distribución de puntos aleatorios entre 0 y 1, uniformemente distribuidos.


In [None]:
plt.plot(np.random.random(4000), '.')
plt.show()

### Distribución normal (Gaussiana)

Una distribución de probabilidad normal tiene la forma Gaussiana

$$p(x) = \frac{1}{\sqrt{ 2 \pi \sigma^2 }} e^{ - \frac{ (x - \mu)^2 } {2 \sigma^2} }$$. En **Numpy** la función que nos da elementos con esa distribución de probabilidad es: 

`np.random.normal(loc=0.0, scale=1.0, size=None)`

donde:
 - `loc` es la posición del máximo (valor medio)
 - `scale` es el ancho de la distribución
 - `size` es el número de puntos a calcular (o forma)
 


In [None]:
z = np.random.normal(size=4000)

In [None]:
plt.plot( z, '.')
plt.show()

In [None]:
np.random.normal(size=(3,5))

### Histogramas

Para visualizar los números generados y comparar su ocurrencia con la distribución de probabilidad 
vamos a generar histogramas usando *Numpy* y *Matplotlib*

In [None]:
h,b = np.histogram(z, bins=20)

In [None]:
b

In [None]:
h

In [None]:
b.size, h.size

La función retorna `b`: los límites de los intervalos en el eje x y `h` las alturas

In [None]:
x = (b[1:] + b[:-1])/2

In [None]:
plt.bar(x,h, align="center", width=0.4)
plt.plot(x,h, 'k', lw=4)
plt.show()

**Matplotlib** tiene una función similar, que directamente realiza el gráfico

In [None]:
h1, b1, p1 = plt.hist(z, bins=20)
#x1 = (b1[:-1] + b1[1:])/2
#plt.plot(x1, h1, '-k', lw=4)
plt.show()

Veamos otro ejemplo, agregando algún otro argumento opcional

In [None]:
plt.hist(z, bins=20, density=True, orientation='horizontal', alpha=0.8, histtype='stepfilled')
plt.show()

En este último ejemplo, cambiamos la orientación a `horizontal` y además normalizamos los resultados, de manera tal que la integral bajo (a la izquierda de, en este caso) la curva sea igual a 1.

### Distribución binomial

Cuando ocurre un evento que puede tener sólo dos resultados (verdadero, con probabilidad $p$, y falso con probabilidad $(1-p)$) y lo repetimos $N$ veces, la probabilidad de obtener el resultado con probabilidad $p$ es

$$
P(n) = \binom{N}{n}p^{n}(1-P)^{N-n},
$$

Para elegir números al azar con esta distribución de probabilidad **Numpy** tiene la función `binomial`,  cuyo primer argumento es $N$ y el segundo $p$. Por ejemplo si tiramos una moneda 100 veces, y queremos saber cuál es la probabilidad de obtener cara $n$ veces podemos usar:

In [None]:
zb = np.random.binomial(100,0.5,size=30000)

In [None]:
plt.hist(zb, bins=41, density=True, range=(30,70))
plt.xlabel('$n$ (veces "cara")')

Este gráfico ilustra la probabilidad de obtener $n$ veces un lado (cara) si tiramos 100 veces una moneda, como función de $n$.