## Numpy Basico
### Diferencias con la sintaxis de matlab
----

In [1]:
# La convención para el uso de NumPy
import numpy as np 

In [2]:
# Creando un arrays, a partir de una lista de python
lista_python = [0,1,2,3] 

mi_array = np.array( [0,1.0,2,3,5] , dtype='float' )
mi_array.dtype

dtype('float64')

```matlab
% En matlab
mi_array = [0 1 2 3] ;
```

In [3]:
mi_array = np.arange(0,10)
mi_array

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [4]:
# Usando metodos de creacion de arrays multidimensionales
# ones, zeros, identity, eye
mi_array = np.ones( (3,3) )
mi_array

array([[ 1.,  1.,  1.],
       [ 1.,  1.,  1.],
       [ 1.,  1.,  1.]])

El resto de los metodos para crear arrays que ofrece numpy:<br>
http://docs.scipy.org/doc/numpy/reference/routines.array-creation.html<br>

----

In [5]:
# Que hay dentro del objeto mi_array
print ('Numero de elementos ' , mi_array.size)
print ('Forma dimensiones ' , mi_array.shape)
print ('Numero dimensiones ' , mi_array.ndim)
print ('Tipo de dato ' , mi_array.dtype)

#dir(mi_array)

Numero de elementos  9
Forma dimensiones  (3, 3)
Numero dimensiones  2
Tipo de dato  float64


```matlab
% En matlab
numel(mi_array) 
size(mi_array)
```

### Visualizando la informacion
- Ultimo eje (dimension) se visualiza de izquierda a derecha
- Penultimo eje se visualiza de arriba a abajo.
- El resto tambien se muestran de arriba a abajo, donde cada bloque es separado del siguiente por una linea vacia.

In [8]:
# array 2D
a = np.arange(12)

a.resize(4,3)
print (a)

[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]


In [9]:
# arrreglo 3D
c = np.arange(24).reshape(2,3,4)
print (c)

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]


### Las operaciones basicas
Todas las operaciones aritmeticas sobre los arrays de numpy se hacen elemento a elemento. Se genera un nuevo array y se llena con el resultado

In [10]:
a = np.arange(4).reshape(2,2)
b = np.ones((2,2))
b = b + 1
c = a * b 


print (a) 
print (b) 
print ('-')
print (c)


[[0 1]
 [2 3]]
[[ 2.  2.]
 [ 2.  2.]]
-
[[ 0.  2.]
 [ 4.  6.]]


```matlab
% En matlab
>> c = a .* b
```

In [11]:
# El producto de matrices
c = np.dot(a,b)
print (c)

[[  2.   2.]
 [ 10.  10.]]


```matlab
% En matlab 
>>> c = a * b
```

### "Broadcasting"
Describe el como se comportan los arrays de numpy de diferenctes dimensiones durante las operaciones aritmeticas.

![alt text](images/np_broadcasting.png "Ejemplos broadcasting")

In [12]:
# "Broadcasting" Operaciones sobre arrays que no tienen la misma dimension, se repiten en los siguientes bloques
# Regla del broadcasting dice que dos dimensiones son compatibles cuando: 
# - Son iguales en las primeras dimensiones
# - Una de ellas es uno.

a = np.arange(12).reshape(4,3)
b = np.ones((3))

print (a, '-', b)
print ('=')
print (a - b)

[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]] - [ 1.  1.  1.]
=
[[ -1.   0.   1.]
 [  2.   3.   4.]
 [  5.   6.   7.]
 [  8.   9.  10.]]


In [13]:
# Otro ejemplo de "broadcasting"
x = np.arange(4)
xx = x.reshape(4,1)


print ('x:', x.shape)
print ('xx:', xx.shape)
print (xx * x) 

x: (4,)
xx: (4, 1)
[[0 0 0 0]
 [0 1 2 3]
 [0 2 4 6]
 [0 3 6 9]]


In [17]:
y = np.ones((3,3))


print ("y shape : " , y.shape)
print ("x shape : " , x.shape)
print ("y : " , y)
print ("x : " , x )


y shape :  (3, 3)
x shape :  (4,)
y :  [[ 1.  1.  1.]
 [ 1.  1.  1.]
 [ 1.  1.  1.]]
x :  [0 1 2 3]


In [18]:
x + y # Generara un error pues las dimensiones no corresponden.

ValueError: operands could not be broadcast together with shapes (4,) (3,3) 

In [19]:
y = np.ones((4,4))

In [20]:
print (xx)
print (y)
xx + y 

[[0]
 [1]
 [2]
 [3]]
[[ 1.  1.  1.  1.]
 [ 1.  1.  1.  1.]
 [ 1.  1.  1.  1.]
 [ 1.  1.  1.  1.]]


array([[ 1.,  1.,  1.,  1.],
       [ 2.,  2.,  2.,  2.],
       [ 3.,  3.,  3.,  3.],
       [ 4.,  4.,  4.,  4.]])

### Metodos ya incluidos en la clase ndarray
Muchos metodos ya se encuentran integrados en la clase *ndarray* de NumPy

In [21]:
a = np.random.random((2,3))
a

array([[ 0.61163313,  0.75888746,  0.17213748],
       [ 0.53532914,  0.15997021,  0.66072802]])

In [22]:
a.sum()

2.8986854295707514

In [23]:
a.min(axis=1)

array([ 0.17213748,  0.15997021])

In [24]:
a.max()

0.75888745530952761

Por default estas operaciones se hacen sobre todos los elementos del arrays, salvo que se especifiquen, que solo se desea hacer la operacion sobre algun eje en especifico.

![Alt Text](images/axis.png "Numpy axis order")

In [25]:
# La suma de cada columna
a.sum(axis=0)

array([ 1.14696227,  0.91885766,  0.8328655 ])

In [26]:
# La suma de cada renglon
a.sum(axis=1)

array([ 1.54265807,  1.35602736])

In [27]:
# La suma aculumativa sobre cada renglon
b = np.arange(12).reshape(3,4)
b.cumsum(axis=0)

array([[ 0,  1,  2,  3],
       [ 4,  6,  8, 10],
       [12, 15, 18, 21]])

### Funciones universales
Funciones matematicas que se realizan de elemento a elemento

Listado: http://docs.scipy.org/doc/numpy/reference/ufuncs.html#math-operations


In [28]:
np.sqrt(b)

array([[ 0.        ,  1.        ,  1.41421356,  1.73205081],
       [ 2.        ,  2.23606798,  2.44948974,  2.64575131],
       [ 2.82842712,  3.        ,  3.16227766,  3.31662479]])

In [29]:
np.sin(b)

array([[ 0.        ,  0.84147098,  0.90929743,  0.14112001],
       [-0.7568025 , -0.95892427, -0.2794155 ,  0.6569866 ],
       [ 0.98935825,  0.41211849, -0.54402111, -0.99999021]])

In [30]:
c = np.array([2,2,2,2])
np.add(b,c)

array([[ 2,  3,  4,  5],
       [ 6,  7,  8,  9],
       [10, 11, 12, 13]])

### Seleccion de rangos, indexado e iteraciones
- Arreglos 1D se pueden acceder por indices, recortar e iterar sobre sus elementos, como una lista de python.
- Arreglos 2D, tienen un indice por eje, y estos indices se dan por un tipo de dato **tuple** 
- Arreglos multidimensionales tienen un indice por cada eje, de igual forma estan dados por un **tuple**

In [31]:
a = np.arange(10)**2
a

array([ 0,  1,  4,  9, 16, 25, 36, 49, 64, 81])

```matlab
% En matlab
>>> a = (0:9) .^ 2
```

In [32]:
# Buscar dentro del arrays, y retornar indices
np.where(a > 10)

(array([4, 5, 6, 7, 8, 9]),)

In [35]:
print (a[2])

print (a[2:5])
print (a[0:-1:2])             # Usando un paso de dos indices 
print (a[np.array([2,4,6])])  # Elementos con indice 2 , 4 y 6


4
[ 4  9 16]
[ 0  4 16 36 64]
[ 4 16 36]


```matlab
% En matlab
>>> a(3)
>>> a(3:5)
>>> a(1:2:end)
>>> a([3,5,7])
```

In [36]:
# Usando los mismos arrays ndarray para referirnos a indices de otro array.
indices = np.array([5,8,1])
a[indices]

array([25, 64,  1])

In [39]:
#
# Visualizando la seleccion de rangos

arr = np.arange(15).reshape(3,5)
arr

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

![Alt Text](images/slicing1.png "Rangos")

In [43]:
arr[0:2,:]

array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [44]:
arr[2,1:]

array([11, 12, 13, 14])

In [49]:
# Modificando datos sobre una region del array.
a[4:6] = -999
a

array([   0,    1,    4,    9, -999, -999,   36,   49,   64,   81])

In [62]:
# Iterar sobre sus elementos.  
for el in a:
    print (el, ',')

0 ,
1 ,
4 ,
9 ,
16 ,
25 ,
36 ,
49 ,
64 ,
81 ,


### Aunque alerta, para que quisieramos iterar sobre sus elementos si tenemos funciones universales y podemos vectorizar la mayoria de las operaciones..

```matlab
% En matlab
>>> for idx = 1:numel(a)
      a(idx)
    end  
```

In [46]:
# Arreglos multidimensionales

# Equivalente a 
# def func(x,y):
#   return 10 * x+y 
func = lambda x,y : 10*x+y         # palabra reservada lambda produce una funcion inline

b = np.fromfunction(func,(5,4))
b

array([[  0.,   1.,   2.,   3.],
       [ 10.,  11.,  12.,  13.],
       [ 20.,  21.,  22.,  23.],
       [ 30.,  31.,  32.,  33.],
       [ 40.,  41.,  42.,  43.]])

In [47]:
# Segundo renglon
b[1,:]

array([ 10.,  11.,  12.,  13.])

```matlab
% En matlab
>>> b(2,:)
```

In [48]:
# Ultima columna
b[:,-1]

array([  3.,  13.,  23.,  33.,  43.])

```matlab
% En matlab
>>> b(:,end)
```

In [49]:
# Iterando sobre arrays multidimensionales.
for renglon in b:
    print (renglon , ',')

[ 0.  1.  2.  3.] ,
[ 10.  11.  12.  13.] ,
[ 20.  21.  22.  23.] ,
[ 30.  31.  32.  33.] ,
[ 40.  41.  42.  43.] ,


In [50]:
# El atributo flat entrega el iterable de todos los elementos del array
for el in b.flat:
    print (el, ',', end="")

0.0 ,1.0 ,2.0 ,3.0 ,10.0 ,11.0 ,12.0 ,13.0 ,20.0 ,21.0 ,22.0 ,23.0 ,30.0 ,31.0 ,32.0 ,33.0 ,40.0 ,41.0 ,42.0 ,43.0 ,

### Ordenando, buscando y contando el array.
Metodos para la busqueda y ordenado de datos en arrays de numpy<br>
http://docs.scipy.org/doc/numpy/reference/routines.sort.html

In [51]:
a = np.arange(12).reshape(4,3)
a

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11]])

In [52]:
# Elementos del arrays, con alguna condicion
a[(a>2) & (a<9)]

array([3, 4, 5, 6, 7, 8])

In [53]:
# Los elementos que cumplan con alguna condición
(a > 4) & (a<10) 

array([[False, False, False],
       [False, False,  True],
       [ True,  True,  True],
       [ True, False, False]], dtype=bool)

In [55]:
# Numpy where(cond, x, y), si se cumple la condicion, recupera de "x", de otra forma, de "y"
np.where(a >5 , a , 999)

array([[999, 999, 999],
       [999, 999, 999],
       [  6,   7,   8],
       [  9,  10,  11]])

In [56]:
# Indices de elementos que cumplan la siguiente condicion
np.argwhere((a>2) & (a<9))

array([[1, 0],
       [1, 1],
       [1, 2],
       [2, 0],
       [2, 1],
       [2, 2]])

In [58]:
# Indices con minimo y maximo
print (np.argmin(a))
print (np.argmax(a))

0
11


### Manipulando la forma de un array

In [59]:
a = np.floor( np.random.random((3,4)) * 10 )
a

array([[ 5.,  0.,  7.,  1.],
       [ 9.,  7.,  5.,  8.],
       [ 0.,  4.,  2.,  1.]])

In [60]:
a.shape

(3, 4)

In [65]:
# Aplanamos el arrays, (Regresa referencias al array original!)
a.ravel()

array([ 5.,  0.,  7.,  1.,  9.,  7.,  5.,  8.,  0.,  4.,  2.,  1.])

```matlab
% En matlab
>>> a(:)
```

In [66]:
# array a transpuesto
a.transpose() # O tambien a.T

array([[ 5.,  9.,  0.],
       [ 0.,  7.,  4.],
       [ 7.,  5.,  2.],
       [ 1.,  8.,  1.]])

```matlab
% En matlab
>>> a.'
```

In [67]:
# Modificamos la forma del array con resize
a.resize(6,2)
a

array([[ 5.,  0.],
       [ 7.,  1.],
       [ 9.,  7.],
       [ 5.,  8.],
       [ 0.,  4.],
       [ 2.,  1.]])

In [68]:
# reshape entrega un nuevo array
# Al incluir -1 en los parametros, dejamos que numpy calcule el tamaño adecuado
a.reshape(-1,6)

array([[ 5.,  0.,  7.,  1.,  9.,  7.],
       [ 5.,  8.,  0.,  4.,  2.,  1.]])

### Concatenando arrays

In [69]:
a = np.floor( 10 * np.random.random((2,2)) )
b = np.floor( 10 * np.random.random((2,2)) )

In [70]:
a

array([[ 7.,  7.],
       [ 5.,  9.]])

In [71]:
b

array([[ 7.,  4.],
       [ 5.,  8.]])

In [72]:
# Apilando los arrays verticalemente
np.vstack( (a,b) )

array([[ 7.,  7.],
       [ 5.,  9.],
       [ 7.,  4.],
       [ 5.,  8.]])

In [73]:
# Apilando horizontalmente
np.hstack((a,b))

array([[ 7.,  7.,  7.,  4.],
       [ 5.,  9.,  5.,  8.]])

```matlab
% En matlab
>>> [a b]
```

In [76]:
# Un array de 1D 
c = np.array([1,2,3,4,5,6])
c

array([1, 2, 3, 4, 5, 6])

In [81]:
# Al agregar np.newaxis, creamos un array 2D con los datos ordenados en la columna
d = c[ :, np.newaxis]
d

array([[1],
       [2],
       [3],
       [4],
       [5],
       [6]])

```matlab
% En matlab
>>> [1:6]
```

In [82]:
np.vstack((d,d))

array([[1],
       [2],
       [3],
       [4],
       [5],
       [6],
       [1],
       [2],
       [3],
       [4],
       [5],
       [6]])

In [83]:
np.hstack((d,d,d))

array([[1, 1, 1],
       [2, 2, 2],
       [3, 3, 3],
       [4, 4, 4],
       [5, 5, 5],
       [6, 6, 6]])

### Copia de datos y vistas
Operando arrays multidimensionales, en ocasiones los datos se copian a un nuevo array y en otras no, para evitar confusiones veremos los casos.

In [84]:
a = np.arange(12)
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [85]:
# El operador = no hace copia de los datos, solo pasa la referencia al 
# puntero donde esta la informacion
b = a 
b is a 

True

In [86]:
# Los cambios realizados en b, tambien afectan al array a, esto sucede igual
# al pasar parametros en una funcion
b.resize(3,4)
a.shape

(3, 4)

#### Vistas o copia ligera
La diferencia con las vistas, es que dos objetos ndarray que observan a los mismos datos. <br>
Al hacer un recorte de un arrays, estamos creado una vista.

In [87]:
c = a.view()
c is a 

False

In [88]:
# Cambiamos la forma de los datos en c, sin que se afecte en a
c.resize((12))
c

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [89]:
a

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [90]:
# Pero al cambiar un dato en el array a ...
a[0] = -9999
c

array([-9999, -9999, -9999, -9999,     4,     5,     6,     7,     8,
           9,    10,    11])

#### Copia real de datos
El metodo copy() hace una copia completa del array y de sus datos.

In [91]:
d = a.copy()
d is a

False

In [92]:
d[0,0] = 5555
a

array([[-9999, -9999, -9999, -9999],
       [    4,     5,     6,     7],
       [    8,     9,    10,    11]])

In [93]:
d

array([[ 5555, -9999, -9999, -9999],
       [    4,     5,     6,     7],
       [    8,     9,    10,    11]])

### Arrays con mascara
Para manejar arrays de datos que puedan contener datos invalidos, por lo que es conveniente usar un array con mascara para no incluir esos datos en las operaciones.<br>
Documentacion completa: http://docs.scipy.org/doc/numpy/reference/maskedarray.generic.html

In [94]:
# Importar el modulo para arrays con mascara
import numpy.ma as ma

In [95]:
x = np.array([1,2,-1,4,5,6,-1,8,9])
mx = ma.masked_array(x , mask=[0,0,1,0,0,0,1,0,0])
mx

masked_array(data = [1 2 -- 4 5 6 -- 8 9],
             mask = [False False  True False False False  True False False],
       fill_value = 999999)

In [96]:
# En todas las operaciones sobre el array no se contaran los datos enmascarados.
mx.mean()

5.0

In [97]:
# Es posible crear una mascara con alguna condicion sobre el array.
nmx = ma.masked_array(x , mask=(x <0))
nmx

masked_array(data = [1 2 -- 4 5 6 -- 8 9],
             mask = [False False  True False False False  True False False],
       fill_value = 999999)

In [98]:
# Accediendo a la mascara
mx.mask

array([False, False,  True, False, False, False,  True, False, False], dtype=bool)

In [99]:
# Recuperar los datos validos
mx.compressed()

array([1, 2, 4, 5, 6, 8, 9])

### Salvando sesion de trabajo y compartir con matlab
Metodos adicionales, para salvar, archivos de text, binarios comprimidos, etc: http://docs.scipy.org/doc/numpy/reference/routines.io.html

In [100]:
# Arreglos de trabajo
a = np.random.random((5,5))
b = np.floor(np.random.random((11,11)) * 10)

In [101]:
# Salvar mis datos en el archivo misesion.npz
np.savez('misesion',a=a,b=b)

In [102]:
# Recuperar mi sesion
data = np.load('misesion.npz')
data.keys()

['a', 'b']

In [103]:
data['a']

array([[ 0.02291248,  0.88256019,  0.08239387,  0.73586174,  0.86282627],
       [ 0.13569382,  0.62066854,  0.07509948,  0.10983912,  0.15883764],
       [ 0.23971668,  0.31251652,  0.06951513,  0.97498177,  0.39159056],
       [ 0.34776182,  0.86918631,  0.49380112,  0.99237343,  0.37560431],
       [ 0.50752342,  0.48611792,  0.31980899,  0.44692608,  0.17743277]])

#### Recuperar datos de un archivo .mat


In [104]:
from scipy.io import loadmat

mat = loadmat('data/datos.mat')
mat

{'__globals__': [],
 '__header__': b'MATLAB 5.0 MAT-file, Platform: PCWIN64, Created on: Wed Sep 30 22:28:07 2015',
 '__version__': '1.0',
 'a': array([[ 0,  1,  4,  9, 16, 25, 36, 49, 64, 81]], dtype=uint8),
 'b': array([[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]], dtype=uint8)}

In [105]:
mat['a']

array([[ 0,  1,  4,  9, 16, 25, 36, 49, 64, 81]], dtype=uint8)

##### Salvar en un .mat

In [106]:
from scipy.io import savemat

savemat('salida.mat',{'a':a, 'b':b})