## Numpy

Creamos un array en Numpy, el cual vendria a ser una lista en Python ademas  de tener informaciones adicionales.

La ventaja de Numpy sobre Python nativo es que las librerias estan optimizadas.

In [47]:
import numpy as np

a = np.array([0, 1, 2, 3, 4, 5])
print(a)
print(a.ndim)
print(a.shape)

[0 1 2 3 4 5]
1
(6,)


In [48]:
b = a.reshape((3, 2))
print(b)
print(b.ndim)
print(b.shape)

[[0 1]
 [2 3]
 [4 5]]
2
(3, 2)


In [49]:
b[1][0] = 77
print(b)

# Se modifica 'a' tambien ya que se ha pasado por referencia.

[[ 0  1]
 [77  3]
 [ 4  5]]


In [45]:
c = a.reshape((3, 2)).copy()
c

# No se modifica 'a' ya que se ha pasado por valor.

array([[0, 1],
       [2, 3],
       [4, 5]])

In [41]:
a = np.array([0, 1, 2, 3, 4, 5])
print(a*2)
print(a**2)

[ 0  2  4  6  8 10]
[ 0  1  4  9 16 25]


En contrastes con las listas ordinarias de Python

In [37]:
[1, 2, 3, 4, 5] * 2

[1, 2, 3, 4, 5, 1, 2, 3, 4, 5]

In [39]:
[1, 2, 3, 4, 5] ** 2

TypeError: unsupported operand type(s) for ** or pow(): 'list' and 'int'

#### Indexing

In [51]:
# Se construye un objeto de tipo np.array con la lista [2, 3, 4] que van
# a servir como indices.
a[np.array([2, 3, 4])]

array([77,  3,  4])

In [52]:
# Broadcasting
a > 4

array([False, False,  True, False, False,  True], dtype=bool)

In [55]:
a[a > 4] = 4
a

array([0, 1, 4, 3, 4, 4])

#### Handling non-existing values

In [56]:
c = np.array([1, 2, np.NAN, 3, 4]) # Hemos obtenido desde un file esto.
c

array([  1.,   2.,  nan,   3.,   4.])

In [57]:
np.isnan(c)

array([False, False,  True, False, False], dtype=bool)

In [59]:
c[~np.isnan(c)]

array([ 1.,  2.,  3.,  4.])

In [60]:
np.mean(c[~np.isnan(c)])

2.5

#### Comparing runtime behaviors

In [68]:
import timeit
normal_py_sec = timeit.timeit('sum(x*x for x in range(1000))',
                              number = 10000)

naive_np_sec = timeit.timeit('sum(na*na)',
                             setup="import numpy as np; na = np.arange(1000)",
                             number = 10000)

# La funcion np.dot() al ser de numpy es mas eficiente.
good_np_sec = timeit.timeit('na.dot(na)',
                            setup = "import numpy as np; na = np.arange(1000)",
                            number = 10000)

print("Normal Python; %f sec" %normal_py_sec)
print("Naive Numpy: %f sec" %naive_np_sec)
print("Good NumPy: %f sec" %good_np_sec)


Normal Python; 1.290029 sec
Naive Numpy: 1.201938 sec
Good NumPy: 0.016972 sec


#### Cost of numpy arrays

In [71]:
# Los arreglos de numpy solo permite un tipo de variable
# No te dan la flexibilidad de los arreglas nativos de Python

a = np.array([1, 2, 3])
a.dtype

dtype('int64')

In [72]:
# Si intentamos diferentes tipos de datos, NumPy va a escoger la mejor
# cohercion entre ellos.

np.array([1, "stringy"])

array(['1', 'stringy'], 
      dtype='<U21')

In [73]:
np.array([1, "stringy", set([1, 2, 3])])

array([1, 'stringy', {1, 2, 3}], dtype=object)

## Scipy

Scipy ofrece una magnitud de algoritmos trabajando sobre los arrays de NumPy. 
En Scipy podemos encontrar librerias para la manipulacion de matrices, algebra lineal, optimizacion, clustering, operaciones espaciales, o incluso Transformacion Rapida de Fourier (FFT).

In [3]:
import scipy, numpy
print(scipy.version.full_version)
print(scipy.dot is numpy.dot)

0.17.1
True


##### cluster 
Clustering Jerarquico (cluster.hierarchy) (!)
Vector quantization / K-Means (cluster.vq)

###### constants 
Metodos de conversion para constantes matematicas y fisicas.

##### fftpack
Algoritmos para transformada de fourier discreta

###### integrate
Rutinas de integracion

###### interpolate
Interpolacion (lineal, cubica, y mas) (!)

###### io
Input y Output de la data

###### linalg
Rutinas de algebra lineal usando la librerias BLAS y LAPACK optimizadas

###### maxentropy
Funciones para encontrar la maxima entropia de los modelos

###### ndimage
Paquete para imagenes n-dimensionales

###### odr
Orthogonal distance regression

###### optimize
Optimizacion (encontrar minima y raices)

##### signal
Procesamiento de senales (!)

##### sparse
Matrices de esparcion

##### spatial
Estructuras de datos y algoritmos espaciales

##### special
Funciones matematicas como Bessel o Jacobiano

##### stats
Toolkit para estadisticas (!)

