
## Matplotlib, un gráfico vale más que mil palabras

Python es un lenguaje muy completo pero, aunque es muy grande, su librería estándar no es infinita. Por suerte hay [miles y miles de bibliotecas extras](https://pypi.python.org) para complementar casi cualquier aspecto en el que queramos aplicar Python. En algunos ámbitos, con soluciones muy destacadas.

Para hacer gráficos la opción canónica es Matplotlib http://matplotlib.org/ . Ya viene instalado con la versión completa de Anaconda.

In [None]:
%matplotlib inline     

In [None]:
from matplotlib import pyplot   # generalmente importado "as plt"

In [None]:
x = []
for i in range(-50, 51):
    x.append(0.1 * i)
x

Antes de continuar, basta de lazos para armar listas **Listas por comprensión**

In [None]:
x = [0.1 * i for i in range(-50, 51)]

In [None]:
y = [x_i ** 2 for x_i in x]

In [None]:
pyplot.plot(x,y)

Los gráficos emergentes son buenos porque tiene la barra de herramientas (interactividad) y podemos guardarlos en excelente calidad a golpe de mouse. Pero en los notebooks podemos poner los gráficos directamente incrustados

In [None]:
%matplotlib inline

In [None]:
pyplot.plot(x,y)
pyplot.title('Pará bola!')
pyplot.scatter([0, 2], [15, 25])
pyplot.annotate(s='un punto', xy=(0, 15), xytext=(0.3, 15.2))
pyplot.annotate(s='otro un punto', xy=(2, 25), xytext=(2.3, 25.2))
pyplot.grid()

Matplotlib sabe hacer muchísimos tipos de gráficos!

In [None]:
import random
campana = []
for i in range(1000):
    campana.append(random.gauss(0, 0.5))

In [None]:
pyplot.hist(campana, bins=15);

### La "papa" de matplotlib

   **Este es el algoritmo más importante para graficar con matplotlib**

1. Ir a http://matplotlib.org/gallery
2. Elegir el gráfico de ejemplo que más se parezca a lo que queremos lograr
3. Copiar el código del ejemplo y adaptarlo a nuestros datos y gustos

In [None]:
import numpy as np
import matplotlib.pyplot as plt


N = 20
theta = np.linspace(0.0, 2 * np.pi, N, endpoint=False)
radii = 10 * np.random.rand(N)
width = np.pi / 4 * np.random.rand(N)

ax = plt.subplot(111, projection='polar')
bars = ax.bar(theta, radii, width=width, bottom=0.0)

# Use custom colors and opacity
for r, bar in zip(radii, bars):
    bar.set_facecolor(plt.cm.jet(r / 10.))
    bar.set_alpha(0.5)

plt.show()

Antes continuar se debe ver el corazón del Python Cientifico: **Numpy**

## Numpy, todo es un array

El paquete **numpy** es usado en casi todos los cálculos numéricos usando Python. Es un paquete que provee a Python de estructuras de datos vectoriales, matriciales y de rango mayor, de alto rendimiento. Está implementado en C y Fortran, de modo que cuando los cálculos son vectorizados (formulados con vectores y matrices), el rendimiento es muy bueno.

In [None]:
import numpy as np

El pilar de numpy (y toda la computación científica basada en Python) es el tipo de datos `ndarray`, o sea arreglos de datos multidimensionales.

¿Otra secuencia más? ¿pero que tenían de malo las listas?

Las listas son geniales paro guardar **cualquier tipo de objeto**, pero esa flexibilidad las vuelve ineficientes cuando lo que queremos es almacenar datos homogéneos

In [None]:
%timeit [0.1*i for i in range(10000)]    # %timeit es otra magia de ipython

In [None]:
%timeit np.arange(0, 1000, .1)    # arange es igual a range, pero soporta paso de tipo flotante y devuelve un array

In [None]:
%%timeit -o
X = range(10000000)
Y = range(10000000)
Z = [(x + y) for x,y in zip(X,Y)]

In [None]:
%%timeit -o
X = np.arange(10000000)
Y = np.arange(10000000)
Z = X + Y

In [None]:
__.best / _.best

Existen varias formas para inicializar nuevos arrays de numpy, por ejemplo desde

- Listas o tuplas
- Usando funciones dedicadas a generar arreglos numpy, como `arange`, `linspace`,`ones`, `zeros` etc.
- Leyendo datos desde archivos

In [None]:
v = np.array([1,2,3,4])
v

In [None]:
# una matriz: el argumento de la función array function es una lista anidada de Python
M = np.array([[1, 2],
              [3, 4.0]])
M

In [None]:
type(v), type(M)

### Dimensiones, tamaño, tipo, forma

Los ndarrays tienen distintos atributos. Por ejemplo

In [None]:
v.ndim, M.ndim    # cantidad de dimensiones

In [None]:
v.shape, M.shape  # tupla de "forma". len(v.shape) == v.ndim

In [None]:
v.size, M.size   # cantidad de elementos.

In [None]:
M.T   # transpuesta!

A diferencia de las listas, los *arrays* tambien **tienen un tipo homogéneo**

In [None]:
v.dtype, M.dtype    #

Se puede definir explicitamente el tipo de datos del array

In [None]:
np.array([[1, 2], [3, 4]], dtype=complex)

Una gran ventaja del atributo `shape` es que podemos cambiarlo. Es decir, reacomodar la distrución de los elementos (por supuesto, sin perderlos en el camino)

In [None]:
A = np.arange(0, 12)
A.shape

In [None]:
A.shape = 3, 4
A

El método `reshape` es otra manera de definir la forma de un array, generando uno nuevo array (a diferencia de `A.shape` que simplemente es otra vista del mismo array)

In [None]:
A = np.arange(12).reshape((3,4))
A

### Vistas

Esto es porque numpy en general no mueve los elementos de la memoria y en cambio usa **vistas** para mostrar los elementos de distinta forma. Es importante entender esto porque incluso los slicings son vistas.

In [None]:
a = np.arange(10)
a

In [None]:
a = np.arange(10)
b = a[::2]  # todo de 2 en 2
b

In [None]:
b[0] = 12
a  # chan!!!

En cambio

In [None]:
c = np.arange(10)
d = c[::2].copy()
d[0] = 12
c

Una forma de saber si un array es "base" o hereda los datos de otro array (es una vista), es verificar el atributo `base`

In [None]:
b.base is a and a.base is None

### Otras funciones constructuras de arrays


Además de `arange` hay otras funciones que devuelven arrays. Por ejemplo `linspace`, que a diferencia de `arange` no se da el tamaño del paso, sino la cantidad de puntos que queremos en el rango

In [None]:
np.linspace(0, 2 * np.pi, 100)      # por defecto, incluye el limite.

In [None]:
_.size   # en cualquier consola, python guarda el ultimo output en la variable _

In [None]:
matriz_de_ceros = np.zeros((4,6))
matriz_de_ceros

In [None]:
np.ones((2, 4))

Pero numpy no sólo nos brinda los arrays. Los conceptos claves que aporta son *vectorización* y *broadcasting*

### Vectorización y funciones universales

La **vectorización** define que las operaciones aritméticas entre arrays de igual forma se realizan implicitamente **elemento a elemento**, y por lo tanto hay una **ausencia de iteraciones explícitas y de indización**. 
La vectorización tiene muchas ventajas:

* El código vectorizado es más conciso y fácil de leer.
* Menos líneas de código habitualmente implican menos errores.
* El código se parece más a la notación matemática estándar (por lo que es más fácil,
por lo general, corregir código asociado a construcciones matemáticas
* La vectorización redunda en un código más "pythónico"

In [None]:
import numpy as np
a = np.array([3, 4.3, 1])
b = np.array([-1, 0, 3.4])
c = a * b
c

Para dar soporte a la vectorización, numpy reimplementa funciones matemáticas como "funciones universales", que son aquellas que funcionan tanto para escalares como para arrays

In [None]:
import math
math.sin(a)

In [None]:
np.sin(a)

In [None]:
# y funciona para simples escalares
np.sin(0)

## Broadcasting


El **broadcasting** (*difusión*) es el otro concepto importante. Describe el **comportamiento de las operaciones con arrays de distinta forma**. Con ciertas restricciones, se trata de que el array de menores dimensiones se "difunde" al más grande, siempre que tengan formas compatibles

En Numpy todas las operaciones adoptan por defecto un comportamiento de este tipo (no sólo las operaciones
aritméticas sino las lógicas, las funcionales y las de nivel de bits)

La forma más obvia de observar el broadcasting es cuando se opera un array con un escalar

In [None]:
a = np.array([1., 2., 3.])
b = 2.
a * b

podemos interpretar que el escalar  `b` es un array adimensional que "se estira" para ser compatible con las dimensiones de `a`

![](img/image001.gif)

#### Regla general del broadcasting

       Dos arrays son compatibles para operar via *broadcasting* si sus dimensiones 
       (de atrás hacia adelante) son iguales o alguna es 1. 


En otras palabras:

      Debe cumplirse que el `shape` de uno sea "sufijo" del `shape` del otro array (1 es comodin) 


In [None]:
a = np.array([[ 0.0, 0.0, 0.0],
              [10.0, 10.0, 10.0],
              [20.0, 20.0, 20.0],
              [30.0, 30.0, 30.0]])
b = np.array([1.0, 2.0, 3.0])

a.shape, b.shape   # son compatibles para broadcasting

In [None]:
a + b

![](img/image002.gif)

In [None]:
a = np.array([0.0, 10.0, 20.0, 30.0])
b = np.array([1.0, 2.0, 3.0])

#fails
a + b

Pero podemos elevar la dimensionalidad de `a` (agregar una dimensión sin cambiar los elementos) para poder operar entre los dos arrays

In [None]:
a =  a.reshape((4,1))   # equivalente a  a[:,np.newaxis]
b = np.array([0.0, 1.0, 2.0])
a + b

![](img/image004.gif)

### Funciones de reducciones/agregación

numpy tiene muchas funciones y/o métodos de "reducción", que sumarizan información del array. Por ejemplo: sumatoria, media, maximo y minimo, etc.

In [None]:
x = np.array([1, 2, 3, 4])
np.sum(x)

Las funciones más importantes también se implementan como métodos

In [None]:
x.sum()

Cuando tenemos un array de más de una dimensión podemos aplicar la función por ejes, a traves del parámetro `axis`

![](img/reductions.png)

In [None]:
x = np.array([[1, 1], [2, 2]])
x.sum(axis=1)

### Funciones de transformación

La función `diag` poner un array 1D en diagonal (convirtiendolo en 2D) o bien extraer una diagonal de un array 2D dado.

In [None]:
np.diag([1,2,3,4, 4])

Podemos decirle qué diagonal con un offset entero

In [None]:
np.diag([1,2,3], k=-1)

In [None]:
np.diag(np.arange(30).reshape(5,6))

`rot90` permite rotar un array multidimensional

In [None]:
A

In [None]:
np.rot90(A)

In [None]:
np.rot90(A, k=2)  # rotamos 180º

### Lectura desde texto y archivos

Como numpy se especializa en manejar números, tiene muchas funciones para crear arrays a partir de información numérica a partir de texto o archivos (como los CSV, por ejemplo).

In [None]:
a_desde_str = np.fromstring("""1.0 2.3   3.0 4.1
-3.1 2  5.0 4.5""", sep=" ", dtype=float)
a_desde_str.shape = (2, 4)
a_desde_str

Para cargar desde un archivo existe la función `loadtxt`. Por ejemplo tenemos el archivo `data/critical.dat` que es el resultado del cálculo de una linea crítica global para un sistema químico binario.

In [None]:
!head ../datos/critical.dat

In [None]:
np.loadtxt?

Vemos que el patrón es en columnas separadas por espacios en blanco y las dos primeras filas son headers

In [None]:
cri_data = np.loadtxt('../datos/critical.dat', skiprows=2, usecols=[0, 1, 2, 3])
cri_data.shape

Por defecto, devuelve una matriz 2D `numero_lineas` x `columnas`, o sea, la fila 0 es la primer linea de números

In [None]:
cri_data[:, 0]

Si directamente queremos los vectores (las columnas), podemos pedir que "desempaque" las columnas

In [None]:
t, p, d, x = np.loadtxt('../datos/critical.dat', skiprows=2, usecols=[0, 1, 2, 3], unpack=True)   # o loadtxt().T

In [None]:
t

In [None]:
t.size

Podemos graficar algo sencillo

In [None]:
%matplotlib inline

In [None]:
from matplotlib import pyplot
pyplot.plot(, p, 'r')   # el tercer parámetro es el formato
pyplot.title('Critical pressure vs temperature')
pyplot.grid()
pyplot.xlabel('Temperature [K]')
pyplot.ylabel('Pressure [bar]')
# el punto y coma evita el output
pyplot.show();