Visualización de datos
===

#### Contenido

> * [Matplotlib](#Matplotlib)
> * [Seaborn](#Seaborn)
> * [Bokeh](#Bokeh)
> * [Plotly](#Plotly)
> * [NetworkX](#NetworkX)

# Matplotlib

[Contenido](#Contenido)

Existen varios recursos externos para el aprendizaje de matpotlib. Algunos son listados [aquí](http://matplotlib.org/resources/index.html).

[Aquí](http://nbviewer.jupyter.org/github/jrjohansson/scientific-python-lectures/blob/master/Lecture-4-Matplotlib.ipynb) hay un tutorial escrito en Jupyter sobre matplotlib que ilustra como resolver muchos problemas comunes en la elaboración de gráficos. 

A continuación hay varios ejemplos autoexplicativos que tienen como fin ilustrar rápidamente las capacidades básicas de matplotlib. 

Para manejar la librería, usualmente se define el tipo de gráfico que se necesita y se buscan ejemplos con características similares en la [galería](http://matplotlib.org/gallery.html). 

In [None]:
%matplotlib inline

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl

In [None]:
x = range(100)
y = [value ** 2 for value in x]
plt.plot(x, y)
plt.show()

In [None]:
import math
T = range(100)
X = [(2 * math.pi * t) / len(T) for t in T]
Y = [math.sin(value) for value in X]
plt.plot(X, Y)

In [None]:
data = [5., 25., 50., 20.]
plt.bar(range(len(data)), data)
plt.show()

In [None]:
data = [5., 25., 50., 20.]
plt.barh(range(len(data)), data)
plt.show()

In [None]:
data = [[5., 25., 50., 20.],
        [4., 23., 51., 17.],
        [6., 22., 52., 19.]]
X = np.arange(4)
plt.bar(X + 0.00, data[0], color = 'b', width = 0.25)
plt.bar(X + 0.25, data[1], color = 'g', width = 0.25)
plt.bar(X + 0.50, data[2], color = 'r', width = 0.25)
plt.show()

In [None]:
mu, sigma = 1, 0.1 # mean and standard deviation
X = np.random.normal(mu, sigma, 1000)
plt.hist(X, bins = 50)
plt.show()

In [None]:
X = np.random.randn(1000)
plt.hist(X, bins = 50)
plt.show()

In [None]:
data = np.random.randn(100)
plt.boxplot(data)
plt.show()

In [None]:
data = np.random.randn(100, 5)
plt.boxplot(data)
plt.show()

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.tri as tri
data = np.random.rand(100, 2)
triangles = tri.Triangulation(data[:,0], data[:,1])
plt.triplot(triangles)
plt.show()

In [None]:
import numpy as np
import matplotlib.pyplot as plt
A = np.random.standard_normal((100, 2))
A += np.array((-1, -1)) # Center the distrib. at <-1, -1>
B = np.random.standard_normal((100, 2))
B += np.array((1, 1)) # Center the distrib. at <1, 1>
plt.scatter(A[:,0], A[:,1], color = '.25')
plt.scatter(B[:,0], B[:,1], color = '.75')
plt.show()

---

**Ejercicio.** Construya una gráfica similar a la siguiente usando el archivo `indicadores-mundiales.csv`. Se grafica la suma del porcetaje de la población por regiones.

![alt text](images/suma-pob-region-edades-1.png)

**Ejercicio.** Construya una gráfica similar a la siguiente usando el archivo `indicadores-mundiales.csv`. Se grafica la suma del porcetaje de la población por regiones.

<img src="images/suma-pob-region-edades-2.png" width=700>

**Ejercicio.** Construya una gráfica similar a la siguiente usando el archivo `indicadores-mundiales.csv`. Se grafica la suma del porcetaje de la población por regiones.

<img src="images/suma-pob-region-edades-3.png" width=600>

**Ejercicio.** Construya una gráfica similar a la siguiente usando el archivo `indicadores-mundiales.csv`. Promedio de gastos per capita por año.

<img src="images/prom-gastos-salud-per-capita-ano.png" width=400>

# Seaborn

[Contenido](#Contenido)

> [seaborn](https://seaborn.pydata.org/index.html)

Seaborn es una biblioteca de visualización de datos de Python basada en matplotlib. Proporciona una interfaz de alto nivel para dibujar gráficos estadísticos atractivos e informativos.

```
pip install seaborn
```

El sitio web del paquete ofrece ejemplos y material sobre el uso de la librería.

Ejecute el siguiente ejemplo para verificar que la librería funciona correctamente.

In [None]:
%matplotlib inline

In [None]:
import seaborn as sns
sns.set(style="darkgrid", palette="deep")

In [None]:
import numpy as np
import pandas as pd

np.random.seed(0)
x = np.random.randn(100)

sns.distplot(x)

In [None]:
from scipy.stats import norm

sns.distplot(x, fit=norm, kde=True)

In [None]:
x = range(100)
y = [value ** 2 for value in x]

sns.lineplot(x, y)

In [None]:
import math
T = range(100)
X = [(2 * math.pi * t) / len(T) for t in T]
Y = [math.sin(value) for value in X]
sns.lineplot(X, Y)

In [None]:
A = np.random.standard_normal((100, 2))
A += np.array((-1, -1)) # Center the distrib. at <-1, -1>
A = pd.DataFrame(A, columns=['num1', 'num2'])
A['type'] = 'A'
B = np.random.standard_normal((100, 2))
B += np.array((1, 1)) # Center the distrib. at <1, 1>
B = pd.DataFrame(B, columns=['num1', 'num2'])
B['type'] = 'B'
data = pd.concat([A,B])

sns.scatterplot(data=data, x="num1", y="num2", hue="type")

---

In [None]:
import pandas as pd

im = pd.read_csv('files/indicadores-mundiales.csv', sep=';', encoding='latin1')

for col in ['Poblacion 0-14','Poblacion 15-64', 'Poblacion 65+']:
    im[col] = im[col].apply(lambda x: float(x.replace('nulo', '0').replace('%', '').replace(',', '.')))
    
im.info()

In [None]:
im[['Poblacion 0-14','Poblacion 15-64', 'Poblacion 65+']].head()

**Ejercicio.** Construya una gráfica similar a la siguiente usando el archivo `indicadores-mundiales.csv`. Se grafica la suma del porcetaje de la población por regiones.

![alt text](images/suma-pob-region-edades-1.png)

In [None]:
f, axes = plt.subplots(1, 3, figsize=(20, 6))

for i, col in enumerate(['Poblacion 0-14','Poblacion 15-64', 'Poblacion 65+']):
    sns.barplot(data=im, y='Region', x=col, ax=axes[i])

**Ejercicio.** Construya una gráfica similar a la siguiente usando el archivo `indicadores-mundiales.csv`. Se grafica la suma del porcetaje de la población por regiones.

<img src="images/suma-pob-region-edades-2.png" width=700>

**Ejercicio.** Construya una gráfica similar a la siguiente usando el archivo `indicadores-mundiales.csv`. Se grafica la suma del porcetaje de la población por regiones.

<img src="images/suma-pob-region-edades-3.png" width=600>

**Ejercicio.** Construya una gráfica similar a la siguiente usando el archivo `indicadores-mundiales.csv`. Promedio de gastos per capita por año.

<img src="images/prom-gastos-salud-per-capita-ano.png" width=400>

[Contenido](#Contenido)