[View in Colaboratory](https://colab.research.google.com/github/politicasydatos/curso_intensivo_estadistica/blob/master/5_Gr%C3%A1ficos_estad%C3%ADsticos.ipynb)

![texto alternativo](https://3.bp.blogspot.com/-O3yeEI3wWN4/Wpbw8NnGFaI/AAAAAAAAABg/ZwFgqtmiwDczgu2BGJ9Qkr9mhkuCK_oogCK4BGAYYCw/s1600/Logo%2Bbanner%2B%25285%2529.png)

# Curso intensivo de estadística en Python

Con [Norman Simón Rodríguez, MSc](https://politicasydatos.blogspot.com/p/acerca-de-mi.html).

## Lección 5: Gráficos estadísticos

En este curso vamos a hacer nuestras gráficas estadísticas usando [Pandas](https://pandas.pydata.org/pandas-docs/stable/visualization.html). Si queremos hacer gráficas más avanzadas (pero un poco más difíciles de programar) tenemos librerías como Seaborn, Bokeh y Plotly, entre otras.

Pandas usa "bajo cuerda" la librería MatPlotLib, que es la librería básica de graficación estadística en Python. Vamos a importar también la librería Seaborn (no es necesaria, pero ayuda a que los gráficos queden más bonitos).

In [0]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="white", font_scale=1.5)

Y vamos a importar algunos datos de una hoja de cálculo de Google Spreadsheets:

**IMPORTAR DESDE URL!!!!!**

In [0]:
#@title
!pip install --upgrade -q gspread

from google.colab import auth
auth.authenticate_user()

import gspread
from oauth2client.client import GoogleCredentials

gc = gspread.authorize(GoogleCredentials.get_application_default())

# Datos de personas
personas = gc.open('datos_seaborn').sheet1
personas = personas.get_all_values() # get_all_values genera una lista de filas.
personas = pd.DataFrame.from_records(personas)
personas.columns = ['nombre', 'mes', 'turnos']
personas['turnos'] = personas['turnos'].astype(int)

# Datos de tasas de cambio
#monedas = gc.open('datos_seaborn').sheet2
#monedas = monedas.get_all_values() # get_all_values genera una lista de filas.
#monedas = pd.DataFrame.from_records(monedas)

personas
#monedas

# Gráfica de barras

Vamos a crear un gráfico de barras sencillo que nos mostrará cuántos turnos tiene cada persona sólo en el mes de **enero**. Para lograrlo, primero filtramos la tabla para tener únicamente los turnos de dicho mes.

In [0]:
enero = personas[personas['mes'] == 'enero']
enero

Y graficamos el diagrama de barras con Pandas:

In [0]:
grafico_barras = enero.plot(x='nombre', y='turnos', kind='bar', legend=False)
plt.title("Turnos de enero")
plt.xlabel("Nombres")
plt.xticks(rotation=0)
plt.ylabel("Turnos")
plt.show(grafico_barras)

Y ahora un diagrama de barras agrupadas con los turnos de todos los meses

In [0]:
grafico_barras_agrupadas = personas.plot(x='nombre', y='turnos', hue='mes')
plt.xlabel("Nombres")
plt.ylabel("Turnos")
plt.title("Turnos")
#plt.legend(loc='upper right')
plt.show(grafico_barras_agrupadas)

# Diagrama de líneas

Vamos a importar nuestros datos (Fuente: [Banco de la República de Colombia, 2018](http://www.banrep.gov.co/es/-estadisticas)).

In [0]:
url = 'https://raw.githubusercontent.com/politicasydatos/curso_intensivo_estadistica/master/datos/salarios_ipc_banrep.csv'
banrep = pd.read_csv(url)
banrep.dtypes

Procedamos a hacer un gráfico de líneas que muestre la evolución del Índice de Precios al Consumidor (IPC) a lo largo del tiempo.

In [0]:
ipc_plot = banrep.plot(x='anio', y='ipc_dic_2008')
plt.suptitle("Índice de Precios al Consumidor (diciembres)")
plt.title("Fuente: Banco de la República", fontsize=14)
plt.xlabel("Año")
plt.ylabel("IPC (base diciembre de 2008)")
plt.show()

Y añadamos una serie adicional para ver la evolución del salario mínimo legal mensual:

In [0]:
ipc_plot = banrep.plot(kind='line', x='anio', y='ipc_dic_2008', label="IPC")
salmin_plot = banrep.plot(x='anio', y='salmin', secondary_y=True, ax=ipc_plot, label="Salario mínimo")
ipc_plot.set_xlabel('Año')
ipc_plot.set_ylabel('IPC')
salmin_plot.set_ylabel('Salario mínimo')
plt.suptitle("Índice de precios y salario mínimo")
plt.title("Fuente: Banco de la República", fontsize=14)
#plt.ylabel("IPC (base diciembre de 2008)")
plt.show()