## 1. Datos de esperanza de vida de Naciones Unidas
<p>La esperanza de vida al nacer es una medida del promedio del número de años que se espera que viva un ser humano. Tiene en cuenta varios factores demográficos como el género, el país o el año de nacimiento.</p>
<p>La esperanza de vida al nacer puede variar a lo largo del tiempo o entre países debido a muchas razones: la evolución de la medicina, el grado de desarrollo de los países o el efecto de los conflictos armados. La esperanza de vida también varía según el género. Los datos muestran que las mujeres viven más que los hombres. ¿Por qué? Varios factores potenciales, incluidas las razones biológicas y la teoría de que las mujeres tienden a ser más conscientes de la salud.</p>
<p>Hagamos algunos gráficos para explorar las desigualdades sobre la esperanza de vida al nacer en todo el mundo. Utilizaremos un conjunto de datos de la División de Estadística de la Organización de las Naciones Unidas, que está disponible <a href="http://data.un.org/Data.aspx?d=GenderStat&f=inID:37&c=1,2,3,4,5,6&s=crEngName:asc,sgvEngName:asc,timeEngName:desc&v=1">aquí</a>.</p>

In [None]:
# Este código determina el tamaño del gráfico
# en el Jupyter Notebook
options(repr.plot.width = 6, repr.plot.height = 6)

# Carga los paquetes 
# .... TU CÓDIGO PARA LA TAREA 1 ....

# Carga tus datos
life_expectancy <- ....

# Utiliza una función para ver las primeras 10 observaciones
# .... YOUR CODE FOR TASK 1 ....

## 2. Esperanza de vida por sexo y país
<p>Haremos algunas manipulaciones a los datos para facilitar nuestra exploración. Construiremos el dataset para nuestro primer gráfico en el que representaremos la esperanza de vida promedio de hombres y mujeres en todos los países durante el último período registrado en nuestros datos (2000-2005).</p>

In [None]:
# Subselecciona y utiliza las funciones de reshape
subdata <- life_expectancy  %>% 
    # .... TU CÓDIGO PARA LA TAREA 2 ....

# Ve las primeras observaciones
# .... TU CÓDIGO PARA LA TAREA 2 ....

## 3. Visualicemos
<p>Un diagrama de dispersión es una forma útil de visualizar la relación entre dos variables. Es un diagrama simple en el que los puntos están dispuestos en dos ejes, cada uno de los cuales representa una de esas variables. </p>
<p>Creemos un diagrama de dispersión usando <code>ggplot2</code> para representar la esperanza de vida de los hombres (en el eje x) frente a las mujeres (en el eje y). Crearemos un gráfico sencillo en este paso, sin muchos detalles. Nos ocuparemos de este tipo de cosas en breve.</p>

In [None]:
# Grafica la esperanza de vida para hombres y mujeres
# .... TU CÓDIGO PARA LA TAREA 3 ....

## 4. Líneas de referencia
<p>Un buen gráfico debe ser fácil de entender. Hay muchas funciones en <code>ggplot2</code> que nos ayudan a lograrlo. Exploremos algunas de ellas empezanso por el gráfico anterior. Primero, pongamos los mismos límites en ambos ejes y añadamos una línea de referencia de 45 grados en nuestra visualización. Con esto, la diferencia en nuestro indicador (esperanza de vida) será más fácil de entender.</p>
<p>Cuando termines esta tarea te darás cuenta que la mayoría de los puntos están colocados arriba de la diagonal y muy dispersos entre ellos. ¿Eso qué significa?</p>

In [None]:
# Añade una geom_abline que pase por cero en cuando x=0
# y que tenga una pendiente m=1 
# .... SOLUCIÓN DE LA TAREA 3 ....
# .... TU CÓDIGO DE LA TAREA 4 ....

## 5. Títulos y etiquetas
<p>Un punto clave para hacer que un gráfico sea comprensible es colocar etiquetas claras. Agreguemos títulos, etiquetas de los ejes y una leyenda para referir a la fuente de datos. Cambiemos también la apariencia para hacerlo más claro.</p>

In [None]:
# Etiquetando el gráfico anterior
ggplot(subdata, aes(x=hombre, y=mujer))+
  geom_point(colour="white", fill="chartreuse3", shape=21, alpha=.55, size=5)+
  geom_abline(intercept = 0, slope = 1, linetype=2)+
  scale_x_continuous(limits=c(35,85))+
  scale_y_continuous(limits=c(35,85))+
  labs(title=....,
       subtitle="Años estimados promedio (2000-2005)",
       caption=....,
       x=....,
       y=....)

## 6. Resaltando países seleccionados
<p>Ahora, etiquetaremos algunos puntos de nuestro gráfico con el nombre del país correspondiente. Queremos llamar la atención sobre algunos países donde la brecha en la esperanza de vida entre hombres y mujeres es significativamente alta. Estos serán los toques finales en este primer gráfico.</p>

In [None]:
# Subseleccionar los datos para obtener países de interés
top_hombre <- subdata %>% arrange(hombre-mujer) %>% head(3)
top_mujer <- subdata %>% arrange(mujer-hombre) %>% head(3)

# Añadiendo texto a la gráfica anterior
ggplot(subdata, aes(x=hombre, y=mujer, ....))+
  geom_point(colour="white", fill="chartreuse3", shape=21, alpha=.55, size=5)+
  geom_abline(intercept = 0, slope = 1, linetype=2)+
  scale_x_continuous(limits=c(35,85))+
  scale_y_continuous(limits=c(35,85))+
  labs(title="Esperanza de vida al nacer, por país y sexo",
       subtitle="Años estimados promedio (2000-2005)",
       caption="Fuente: División de Estadística de Naciones Unidas",
       x="Hombres",
       y="Mujeres")+
# .... TU CÓDIGO PARA LA TAREA 6 ....


## 7. Evolución de la esperanza de vida por sexo
<p>Dado que nuestros datos contienen información histórica, veamos ahora cómo ha evolucionado la esperanza de vida en los últimos años. Nuestro segundo diagrama representará la diferencia entre hombres y mujeres en los países entre dos períodos: 2000-2005 y 1985-1990.</p>
<p>Creemos un objeto llamado <code>subdata2</code> con información para nuestro segundo gráfico. </p>

In [None]:
# Subselecciona, crea y aplica el reshape a la base
subdata2 <- life_expectancy %>% 
  filter(Year %in% c("1985-1990", "2000-2005")) %>% 
  mutate(Sub_Year=paste(Subgroup, Year, sep="_")) %>% 
  mutate(Sub_Year=gsub("-", "_", Sub_Year)) %>% 
  select(-Subgroup, -Year) %>% 
# .... TU CÓDIGO PARA LA TAREA 7 ....


# Imprime las primeras observaciones
# .... TU CÓDIGO PARA LA TAREA 7 ....

## 8. Segunda visualización
<p>Ahora crea una segunda gáfica en donde se represente la diferencia en la esperanza de vida, por sexo, entre "1985-1990" y "2000-2005".</p>

In [None]:
# Gráfico con líneas de referencia, ejes y etiquetas
ggplot(subdata2, aes(x=...., y=...., label=pais_o_region))+
  geom_point(colour="white", fill="chartreuse3", shape=21, alpha=.55, size=5)+
  geom_abline(intercept = 0, slope = 1, linetype=2)+
# .... TU CÓDIGO PARA LA TAREA 8 ....
  labs(title="Esperanza de vida al nacer, por país y sexo",
       subtitle="Diferencia entre 1985-1990 y 2000-2005",
       caption="Fuente: División de Estadística de Naciones Unidas",
       x="Hombres",
       y="Mujeres")+
theme_bw()

## 9. Más líneas de referencia
<p>Agregar líneas de referencia puede hacer que las gráficas sean más fáciles de entender. Ya agregamos una línea diagonal para visualizar las diferencias entre hombres y mujeres más claramente. Ahora agregaremos dos líneas más para ayudar a identificar en qué países las personas aumentaron o disminuyeron su esperanza de vida en el período analizado.</p>

In [None]:
# Añade una hline y vline al gráfico anterior
ggplot(subdata2, aes(x=dif_hombre, y=dif_mujer, label=pais_o_region))+
  geom_point(colour="white", fill="chartreuse3", shape=21, alpha=.55, size=5)+
  geom_abline(intercept = 0, slope = 1, linetype=2)+
  scale_x_continuous(limits=c(-25,25))+
  scale_y_continuous(limits=c(-25,25))+
# .... TU CÓDIGO PARA LA TAREA 9 ....
  labs(title="Esperanza de vida al nacer, por país y sexo",
       subtitle="Diferencia entre 1985-1990 y 2000-2005",
       caption="Fuente: División de Estadística de Naciones Unidas",
       x="Hombres",
       y="Mujeres")+
theme_bw()

## 10. Últimos detalles
<p>Como hicimos en el primer gráfico, etiquetemos algunos puntos. Concretamente, señalaremos los tres donde la esperanza de vida promedio sumada para hombres y mujeres aumentó más y los tres donde disminuyeron más en el período.</p>

In [None]:
# Subseleccionar para obtener países de interés
top <- subdata2 %>% arrange(dif_hombre+dif_mujer) %>% head(3)
bottom <- ....

# Añadir las etiquetas de interés
ggplot(subdata2, aes(x=dif_hombre, y=dif_mujer, label=pais_o_region), guide=FALSE)+
  geom_point(colour="white", fill="chartreuse3", shape=21, alpha=.55, size=5)+
  geom_abline(intercept = 0, slope = 1, linetype=2)+
  scale_x_continuous(limits=c(-25,25))+
  scale_y_continuous(limits=c(-25,25))+
  geom_hline(yintercept=0, linetype=2)+
  geom_vline(xintercept=0, linetype=2)+
  labs(title="Esperanza de vida al nacer, por país y sexo",
       subtitle="Diferencia entre 1985-1990 y 2000-2005",
       caption="Fuente: División de Estadística de Naciones Unidas",
       x="Hombres",
       y="Mujeres")+
# .... TU CÓDIGO PARA LA TAREA 10 ....
  theme_bw()