#  Big Data y Machine Learning (UBA) 2025
## Clase 1 - Parte 2 - Bonus de Visualización con Seaborn

**Objetivo:**

Este Jupyter Notebook, ilustra como incorporar los tres principios de visualización de [Schwabish (2014)](https://www.aeaweb.org/articles?id=10.1257/jep.28.1.209) para visualizar información de la Tabla 2 del trabajo de [Allen (2019)](https://onlinelibrary.wiley.com/doi/abs/10.1111/ehr.12661) pag. 104. Conb dicha información, Allen (2019) hace un punto interesante al comparar dos formas de medir el share de agricultura en la economía de Inglaterra del s. XVII al XIX.

Usaremos el modulo de `seaborn`, también muy utilizada en procesamiento y visualización de datos en Python. Para más información ver [seaborn](https://seaborn.pydata.org/)

In [None]:
# Primero, installamos el paquete
#!pip install seaborn

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

In [None]:
# Datos en la Tabla 2. pagina 104
years = [1688, 1759, 1798, 1846, 1867]
serie1 = [46, 46, 35, 21, 15]
serie2 = [39, 38, 33, 20, 20]

# Crear DataFrames para cada serie
df1 = pd.DataFrame({'Years': years, 'Value_added': serie1})
df2 = pd.DataFrame({'Years': years, 'Labour_force': serie2})

In [None]:
# Configurar el estilo de Seaborn
sns.set(style="whitegrid")

# Crear un figura con dos subplots
fig, axs = plt.subplots(1, 2, figsize=(10, 6))

# Gráfico de barras para Serie 1
sns.barplot(x='Years', y='Value_added', data=df1, ax=axs[0], alpha=0.9)
axs[0].set_title('Value Added')
axs[0].set_ylim(0,50)

# Gráfico de barras para Serie 2
sns.barplot(x='Years', y='Labour_force', data=df2, ax=axs[1], alpha=0.9)
axs[1].set_title('Labour Force')
axs[1].set_ylim(0,50)

# Etiquetas para los ejes
for ax in axs:
    ax.set_xlabel('Years')
    ax.set_ylabel('Valor')

# Layout ajustado
fig.tight_layout()

# Mostrar los gráficos
plt.show()

Dicha figura ilustra mucho mejor un punto que destaca el autor Allen (2019) en el trabajo: el share de la agricultura en la economía de Inglaterra cae más (un 20 puntos porcentuales) mucho entre 1688 y 1867 cuando se usa la medición por la fuerza laboral (panel de la derecha). Esta diferencia en ambas mediciones (sobretodo para 1688: 46% vs. 39% de share de agricultura) se debe a que las rentas agriculas tienen mayor peso en la medición por valor agregado (panel de la izquierda), mientras que los salarios agricolas eran muy bajos en 1688.