A continuación, se desarrollará un pequeño análisis respecto a la edad, la superficie de cosecha y el sexo de los/as productores/as agropecuarios/as con información extraída de la Encuesta Nacional Agropecuaria (ENA) 2019. 


Primero, importamos Pandas y Altair para el procesamiento de datos y la realización de gráficos. Asimismo, importamos el módulo 2 de la ENA, que contiene información respecto a la superficie, cantidad y ventas de la producción agropecuaria.

In [None]:
import pandas as pd
import altair as alt

In [None]:
mod_2 = pd.read_stata("./02_Cap200_2019.dta",preserve_dtypes = False)

Nos quedamos con las columnas de nuestro interés

In [None]:
lista_2 = [ 'CCDD', 'NOMBREDD', 'CCPP', 'NOMBREPV', 'CCDI', 'NOMBREDI',
       'CONGLOMERADO', 'NSELUA', 'UA' , "P217_SUP_ha" ]
trab_mod_2 = mod_2[lista_2].copy().reset_index()

Repetimos el procedimiento para el módulo 19 de la ENA, que contiene información general del/ de la productor/a agropecuario/a y su familia

In [None]:
mod_19 = pd.read_stata("./19_Cap1100_2019.dta",preserve_dtypes = False)

In [None]:
lista_19 = [ 'CCDD', 'NOMBREDD', 'CCPP', 'NOMBREPV', 'CCDI', 'NOMBREDI',
       'CONGLOMERADO', 'NSELUA', 'UA' , "P1102", "P1103", "P1104_A"]
trab_mod_19= mod_19[lista_19].copy().reset_index()

Ya que ya solo tenemos la información relevante de ambas bases, podemos realizar el merge. En este caso, ya que la ENA use múltiples variables para identificar a una persona, todas estas serán usadas. Asimismo, usaremos el tipo de merge "inner", para no conservar información innecesaria.

In [None]:
ena_merge = pd.merge(trab_mod_2,
                     trab_mod_19,
                    on=("CCDD", "NOMBREDD", "CCPP", "NOMBREPV", "CCDI", 'NOMBREDI',
       'CONGLOMERADO', 'NSELUA', 'UA' ),
                    how = 'inner')

Ya que nos interesa la información de los/as productores/as, nos quedaremos solo con dichas personas del total de miembros de la familia. Asimismo, por temas de procesamiento de datos de altair y de estética visual, conservaremos 2000 observaciones.

In [None]:
cond_1 = ena_merge['P1102'] == "Productor/a"
ena_1 = ena_merge[cond_1].copy().reset_index()

In [None]:
ena = ena_1.loc[0:2000].copy().reset_index()

Renombramos las variables conservadas

In [None]:
nuevos_nombres = {"CCDD": "Codigo_depart", "NOMBREDD": "Nombre_depart", "CCPP": "Codigo_provincia", "NOMBREPV": "Nombre_provincia", "CCDI": "Codigo_distrito", 'NOMBREDI': "Nombre_distrito",
       'CONGLOMERADO': "Numero_conglomerado", 'NSELUA': "Numero_selec_unidad_agro", 'UA': "Unidad_agro", "P217_SUP_ha": "Superficie cosechada en hectareas", "P1102": "Parentesco", "P1103": "Sexo", "P1104_A": "Edad" }

In [None]:
ena.rename(columns = nuevos_nombres, inplace = True)

Finalmente, realizamos un gráfico de puntos, teniendo en cuenta las variables de nuestro interés

In [None]:
alt.Chart(ena, height = 500, width = 800).mark_point().encode(
    x = alt.X("Superficie cosechada en hectareas:Q"),
    y = alt.Y("Edad:Q"),
    color = "Sexo"
    ).interactive().properties(
    title={
      "text": ["Superficie cosechada por pequeños y medianos productores"], 
      "subtitle": ["Según afiliación a seguro agropecuario y marcado por sexo",
                   "Fuente: Encuesta Nacional Agropecuaria 2019"],
      "color": "Black",
      "subtitleColor": "Gray"
    })

Si bien el gráfico no muestra tendencias clara, podemos sacar algunas conclusiones de la información visual provista. En primer lugar, es importante resaltar que existen productores/as de distintas edades, por lo que la práctica agropecuaria se sigue extendiendo entre generaciones. En segundo lugar, al ser la ENA una encuesta para pequeños y medianos productores/as, no extraña que la mayor parte de estos/as tengan una superficie de cosecha menor a las dos hectáreas. En ese sentido, son pocas las personas que logran pasar esa "valla" y sus edades son, en general, variadas: principalmente entre los 30 y 70 años. Finalmente, un punto muy importante a resaltar que nos permite observar la diferenciación por colores es que la mayor parte de productores son hombres y que la presencia de mujeres se diluye aun más en cuanto aumenta el tamaño de la superficie de cosecha, por lo que se puede apreciar una clara brecha en este tipo de producción.