In [None]:
'''
1. Número de estudiantes asociados/egresados/titulados en área de la agricultura de los últimos 20 años
2. Mapeo de agricultores, ¿Qué se está cultivando y en qué zonas?
3. Base de datos asociadas a agricultura
4. Montos de proyectos asociados a agricultura
5. Catastro frutícola, ¿Cuántas hectáreas de la macrozona centro sur se han establecido con cultivos frutícolas en los últimos 20 años?
6. Datos del último censo agrícola
'''
# De datos extraidos desde mineduc titulados podemos extraer información relevante al área, sin embargo los datos incluidos
# en mineduc comprenden desde el año 2007 hasta 2019 dispnibles en:
# https://bit.ly/2DnDKIV

!pip install pandas
!pip install altair

import pandas as pd
import altair as alt

# Para pregunta 1
urls = ['http://datos.mineduc.cl/datasets/193402-titulados-de-educacion-superior-2019.download/',
        'http://datos.mineduc.cl/datasets/190756-titulados-de-educacion-superior-2018.download/',
        'http://datos.mineduc.cl/datasets/185829-titulados-de-educacion-superior-2017.download/',
        'http://datos.mineduc.cl/datasets/179074-titulados-de-educacion-superior-2016.download/',
        'http://datos.mineduc.cl/datasets/179073-titulados-de-educacion-superior-2015.download/',
        'http://datos.mineduc.cl/datasets/179072-titulados-de-educacion-superior-2014.download/',
        'http://datos.mineduc.cl/datasets/179071-titulados-de-educacion-superior-2013.download/',
        'http://datos.mineduc.cl/datasets/179070-titulados-de-educacion-superior-2012.download/',
        'http://datos.mineduc.cl/datasets/179069-titulados-de-educacion-superior-2011.download/',
        'http://datos.mineduc.cl/datasets/179068-titulados-de-educacion-superior-2010.download/',
        'http://datos.mineduc.cl/datasets/179067-titulados-de-educacion-superior-2009.download/',
        'http://datos.mineduc.cl/datasets/179066-titulados-de-educacion-superior-2008.download/',
        'http://datos.mineduc.cl/datasets/179065-titulados-de-educacion-superior-2007.download/']

dataframes = []
for url in urls:
  df_aux = pd.read_csv(url, sep=';', low_memory=False)
  #filtro macrozona
  df_aux = df_aux[df_aux['REGION_SEDE'].isin(['BIOBÍO','ÑUBLE',"LIB. GRAL B. O'HIGGINS",'MAULE'])]
  #filtro área
  df_aux = df_aux[df_aux['OECD_AREA']=='AGRICULTURA']
  dataframes.append(df_aux)

df_titulados = pd.concat(dataframes)

# Para pregunta 4
# Adjudicaciones de proyectos con fuente de ANID
URL = 'https://raw.githubusercontent.com/ANID-GITHUB/Historico-de-Proyectos-Adjudicados/master/BDH_Proyectos.csv'
df_adjudicaciones = pd.read_csv(URL, sep=';', encoding='latin-1')



In [None]:
df_titulados.columns

Index(['CAT_PERIODO', 'CODIGO_UNICO', 'MRUN', 'GEN_ALU', 'FEC_NAC_ALU',
       'EDAD_ALU', 'RANGO_EDAD', 'AÑO_ING_PRI_AÑO', 'SEM_ING_PRI_AÑO',
       'AÑO_ING_CARR', 'SEM_ING_CARR', 'NOMB_TITULO_OBTENIDO',
       'NOMB_GRADO_OBTENIDO', 'FECHA_OBTENCION_TITULO', 'TIPO_INST_1',
       'TIPO_INST_2', 'TIPO_INST_3', 'COD_INST', 'NOMB_INST', 'COD_SEDE',
       'NOMB_SEDE', 'COD_CARRERA', 'NOMB_CARRERA', 'NIVEL_GLOBAL',
       'NIVEL_CARRERA_1', 'NIVEL_CARRERA_2', 'DUR_ESTUDIO_CARR',
       'DUR_PROCESO_TIT', 'DUR_TOTAL_CARR', 'REGION_SEDE', 'PROVINCIA_SEDE',
       'COMUNA_SEDE', 'JORNADA', 'MODALIDAD', 'VERSION', 'TIPO_PLAN_CARR',
       'AREA_CINEUNESCO', 'OECD_AREA', 'OECD_SUBAREA',
       'AREA_CARRERA_GENERICA_N'],
      dtype='object')

In [None]:
df_titulados['AREA_CARRERA_GENERICA_N'].unique()

array(['INGENIERÍA AGRÍCOLA', 'INGENIERÍA DE EJECUCIÓN FORESTAL',
       'MEDICINA VETERINARIA', 'TÉCNICO AGROPECUARIO',
       'TÉCNICO VETERINARIO', 'AGRONOMÍA', 'MAGISTER EN AGROPECUARIA',
       'MAGISTER EN ADMINISTRACIÓN Y COMERCIO',
       'DOCTORADO EN AGROPECUARIA', 'INGENIERÍA FORESTAL',
       'TÉCNICO EN VITIVINICULTURA Y/O ENOLOGÍA',
       'POSTÍTULO EN AGROPECUARIA', 'INGENIERÍA EN ACUICULTURA Y PESCA',
       'TÉCNICO EN ACUICULTURA Y PESCA'], dtype=object)

In [None]:
df_titulados.head()

Unnamed: 0,CAT_PERIODO,CODIGO_UNICO,MRUN,GEN_ALU,FEC_NAC_ALU,EDAD_ALU,RANGO_EDAD,AÑO_ING_PRI_AÑO,SEM_ING_PRI_AÑO,AÑO_ING_CARR,SEM_ING_CARR,NOMB_TITULO_OBTENIDO,NOMB_GRADO_OBTENIDO,FECHA_OBTENCION_TITULO,TIPO_INST_1,TIPO_INST_2,TIPO_INST_3,COD_INST,NOMB_INST,COD_SEDE,NOMB_SEDE,COD_CARRERA,NOMB_CARRERA,NIVEL_GLOBAL,NIVEL_CARRERA_1,NIVEL_CARRERA_2,DUR_ESTUDIO_CARR,DUR_PROCESO_TIT,DUR_TOTAL_CARR,REGION_SEDE,PROVINCIA_SEDE,COMUNA_SEDE,JORNADA,MODALIDAD,VERSION,TIPO_PLAN_CARR,AREA_CINEUNESCO,OECD_AREA,OECD_SUBAREA,AREA_CARRERA_GENERICA_N
2128,TIT_2019,I100S23C169J1V1,914085,1,199505,24,20 A 24 AÑOS,2015,1,2015,1,INGENIERO AGRICOLA,,20190415,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,100,IP INACAP,23,SEDE RANCAGUA,169,INGENIERIA AGRICOLA,PREGRADO,PROFESIONAL SIN LICENCIATURA,CARRERAS PROFESIONALES,8,0,8,LIB. GRAL B. O'HIGGINS,CACHAPOAL,RANCAGUA,DIURNO,PRESENCIAL,1,PLAN REGULAR,AGROPECUARIA,AGRICULTURA,"AGRICULTURA, SILVICULTURA Y PESCA",INGENIERÍA AGRÍCOLA
2129,TIT_2019,I100S23C169J1V1,1550444,1,199511,23,20 A 24 AÑOS,2015,1,2015,1,INGENIERO AGRICOLA,,20190809,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,100,IP INACAP,23,SEDE RANCAGUA,169,INGENIERIA AGRICOLA,PREGRADO,PROFESIONAL SIN LICENCIATURA,CARRERAS PROFESIONALES,8,0,8,LIB. GRAL B. O'HIGGINS,CACHAPOAL,RANCAGUA,DIURNO,PRESENCIAL,1,PLAN REGULAR,AGROPECUARIA,AGRICULTURA,"AGRICULTURA, SILVICULTURA Y PESCA",INGENIERÍA AGRÍCOLA
2130,TIT_2019,I100S23C169J1V1,2399537,2,199511,23,20 A 24 AÑOS,2015,1,2015,1,INGENIERO AGRICOLA,,20190410,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,100,IP INACAP,23,SEDE RANCAGUA,169,INGENIERIA AGRICOLA,PREGRADO,PROFESIONAL SIN LICENCIATURA,CARRERAS PROFESIONALES,8,0,8,LIB. GRAL B. O'HIGGINS,CACHAPOAL,RANCAGUA,DIURNO,PRESENCIAL,1,PLAN REGULAR,AGROPECUARIA,AGRICULTURA,"AGRICULTURA, SILVICULTURA Y PESCA",INGENIERÍA AGRÍCOLA
2131,TIT_2019,I100S23C169J1V1,3867785,1,199406,25,25 A 29 AÑOS,2016,1,2018,1,INGENIERO AGRICOLA,,20191227,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,100,IP INACAP,23,SEDE RANCAGUA,169,INGENIERIA AGRICOLA,PREGRADO,PROFESIONAL SIN LICENCIATURA,CARRERAS PROFESIONALES,8,0,8,LIB. GRAL B. O'HIGGINS,CACHAPOAL,RANCAGUA,DIURNO,PRESENCIAL,1,PLAN REGULAR,AGROPECUARIA,AGRICULTURA,"AGRICULTURA, SILVICULTURA Y PESCA",INGENIERÍA AGRÍCOLA
2132,TIT_2019,I100S23C169J1V1,4249578,1,199508,23,20 A 24 AÑOS,2015,1,2015,1,INGENIERO AGRICOLA,,20190417,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,INSTITUTOS PROFESIONALES,100,IP INACAP,23,SEDE RANCAGUA,169,INGENIERIA AGRICOLA,PREGRADO,PROFESIONAL SIN LICENCIATURA,CARRERAS PROFESIONALES,8,0,8,LIB. GRAL B. O'HIGGINS,CACHAPOAL,RANCAGUA,DIURNO,PRESENCIAL,1,PLAN REGULAR,AGROPECUARIA,AGRICULTURA,"AGRICULTURA, SILVICULTURA Y PESCA",INGENIERÍA AGRÍCOLA


# Respuesta pregunta 1

In [None]:
df_1 = df_titulados.groupby(['CAT_PERIODO']).agg({'CODIGO_UNICO': 'count'}).copy()
df_1 = df_1.reset_index().copy()
df_1["CAT_PERIODO"] = df_1["CAT_PERIODO"].astype(str).str[4:8]

df_1.head()

Unnamed: 0,CAT_PERIODO,CODIGO_UNICO
0,2007,578
1,2008,817
2,2009,684
3,2010,570
4,2011,791


In [None]:
#Gráfico
chart1 =  alt.Chart(df_1).mark_bar(color='darkseagreen').encode(
            x = alt.X('CAT_PERIODO',title=None),
            y = alt.Y('CODIGO_UNICO',title='N° Titulados'),
          )
text =  chart1.mark_text(color='forestgreen', fontSize = 13,
                         align='center', baseline='middle', dy=-10).encode(
          text = 'CODIGO_UNICO'
        )
(chart1+text).properties(width=500, height=200,
    title=['Titulados área Agricultura','Macrozona Centro-Sur','']
).configure_legend(titleFontSize=14,labelFontSize=10).configure_title(
    fontSize=20, font='Arial', anchor='middle',color='black'
  ).configure_axis(labelFontSize=13, titleFontSize=13)

# Respuesta pregunta 4


In [None]:
# Para responder la pregunta tomamos como referencia los datos abiertos que provee la ANID en base a proyectos adjudicados al 2019
# Donde además podemos ver que Ñuble no aparece con ninguna adjudicación en este ámbito (ciencias agricolas)

df_4 = df_adjudicaciones[df_adjudicaciones['MACROZONA MINCIENCIA (segUn ax)'] == 'CENTRO SUR'].copy()
df_4 = df_4[df_4['SUBDIRECCION'].\
            isin(['PROYECTOS DE INVESTIGACION','INVESTIGACION APLICADA'])]
df_4 = df_4[df_4['AREA_OCDE'] == 'CIENCIAS AGRICOLAS']
df_4['REGION_EJECUCION'] = df_4['REGION_EJECUCION'].str.replace("'","")
df_4['MONTO ADJUDICADO (MILES $)'] = df_4['MONTO ADJUDICADO (MILES $)'].str.replace(',','.').astype(float)
df_4.head(3)

Unnamed: 0,CODIGO_PROYECTO,N,SUBDIRECCION,PROGRAMA_CONICYT,INSTRUMENTO,NOMBRE_CONCURSO,AÑO_CONCURSO,AÑO_FALLO,NOMBRE_PROYECTO,AREA_OCDE,DISCIPLINA_DETALLE,GRUPO_DE_EVALUACION,DURACION_MESES,TIPO_BENEFICIARIO,NOMBRE_RESPONSABLE,SEXO,INSTITUCION_PRINCIPAL,MACROZONA MINCIENCIA (segUn ax),REGION_EJECUCION,MONTO ADJUDICADO (MILES $),M$_SINFO_NOSOLICITA
110,1820822,111,PROYECTOS DE INVESTIGACION,FONDECYT,REGULAR,CONCURSO NACIONAL REGULAR 1982,1982,1982,BALANCE DE ENERGIA DE UN PREDIO.,CIENCIAS AGRICOLAS,AGRONOMIA,AGRONOMIA,12,PERSONA NATURAL,ALEJANDRO ALBERTO VALENZUELA AVILES,HOMBRE,UNIVERSIDAD DE CONCEPCION,CENTRO SUR,08. BIOBIO,275.0,
234,1840010,235,PROYECTOS DE INVESTIGACION,FONDECYT,REGULAR,CONCURSO NACIONAL REGULAR 1984,1984,1984,EVALUACIION DE PRODUCTOS IGNIFUGOS PARA MADERA...,CIENCIAS AGRICOLAS,AGRONOMIA,AGRONOMIA,12,PERSONA NATURAL,LAURA ROSA REYES NUNEZ,MUJER,UNIVERSIDAD DEL BIO-BIO,CENTRO SUR,08. BIOBIO,400.0,
300,1840142,301,PROYECTOS DE INVESTIGACION,FONDECYT,REGULAR,CONCURSO NACIONAL REGULAR 1984,1984,1984,SECADO DE GRANO A NIVEL PREDIAL.,CIENCIAS AGRICOLAS,AGRONOMIA,AGRONOMIA,12,PERSONA NATURAL,JOSE ANTONIO FUENTES GOMEZ,HOMBRE,UNIVERSIDAD DE CONCEPCION,CENTRO SUR,08. BIOBIO,230.0,


In [None]:
# de los datos anteriores podemos obtener varias visualizaciones, una de ellas es el monto por región de la macrozona
# De ser necesario se puede incluir una comparación con la región metropolitana

df_4a = df_4.groupby(['REGION_EJECUCION']).agg({'MONTO ADJUDICADO (MILES $)': 'sum'}).copy()
df_4a = df_4a.reset_index().copy()

df_4a.head()


Unnamed: 0,REGION_EJECUCION,MONTO ADJUDICADO (MILES $)
0,06. OHIGGINS,2389850.0
1,07. MAULE,16613420.0
2,08. BIOBIO,20750560.0


In [None]:
# Otra opción es separar por tipo programa conicyt al que pertenece
df_4b = df_4.groupby(['PROGRAMA_CONICYT']).agg({'MONTO ADJUDICADO (MILES $)': 'sum'}).copy()
df_4b = df_4b.reset_index().copy()

df_4b.head()

Unnamed: 0,PROGRAMA_CONICYT,MONTO ADJUDICADO (MILES $)
0,FONDECYT,27040500.0
1,FONDEF,12713330.0


In [None]:
# Incluso se podría saber que instituciones se adjudican mayor cantidad de dinero
df_4c = df_4.groupby(['INSTITUCION_PRINCIPAL']).agg({'MONTO ADJUDICADO (MILES $)': 'sum'}).copy()
df_4c = df_4c.reset_index().copy()

df_4c.head(7)

Unnamed: 0,INSTITUCION_PRINCIPAL,MONTO ADJUDICADO (MILES $)
0,C. DE ESTUDIOS ALIMENTOS PROCESADOS,150000.0
1,CENTRO DE EST. AVANZADOS EN FRUTICULTURA,342298.0
2,CENTRO DE ESTUDIOS AVANZADOS EN FRUTICULTURA,613706.0
3,CONSORCIO TECNOLOGICO BIOENERCEL S.A.,85376.0
4,GENOMICA FORESTAL S.A.,225116.889
5,INSTITUTO DE INVESTIGACIONES AGROPECUARIAS,2003289.0
6,INSTITUTO FORESTAL,37413.0


In [None]:
# El gráfico que planeamos es un híbrido entre la propuesta 1 y 2 
df_4g = df_4.groupby(['REGION_EJECUCION','PROGRAMA_CONICYT']).\
                      agg({'MONTO ADJUDICADO (MILES $)': 'sum'}).copy()

df_4g = df_4g.reset_index().rename(columns={'PROGRAMA_CONICYT': 'Programa CONICYT'})

df_4g.head()

Unnamed: 0,REGION_EJECUCION,Programa CONICYT,MONTO ADJUDICADO (MILES $)
0,06. OHIGGINS,FONDECYT,2389850.0
1,07. MAULE,FONDECYT,12411740.0
2,07. MAULE,FONDEF,4201685.0
3,08. BIOBIO,FONDECYT,12238920.0
4,08. BIOBIO,FONDEF,8511644.0


In [None]:
chart4 = alt.Chart(df_4g).mark_bar().encode(
          x = alt.X('MONTO ADJUDICADO (MILES $)'),
          y = alt.Y('REGION_EJECUCION',title=None),
          color='Programa CONICYT'
      )

text4 = alt.Chart(df_4g).mark_text(dx=42, color='black',fontSize=15).encode(
    x = alt.X('MONTO ADJUDICADO (MILES $)',stack='zero'),
    y = alt.Y('REGION_EJECUCION'),
    detail='Programa CONICYT',
    text=alt.Text('MONTO ADJUDICADO (MILES $)', format='.2f')
)
(chart4+text4).configure_range(
    category={'scheme': 'set2'}
).properties(width=450, height=100,
      title=['Montos adjudicados proyectos del área Ciencias Agrícolas', 'Macro zona Centro-Sur',' '])\
      .configure_title( fontSize=20, font='Arial', anchor='middle', color='black')\
      .configure_legend(titleFontSize=14,labelFontSize=13,strokeColor='gray',
                         fillColor='#EEEEEE', padding=10, cornerRadius=10)\
      .configure_axis(labelFontSize=13, titleFontSize=13)


# Respuesta Pregunta 6

In [None]:
#estoy buscando el archivo del censo agricola, para ver si al menos éste es público
# El instituto nacional de estádistica ofrece datos sobre el área en particular por subsegmento/área (no sé como decirle)
# disponible en: https://www.ine.cl/estadisticas/economia/agricultura-agroindustria-y-pesca
# Aquí creo que es mas fácil que ellos revisen y vean cual es la información que les puede ser o solicitar BD filtrados
# al ine mediante solicitud y obtener la data (también lo podemos hacer nosotros pero no sé, deberiamos discutirlo con Carlos)
# 
