# Analizando dataset: Indicadores de Ovinos 

## Introducción

Este dataset se obtuvo de [Datos Argentina](https://www.datos.gob.ar/dataset/ssprys-indicadores-sectoriales-provinciales/archivo/ssprys_01.27). Se trata de un dataset muy poblado que contiene información sobre existencias ovinas, producción de lana y producción de carne tomadas de distintas fuentes como [MAGyP](https://www.argentina.gob.ar/agricultura/ganaderia), [FAO](https://www.fao.org/argentina/es/), [FLA](https://www.flasite.com/index.php/es/) y [SENASA](https://www.argentina.gob.ar/senasa).

Nos encontramos con indicadores anuales, trimestrales y mensuales. No existe documentación que nos proporcione información sobre el dataset, así que vamos a cargarlo para ver su contenido y comenzar el análisis.

## Análisis

### Importar librerias

Importamos las librerías de Python que necesitamos para analizar el dataset.

In [1]:
import pandas as pd

### Cargar dataset

Cargamos el dataset y observamos su contenido.

In [2]:
df = pd.read_csv('datos/ovinos-lana-y-carne.csv', sep=",", encoding='latin-1')
df

Unnamed: 0,sector_id,sector_nombre,variable_id,actividad_producto_nombre,indicador,unidad_de_medida,fuente,frecuencia_nombre,cobertura_nombre,alcance_tipo,alcance_id,alcance_nombre,indice_tiempo,valor
0,1,Ovinos - Lana y Carne,1,Carne ovina,Consumo aparente,tn res con hueso,MAGYP,Anual,Nacional,PAIS,200,Argentina,1998-01-01,39221.694655
1,1,Ovinos - Lana y Carne,1,Carne ovina,Consumo aparente,tn res con hueso,MAGYP,Anual,Nacional,PAIS,200,Argentina,1999-01-01,52247.903796
2,1,Ovinos - Lana y Carne,1,Carne ovina,Consumo aparente,tn res con hueso,MAGYP,Anual,Nacional,PAIS,200,Argentina,2000-01-01,67633.175045
3,1,Ovinos - Lana y Carne,1,Carne ovina,Consumo aparente,tn res con hueso,MAGYP,Anual,Nacional,PAIS,200,Argentina,2001-01-01,44560.747617
4,1,Ovinos - Lana y Carne,1,Carne ovina,Consumo aparente,tn res con hueso,MAGYP,Anual,Nacional,PAIS,200,Argentina,2002-01-01,44549.057091
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
8050,1,Ovinos - Lana y Carne,18,Ovino,Stock al 31-03,cabezas,SENASA,Anual,Nacional,DEPARTAMENTO,94015,USHUAIA,2015-01-01,81.000000
8051,1,Ovinos - Lana y Carne,18,Ovino,Stock al 31-03,cabezas,SENASA,Anual,Nacional,DEPARTAMENTO,94015,USHUAIA,2016-01-01,43.000000
8052,1,Ovinos - Lana y Carne,18,Ovino,Stock al 31-03,cabezas,SENASA,Anual,Nacional,DEPARTAMENTO,94015,USHUAIA,2018-01-01,4.000000
8053,1,Ovinos - Lana y Carne,18,Ovino,Stock al 31-03,cabezas,SENASA,Anual,Nacional,DEPARTAMENTO,94015,USHUAIA,2019-01-01,6.000000


Como se mencionó anteriormente se trata de un conjunto de datos un tanto mezclado, y será necesario analizarlo en detenimiento para encontrar los datos que necesitamos. Es un dataset de 8055 filas y 14 columnas, miremos las columnas que trae:

In [3]:
df.columns

Index(['sector_id', 'sector_nombre', 'variable_id',
       'actividad_producto_nombre', 'indicador', 'unidad_de_medida', 'fuente',
       'frecuencia_nombre', 'cobertura_nombre', 'alcance_tipo', 'alcance_id',
       'alcance_nombre', 'indice_tiempo', 'valor'],
      dtype='object')

La columna que parece decirnos el producto es "actividad_producto_nombre", por lo tanto veamos si en efecto es así:

In [4]:
df['actividad_producto_nombre'].unique()

array(['Carne ovina', 'Lana fina_ 20 micrones Rinde peine 55%',
       'Lana mediana_ 27 micrones Rinde peine 55%', 'Lana sucia',
       'Lana sucia cruza fina', 'Lana sucia fina', 'Lana sucia gruesa',
       'Lana sucia mediana', 'Ovino'], dtype=object)

Tenemos 9 "productos":
- Carne ovina
- Lana fina_ 20 micrones Rinde peine 55%
- Lana mediana_ 27 micrones Rinde peine 55%
- Lana sucia
- Lana sucia cruza fina
- Lana sucia fina
- Lana sucia gruesa
- Lana sucia mediana
- Ovino: Representa las existencias ovinas

Lo siguiente es buscar los productos que nos interesan pero que sean de la provincia del Chubut. Empezamos por la producción de carne.

In [5]:
resultado_carne = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in df.index: 
    if "Carne ovina" == df['actividad_producto_nombre'][i]:
         resultado_carne = resultado_carne.append({
                                       'actividad_producto_nombre': df['actividad_producto_nombre'][i],
                                       'indicador': df['indicador'][i],
                                       'unidad_de_medida':df['unidad_de_medida'][i], 
                                       'frecuencia_nombre':df['frecuencia_nombre'][i],
                                       'alcance_tipo':df['alcance_tipo'][i],
                                       'alcance_nombre':df['alcance_nombre'][i],
                                       'indice_tiempo':df['indice_tiempo'][i],
                                       'valor':df['valor'][i],}, 
                                      ignore_index=True)
resultado_carne

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Carne ovina,Consumo aparente,tn res con hueso,Anual,PAIS,Argentina,1998-01-01,39221.694655
1,Carne ovina,Consumo aparente,tn res con hueso,Anual,PAIS,Argentina,1999-01-01,52247.903796
2,Carne ovina,Consumo aparente,tn res con hueso,Anual,PAIS,Argentina,2000-01-01,67633.175045
3,Carne ovina,Consumo aparente,tn res con hueso,Anual,PAIS,Argentina,2001-01-01,44560.747617
4,Carne ovina,Consumo aparente,tn res con hueso,Anual,PAIS,Argentina,2002-01-01,44549.057091
...,...,...,...,...,...,...,...,...
61,Carne ovina,Producción,tn res con hueso,Anual,PAIS,Argentina,2015-01-01,57608.544032
62,Carne ovina,Producción,tn res con hueso,Anual,PAIS,Argentina,2016-01-01,51590.113369
63,Carne ovina,Producción,tn res con hueso,Anual,PAIS,Argentina,2017-01-01,50615.827729
64,Carne ovina,Producción,tn res con hueso,Anual,PAIS,Argentina,2018-01-01,49126.437112


Son 66 filas, entonces lo que hacemos es buscar si existen datos a nivel provincia o departamento

In [6]:
resultado_carne['alcance_tipo'].unique()

array(['PAIS'], dtype=object)

No hay datos especificados por provincia ni por departamento, por lo tanto este dataset no tiene información sobre la producción de carne de Chubut. Pasemos al siguiente producto que sería la lana fina de 20 micrones.

In [7]:
resultado_lana_20 = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in df.index: 
    if "Lana fina_ 20 micrones Rinde peine 55%" == df['actividad_producto_nombre'][i]:
         resultado_lana_20 = resultado_lana_20.append({
                                       'actividad_producto_nombre': df['actividad_producto_nombre'][i],
                                       'indicador': df['indicador'][i],
                                       'unidad_de_medida':df['unidad_de_medida'][i], 
                                       'frecuencia_nombre':df['frecuencia_nombre'][i],
                                       'alcance_tipo':df['alcance_tipo'][i],
                                       'alcance_nombre':df['alcance_nombre'][i],
                                       'indice_tiempo':df['indice_tiempo'][i],
                                       'valor':df['valor'][i],
                                      }, 
                                      ignore_index=True)
resultado_lana_20

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana fina_ 20 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-01-01,2.93
1,Lana fina_ 20 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-02-01,2.83
2,Lana fina_ 20 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-03-01,2.77
3,Lana fina_ 20 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-04-01,2.68
4,Lana fina_ 20 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-05-01,2.68
...,...,...,...,...,...,...,...,...
210,Lana fina_ 20 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2021-07-01,4.43
211,Lana fina_ 20 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2021-08-01,4.01
212,Lana fina_ 20 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2021-09-01,3.87
213,Lana fina_ 20 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2021-10-01,4.08


Son 215 filas, entonces lo que hacemos es buscar si existen datos a nivel provincia o departamento

In [8]:
resultado_lana_20['alcance_tipo'].unique()

array(['PAIS'], dtype=object)

No hay datos especificados por provincia ni por departamento, por lo tanto este dataset no tiene información sobre la lana fina de 20 micrones de Chubut. Pasemos al siguiente producto que sería la lana mediana de 27 micrones.

In [9]:
resultado_lana_27 = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in df.index:
    if "Lana mediana_ 27 micrones Rinde peine 55%" == df['actividad_producto_nombre'][i]:
         resultado_lana_27 = resultado_lana_27.append({
                                       'actividad_producto_nombre': df['actividad_producto_nombre'][i],
                                       'indicador': df['indicador'][i],
                                       'unidad_de_medida':df['unidad_de_medida'][i], 
                                       'frecuencia_nombre':df['frecuencia_nombre'][i],
                                       'alcance_tipo':df['alcance_tipo'][i],
                                       'alcance_nombre':df['alcance_nombre'][i],
                                       'indice_tiempo':df['indice_tiempo'][i],
                                       'valor':df['valor'][i],
                                         }, 
                                      ignore_index=True)
resultado_lana_27

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana mediana_ 27 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-01-01,1.90
1,Lana mediana_ 27 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-02-01,1.91
2,Lana mediana_ 27 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-03-01,1.87
3,Lana mediana_ 27 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-04-01,1.80
4,Lana mediana_ 27 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2004-05-01,1.78
...,...,...,...,...,...,...,...,...
210,Lana mediana_ 27 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2021-07-01,1.86
211,Lana mediana_ 27 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2021-08-01,1.74
212,Lana mediana_ 27 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2021-09-01,1.60
213,Lana mediana_ 27 micrones Rinde peine 55%,Precio interno_de referencia,US$,Mensual,PAIS,Argentina,2021-10-01,1.50


Son 215 filas, entonces lo que hacemos es buscar si existen datos a nivel provincia o departamento

In [10]:
resultado_lana_27['alcance_tipo'].unique()

array(['PAIS'], dtype=object)

No hay datos especificados por provincia ni por departamento, por lo tanto este dataset no tiene información sobre la lana mediana de 27 micrones de Chubut. Pasemos al siguiente producto que sería la lana sucia.

In [11]:
resultado_lana_sucia = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in df.index: 
    if "Lana sucia" == df['actividad_producto_nombre'][i]:
         resultado_lana_sucia = resultado_lana_sucia.append({
                                       'actividad_producto_nombre': df['actividad_producto_nombre'][i],
                                       'indicador': df['indicador'][i],
                                       'unidad_de_medida':df['unidad_de_medida'][i], 
                                       'frecuencia_nombre':df['frecuencia_nombre'][i],
                                       'alcance_tipo':df['alcance_tipo'][i],
                                       'alcance_nombre':df['alcance_nombre'][i],
                                       'indice_tiempo':df['indice_tiempo'][i],
                                       'valor':df['valor'][i],
                                         }, 
                                      ignore_index=True)
resultado_lana_sucia

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana sucia,Producción,tn,Anual,MUNDO,MUNDO,1990-01-01,3350481.0
1,Lana sucia,Producción,tn,Anual,MUNDO,MUNDO,1991-01-01,2736390.0
2,Lana sucia,Producción,tn,Anual,MUNDO,MUNDO,1992-01-01,2872360.0
3,Lana sucia,Producción,tn,Anual,MUNDO,MUNDO,1993-01-01,2775281.0
4,Lana sucia,Producción,tn,Anual,MUNDO,MUNDO,1994-01-01,2687770.0
...,...,...,...,...,...,...,...,...
477,Lana sucia,Producción,tn,Anual,PROVINCIA,INDETERMINADA,2003-01-01,5900.0
478,Lana sucia,Producción,tn,Anual,PROVINCIA,INDETERMINADA,2004-01-01,7000.0
479,Lana sucia,Producción,tn,Anual,PROVINCIA,INDETERMINADA,2005-01-01,6200.0
480,Lana sucia,Producción,tn,Anual,PROVINCIA,INDETERMINADA,2006-01-01,4600.0


Son 482 filas, entonces lo que hacemos es buscar si existen datos a nivel provincia o departamento

In [12]:
resultado_lana_sucia['alcance_tipo'].unique()

array(['MUNDO', 'PAIS', 'PROVINCIA'], dtype=object)

Hay datos especificados por provincia, por lo tanto buscamos si hay de Chubut.

In [13]:
resultado_lana_sucia['alcance_nombre'].unique()

array(['MUNDO', 'Argentina', 'BUENOS AIRES', 'CATAMARCA', 'CORDOBA',
       'CORRIENTES', 'CHACO', 'CHUBUT', 'ENTRE RIOS', 'FORMOSA', 'JUJUY',
       'LA PAMPA', 'LA RIOJA', 'MENDOZA', 'MISIONES', 'NEUQUEN',
       'RIO NEGRO', 'SALTA', 'SAN JUAN', 'SAN LUIS', 'SANTA CRUZ',
       'SANTA FE', 'SANTIAGO DEL ESTERO', 'TUCUMAN', 'TIERRA DEL FUEGO',
       'INDETERMINADA'], dtype=object)

Efectivamente hay datos sobre la producción de lana sucia en Chubut, por lo tanto filtramos esos datos y los guardamos en un archivo csv.

In [14]:
resultado_lana_sucia_chubut = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in resultado_lana_sucia.index: 
    if "CHUBUT" == resultado_lana_sucia['alcance_nombre'][i]:
         resultado_lana_sucia_chubut = resultado_lana_sucia_chubut.append({
                                       'actividad_producto_nombre': resultado_lana_sucia['actividad_producto_nombre'][i],
                                       'indicador': resultado_lana_sucia['indicador'][i],
                                       'unidad_de_medida':resultado_lana_sucia['unidad_de_medida'][i], 
                                       'frecuencia_nombre':resultado_lana_sucia['frecuencia_nombre'][i],
                                       'alcance_tipo':resultado_lana_sucia['alcance_tipo'][i],
                                       'alcance_nombre':resultado_lana_sucia['alcance_nombre'][i],
                                       'indice_tiempo':resultado_lana_sucia['indice_tiempo'][i],
                                       'valor':resultado_lana_sucia['valor'][i],}, 
                                      ignore_index=True)
resultado_lana_sucia_chubut

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2000-01-01,17000.0
1,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2001-01-01,17000.0
2,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2002-01-01,16900.0
3,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2003-01-01,21300.0
4,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2004-01-01,21900.0
5,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2005-01-01,23200.0
6,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2006-01-01,22000.0
7,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2007-01-01,22000.0
8,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2008-01-01,21600.0
9,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2009-01-01,17120.0


In [15]:
resultado_lana_sucia_chubut.to_csv('datos_producidos/indicadores_ovinos/lana_sucia_chubut_2000-2022.csv', index=False)

Pasamos al siguiente producto que sería la lana sucia cruza fina.

In [16]:
resultado_lana_sucia_cruza_fina = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in df.index: 
    if "Lana sucia cruza fina" == df['actividad_producto_nombre'][i]:
         resultado_lana_sucia_cruza_fina = resultado_lana_sucia_cruza_fina.append({
                                       'actividad_producto_nombre': df['actividad_producto_nombre'][i],
                                       'indicador': df['indicador'][i],
                                       'unidad_de_medida':df['unidad_de_medida'][i], 
                                       'frecuencia_nombre':df['frecuencia_nombre'][i],
                                       'alcance_tipo':df['alcance_tipo'][i],
                                       'alcance_nombre':df['alcance_nombre'][i],
                                       'indice_tiempo':df['indice_tiempo'][i],
                                       'valor':df['valor'][i],
                                         }, 
                                      ignore_index=True)
resultado_lana_sucia_cruza_fina

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1990-01-01,67250.0
1,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1991-01-01,58000.0
2,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1992-01-01,51100.0
3,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1993-01-01,42400.0
4,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1994-01-01,35000.0
5,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1995-01-01,31600.0
6,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1996-01-01,27400.0
7,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1997-01-01,25650.0
8,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1998-01-01,24100.0
9,Lana sucia cruza fina,Producción por finura,tn,Anual,PAIS,Argentina,1999-01-01,25200.0


Son 15 filas por lo tanto ya se observa que solo tiene alcance a nivel pais. Pasamos al siguiente producto que seria la lana sucia fina.

In [17]:
resultado_lana_sucia_fina = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in df.index: 
    if "Lana sucia fina" == df['actividad_producto_nombre'][i]:
         resultado_lana_sucia_fina = resultado_lana_sucia_fina.append({
                                       'actividad_producto_nombre': df['actividad_producto_nombre'][i],
                                       'indicador': df['indicador'][i],
                                       'unidad_de_medida':df['unidad_de_medida'][i], 
                                       'frecuencia_nombre':df['frecuencia_nombre'][i],
                                       'alcance_tipo':df['alcance_tipo'][i],
                                       'alcance_nombre':df['alcance_nombre'][i],
                                       'indice_tiempo':df['indice_tiempo'][i],
                                       'valor':df['valor'][i],
                                         }, 
                                      ignore_index=True)
resultado_lana_sucia_fina

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana sucia fina,Producción por finura,tn,Anual,PAIS,Argentina,1990-01-01,44150.00
1,Lana sucia fina,Producción por finura,tn,Anual,PAIS,Argentina,1991-01-01,40000.00
2,Lana sucia fina,Producción por finura,tn,Anual,PAIS,Argentina,1992-01-01,37200.00
3,Lana sucia fina,Producción por finura,tn,Anual,PAIS,Argentina,1993-01-01,41800.00
4,Lana sucia fina,Producción por finura,tn,Anual,PAIS,Argentina,1994-01-01,36000.00
...,...,...,...,...,...,...,...,...
226,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2018-01-01,500.00
227,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2019-01-01,448.00
228,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2020-01-01,448.00
229,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2021-01-01,602.00


Son 231 filas, entonces lo que hacemos es buscar si existen datos a nivel provincia o departamento

In [18]:
resultado_lana_sucia_fina['alcance_tipo'].unique()

array(['PAIS', 'PROVINCIA'], dtype=object)

Hay datos especificados por provincia, por lo tanto buscamos si hay de Chubut.

In [19]:
resultado_lana_sucia_fina['alcance_nombre'].unique()

array(['Argentina', 'BUENOS AIRES', 'CATAMARCA', 'CORDOBA', 'CORRIENTES',
       'CHACO', 'CHUBUT', 'ENTRE RIOS', 'FORMOSA', 'JUJUY', 'LA PAMPA',
       'LA RIOJA', 'MENDOZA', 'MISIONES', 'NEUQUEN', 'RIO NEGRO', 'SALTA',
       'SAN JUAN', 'SAN LUIS', 'SANTA CRUZ', 'SANTA FE',
       'SANTIAGO DEL ESTERO', 'TUCUMAN', 'TIERRA DEL FUEGO'], dtype=object)


Efectivamente hay datos sobre la producción de lana sucia fina en Chubut, por lo tanto filtramos esos datos y los guardamos en un archivo csv.

In [20]:
resultado_lana_sucia_fina_chubut = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in resultado_lana_sucia_fina.index: 
    if "CHUBUT" == resultado_lana_sucia_fina['alcance_nombre'][i]:
         resultado_lana_sucia_fina_chubut = resultado_lana_sucia_fina_chubut.append({
                                       'actividad_producto_nombre': resultado_lana_sucia_fina['actividad_producto_nombre'][i],
                                       'indicador': resultado_lana_sucia_fina['indicador'][i],
                                       'unidad_de_medida':resultado_lana_sucia_fina['unidad_de_medida'][i], 
                                       'frecuencia_nombre':resultado_lana_sucia_fina['frecuencia_nombre'][i],
                                       'alcance_tipo':resultado_lana_sucia_fina['alcance_tipo'][i],
                                       'alcance_nombre':resultado_lana_sucia_fina['alcance_nombre'][i],
                                       'indice_tiempo':resultado_lana_sucia_fina['indice_tiempo'][i],
                                       'valor':resultado_lana_sucia_fina['valor'][i],}, 
                                      ignore_index=True)
resultado_lana_sucia_fina_chubut

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2014-01-01,13500.0
1,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2015-01-01,14200.0
2,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2016-01-01,13700.0
3,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2017-01-01,13700.0
4,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2018-01-01,13700.0
5,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2019-01-01,13230.0
6,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2020-01-01,13230.0
7,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2021-01-01,13072.0
8,Lana sucia fina,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2022-01-01,11320.31


In [21]:
resultado_lana_sucia_fina_chubut.to_csv('datos_producidos/indicadores_ovinos/lana_sucia_fina_chubut_2014-2022.csv', index=False)

Pasamos al siguiente producto que seria la lana sucia gruesa.

In [22]:
resultado_lana_sucia_gruesa = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in df.index: 
    if "Lana sucia gruesa" == df['actividad_producto_nombre'][i]:
         resultado_lana_sucia_gruesa = resultado_lana_sucia_gruesa.append({
                                       'actividad_producto_nombre': df['actividad_producto_nombre'][i],
                                       'indicador': df['indicador'][i],
                                       'unidad_de_medida':df['unidad_de_medida'][i], 
                                       'frecuencia_nombre':df['frecuencia_nombre'][i],
                                       'alcance_tipo':df['alcance_tipo'][i],
                                       'alcance_nombre':df['alcance_nombre'][i],
                                       'indice_tiempo':df['indice_tiempo'][i],
                                       'valor':df['valor'][i],
                                         }, 
                                      ignore_index=True)
resultado_lana_sucia_gruesa

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana sucia gruesa,Producción por finura,tn,Anual,PAIS,Argentina,1990-01-01,10300.0
1,Lana sucia gruesa,Producción por finura,tn,Anual,PAIS,Argentina,1991-01-01,13000.0
2,Lana sucia gruesa,Producción por finura,tn,Anual,PAIS,Argentina,1992-01-01,10000.0
3,Lana sucia gruesa,Producción por finura,tn,Anual,PAIS,Argentina,1993-01-01,8300.0
4,Lana sucia gruesa,Producción por finura,tn,Anual,PAIS,Argentina,1994-01-01,9000.0
...,...,...,...,...,...,...,...,...
226,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2018-01-01,0.0
227,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2019-01-01,0.0
228,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2020-01-01,0.0
229,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2021-01-01,0.0


Son 231 filas, entonces lo que hacemos es buscar si existen datos a nivel provincia o departamento

In [23]:
resultado_lana_sucia_gruesa['alcance_tipo'].unique()

array(['PAIS', 'PROVINCIA'], dtype=object)

Hay datos especificados por provincia, por lo tanto buscamos si hay de Chubut.

In [24]:
resultado_lana_sucia_gruesa['alcance_nombre'].unique()

array(['Argentina', 'BUENOS AIRES', 'CATAMARCA', 'CORDOBA', 'CORRIENTES',
       'CHACO', 'CHUBUT', 'ENTRE RIOS', 'FORMOSA', 'JUJUY', 'LA PAMPA',
       'LA RIOJA', 'MENDOZA', 'MISIONES', 'NEUQUEN', 'RIO NEGRO', 'SALTA',
       'SAN JUAN', 'SAN LUIS', 'SANTA CRUZ', 'SANTA FE',
       'SANTIAGO DEL ESTERO', 'TUCUMAN', 'TIERRA DEL FUEGO'], dtype=object)

Efectivamente hay datos sobre la producción de lana sucia gruesa en Chubut, por lo tanto filtramos esos datos y los guardamos en un archivo csv.

In [25]:
resultado_lana_sucia_gruesa_chubut = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in resultado_lana_sucia_gruesa.index: 
    if "CHUBUT" == resultado_lana_sucia_gruesa['alcance_nombre'][i]:
         resultado_lana_sucia_gruesa_chubut = resultado_lana_sucia_gruesa_chubut.append({
                                       'actividad_producto_nombre': resultado_lana_sucia_gruesa['actividad_producto_nombre'][i],
                                       'indicador': resultado_lana_sucia_gruesa['indicador'][i],
                                       'unidad_de_medida':resultado_lana_sucia_gruesa['unidad_de_medida'][i], 
                                       'frecuencia_nombre':resultado_lana_sucia_gruesa['frecuencia_nombre'][i],
                                       'alcance_tipo':resultado_lana_sucia_gruesa['alcance_tipo'][i],
                                       'alcance_nombre':resultado_lana_sucia_gruesa['alcance_nombre'][i],
                                       'indice_tiempo':resultado_lana_sucia_gruesa['indice_tiempo'][i],
                                       'valor':resultado_lana_sucia_gruesa['valor'][i],}, 
                                      ignore_index=True)
resultado_lana_sucia_gruesa_chubut

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2014-01-01,0.0
1,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2015-01-01,0.0
2,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2016-01-01,0.0
3,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2017-01-01,0.0
4,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2018-01-01,0.0
5,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2019-01-01,0.0
6,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2020-01-01,0.0
7,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2021-01-01,0.0
8,Lana sucia gruesa,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2022-01-01,0.0


In [26]:
resultado_lana_sucia_gruesa_chubut.to_csv('datos_producidos/indicadores_ovinos/lana_sucia_gruesa_chubut_2014-2022.csv', index=False)

Pasamos al siguiente producto que sería la lana sucia mediana.

In [27]:
resultado_lana_sucia_mediana = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in df.index: 
    if "Lana sucia mediana" == df['actividad_producto_nombre'][i]:
         resultado_lana_sucia_mediana = resultado_lana_sucia_mediana.append({
                                       'actividad_producto_nombre': df['actividad_producto_nombre'][i],
                                       'indicador': df['indicador'][i],
                                       'unidad_de_medida':df['unidad_de_medida'][i], 
                                       'frecuencia_nombre':df['frecuencia_nombre'][i],
                                       'alcance_tipo':df['alcance_tipo'][i],
                                       'alcance_nombre':df['alcance_nombre'][i],
                                       'indice_tiempo':df['indice_tiempo'][i],
                                       'valor':df['valor'][i],
                                         }, 
                                      ignore_index=True)
resultado_lana_sucia_mediana

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana sucia mediana,Producción por finura,tn,Anual,PAIS,Argentina,1990-01-01,16900.00
1,Lana sucia mediana,Producción por finura,tn,Anual,PAIS,Argentina,1991-01-01,14000.00
2,Lana sucia mediana,Producción por finura,tn,Anual,PAIS,Argentina,1992-01-01,11700.00
3,Lana sucia mediana,Producción por finura,tn,Anual,PAIS,Argentina,1993-01-01,10500.00
4,Lana sucia mediana,Producción por finura,tn,Anual,PAIS,Argentina,1994-01-01,8000.00
...,...,...,...,...,...,...,...,...
226,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2018-01-01,1100.00
227,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2019-01-01,857.00
228,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2020-01-01,952.00
229,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,TIERRA DEL FUEGO,2021-01-01,492.00


Son 231 filas, entonces lo que hacemos es buscar si existen datos a nivel provincia o departamento

In [28]:
resultado_lana_sucia_mediana['alcance_tipo'].unique()

array(['PAIS', 'PROVINCIA'], dtype=object)

Hay datos especificados por provincia, por lo tanto buscamos si hay de Chubut.

In [29]:
resultado_lana_sucia_mediana['alcance_nombre'].unique()

array(['Argentina', 'BUENOS AIRES', 'CATAMARCA', 'CORDOBA', 'CORRIENTES',
       'CHACO', 'CHUBUT', 'ENTRE RIOS', 'FORMOSA', 'JUJUY', 'LA PAMPA',
       'LA RIOJA', 'MENDOZA', 'MISIONES', 'NEUQUEN', 'RIO NEGRO', 'SALTA',
       'SAN JUAN', 'SAN LUIS', 'SANTA CRUZ', 'SANTA FE',
       'SANTIAGO DEL ESTERO', 'TUCUMAN', 'TIERRA DEL FUEGO'], dtype=object)

Efectivamente hay datos sobre la producción de lana sucia mediana en Chubut, por lo tanto filtramos esos datos y los guardamos en un archivo csv.

In [30]:
resultado_lana_sucia_mediana_chubut = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in resultado_lana_sucia_gruesa.index: 
    if "CHUBUT" == resultado_lana_sucia_gruesa['alcance_nombre'][i]:
         resultado_lana_sucia_mediana_chubut = resultado_lana_sucia_mediana_chubut.append({
                                       'actividad_producto_nombre': resultado_lana_sucia_mediana['actividad_producto_nombre'][i],
                                       'indicador': resultado_lana_sucia_mediana['indicador'][i],
                                       'unidad_de_medida':resultado_lana_sucia_mediana['unidad_de_medida'][i], 
                                       'frecuencia_nombre':resultado_lana_sucia_mediana['frecuencia_nombre'][i],
                                       'alcance_tipo':resultado_lana_sucia_mediana['alcance_tipo'][i],
                                       'alcance_nombre':resultado_lana_sucia_mediana['alcance_nombre'][i],
                                       'indice_tiempo':resultado_lana_sucia_mediana['indice_tiempo'][i],
                                       'valor':resultado_lana_sucia_mediana['valor'][i],}, 
                                      ignore_index=True)
resultado_lana_sucia_mediana_chubut

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2014-01-01,400.0
1,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2015-01-01,200.0
2,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2016-01-01,300.0
3,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2017-01-01,300.0
4,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2018-01-01,300.0
5,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2019-01-01,243.0
6,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2020-01-01,270.0
7,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2021-01-01,267.0
8,Lana sucia mediana,Producción por finura,tn,Anual,PROVINCIA,CHUBUT,2022-01-01,231.03


In [31]:
resultado_lana_sucia_mediana_chubut.to_csv('datos_producidos/indicadores_ovinos/lana_sucia_mediana_chubut_2014-2022.csv', index=False)

Pasamos al siguiente producto que sería la existencia de ovinos.

In [32]:
resultado_ovinos = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in df.index: 
    if "Ovino" == df['actividad_producto_nombre'][i]:
         resultado_ovinos = resultado_ovinos.append({
                                       'actividad_producto_nombre': df['actividad_producto_nombre'][i],
                                       'indicador': df['indicador'][i],
                                       'unidad_de_medida':df['unidad_de_medida'][i], 
                                       'frecuencia_nombre':df['frecuencia_nombre'][i],
                                       'alcance_tipo':df['alcance_tipo'][i],
                                       'alcance_nombre':df['alcance_nombre'][i],
                                       'indice_tiempo':df['indice_tiempo'][i],
                                       'valor':df['valor'][i],
                                         }, 
                                      ignore_index=True)
resultado_ovinos

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Ovino,Faena estimada,cabezas,Anual,PAIS,Argentina,1998-01-01,1.993746e+06
1,Ovino,Faena estimada,cabezas,Anual,PAIS,Argentina,1999-01-01,2.997181e+06
2,Ovino,Faena estimada,cabezas,Anual,PAIS,Argentina,2000-01-01,3.653250e+06
3,Ovino,Faena estimada,cabezas,Anual,PAIS,Argentina,2001-01-01,2.411242e+06
4,Ovino,Faena estimada,cabezas,Anual,PAIS,Argentina,2002-01-01,2.535396e+06
...,...,...,...,...,...,...,...,...
6363,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,USHUAIA,2015-01-01,8.100000e+01
6364,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,USHUAIA,2016-01-01,4.300000e+01
6365,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,USHUAIA,2018-01-01,4.000000e+00
6366,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,USHUAIA,2019-01-01,6.000000e+00


Son 6368 filas, entonces lo que hacemos es buscar si existen datos a nivel provincia o departamento

In [33]:
resultado_ovinos['alcance_tipo'].unique()

array(['PAIS', 'DEPARTAMENTO'], dtype=object)

Hay datos especificados por departamento, por lo tanto buscamos si estan los de Chubut.

In [34]:
departamentos = resultado_ovinos['alcance_nombre'].unique().tolist()
departamentos_chubut = ["BIEDMA", "CUSHAMEN", "ESCALANTE","FUTALEUFU", "GAIMAN", "GASTRE","LANGUIÑEO", "MARTIRES", "PASO DE INDIOS", "RAWSON", "RIO SENGUER","SARMIENTO", "TEHUELCHES", "TELSEN"]

def compare(lst1, lst2, ini=0):
    n = len(lst2)
    return lst1[ini:ini+n] == lst2

def indexes(lst, x):
    return (i for (i,y) in enumerate(lst) if x==y)

any(compare(departamentos, departamentos_chubut, i) for i in indexes(departamentos, departamentos_chubut[0]))

True

Segun la función anterior están los departamentos de Chubut por lo tanto hay datos sobre las existencias ovinas en la provincia. Lo siguiente es filtrar esos datos y guardalos en un archivo csv.

In [35]:
departamentos_chubut = ["BIEDMA", "CUSHAMEN", "ESCALANTE","FUTALEUFU", "GAIMAN", "GASTRE","LANGUIÑEO", "MARTIRES", "PASO DE INDIOS", "RAWSON", "RIO SENGUER","SARMIENTO", "TEHUELCHES", "TELSEN"]

resultado_ovinos_chubut = pd.DataFrame(columns=['actividad_producto_nombre','indicador', 'unidad_de_medida', 'frecuencia_nombre', 'alcance_tipo', 'alcance_nombre', 'indice_tiempo', 'valor'])
for i in resultado_ovinos.index: 
    if resultado_ovinos['alcance_nombre'][i] in departamentos_chubut:
         resultado_ovinos_chubut = resultado_ovinos_chubut.append({
                                       'actividad_producto_nombre': resultado_ovinos['actividad_producto_nombre'][i],
                                       'indicador': resultado_ovinos['indicador'][i],
                                       'unidad_de_medida':resultado_ovinos['unidad_de_medida'][i], 
                                       'frecuencia_nombre':resultado_ovinos['frecuencia_nombre'][i],
                                       'alcance_tipo':resultado_ovinos['alcance_tipo'][i],
                                       'alcance_nombre':resultado_ovinos['alcance_nombre'][i],
                                       'indice_tiempo':resultado_ovinos['indice_tiempo'][i],
                                       'valor':resultado_ovinos['valor'][i],}, 
                                      ignore_index=True)
resultado_ovinos_chubut

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,valor
0,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,BIEDMA,2008-01-01,291332.0
1,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,BIEDMA,2009-01-01,271568.0
2,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,BIEDMA,2010-01-01,241263.0
3,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,BIEDMA,2011-01-01,216823.0
4,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,BIEDMA,2012-01-01,193849.0
...,...,...,...,...,...,...,...,...
216,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,SARMIENTO,2016-01-01,910.0
217,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,SARMIENTO,2017-01-01,1083.0
218,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,SARMIENTO,2018-01-01,1106.0
219,Ovino,Stock al 31-03,cabezas,Anual,DEPARTAMENTO,SARMIENTO,2019-01-01,1299.0


Son 221 filas, por lo tanto verificamos que esten todos los departamentos de Chubut.

In [36]:
resultado_ovinos_chubut['alcance_nombre'].unique()

array(['BIEDMA', 'CUSHAMEN', 'ESCALANTE', 'FUTALEUFU', 'GAIMAN', 'GASTRE',
       'LANGUIÑEO', 'MARTIRES', 'PASO DE INDIOS', 'RAWSON', 'RIO SENGUER',
       'SARMIENTO', 'TEHUELCHES', 'TELSEN'], dtype=object)

Una vez comprobado que los departamentos estan, los guardamos. 

In [37]:
resultado_ovinos_chubut.to_csv('datos_producidos/indicadores_ovinos/ovinos_chubut_2008-2020.csv', index=False)