# Dataset de lana FLA

Anteriormente se seleccionó este dataset para trabajar, ahora lo que necesitamos es conseguir la información de cada departamento de Chubut.
Existe una encuenta ganadera que se realiza en la provincia, inta tiene una [sección](https://sipas.inta.gob.ar/?q=Info-Estrategica-estad-cen) donde aparecen los resultados de las de encuentas de los siguientes años:
- 2004-2005
- 2006-2007
- 2008-2009
- 2009-2010
- 2010-2011
- 2012
- 2013
- 2014

Lamentablemente solo se puede acceder a la encuesta del 2014. Suponiendo que el formato de la encuesta 2014 es el mismo que las anteriores realmente nos hubiese sido de mucha utilidad poder acceder a las demás, porque nos dice la cantidad de lana que produjo cada departamento de Chubut, que es exactamente lo que estamos buscando. Se invirtieron muchas horas tratando de conseguir acceso a las demás encuestas pero no se llegaron a buenos resultados.

Entonces lo que se va a hacer es generalizar la lana que produjo cada departamento en el año 2014 al resto de los años, los datos van a ser bastantes inexactos pero es lo único que tenemos.

Se tomo de la [encuesta](https://sipas.inta.gob.ar/sites/default/files/archivos/ESTADISTICAS%20GANADERAS%202014%20CHUBUT.pdf) algunos datos y se armo el siguiente archivo csv

In [10]:
import pandas as pd
import random

In [12]:
encuesta_ganadera = pd.read_csv('datos_sipas/encuesta_ganadera_2014.csv', sep=",")
encuesta_ganadera

Unnamed: 0,DEPARTAMENTO,OVINOS,OVINOS_%,OVEJAS,CARNEROS,CAPONES,BORREGAS,CORDEROS_SEÑALADOS,OVINOS_ESQUILADOS,OVINOS_ESQUILADOS_%,LANA_SUCIA_PRODUCIDA,KG_LANA_CABEZA,FINURA,RINDE,LANA_SUCIA_%
0,BIEDMA,158523,48,61195,3223,29688,29491,34926,123597,78,513951,416,19.22,58.86,4.67
1,CUSHAMEN,173238,53,77263,4198,18975,26512,46290,126948,73,578184,455,19.74,63.35,5.25
2,ESCALANTE,202476,62,80819,6921,35212,33497,46027,156449,77,703221,449,19.83,50.91,6.39
3,FLORENTINO AMEGHINO,347112,106,140928,8893,51459,56282,89550,257562,74,948220,368,19.53,60.37,8.61
4,FUTALEUFU,109363,33,51384,3436,11841,13783,28919,80444,74,360959,449,20.27,63.13,3.28
5,GAIMAN,199824,61,90039,4936,26376,27772,50701,149123,75,637321,427,20.39,55.06,5.79
6,GASTRE,153194,47,63706,3791,29293,21054,35350,117844,77,477937,406,19.8,54.38,4.34
7,LANGUIÑEO,221111,67,87640,6151,40929,38874,47517,173594,79,782652,451,19.86,60.94,7.11
8,MARTIRES,136857,42,62066,3788,21770,18961,30272,106585,78,498970,468,20.1,49.07,4.53
9,PASO DE INDIOS,207630,63,89998,5398,37250,30804,44180,163450,79,708994,434,19.92,54.19,6.44


Cambiamos la coma por punto para que tomará el decimal.

In [5]:
lana_sucia_chubut = pd.read_csv('datos_producidos/lana_sucia_chubut_2000-2022_FLA.csv', sep=",")
lana_sucia_chubut

Unnamed: 0,actividad_producto_nombre,indicador,unidad_de_medida,frecuencia_nombre,alcance_tipo,alcance_nombre,indice_tiempo,fina,mediana,total,existencias_ovinas
0,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2000-01-01,16600.0,400.0,17000.0,4017000.0
1,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2001-01-01,16600.0,400.0,17000.0,
2,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2002-01-01,16500.0,400.0,16900.0,3871000.0
3,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2003-01-01,20900.0,400.0,21300.0,
4,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2004-01-01,21500.0,400.0,21900.0,
5,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2005-01-01,22775.0,425.0,23200.0,
6,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2006-01-01,21100.0,900.0,22000.0,4548000.0
7,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2007-01-01,23700.0,300.0,24000.0,4953000.0
8,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2008-01-01,21385.0,215.0,21600.0,5023000.0
9,Lana sucia,Producción,tn,Anual,PROVINCIA,CHUBUT,2009-01-01,17000.0,120.0,17120.0,3990000.0


Miremos las columnas que tiene el dataset

In [22]:
encuesta_ganadera.columns

Index(['DEPARTAMENTO', 'OVINOS', 'OVINOS_%', 'OVEJAS', 'CARNEROS', 'CAPONES',
       'BORREGAS', 'CORDEROS_SEÑALADOS', 'OVINOS_ESQUILADOS',
       'OVINOS_ESQUILADOS_%', 'LANA_SUCIA_PRODUCIDA', 'KG_LANA_CABEZA',
       'FINURA', 'RINDE', 'LANA_SUCIA_%'],
      dtype='object')

Se va a crear una lista de objetos, donde cada objeto va a tener el nombre del departamento y el porcentaje de lana que ese departamento produjo en el año 2014.

In [13]:
departamentos = []
for i in encuesta_ganadera.index:
    departamentos.append({'nombre': encuesta_ganadera["DEPARTAMENTO"][i],
                         'lana_%': encuesta_ganadera["LANA_SUCIA_%"][i],
                          'finura': encuesta_ganadera["FINURA"][i],
                          'rinde': encuesta_ganadera["RINDE"][i]})
departamentos

[{'nombre': 'BIEDMA', 'lana_%': 4.67, 'finura': 19.22, 'rinde': 58.86},
 {'nombre': 'CUSHAMEN', 'lana_%': 5.25, 'finura': 19.74, 'rinde': 63.35},
 {'nombre': 'ESCALANTE', 'lana_%': 6.39, 'finura': 19.83, 'rinde': 50.91},
 {'nombre': 'FLORENTINO AMEGHINO',
  'lana_%': 8.61,
  'finura': 19.53,
  'rinde': 60.37},
 {'nombre': 'FUTALEUFU', 'lana_%': 3.28, 'finura': 20.27, 'rinde': 63.13},
 {'nombre': 'GAIMAN', 'lana_%': 5.79, 'finura': 20.39, 'rinde': 55.06},
 {'nombre': 'GASTRE', 'lana_%': 4.34, 'finura': 19.8, 'rinde': 54.38},
 {'nombre': 'LANGUIÑEO', 'lana_%': 7.11, 'finura': 19.86, 'rinde': 60.94},
 {'nombre': 'MARTIRES', 'lana_%': 4.53, 'finura': 20.1, 'rinde': 49.07},
 {'nombre': 'PASO DE INDIOS', 'lana_%': 6.44, 'finura': 19.92, 'rinde': 54.19},
 {'nombre': 'RAWSON', 'lana_%': 1.52, 'finura': 19.78, 'rinde': 61.22},
 {'nombre': 'RIO SENGUERR', 'lana_%': 17.12, 'finura': 20.1, 'rinde': 59.01},
 {'nombre': 'SARMIENTO', 'lana_%': 6.31, 'finura': 19.92, 'rinde': 48.21},
 {'nombre': 'TEHU

Se va a recorrer el dataset de FLA que solo tiene los totales anuales de lana producidos, como se va a trabajar en kilos a las toneladas se las multiplica por mil para hacer la transformación. Luego se va a recorrer la lista creada anteriormente y se va a calcular el porcentaje de lana que produjo cada departamento a partir del total de lana producido. 

In [14]:
datos=[]
for i in lana_sucia_chubut.index:
    fecha = lana_sucia_chubut['indice_tiempo'][i]
    total_lana_kg = lana_sucia_chubut['total'][i]*1000
    for dpto in departamentos:
        kg_lana = round((dpto['lana_%']*total_lana_kg)/100,2)
        finura = round(random.normalvariate(dpto['finura'], 0.95),2)
        rinde = round(random.normalvariate(dpto['rinde'], 0.95),2)
        datos.append([fecha, dpto['nombre'],kg_lana,finura,rinde])
datos

[['2000-01-01', 'BIEDMA', 793900.0, 20.39, 59.21],
 ['2000-01-01', 'CUSHAMEN', 892500.0, 19.1, 61.65],
 ['2000-01-01', 'ESCALANTE', 1086300.0, 21.9, 49.99],
 ['2000-01-01', 'FLORENTINO AMEGHINO', 1463700.0, 19.61, 60.32],
 ['2000-01-01', 'FUTALEUFU', 557600.0, 20.57, 63.37],
 ['2000-01-01', 'GAIMAN', 984300.0, 20.76, 54.52],
 ['2000-01-01', 'GASTRE', 737800.0, 19.27, 55.73],
 ['2000-01-01', 'LANGUIÑEO', 1208700.0, 19.0, 60.69],
 ['2000-01-01', 'MARTIRES', 770100.0, 20.64, 47.37],
 ['2000-01-01', 'PASO DE INDIOS', 1094800.0, 20.11, 54.48],
 ['2000-01-01', 'RAWSON', 258400.0, 17.66, 61.53],
 ['2000-01-01', 'RIO SENGUERR', 2910400.0, 20.89, 58.82],
 ['2000-01-01', 'SARMIENTO', 1072700.0, 19.47, 46.59],
 ['2000-01-01', 'TEHUELCHES', 2397000.0, 18.32, 60.39],
 ['2000-01-01', 'TELSEN', 773500.0, 18.22, 54.67],
 ['2000-01-01', 'TOTAL', 17000000.0, 21.26, 57.38],
 ['2001-01-01', 'BIEDMA', 793900.0, 19.01, 59.03],
 ['2001-01-01', 'CUSHAMEN', 892500.0, 19.32, 63.65],
 ['2001-01-01', 'ESCALANTE',

Por último se va a utilizar la lista de datos obtenidas para conseguir el siguiente dataframe:

In [15]:
columnas = ['anio','departamento', 'kg_lana','finura','rinde']
lana_chubut = pd.DataFrame(datos,columns=columnas)
lana_chubut

Unnamed: 0,anio,departamento,kg_lana,finura,rinde
0,2000-01-01,BIEDMA,793900.00,20.39,59.21
1,2000-01-01,CUSHAMEN,892500.00,19.10,61.65
2,2000-01-01,ESCALANTE,1086300.00,21.90,49.99
3,2000-01-01,FLORENTINO AMEGHINO,1463700.00,19.61,60.32
4,2000-01-01,FUTALEUFU,557600.00,20.57,63.37
...,...,...,...,...,...
363,2022-01-01,RIO SENGUERR,1977589.41,19.72,58.07
364,2022-01-01,SARMIENTO,728889.55,20.94,49.20
365,2022-01-01,TEHUELCHES,1628738.94,18.47,60.56
366,2022-01-01,TELSEN,525585.97,19.11,55.35


Guardamos los datos en un archivo csv

In [16]:
lana_chubut.to_csv('datos_producidos/lana_chubut_2000-2022.csv', index=False)

Cada fila va a tener la siguiente información:

In [17]:
lana_chubut.loc[128]

anio            2008-01-01
departamento        BIEDMA
kg_lana          1008720.0
finura               18.88
rinde                 58.4
Name: 128, dtype: object

16 a 25 micrones  tiene la raza merino
https://www.magyp.gob.ar/sitio/areas/prolana/documentacion/manual-acondicionamiento-lanas.pdf pag11

 25 y 32 micrones. tiene la corrialde
 
 ![image.png](attachment:image.png)