<a href="https://colab.research.google.com/github/SebaSego/AnalisisDatos/blob/main/Biocombustible.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Biocombustibles en Argentina


## Fuente de datos

Datos extraidos del portal https://datos.gob.ar

Datos sobre producción de soja destinada al biodiesel https://datos.gob.ar/dataset/agroindustria-soja---produccion-aceite-para-biodiesel


### (instalar software, etc.)

In [None]:
!pip install --upgrade plotly >/dev/null 2>&1 ;
;

''

# Nueva sección

In [None]:
PrepareForWeb= False
PrepareForWeb= True #U: descomentar esta línea antes de guardar en github

In [None]:
import pandas as pd #U: leer y agrupar datos
import numpy as np

import plotly.graph_objects as go #U: graficar con plotly
import plotly.express as px #U: graficar con plotly
import plotly #SEE: https://medium.com/@282abhishek/using-plotly-with-nbconvert-in-google-colab-96834c4f2850
if PrepareForWeb:
  plotly.offline.init_notebook_mode(connected=True)
else:
  plotly.io.renderers.default = 'colab'

##Datos de producción y ventas de biocombustibles.
Datos extraidos de https://datos.gob.ar/dataset/sspm-produccion-ventas-biocombustibles

Unidades medidas en toneladas

In [None]:
df_biocombustibles = pd.read_csv('https://infra.datos.gob.ar/catalog/sspm/dataset/368/distribution/368.3/download/produccion-ventas-biocombustibles-anual-mensual.csv')

df_biocombustibles.rename(columns={'indice_tiempo':'fecha'}, inplace=True)
df_biocombustibles.fecha = pd.to_datetime(df_biocombustibles.fecha, format='%Y-%m-%d')
df_biocombustibles['total_ventas'] = df_biocombustibles['biodisel_ventas_al_corte']+ df_biocombustibles['biodisel_otras_ventas_al_mercado_interno']+df_biocombustibles['biodisel_exportaciones']

df_biocombustibles.head()

Unnamed: 0,fecha,biodisel_produccion,biodisel_ventas_al_corte,biodisel_otras_ventas_al_mercado_interno,biodisel_exportaciones,bioetanol_total_produccion,bioetanol_total_ventas_corte,bioetanol_en_base_a_maiz_produccion,bioetanol_base_maiz_ventas_corte,bioetanol_base_cania_azucar_produccion,bioetanol_base_cania_azucar_ventas_corte,total_ventas
0,2008-01-01,47251.0,0.0,1.0,43599.0,,,,,,,43600.0
1,2008-02-01,38747.0,0.0,0.0,25147.0,,,,,,,25147.0
2,2008-03-01,42095.0,0.0,264.0,52150.0,,,,,,,52414.0
3,2008-04-01,43881.0,0.0,0.0,55907.0,,,,,,,55907.0
4,2008-05-01,51679.0,0.0,0.0,42214.0,,,,,,,42214.0


In [None]:
fig = px.line(df_biocombustibles, x="fecha", y=["biodisel_produccion","total_ventas"], title='Datos de Producción y Ventas')
fig.show()



##Soja - Producción de aceite para biodiesel
Dirección de Bioenergía, Secretaria de Alimentos y Bioeconomía

Datos estimados de la producción de aceite de soja destinado a la elaboración de biodiesel. Datos expresados en toneladas, poseen información desde el año 2014 hasta la actualidad.

Fecha de actualización
24 de octubre de 2019 (dato extraido de la página)

In [None]:
soja_df= pd.read_csv(r'https://datos.magyp.gob.ar/dataset/f0f27bbd-d54a-4633-93ff-79dbf52ac62a/resource/02648480-3c6f-4331-93ff-d4fe9daa9e99/download/estimacion-del-aceite-de-soja-destinado-a-la-elaboracion-de-biodiesel-.csv')

soja_df.head()

Unnamed: 0,cod_pais,nom_pais,año,mes,insumo,destino,cod_uni_med,nom_uni_med,cantidad
0,32,Argentina,2014,Enero,aceite de soja,biodiesel,t,toneladas,145809
1,32,Argentina,2014,Febrero,aceite de soja,biodiesel,t,toneladas,136940
2,32,Argentina,2014,Marzo,aceite de soja,biodiesel,t,toneladas,125415
3,32,Argentina,2014,Abril,aceite de soja,biodiesel,t,toneladas,147477
4,32,Argentina,2014,Mayo,aceite de soja,biodiesel,t,toneladas,237136


##Estableciendo DataFrame con datos a utilizar

Solo utilizo año, mes y cantidad. Se renombra "cantidad" en "Toneladas"

In [None]:
filtro=soja_df.columns.isin(['año', 'mes', 'cantidad'])
selectedCols =soja_df.columns[filtro]
df = soja_df[selectedCols]
df.rename(columns={'cantidad':'Toneladas'}, inplace=True)
df[0:12]



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



Unnamed: 0,año,mes,Toneladas
0,2014,Enero,145809
1,2014,Febrero,136940
2,2014,Marzo,125415
3,2014,Abril,147477
4,2014,Mayo,237136
5,2014,Junio,258457
6,2014,Julio,284321
7,2014,Agosto,287682
8,2014,Septiembre,305381
9,2014,Octubre,319244


##Cambiando dato string de meses a numérico

In [None]:
df["mes"] = df["mes"].replace({"Enero": 1, "Febrero": 2, "Marzo": 3, "Abril": 4, "Mayo": 5, "Junio": 6, "Julio": 7, "Agosto": 8, "Septiembre": 9, "Octubre": 10, "Noviembre": 11, "Diciembre": 12})
df.head()



### Backtesting y simulación en finanzas

#### Dólar vs Inflación en Argentina

In [None]:
uva_df_tables= pd.read_html('http://data.podemosaprender.org/finanzas/UVA_BCRA_2022.html')
uva_df= uva_df_tables[0] #A: sabemos que hay una sola!
uva_df.rename(columns={'Valor':'UVA', 'Fecha': 'fecha'}, inplace=True)
uva_df.fecha= pd.to_datetime( uva_df.fecha, format='%Y-%m-%d')

usd_blue_df= pd.read_csv("https://data.podemosaprender.org/finanzas/USD_BLUE_2022.csv", sep="\t")
usd_blue_df.fecha= pd.to_datetime( usd_blue_df.fecha, format='%Y/%m/%d')

uva_usd_df= pd.merge(uva_df, usd_blue_df, on="fecha")

uva_usd_df.head()

Unnamed: 0,fecha,UVA,compra,venta
0,2022-01-03,97.58,202.0,202.0
1,2022-01-04,97.82,202.5,202.5
2,2022-01-05,97.89,203.5,203.5
3,2022-01-06,97.97,204.5,204.5
4,2022-01-07,98.05,204.0,204.0


In [None]:
fig = px.line(uva_usd_df, x="fecha", y=["UVA","venta"], title='Dólar vs Inflación')
fig.show()

In [None]:
uva_usd_df['usd_en_uva']= uva_usd_df.venta / uva_usd_df.UVA
uva_usd_df.head()

Unnamed: 0,fecha,UVA,compra,venta,usd_en_uva
0,2022-01-03,97.58,202.0,202.0,2.070096
1,2022-01-04,97.82,202.5,202.5,2.070129
2,2022-01-05,97.89,203.5,203.5,2.078864
3,2022-01-06,97.97,204.5,204.5,2.087374
4,2022-01-07,98.05,204.0,204.0,2.080571


In [None]:
fig = px.line(uva_usd_df, x="fecha", y=["usd_en_uva"], title='USD/UVA')
fig.show()

In [None]:
uva_usd_df['chg']= uva_usd_df.usd_en_uva.pct_change()

In [None]:
px.histogram(uva_usd_df, x='chg', nbins=10, title='Cuantos días para cada % de suba/baja del dólar en uva')