In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import plotly.express as px
import plotly.graph_objects as go

In [2]:
# Obtenido de
# https://www.datos.gob.ar/dataset/agroindustria-producciones-sostenibles---emisiones-gei-provenientes-agricultura-ganaderia-otros/archivo/agroindustria_f05eac90-6b9b-4b65-80f4-d015f3b64b26

Filename = "data.csv"
df = pd.read_csv(Filename, sep=";")
df.drop('unidades', inplace=True, axis=1); df.drop('pais_id', inplace=True, axis=1); df.drop('pais', inplace=True, axis=1)
df.rename(columns = {'valor':'valor(MtCO2eq)'}, inplace = True)
df.head()

Unnamed: 0,anio,sector_IPCC,categoria_IPCC,subcategoria_de_1er_orden,subactividad,fuente_de_emision_y_absorcion_id,fuente_de_emision_y_absorcion,gas,valor(MtCO2eq)
0,1990,"Agricultura, Ganaderia, Silvicultura y Otros U...",Tierras,Tierras Forestales,Bosque Nativo,3B1ai1,Tierras forestales que permanecen como tales (...,CO2,11.73
1,1990,"Agricultura, Ganaderia, Silvicultura y Otros U...",Tierras,Tierras Forestales,Bosque Nativo,3B1ai2,Tierras forestales que permanecen como tales (...,CO2,-4.08
2,1990,"Agricultura, Ganaderia, Silvicultura y Otros U...",Tierras,Tierras Forestales,Bosque Cultivado,3B1aii1,Tierras forestales que permanecen como tales (...,CO2,5.82
3,1990,"Agricultura, Ganaderia, Silvicultura y Otros U...",Tierras,Tierras Forestales,Bosque Cultivado,3B1aii2,Tierras forestales que permanecen como tales (...,CO2,-20.77
4,1990,"Agricultura, Ganaderia, Silvicultura y Otros U...",Tierras,Tierras de Cultivo,Cultivo/Pasturas,3B2bi,Tierras forestales convertidas en suelos culti...,CO2,28.09


In [3]:
df.info()
df['anio'].unique()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2641 entries, 0 to 2640
Data columns (total 9 columns):
 #   Column                            Non-Null Count  Dtype  
---  ------                            --------------  -----  
 0   anio                              2641 non-null   int64  
 1   sector_IPCC                       2641 non-null   object 
 2   categoria_IPCC                    2641 non-null   object 
 3   subcategoria_de_1er_orden         2641 non-null   object 
 4   subactividad                      2641 non-null   object 
 5   fuente_de_emision_y_absorcion_id  2641 non-null   object 
 6   fuente_de_emision_y_absorcion     2641 non-null   object 
 7   gas                               2641 non-null   object 
 8   valor(MtCO2eq)                    2641 non-null   float64
dtypes: float64(1), int64(1), object(7)
memory usage: 185.8+ KB


array([1990, 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000,
       2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011,
       2012, 2013, 2014, 2015, 2016], dtype=int64)

In [4]:
# MtCO2eq == millones de toneladas de dióxido de carbono equivalente
# https://www.ipcc-nggip.iges.or.jp/public/2006gl/spanish/pdf/1_Volume1/V1_8x_Ch8_An2_ReportingTables.pdf

#for each value in fuente_de_emision_y_absorcion_id column, get the sum of the values in valor column
MtCO2eq_emitidos_por_fuente_id = df.groupby('fuente_de_emision_y_absorcion_id', as_index = False).agg({'valor(MtCO2eq)':'sum'}).sort_values('valor(MtCO2eq)')
MtCO2eq_emitidos_por_fuente_id


# 3B3b1: Tierras forestales convertidas en pastizales
# 3A1aii: Fermentación entérica de ganado
# 3B2bi: Tierras forestales convertidas en tierras de cultivo
# 3B1ai1: 
# 3C4c: Emisiones directas de N2O de los suelos gestionados



Unnamed: 0,fuente_de_emision_y_absorcion_id,valor(MtCO2eq)
22,3B1aii2,-919.37
24,3B2bii,-236.59
20,3B1ai2,-114.88
74,3C5gi2,0.00
63,3C5div1,0.00
...,...,...
37,3C4c,432.49
19,3B1ai1,503.22
23,3B2bi,858.85
1,3A1aii,1289.56


In [5]:
fig = px.line(df, x="anio", y="valor(MtCO2eq)", color="fuente_de_emision_y_absorcion_id", hover_name="fuente_de_emision_y_absorcion_id")
fig.show()


In [6]:
#Gases emitidos
gases_emitidos = df[df['valor(MtCO2eq)'] > 10]
gases_emitidos = gases_emitidos.groupby('fuente_de_emision_y_absorcion', as_index = False).agg({'valor(MtCO2eq)':'sum'}).sort_values('valor(MtCO2eq)')
fig = px.bar(gases_emitidos, x="valor(MtCO2eq)", y="fuente_de_emision_y_absorcion", color="fuente_de_emision_y_absorcion", hover_name="fuente_de_emision_y_absorcion")
fig.show()

In [11]:
gases_emitidos = df[df['valor(MtCO2eq)'] > 10]
gases_emitidos = gases_emitidos.groupby(['fuente_de_emision_y_absorcion', 'anio'], as_index = False).agg({'valor(MtCO2eq)':'sum'}).sort_values('valor(MtCO2eq)' , ascending=True)
gases_emitidos = gases_emitidos.sort_values('valor(MtCO2eq)' , ascending=True)
fig = px.bar(gases_emitidos, x="anio", y="valor(MtCO2eq)", color="fuente_de_emision_y_absorcion", hover_name="fuente_de_emision_y_absorcion")
fig.show()
fig.write_image("images/MtCO2eq_mean_por_fuente_y_año_bar.svg")

In [115]:
gases_emitidos = df[df['valor(MtCO2eq)'] > 0]
gases_emitidos = gases_emitidos.groupby('subactividad', as_index = False).agg({'valor(MtCO2eq)':'sum'}).sort_values('valor(MtCO2eq)')
fig = px.bar(gases_emitidos, x="subactividad", y="valor(MtCO2eq)", color="subactividad", hover_name="subactividad")
fig.show()

In [110]:
#Gases absorbidos
gases_absorbidos = df[df['valor(MtCO2eq)'] < 0]
gases_absorbidos = gases_absorbidos.groupby('fuente_de_emision_y_absorcion', as_index = False).agg({'valor(MtCO2eq)':'sum'}).sort_values('valor(MtCO2eq)')
fig = px.bar(gases_absorbidos, x="fuente_de_emision_y_absorcion", y="valor(MtCO2eq)", color="fuente_de_emision_y_absorcion", hover_name="fuente_de_emision_y_absorcion")
fig.show()

In [9]:
gases_totales_emitidos = df[df['valor(MtCO2eq)'] > 0]
total_emissions = gases_totales_emitidos.groupby('anio', as_index = False).agg({'valor(MtCO2eq)':'sum'})
fig = px.line(total_emissions, x="anio", y="valor(MtCO2eq)", color_discrete_sequence=['red'])
fig.show()
fig.write_image("images/MtCO2eq_sum_por_año.svg")


In [20]:
# group fuente_de_emision_y_absorcion if includes 'forestales' or 'forestal' and valor(MtCO2eq) > 0 and group by anio and sum the values, then get rate of change as a percentage
forestales = df[df['fuente_de_emision_y_absorcion'].str.contains('forestales|forestal', case=False)]
forestales = forestales[forestales['valor(MtCO2eq)'] > 0]
forestales = forestales.groupby('anio', as_index = False).agg({'valor(MtCO2eq)':'sum'})
forestales['rate_of_change'] = forestales['valor(MtCO2eq)'].pct_change()
forestales['rate_of_change'] = forestales['rate_of_change'].fillna(0)
forestales['rate_of_change'] = forestales['rate_of_change'].apply(lambda x: x*100)
forestales['rate_of_change'] = forestales['rate_of_change'].round(2)
fig = px.line(forestales, x="anio", y="rate_of_change", color_discrete_sequence=['green'])
fig.show()
fig.write_image("images/change_rate_of_deforestacion.svg")

In [41]:
gases_totales_absorbidos = df[df['valor(MtCO2eq)'] < 0]
total_emissions = gases_totales_absorbidos.groupby('anio', as_index = False).agg({'valor(MtCO2eq)':'sum'})
fig = px.line(total_emissions, x="anio", y="valor(MtCO2eq)", color_discrete_sequence=['blue'])
fig.show()
fig.write_image("images/MtCO2eq_sum_absorbido_por_año.svg")

In [47]:
MtCO2eq_por_gas = df.groupby('gas', as_index = False).agg({'valor(MtCO2eq)':'sum'}).sort_values('valor(MtCO2eq)')
#plot the MtCO2eq_por_gas series as a plotly pie chart
fig = px.pie(MtCO2eq_por_gas, values='valor(MtCO2eq)', names='gas')
fig.show()

In [83]:
gases_emitidos_por_fuente = df[df['valor(MtCO2eq)'] > 10].groupby(['subactividad', 'gas'], as_index = False).agg({'valor(MtCO2eq)':'sum'}).sort_values('valor(MtCO2eq)')
gases_emitidos_por_fuente

Unnamed: 0,subactividad,gas,valor(MtCO2eq)
5,Produccion agricola,N2O,20.86
0,Bosque Cultivado,CO2,377.08
3,Bovinos de Carne,N2O,432.49
1,Bosque Nativo,CO2,503.22
2,Bovinos de Carne,CH4,1289.56
4,Cultivo/Pasturas,CO2,2609.45


In [84]:
gases_absorbidos_por_fuente = df[df['valor(MtCO2eq)'] < 0].groupby(['subactividad', 'gas'], as_index = False).agg({'valor(MtCO2eq)':'sum'}).sort_values('valor(MtCO2eq)')
gases_absorbidos_por_fuente

Unnamed: 0,subactividad,gas,valor(MtCO2eq)
0,Bosque Cultivado,CO2,-919.37
2,Cultivo/Pasturas,CO2,-236.59
1,Bosque Nativo,CO2,-114.88
