# Librairie Pymrio et EXIOBASE3

Pymrio est une librairie sur Python qui permet de télécharger, manipuler et analyser des bases de données de tableaux entrées-sorties multi-régionaux environnementaux (EE MRIO) avec un accès libre telles que EXIOBASE, WIOD, EORA26 et OECD-ICIO.

[Lien](https://github.com/IndEcol/pymrio) du dêpot GitHup contenant le code source de Pymrio.

[Lien](https://pymrio.readthedocs.io/en/latest/) de la documentation supplémentaire sur la librairie Pymrio.

[Lien](https://openresearchsoftware.metajnl.com/articles/10.5334/jors.251)



Pour installer le package Pymrio: <br>
pip install pymrio --upgrade

In [5]:
#importation de la librairie Pymrio
import pymrio
import pandas as pd

In [None]:
#Chemin du dossier où seront stocker les bases de données MRIO 
exio3_folder = "/tmp/mrios/autodownload/EXIO3"

##### Processus de téléchargement et de chargement pour les données EXIOBASE3

In [None]:
#Téléchargement des bases de donnée MRIO en format produit x produit pour les années choisies, ici 2007
exio_download = pymrio.download_exiobase3(
    storage_folder=exio3_folder, system="pxp", years=[2007])

#Chargement des données EXIOBASE3 en produit x produit pour l'année 2007
#calc_all() permet d'identifier les tables manquantes et de les calculer 
exio3_pxp = pymrio.parse_exiobase3(path="C:/Master 1/Stage/EXIOBASE3/IOT_2007_ixi.zip").calc_all()

In [7]:
#Téléchargement des bases de donnée MRIO en format industrie x industrie pour les années choisies, ici 2007
#exio_download = pymrio.download_exiobase3(
    #storage_folder=exio3_folder, system="ixi", years=[2007])

#Chargement des données EXIOBASE3 en industrie x industrie pour l'année 2007 
#calc_all() permet d'identifier les tables manquantes et de les calculer 
exio3_ixi = pymrio.parse_exiobase3(path="C:/Master 1/Stage/EXIOBASE3/IOT_2007_ixi.zip").calc_all()

  Y_agg = Y.groupby(level="region", axis=1, sort=False).sum()
  F_Y_agg = self.F_Y.groupby(level="region", axis=1, sort=False).sum()
  Y_agg = Y.groupby(level="region", axis=1, sort=False).sum()
  F_Y_agg = self.F_Y.groupby(level="region", axis=1, sort=False).sum()


Enregistrement des bases de donnée en format zip le nom:
- IOT_{YEAR}_pxp pour les tables input-output en format produit x produit pour l'année choisit.
- IOT_{YEAR}_ixi pour les tables input-output en format industrie x industrie pour l'année choisit.

Il est possible de télécharger les données MRIO de EXIOBASE3 de 1995 à 2022.

Nous nous intéressons ici aux base de données MRIO de EXIOBASE3, car ce sont celles que nous avons utilisé tout au long de notre analyse. Si vous êtes intéressé par les bases de données MRIO telles que celles de WIOD, EORA26 et OECD-ICIO, vous pouvez voir leur processus de téléchargement et de chargements en suivant ce [lien](https://pymrio.readthedocs.io/en/latest/notebooks/autodownload.html#).

## Base de donnée MRIO de EXIOBASE3

Pour notre analyse, nous nous concentrons sur l'utilisation des données MRIO industry x industry car elles sont plus aggrégés que celles en format produit x produit. Cela nous permet de facilter notre analyse en manipulant des bases de données moins volumineuses.

EXIOBASE3 est composés de 49 régions. Le détail de ces régions peuvent être retrouvés en cliquant [ici](https://github.com/MarDrd/exiobase3-manipulation/blob/main/R%C3%A9gions.ipynb).

Chaque donnée MRIO de EXIOBASE3 contient les base de données en format texte suivantes:
- A.txt: la matrice des coefficients qui représente le niveau d'intrants nécessaires en millions d'euros pour produire un million d'euros de production dans chaque industrie.
- finaldemands.txt: liste des differentes catégories de demande finale.
- industries.txt: liste de toutes les industries.
- products.txt: liste de tous les produits.
- unit.txt: liste des unités utilisés pour chaque industrie, ici elles sont toutes exprimés en millions d'euros.
- x.txt: la production totale par régions et par secteurs.
- Y.txt: la matrice de la demande finale qui représente la consommation finale pour plusieurs catégories de demande finale.
- Z.txt: la matrice de transaction qui représente les échanges de biens et services entres industries.

On retrouve égalment deux sous-dossiers 'impacts' et 'satellite'. Le sous-dossier 'impacts' regroupe des stresseursenvironnementaux agrégés tel que les emissions de gaz à effet de serre, l'utilisation des sols, alors que le sous-dossier 'satellite' désaggrage ces mêmes stresseurs environmentaux avec par exemple le d'émissions de CO2, de CH4 et de N2O suite à la combustion, et l'utilisation des sols pour quels types de cultivation.

Ces sous-dossiers regroupent les matrices suivantes:
- D_cba_reg.txt: les impacts/stresseurs associés à la consommation finale dans chaque région.
- D_cba.txt: les impacts/stresseurs associés à la consommation finale dans chaque industrie.
- D_exp_reg.txt: les impacts/stresseurs associés aux exportations dans chaque région.
- D_imp_reg.txt: les impacts/stresseurs associés aux importantions dans chaque région.
- D_pba_reg.txt: les impacts/stresseurs environnementaux associés à la production dans chaque région.
- D_pba.txt: les impacts/stresseurs environnementaux associés à la production dans chaque industrie.
- F_Y.txt: les impacts/stresseurs associés à la demande finale
- F_Y.txt: les impacts/stresseurs associés à la production
- M.txt: la matrice de coefficients techniques qui représente les besoins d'input directs et indirects en millions d'euros pour produire un million d'euros de production dans chaque industrie.
- S_Y.txt: la matrice de coefficients des impacts/stresseurs environnementaux pour répondre à la demande finale.
- S.txt: la matrice de coefficients des impacts/stresseurs environnementaux pour chaque industries.
- unit.txt: liste des unités utilisés pour chaque impact/stresseur.

Pour avoir plus de détails sur ces base de données EXIOBASE3 vous pouvez cliquer [ici](https://zenodo.org/records/5589597).

Nous avons crée un document donnant plus de détails sur la formations de ces matrices, leur composition et leur taille que vous pouvez retrouver en cliquant ici.



In [9]:
#La matrice x
x = exio3_ixi.x

#La matrice Y
Y = exio3_ixi.Y

#La matrice Z
Z = exio3_ixi.Z

#La matrice A
A = exio3_ixi.A

#Afficher la matrice A
A

Unnamed: 0_level_0,region,AT,AT,AT,AT,AT,AT,AT,AT,AT,AT,...,WM,WM,WM,WM,WM,WM,WM,WM,WM,WM
Unnamed: 0_level_1,sector,Cultivation of paddy rice,Cultivation of wheat,Cultivation of cereal grains nec,"Cultivation of vegetables, fruit, nuts",Cultivation of oil seeds,"Cultivation of sugar cane, sugar beet",Cultivation of plant-based fibers,Cultivation of crops nec,Cattle farming,Pigs farming,...,Landfill of waste: Paper,Landfill of waste: Plastic,Landfill of waste: Inert/metal/hazardous,Landfill of waste: Textiles,Landfill of waste: Wood,Activities of membership organisation n.e.c. (91),"Recreational, cultural and sporting activities (92)",Other service activities (93),Private households with employed persons (95),Extra-territorial organizations and bodies
region,sector,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2,Unnamed: 19_level_2,Unnamed: 20_level_2,Unnamed: 21_level_2,Unnamed: 22_level_2
AT,Cultivation of paddy rice,0,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,...,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0
AT,Cultivation of wheat,0,2.258764e-02,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,5.164785e-04,5.577288e-03,4.704554e-03,...,6.071806e-06,8.040446e-06,5.796127e-06,4.920378e-06,5.687491e-06,5.113861e-07,3.436722e-07,6.724194e-07,7.523895e-07,0
AT,Cultivation of cereal grains nec,0,0.000000e+00,1.061038e-02,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,8.581725e-04,3.237179e-02,2.704344e-02,...,7.769757e-07,9.322033e-07,7.521803e-07,4.956332e-07,5.858888e-07,6.749016e-08,4.837023e-08,9.658764e-08,7.836770e-08,0
AT,"Cultivation of vegetables, fruit, nuts",0,0.000000e+00,0.000000e+00,5.706509e-02,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,1.759431e-04,4.850276e-04,...,1.092704e-07,1.285469e-07,1.065467e-07,3.548421e-08,6.990969e-08,8.376130e-09,6.850061e-09,1.416513e-08,5.658243e-09,0
AT,Cultivation of oil seeds,0,0.000000e+00,0.000000e+00,0.000000e+00,3.859388e-03,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,0.000000e+00,...,8.192021e-08,7.736781e-08,8.111924e-08,0.000000e+00,1.070722e-08,7.350793e-09,5.422107e-09,1.202731e-08,6.429437e-09,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
WM,Activities of membership organisation n.e.c. (91),0,8.836211e-08,8.627059e-08,7.027429e-08,5.852782e-08,9.277384e-08,4.428400e-09,1.021812e-07,1.945998e-07,6.614018e-08,...,6.059761e-05,2.655170e-05,7.483004e-05,7.766794e-06,1.294307e-05,4.588709e-03,2.208544e-03,1.001438e-03,4.074000e-04,0
WM,"Recreational, cultural and sporting activities (92)",0,8.141581e-07,7.757368e-07,7.342500e-07,4.065691e-07,6.860121e-07,4.038786e-08,9.121560e-07,2.193257e-06,7.921487e-07,...,3.040268e-04,2.084056e-04,3.245523e-04,9.109386e-05,1.427306e-04,5.966059e-03,6.440629e-02,6.107510e-03,8.189689e-05,0
WM,Other service activities (93),0,5.156536e-07,6.399811e-07,2.599953e-07,4.071806e-07,6.015722e-07,3.020993e-08,4.769550e-07,5.965346e-07,2.470385e-07,...,2.506339e-05,1.381828e-05,2.967456e-05,9.225008e-06,1.185983e-05,2.661496e-03,2.909821e-03,1.295877e-02,1.551007e-05,0
WM,Private households with employed persons (95),0,2.774700e-07,2.724062e-07,1.849266e-07,2.047110e-07,2.994369e-07,1.529985e-07,2.764596e-07,6.080766e-07,3.310197e-07,...,4.036282e-05,2.697648e-05,3.741977e-05,2.231206e-05,2.505964e-05,5.942988e-04,4.192704e-04,8.290709e-04,4.463836e-03,0


In [10]:
#Pour les matrices satelittes avec ici l'exemple de la matrice D_cba et M
D_cba_sat = exio3_ixi.satellite.D_cba
M_sat = exio3_ixi.satellite.M

#Pour les matrices impacts avec ici l'exemple de la matrice D_cba et M
D_cba_imp = exio3_ixi.impacts.D_cba
M_imp = exio3_ixi.impacts.M

### La librairie Pymrio possède des fonctions qui permettent de calculer certaines matrices directement.

In [22]:
#Fonction qui calcul la matrice x grâce aux matrices Z et Y
x = pymrio.calc_x(Z=exio3_ixi.Z, Y=exio3_ixi.Y)

#Fonction qui calcul la matrice Z grâce à la matrices Z et x
Z = pymrio.calc_Z(A=exio3_ixi.A, x=x)

#Fonction qui calcul la matrice A grâce aux matrices Z et x
A = pymrio.calc_A(Z=exio3_ixi.Z, x=x)

#Calcul la matrice inverse de Leontief L grâce à la matrice A
L = pymrio.calc_L(A)

#Fonction qui calcul la matrice S asscoiés aux impacts grâce aux matrices F et x
S = pymrio.calc_S(F=exio3_ixi.impacts.F, x=x)

#Fonction qui calcul la matrice F asscoiés aux impacts grâce aux matrices S et x
F = pymrio.calc_F(S=S, x=x)

#Fonction qui calcul la matrice M asscoiés aux impacts grâce aux matrices S et L
M = pymrio.calc_M(S=S, L=L)

#Fonction qui calcul les matrices D_cba, D_pba, D_imp, D_exp asscoiés aux impacts grâce aux matrices S, L et Y
#Pour cette fonction Y doit être un vecteur soit en aggregeant les catégories de demande finale soit en gardant qu'une seule catégorie de demande finale
Y_aggregated = Y.groupby(level=0, axis=1).sum()
D_cba, D_pba, D_imp, D_exp = pymrio.calc_accounts(S=S, L=L, Y=Y_aggregated)

#Afficher les 5 premières lignes de la matrice D_cba
D_cba.head(5)

  Y_aggregated = Y.groupby(level=0, axis=1).sum()


region,AT,AT,AT,AT,AT,AT,AT,AT,AT,AT,...,ZA,ZA,ZA,ZA,ZA,ZA,ZA,ZA,ZA,ZA
sector,Cultivation of paddy rice,Cultivation of wheat,Cultivation of cereal grains nec,"Cultivation of vegetables, fruit, nuts",Cultivation of oil seeds,"Cultivation of sugar cane, sugar beet",Cultivation of plant-based fibers,Cultivation of crops nec,Cattle farming,Pigs farming,...,Landfill of waste: Paper,Landfill of waste: Plastic,Landfill of waste: Inert/metal/hazardous,Landfill of waste: Textiles,Landfill of waste: Wood,Activities of membership organisation n.e.c. (91),"Recreational, cultural and sporting activities (92)",Other service activities (93),Private households with employed persons (95),Extra-territorial organizations and bodies
impact,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2,Unnamed: 19_level_2,Unnamed: 20_level_2,Unnamed: 21_level_2
Value Added,1.165228,72.93693,187.9488,1435.315,88.8781,3.421644,7.018376,112.9411,77.29447,234.691,...,0.2346616,0.1694597,0.257122,0.1955278,0.2225206,9.519707,22.51579,652.7047,1547.105,0.0
Employment,1.087367,4.945363,8.184454,135.8364,8.096996,0.5457298,1.530912,18.34711,11.0787,14.27908,...,0.05683599,0.04917672,0.065697,0.06603862,0.0678748,1.516646,1.539625,104.4897,272.838,0.0
Employment hour,2140753.0,11219050.0,19198750.0,301221600.0,17094000.0,1194957.0,2993909.0,40205420.0,25628170.0,32817020.0,...,129038.9,112573.9,147908.655462,152416.0,155659.3,3256656.0,3287362.0,225706900.0,500918300.0,0.0
"GHG emissions (GWP100) | Problem oriented approach: baseline (CML, 2001) | GWP100 (IPCC, 2007)",19748200.0,125092900.0,217648700.0,707052600.0,131333900.0,4128663.0,9106723.0,72025580.0,615806400.0,187240800.0,...,14539440.0,1870495.0,576633.823855,21279300.0,4209811.0,6396480.0,14020360.0,635237400.0,1394534000.0,0.0
"Human toxicity (USEtox) | USEtox2008 | CTUh (Rosenbaum et al., 2008)",0.1754099,10.681,19.98804,159.6359,14.03225,0.433496,1.773168,39.27549,15.14755,23.49462,...,0.1884004,0.1677437,0.189317,0.1990936,0.2208522,3.843273,6.620889,357.2236,673.8148,0.0


In [21]:
#Fonction qui calcul le niveau d'impact nécessaire pour répondre à chaque catégorie de la demande finale
E = pymrio.calc_e(M=M, Y=Y)

#Afficher les 5 premières lignes de la matrice E
E.head(5)

region,AT,AT,AT,AT,AT,AT,AT,BE,BE,BE,...,WF,WF,WF,WM,WM,WM,WM,WM,WM,WM
category,Final consumption expenditure by households,Final consumption expenditure by non-profit organisations serving households (NPISH),Final consumption expenditure by government,Gross fixed capital formation,Changes in inventories,Changes in valuables,Exports: Total (fob),Final consumption expenditure by households,Final consumption expenditure by non-profit organisations serving households (NPISH),Final consumption expenditure by government,...,Changes in inventories,Changes in valuables,Exports: Total (fob),Final consumption expenditure by households,Final consumption expenditure by non-profit organisations serving households (NPISH),Final consumption expenditure by government,Gross fixed capital formation,Changes in inventories,Changes in valuables,Exports: Total (fob)
impact,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2,Unnamed: 19_level_2,Unnamed: 20_level_2,Unnamed: 21_level_2
Value Added,140856.2,7054.04,53302.06,65798.51,4108.589,0.0,0.0,146446.8,23917.06,74177.0,...,9592.717,11513.65,0.0,500800.2,74947.25,194955.4,448791.9,0.0,0.0,0.0
Employment,3569.229,119.4609,1116.907,1511.935,118.068,0.0,0.0,5970.906,390.7764,1593.79,...,2497.507,4441.666,0.0,30298.33,3031.015,7953.547,22333.85,0.0,0.0,0.0
Employment hour,7167951000.0,213364700.0,1915819000.0,2973583000.0,238292600.0,0.0,0.0,12479770000.0,615785900.0,2736959000.0,...,5405545000.0,9446774000.0,0.0,69838770000.0,8063050000.0,20954270000.0,53669590000.0,0.0,0.0,0.0
"GHG emissions (GWP100) | Problem oriented approach: baseline (CML, 2001) | GWP100 (IPCC, 2007)",60230760000.0,1478852000.0,9507893000.0,27623290000.0,2554129000.0,0.0,0.0,79479790000.0,3486122000.0,17910950000.0,...,9892341000.0,8409813000.0,0.0,767591900000.0,60567880000.0,177124200000.0,561429000000.0,0.0,0.0,0.0
"Human toxicity (USEtox) | USEtox2008 | CTUh (Rosenbaum et al., 2008)",18217.83,356.0401,2696.652,20551.47,2055.69,0.0,0.0,34882.56,1598.519,7854.357,...,3898.548,17773.85,0.0,279292.4,28865.05,70126.17,1103894.0,0.0,0.0,0.0


Pour connaître les calculs utilisés lors de l'utilisation de ces fonctions vous pouvez cliquer [ici](https://openresearchsoftware.metajnl.com/articles/10.5334/jors.251) et [ici](https://pymrio.readthedocs.io/en/latest/api_references.html#low-level-matrix-calculations).