# Analisi dell'impatto ambientale della produzione di cibi e mangimi
### In base ai dati raccolti dall' Organizzazione delle Nazioni Unite capiremo quali sono gli alimenti che richiedono più risorse naturali in modo tale da poter spostare il focus produttivo su alimenti più sostenibili per l'ambiente.

In [362]:
import sys
!{sys.executable} -m pip install --upgrade pip

try:
     import numpy as np
except ModuleNotFoundError as MNF:
     print("########## numpy non trovato lo installo")
     !{sys.executable} -m pip install numpy
finally:
     import numpy as np
     print("##########   ########## numpy installato ed importato")
     
try:
     import pandas as pd
except ModuleNotFoundError:
     print("########## pandas non trovato lo installo")
     !{sys.executable} -m pip install pandas
finally:
     import pandas as pd
     print("##########   ########## pandas installato ed importato")
     
try:
     import matplotlib.pyplot as plt
except ModuleNotFoundError:
     print("########## matplotlib non trovato lo installo")
     !{sys.executable} -m pip install matplotlib
finally:
     import matplotlib.pyplot as plt
     print("##########   ########## matplotlib installato ed importato")

try:
     import seaborn as sns
except ModuleNotFoundError:
     print("########## seaborn non trovato lo installo")
     !{sys.executable} -m pip install seaborn
finally:
     import seaborn as sns
     print("##########   ########## seaborn installato ed importato")

try:
     import plotly.express as px
except ModuleNotFoundError:
     print("########## plotly non trovato lo installo")
     !{sys.executable} -m pip install plotly
finally:
     import plotly.express as px
     print("##########   ########## plotly installato ed importato")


FAO_df = pd.read_csv("data/FAO.csv", encoding='latin-1')
Food_Production_df = pd.read_csv("data/Food_Production.csv")
FAO_df["Type"] = ""

##########   ########## numpy installato ed importato
##########   ########## pandas installato ed importato
##########   ########## matplotlib installato ed importato
##########   ########## seaborn installato ed importato
##########   ########## plotly installato ed importato


# Datasets

#### Visualizzeremo i primi record dei datasets

In [363]:
FAO_df.head()

Unnamed: 0,Area Abbreviation,Area Code,Area,Item Code,Item,Element Code,Element,Unit,latitude,longitude,...,Y2005,Y2006,Y2007,Y2008,Y2009,Y2010,Y2011,Y2012,Y2013,Type
0,AFG,2,Afghanistan,2511,Wheat and products,5142,Food,1000 tonnes,33.94,67.71,...,3486.0,3704.0,4164.0,4252.0,4538.0,4605.0,4711.0,4810,4895,
1,AFG,2,Afghanistan,2805,Rice (Milled Equivalent),5142,Food,1000 tonnes,33.94,67.71,...,445.0,546.0,455.0,490.0,415.0,442.0,476.0,425,422,
2,AFG,2,Afghanistan,2513,Barley and products,5521,Feed,1000 tonnes,33.94,67.71,...,236.0,262.0,263.0,230.0,379.0,315.0,203.0,367,360,
3,AFG,2,Afghanistan,2513,Barley and products,5142,Food,1000 tonnes,33.94,67.71,...,43.0,44.0,48.0,62.0,55.0,60.0,72.0,78,89,
4,AFG,2,Afghanistan,2514,Maize and products,5521,Feed,1000 tonnes,33.94,67.71,...,208.0,233.0,249.0,247.0,195.0,178.0,191.0,200,200,


In [364]:
Food_Production_df.head()

Unnamed: 0,Food product,Land use change,Animal Feed,Farm,Processing,Transport,Packging,Retail,Total_emissions,Eutrophying emissions per 1000kcal (gPO₄eq per 1000kcal),...,Freshwater withdrawals per 100g protein (liters per 100g protein),Freshwater withdrawals per kilogram (liters per kilogram),Greenhouse gas emissions per 1000kcal (kgCO₂eq per 1000kcal),Greenhouse gas emissions per 100g protein (kgCO₂eq per 100g protein),Land use per 1000kcal (m² per 1000kcal),Land use per kilogram (m² per kilogram),Land use per 100g protein (m² per 100g protein),Scarcity-weighted water use per kilogram (liters per kilogram),Scarcity-weighted water use per 100g protein (liters per 100g protein),Scarcity-weighted water use per 1000kcal (liters per 1000 kilocalories)
0,Wheat & Rye (Bread),0.1,0.0,0.8,0.2,0.1,0.1,0.1,1.4,,...,,,,,,,,,,
1,Maize (Meal),0.3,0.0,0.5,0.1,0.1,0.1,0.0,1.1,,...,,,,,,,,,,
2,Barley (Beer),0.0,0.0,0.2,0.1,0.0,0.5,0.3,1.1,,...,,,,,,,,,,
3,Oatmeal,0.0,0.0,1.4,0.0,0.1,0.1,0.0,1.6,4.281357,...,371.076923,482.4,0.945482,1.907692,2.897446,7.6,5.846154,18786.2,14450.92308,7162.104461
4,Rice,0.0,0.0,3.6,0.1,0.1,0.1,0.1,4.0,9.514379,...,3166.760563,2248.4,1.207271,6.267606,0.759631,2.8,3.943662,49576.3,69825.77465,13449.89148


#### Abbiamo rispettivamente un dataset che ci da informazioni sulle quantità prodotte e un datasets che ci da informazioni rigurado l'inquinamento.

# Colonne del primo dataset
#### Del primo dataset andremo a considerare le seguenti colonne:
- **Area Abbreviation -> Abbreviazione dell'area**
- **Area -> Area scritta per esteso**
- **Item -> Prodotto**
- **Element -> Mangime o Cibo**
- **Unit -> Unità di misura per la produzione**
- **Tutte le colonne che iniziano con Y -> Quanto è stato prodotto ogni anno**

In [365]:
# Selezione delle colonne del primo dataset
colonne_interessate = ["Area Abbreviation", "Area", "Item", "Element", "Unit", "Type"]
FAO_df_colonne_interessate = [ colonna for colonna in FAO_df.columns if colonna.startswith("Y") or (colonna in colonne_interessate)]
FAO_df[FAO_df_colonne_interessate].head()

Unnamed: 0,Area Abbreviation,Area,Item,Element,Unit,Y1961,Y1962,Y1963,Y1964,Y1965,...,Y2005,Y2006,Y2007,Y2008,Y2009,Y2010,Y2011,Y2012,Y2013,Type
0,AFG,Afghanistan,Wheat and products,Food,1000 tonnes,1928.0,1904.0,1666.0,1950.0,2001.0,...,3486.0,3704.0,4164.0,4252.0,4538.0,4605.0,4711.0,4810,4895,
1,AFG,Afghanistan,Rice (Milled Equivalent),Food,1000 tonnes,183.0,183.0,182.0,220.0,220.0,...,445.0,546.0,455.0,490.0,415.0,442.0,476.0,425,422,
2,AFG,Afghanistan,Barley and products,Feed,1000 tonnes,76.0,76.0,76.0,76.0,76.0,...,236.0,262.0,263.0,230.0,379.0,315.0,203.0,367,360,
3,AFG,Afghanistan,Barley and products,Food,1000 tonnes,237.0,237.0,237.0,238.0,238.0,...,43.0,44.0,48.0,62.0,55.0,60.0,72.0,78,89,
4,AFG,Afghanistan,Maize and products,Feed,1000 tonnes,210.0,210.0,214.0,216.0,216.0,...,208.0,233.0,249.0,247.0,195.0,178.0,191.0,200,200,


# Estrapolazione degli alimenti il cui inquinamento è tracciato


##### Bisogna andare a prendere i cibi ed i mangimi di cui abbiamo informazioni nei datasets e bisogna aggiustare alcune righe poichè ci sono alcuni record che hanno 2 prodotti come ad esempio Wheat & Rye che sono unificati.

In [366]:
cibi = Food_Production_df["Food product"]
# Adattamento per favorire l'incrocio dati
cibi_temp = list()
for cibo in cibi:
     if "Beef" not in cibo:
          split = cibo.split('&')
          cibi_temp.append(str.strip(split[0]))
          if len(split) > 1:
               cibi_temp.append(str.strip(split[1]))
cibi_temp.sort()
cibi = pd.Series(cibi_temp)


# Incorcio dei dati
#### L'incrocio dei dati porterà ad una diminuzione del campione il che è naturale poichè non vengono tracciati tutti i cibi che ci sono nel dataset delle Nazioni Unite.

In [367]:
# Funzione per incrocio dati
def incrocio_dati(df, cibi, prodotti_tracciati, colonne) -> None:
     for index, record in FAO_df[FAO_df_colonne_interessate].iterrows():
          food_type = record["Item"].lower()
          # Caso del dizionario
          if(isinstance(cibi, dict)):
               for key in cibi.keys():
                    if food_type.startswith(cibi[key].lower()) and index not in prodotti_tracciati:
                         prodotti_tracciati.append(index)
                         FAO_df.at[index, "Type"] = key
          # Caso lista/pd.series.Series
          elif(isinstance(cibi, pd.core.series.Series) or isinstance(cibi, list)):
               for i in range(len(cibi)):
                    if food_type.startswith(cibi[i].lower()) and index not in prodotti_tracciati:
                         prodotti_tracciati.append(index)
                         FAO_df.at[index, "Type"] = cibi[i]
          # Caso di un tipo non permesso
          else:
               print("No type encoded")


In [368]:
# Inserimento nel df in base al tipo di alimento(pt.1)
prodotti_tracciati = list()
incrocio_dati(FAO_df, cibi, prodotti_tracciati, colonne_interessate)
print("Numero di prodotti tracciati: ", len(prodotti_tracciati))

Numero di prodotti tracciati:  4369


# Dati non presi
#### Alcuni dati non sono stati presi a causa della differente nomenclatura tra i datasets in particolare: 
- **Beet Sugar**
- **Cane Sugar**
- **Citrus Fruit**
- **Fish (farmed)**
- **Other Fruit**
- **Other Pulses**
- **Other Vegetable**
- **Pig Meat**
- **Sunflower Oil**

#### Effettuerò delle modifiche alle nomenclature al fine di estrapolarli.

In [369]:
colonne_dict = {
     'Beet Sugar': 'sugar beet',
     'Cane Sugar': 'sugar cane',
     'Citrus Fruit': 'citrus',
     'Fish (farmed)': 'fish',
     'Other Fruit': 'fruits, other',
     'Other Pulses': 'pulses, other and product',
     'Other Vegetables': 'vegetables, other',
     'Pig Meat': 'pigmeat',
     'Beef (beef herd)': 'bovine meat'
}

incrocio_dati(FAO_df, colonne_dict, prodotti_tracciati, colonne_interessate)
print("Numero di prodotti tracciati: ", len(prodotti_tracciati))


Numero di prodotti tracciati:  6483


# Creazione del dataset 

In [370]:
prodotti_tracciati_df = FAO_df.iloc[prodotti_tracciati]
prodotti_tracciati_df = prodotti_tracciati_df[FAO_df_colonne_interessate].reset_index().drop(columns=['index'])
prodotti_tracciati_df.head()


Unnamed: 0,Area Abbreviation,Area,Item,Element,Unit,Y1961,Y1962,Y1963,Y1964,Y1965,...,Y2005,Y2006,Y2007,Y2008,Y2009,Y2010,Y2011,Y2012,Y2013,Type
0,AFG,Afghanistan,Wheat and products,Food,1000 tonnes,1928.0,1904.0,1666.0,1950.0,2001.0,...,3486.0,3704.0,4164.0,4252.0,4538.0,4605.0,4711.0,4810,4895,Wheat
1,AFG,Afghanistan,Rice (Milled Equivalent),Food,1000 tonnes,183.0,183.0,182.0,220.0,220.0,...,445.0,546.0,455.0,490.0,415.0,442.0,476.0,425,422,Rice
2,AFG,Afghanistan,Potatoes and products,Food,1000 tonnes,111.0,97.0,103.0,110.0,113.0,...,294.0,294.0,260.0,242.0,250.0,192.0,169.0,196,230,Potatoes
3,AFG,Afghanistan,Nuts and products,Food,1000 tonnes,2.0,3.0,1.0,1.0,2.0,...,13.0,24.0,34.0,42.0,28.0,66.0,71.0,70,44,Nuts
4,AFG,Afghanistan,Palm Oil,Food,1000 tonnes,0.0,0.0,0.0,0.0,0.0,...,69.0,56.0,51.0,36.0,53.0,59.0,51.0,61,64,Palm Oil


# Pulizia dei dati
#### All'interno dei dati incrociati potremmo avere dei valori nulli che sporcano i dati, effettueremo quindi una pulizia dei dati. Verranno prima divisi per categoria e poi puliti.

In [371]:
# Dizionario alimento => sub_df
alimenti_dict = dict()
keys = cibi.to_list()

for i in range(len(keys)):
     if keys[i] in colonne_dict.keys():
          keys[i] = colonne_dict[keys[i]].capitalize()

# Assegnazione delle chiavi a delle liste vuote
for key in keys:
     alimenti_dict[key] = list()

# Divisione dei record in base all'alimento
for index, record in prodotti_tracciati_df.iterrows():
     for key in keys:
          if record["Item"].lower().startswith(key.lower()) and index not in alimenti_dict[key]:
               alimenti_dict[key].append(index)

# Cerco le categorie vuote
prodotti_vuoti = []
for key in alimenti_dict.keys():
     if len(alimenti_dict[key]) == 0:
          prodotti_vuoti.append(key)

# Elimino le categorie di prodotto che hanno una lista di lunghezza 0
for prodotto_vuoto in prodotti_vuoti:
     alimenti_dict.pop(prodotto_vuoto, None)
alimenti_dict.keys()

alimenti_trovati = list(alimenti_dict.keys())
alimenti_quantita = [len(alimenti_dict[alimenti]) for alimenti in alimenti_trovati]
color_palette = sns.color_palette('bright')[0:len(alimenti_trovati) - 1]

print("Totale di alimenti = ", sum(alimenti_quantita))
fig = px.pie(values=alimenti_quantita, names=alimenti_trovati, title='Alimenti tracciati')
fig.show()

Totale di alimenti =  6306


# Effettuo la pulizia dati
### Elimino le righe cha hanno valori nulli.  

In [372]:
indici_da_eliminare = list()

for key in alimenti_dict.keys():
     for index in alimenti_dict[key]:
          if not prodotti_tracciati_df.iloc[index]["Item"].lower().startswith(key.lower()):
               indici_da_eliminare.append(int(index))

# Pulizia degli indici
for indice_da_eliminare in indici_da_eliminare:
     if indice_da_eliminare in prodotti_tracciati:
          prodotti_tracciati.remove(indice_da_eliminare)

prodotti_tracciati_df = FAO_df.iloc[prodotti_tracciati]
prodotti_tracciati_df = prodotti_tracciati_df[FAO_df_colonne_interessate].reset_index()
prodotti_tracciati_df = prodotti_tracciati_df.dropna().reset_index()
prodotti_tracciati_df.drop(columns=["level_0", "index"], inplace=True)
prodotti_tracciati_df["Prod. 1961 - 2013"] = prodotti_tracciati_df[[f"Y{i}" for i in range(1961, 2014)]].sum(axis=1)
cond = prodotti_tracciati_df["Prod. 1961 - 2013"] != 0
prodotti_tracciati_df = prodotti_tracciati_df[cond]

# Esplorazione dei dati
#### Come primo step esplorativo andremo a vedere cosa viene prodotto in quantita' maggiore tra mangimi(Feed) e cibo(Food) in media dal 1961 al 2013.

In [373]:
cibi_mangimi = prodotti_tracciati_df.groupby("Element")[[f"Y{i}" for i in range(1961, 2014)]].mean()
print("Cibo prodotto dal 1960 al 2013: ", cibi_mangimi.iloc[1].sum())
print("Mangime prodotto dal 1960 al 2013: ", cibi_mangimi.iloc[0].sum())
cibi_mangimi


Cibo prodotto dal 1960 al 2013:  31890.85144464331
Mangime prodotto dal 1960 al 2013:  20897.416164053076


Unnamed: 0_level_0,Y1961,Y1962,Y1963,Y1964,Y1965,Y1966,Y1967,Y1968,Y1969,Y1970,...,Y2004,Y2005,Y2006,Y2007,Y2008,Y2009,Y2010,Y2011,Y2012,Y2013
Element,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Feed,306.495778,312.610374,322.412545,329.761158,328.675513,342.454765,338.193004,365.063932,362.295537,352.369119,...,457.699638,454.934861,468.605549,467.661037,490.710495,501.890229,505.241255,553.435464,557.232811,568.977081
Food,292.12989,297.916134,305.809512,313.248018,321.925339,329.274866,334.969573,347.122475,353.654053,361.07236,...,865.456405,886.113782,907.59371,935.982102,957.513168,975.363334,1000.261059,1025.631041,1050.72002,1064.981335


# Anno di maggiore produzione di cibi e mangimi
#### Tutti i valori vanno moltiplicati per 1000

In [374]:
magimi_max_produzione = cibi_mangimi.loc["Feed"].max()
cibo_max_produzione = cibi_mangimi.loc["Food"].max()
print(cibi_mangimi.loc["Feed"].max() * 1000, " tonnellate di mangime nell'anno", cibi_mangimi.idxmax(axis=1)[0].split("Y")[1])
print(cibi_mangimi.loc["Food"].max() * 1000, "tonnellate di cibo nell'anno", cibi_mangimi.idxmax(axis=1)[1].split("Y")[1])

568977.0808202655  tonnellate di mangime nell'anno 2013
1064981.3346970084 tonnellate di cibo nell'anno 2013


#### I valori più elevati corrispondono con il 2013 che è anche l'ultimo anno a disposizione.
# Cibi
#### Vedremo l'aumento della produzione di cibi anno per anno, ogni colonna ci dice di quanto è aumentata la produzione rispetto all'anno precedente.

In [375]:
Food = cibi_mangimi.loc["Food"]

Food_yearly_increment = [abs(Food[f"Y{i}"] - Food[f"Y{i+1}"]) for i in range(1961, 2014) if i + 1 < 2014]
Food_yearly_increment_df = pd.DataFrame()
for i in range(1961, 2014):
     if i+1 < 2014:
          Food_yearly_increment_df[f"Y{i}/Y{i+1}"] = pd.Series(Food_yearly_increment[abs(1961 - i)])

print(f"Incremento annuo medio della produzione di cibo = {Food_yearly_increment_df.iloc[0].mean() * 1000} tonnellate")
Food_yearly_increment_df = Food_yearly_increment_df * 1000
Food_yearly_increment_df

Incremento annuo medio della produzione di cibo = 14862.527781602186 tonnellate


Unnamed: 0,Y1961/Y1962,Y1962/Y1963,Y1963/Y1964,Y1964/Y1965,Y1965/Y1966,Y1966/Y1967,Y1967/Y1968,Y1968/Y1969,Y1969/Y1970,Y1970/Y1971,...,Y2003/Y2004,Y2004/Y2005,Y2005/Y2006,Y2006/Y2007,Y2007/Y2008,Y2008/Y2009,Y2009/Y2010,Y2010/Y2011,Y2011/Y2012,Y2012/Y2013
0,5786.243927,7893.377653,7438.506776,8677.320378,7349.526975,5694.707236,12152.902071,6531.577602,7418.307338,7535.157249,...,19188.954232,20657.37663,21479.928407,28388.391716,21531.066223,17850.166198,24897.724367,25369.982102,25088.979801,14261.314242


# Mangimi
#### Ogni colonna ci dice di quanto è aumentata la produzione rispetto all'anno precedente

In [376]:
Feed = cibi_mangimi.loc["Feed"]

Feed_yearly_increment = [abs(Feed[f"Y{i}"] - Feed[f"Y{i+1}"]) for i in range(1961, 2014) if i + 1 < 2014]
Feed_yearly_increment_df = pd.DataFrame()
for i in range(1961, 2014):
     if i+1 < 2014:
          Feed_yearly_increment_df[f"Y{i}/Y{i+1}"] = pd.Series(Feed_yearly_increment[abs(1961 - i)])

print(f"Incremento annuo medio della produzione di mangimi = {Feed_yearly_increment_df.iloc[0].mean() * 1000} tonnellate")
prodotti_tracciati_df

Incremento annuo medio della produzione di mangimi = 11787.02329034054 tonnellate


Unnamed: 0,Area Abbreviation,Area,Item,Element,Unit,Y1961,Y1962,Y1963,Y1964,Y1965,...,Y2006,Y2007,Y2008,Y2009,Y2010,Y2011,Y2012,Y2013,Type,Prod. 1961 - 2013
0,AFG,Afghanistan,Wheat and products,Food,1000 tonnes,1928.0,1904.0,1666.0,1950.0,2001.0,...,3704.0,4164.0,4252.0,4538.0,4605.0,4711.0,4810,4895,Wheat,132926.0
1,AFG,Afghanistan,Rice (Milled Equivalent),Food,1000 tonnes,183.0,183.0,182.0,220.0,220.0,...,546.0,455.0,490.0,415.0,442.0,476.0,425,422,Rice,15282.0
2,AFG,Afghanistan,Potatoes and products,Food,1000 tonnes,111.0,97.0,103.0,110.0,113.0,...,294.0,260.0,242.0,250.0,192.0,169.0,196,230,Potatoes,10625.0
3,AFG,Afghanistan,Nuts and products,Food,1000 tonnes,2.0,3.0,1.0,1.0,2.0,...,24.0,34.0,42.0,28.0,66.0,71.0,70,44,Nuts,808.0
4,AFG,Afghanistan,Palm Oil,Food,1000 tonnes,0.0,0.0,0.0,0.0,0.0,...,56.0,51.0,36.0,53.0,59.0,51.0,61,64,Palm Oil,704.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5389,ZWE,Zimbabwe,"Fruits, Other",Food,1000 tonnes,1.0,1.0,1.0,1.0,1.0,...,6.0,8.0,8.0,9.0,10.0,10.0,12,9,Other Fruit,214.0
5390,ZWE,Zimbabwe,Bovine Meat,Food,1000 tonnes,43.0,42.0,42.0,31.0,28.0,...,104.0,104.0,104.0,105.0,100.0,102.0,103,104,Beef (beef herd),3414.0
5391,ZWE,Zimbabwe,Pigmeat,Food,1000 tonnes,5.0,6.0,6.0,6.0,6.0,...,28.0,28.0,28.0,33.0,34.0,37.0,40,37,Pig Meat,781.0
5394,ZWE,Zimbabwe,"Fish, Seafood",Feed,1000 tonnes,27.0,25.0,27.0,23.0,27.0,...,9.0,6.0,9.0,5.0,15.0,15.0,15,15,Fish (farmed),607.0


# Cibi piu' e meno prodotti dal 1961 al 2013
#### Vedremo quali sono stati i cibi più prodotti e quali meno.

In [377]:
columns_interested = ["Item", "Element", "Area", "Prod. 1961 - 2013", "Type"]
Food_items = prodotti_tracciati_df[columns_interested]
Food_items = Food_items[Food_items["Element"] == "Food"]
Food_items = Food_items.sort_values(by=["Prod. 1961 - 2013"], ascending=False).reset_index().drop(columns=["index"]).drop_duplicates().reset_index().drop(columns=["index"])
Food_items["Tonnes"] = Food_items["Prod. 1961 - 2013"] * 1000
temp_df = Food_items.groupby("Type").sum(numeric_only=True).sort_values(by="Tonnes", ascending=False)

# prodotti_tracciati_df["Tonnes"] = prodotti_tracciati_df["Prod. 1961 - 2013"] * 1000
# Food_items["Tonnes"] = prodotti_tracciati_df["Tonnes"]

fig = px.bar(
     temp_df,
     x=temp_df.index,
     y="Tonnes",
     color="Tonnes",
     title='Cibi più e meno prodotti dal 1961 al 2013',
     height=600
)

fig.show()

# Mangimi più e meno prodotti dal 1961 al 2013
#### Vediamo la produzione di mangimi quali categorie di cibo va a colpire maggiormente

In [378]:
Feed_items = prodotti_tracciati_df[columns_interested]
Feed_items = Feed_items[Feed_items["Element"] == "Feed"]
Feed_items = Feed_items.sort_values(by=["Prod. 1961 - 2013"], ascending=False).reset_index().drop(columns=["index"]).drop_duplicates().reset_index().drop(columns=["index"])
Feed_items["Tonnes"] = Feed_items["Prod. 1961 - 2013"] * 1000

temp_df = Feed_items.groupby("Type").sum(numeric_only=True).sort_values(by="Tonnes", ascending=False)

fig = px.bar(
     temp_df,
     x=temp_df.index,
     y="Tonnes",
     color="Tonnes",
     title='Magimi più e meno prodotti dal 1961 al 2013',
     height=600
)
fig.show()

# Calcolo l'inquinamento da CO2 di tutti i cibi e mangimi

In [379]:
# Estrazione dei tipi di alimento
Food_types = Food_items["Type"].drop_duplicates().to_list()
Food_types_CO2KG = [Food_Production_df[Food_Production_df["Food product"] == food_type]["Total_emissions"].to_list() for food_type in Food_types]

Feed_types = Feed_items["Type"].drop_duplicates().to_list()
Feed_types_CO2KG = [Food_Production_df[Food_Production_df["Food product"] == feed_type]["Total_emissions"].to_list() for feed_type in Feed_types]

# Creazione del dizionario
Food_types_CO2KG_dict = dict()
Feed_types_CO2KG_dict = dict()

# Creazione del dizionario
for i in range(len(Food_types)):
     Food_types_CO2KG_dict[Food_types[i]] = 0

     if len(Food_types_CO2KG[i]) != 0:
          Food_types_CO2KG_dict[Food_types[i]] = Food_types_CO2KG[i][0]

for index, record in Food_items.iterrows():
     Food_type = record["Type"]
     if Food_type in Food_types_CO2KG_dict.keys():
          Food_items.at[index, "KGCO2"] =  Food_items.at[index, "Tonnes"] * Food_types_CO2KG_dict[Food_type] * 1000
          Food_items.at[index, "TonnesCO2"] = Food_items.at[index, "Tonnes"] * Food_types_CO2KG_dict[Food_type]

for i in range(len(Feed_types)):
     Feed_types_CO2KG_dict[Feed_types[i]] = 0

     if len(Feed_types_CO2KG[i]) != 0:
          Feed_types_CO2KG_dict[Feed_types[i]] = Feed_types_CO2KG[i][0]

for index, record in Feed_items.iterrows():
     Feed_type = record["Type"]
     if Feed_type in Feed_types_CO2KG_dict.keys():
          Feed_items.at[index, "KGCO2"] =  Feed_items.at[index, "Tonnes"] * Feed_types_CO2KG_dict[Feed_type] * 1000
          Feed_items.at[index, "TonnesCO2"] = Feed_items.at[index, "Tonnes"] * Feed_types_CO2KG_dict[Feed_type]

Food_feed_df = pd.concat([Food_items, Feed_items], ignore_index=True)

temp_df = Food_feed_df.groupby("Type").sum(numeric_only=True).sort_values(by="KGCO2", ascending=False)

fig = px.bar(
     temp_df,
     x=temp_df.index,
     y="KGCO2",
     color="KGCO2",
     title='Inquinamento da CO2 dal 1961 al 2013 causato dalla produzione di cibi e mangimi',
     height=600
)

fig.show()

# Calcolo eutrofizzazione dei cibi e mangimi prodotti dal 1961 al 2013

#### L'eutrofizzazione è un fenomeno dato dal rilascio della sostanza PO4, creerò una colonna che calcola i grammi di PO4 per ogni kilo di cibo/mangime prodotto

In [380]:
# Creare una funzione troppo codice
Food_types_PO4_emissions = [Food_Production_df[Food_Production_df["Food product"] == food_type]["Eutrophying emissions per kilogram (gPO₄eq per kilogram)"].to_list() for food_type in Food_types]
Food_types_PO4_dict = dict()

Feed_types_PO4_emissions = [Food_Production_df[Food_Production_df["Food product"] == food_type]["Eutrophying emissions per kilogram (gPO₄eq per kilogram)"].to_list() for food_type in Food_types]
Feed_types_PO4_dict = dict()

for i in range(len(Food_types)):
     Food_types_PO4_dict[Food_types[i]] = 0

     if len(Food_types_PO4_emissions[i]) != 0:
          Food_types_PO4_dict[Food_types[i]] = Food_types_PO4_emissions[i][0]

for index, record in Feed_items.iterrows():
     Food_type = record["Type"]
     if Food_type in Food_types_PO4_dict.keys():
          Food_items.at[index, "Total gPO4 per kilogram"] =  Food_items.at[index, "Tonnes"] * 1000000 * Food_types_PO4_dict[Food_type]

for i in range(len(Feed_types)):
     Feed_types_PO4_dict[Feed_types[i]] = 0

     if len(Feed_types_PO4_emissions[i]) != 0:
          Feed_types_PO4_dict[Feed_types[i]] = Feed_types_PO4_emissions[i][0]

for index, record in Feed_items.iterrows():
     Feed_type = record["Type"]
     if Feed_type in Feed_types_PO4_dict.keys():
          Feed_items.at[index, "Total gPO4 per kilogram"] =  Feed_items.at[index, "Tonnes"] * 1000000 * Feed_types_PO4_dict[Food_type]


Food_feed_df = pd.concat([Food_items, Feed_items], ignore_index=True)
temp_df = Food_feed_df.groupby("Type").sum(numeric_only=True).sort_values(by="Total gPO4 per kilogram", ascending=False)

fig = px.bar(
     temp_df,
     x=temp_df.index,
     y="Total gPO4 per kilogram",
     color="Total gPO4 per kilogram",
     height=600
)

fig.show()

# Calcolo acqua usata per i cibi/mangimi prodotti a livello mondiale

In [393]:
Food_types_water_liters_per_kilogram = [Food_Production_df[Food_Production_df["Food product"] == food_type]["Freshwater withdrawals per kilogram (liters per kilogram)"].to_list() for food_type in Food_types]
Food_types_water_liters_per_kilogram_dict = dict()

Feed_types_water_liters_per_kilogram = [Food_Production_df[Food_Production_df["Food product"] == food_type]["Freshwater withdrawals per kilogram (liters per kilogram)"].to_list() for food_type in Feed_types]
Feed_types_water_liters_per_kilogram_dict = dict()

for i in range(len(Food_types)):
     Food_types_water_liters_per_kilogram_dict[Food_types[i]] = 0

     if len(Food_types_water_liters_per_kilogram[i]) != 0:
          Food_types_water_liters_per_kilogram_dict[Food_types[i]] = Food_types_water_liters_per_kilogram[i][0]

for index, record in Food_items.iterrows():
     Food_type = record["Type"]
     if Food_type in Food_types_water_liters_per_kilogram_dict.keys():
          Food_items.at[index, "Total water(lt) per kilogram"] =  Food_items.at[index, "Tonnes"] * 1000 * Food_types_water_liters_per_kilogram_dict[Food_type]

for i in range(len(Feed_types)):
     Feed_types_water_liters_per_kilogram_dict[Feed_types[i]] = 0

     if len(Feed_types_water_liters_per_kilogram[i]) != 0:
          Feed_types_water_liters_per_kilogram_dict[Feed_types[i]] = Feed_types_water_liters_per_kilogram[i][0]

for index, record in Feed_items.iterrows():
     Feed_type = record["Type"]
     if Feed_type in Feed_types_water_liters_per_kilogram_dict.keys():
          Feed_items.at[index, "Total water(lt) per kilogram"] =  Feed_items.at[index, "Tonnes"] * 1000 * Feed_types_water_liters_per_kilogram_dict[Food_type]

Food_feed_df = pd.concat([Food_items, Feed_items], ignore_index=True)
temp_df = Food_feed_df.groupby("Type").sum(numeric_only=True).sort_values(by="Total water(lt) per kilogram", ascending=False)

fig = px.bar(
     temp_df,
     x=temp_df.index,
     y="Total water(lt) per kilogram",
     color="Total water(lt) per kilogram",
     height=600
)

fig.show()

# Calcolo emissione gas serra prodotti dal 1961 al 2013

#### Per questo calcolo andrò a inserire per ogni prodotto tracciato il numero di kcal presenti in 100gr di cibo/mangime uso google come fonte per i miei dati.
#### Verrà create una nuova colonna chiamata "Kg producted x 1000kcal" che ci dirà quanti chili devono essere prodotti per generare 1000kcal.
#### Subito dopo mostrerò un istogramma in orizzontale per mostrare quali sono i cibi che emettono più gas serra

In [394]:
Food_kcalories_100gr = {

     "Other Vegetables": 65,
     "Rice": 130,
     "Wheat": 329,
     "Milk": 42,
     "Potatoes": 77,
     "Pig Meat": 242,
     "Fish (farmed)": 158,
     "Other Fruit": 80,
     "Tomatoes": 18,
     "Beef (beef herd)": 332,
     "Cassava": 159,
     "Eggs": 155,
     "Poultry Meat": 272,
     "Cane Sugar": 400,
     "Bananas": 89,
     "Apples": 52,
     "Other Pulses": 181,
     "Onions": 40,
     "Wine": 83,
     "Grapes": 67,
     "Citrus Fruit": 72,
     "Groundnuts": 567,
     "Mutton": 294,
     "Coffee": 0,
     "Peas": 81,
     "Palm Oil": 884,
     "Nuts": 607,
     "Olive Oil": 884,
     "Beet Sugar": 405,

}

# Aggiungo la colonna a Food_Production_df
for index, record in Food_Production_df.iterrows():
     Type = record["Food product"]
     if Type in Food_kcalories_100gr.keys():
          if Food_kcalories_100gr[Type] != 0 and Food_kcalories_100gr[Type] != np.NAN:
               Food_Production_df.at[index, "Kg producted x 1000kcal"] = (1000 / (Food_kcalories_100gr[Type]))

gas_serra_emissions = Food_items["Tonnes"] * 1000**2 # Con questa operazione porto tutto alla grandezza dei grammi
for index, record in Food_items.iterrows():
     Type = record["Type"]
     if Type in Food_kcalories_100gr.keys():  
          if len(Food_Production_df[Food_Production_df["Food product"] == Type]["Greenhouse gas emissions per 1000kcal (kgCO₂eq per 1000kcal)"].values) != 0:
               Food_items.at[index, "KGCO2eq tot"] = ((record["Tonnes"] * 1000)/(Food_Production_df[Food_Production_df["Food product"] == Type]["Kg producted x 1000kcal"].to_list()[0]))
          else:
               Food_items.at[index, "KGCO2eq tot"] = 0

Food_items = Food_items.assign(CO2eqTonnes=Food_items["KGCO2eq tot"]/1000)
temp_df = Food_items.groupby("Item").sum(numeric_only=True).sort_values(by="KGCO2eq tot", ascending=False)

fig = px.bar(
     temp_df,
     x=temp_df.index,
     y="CO2eqTonnes",
     color="CO2eqTonnes",
     height=600
)

fig.show()

# Unificazione di tutte le informazioni
#### L'unificazione è avvenuta in parte sopra ora mancano al df "Food_items" solo la produzione annua.

In [383]:
years_productions = dict() # Contiene tutte le produzioni divise per area tipo e produzione dal 1961 al 2013
Food_items[[f"Y{i}" for i in range(1961, 2014)]] = 0
for index, record in Food_items.iterrows():
    
    condition_type = FAO_df["Type"] == record["Type"]
    condition_area = FAO_df["Area"] == record["Area"]

    years_production = FAO_df.loc[condition_type & condition_area]
    years_production = years_production[[f"Y{i}" for i in range(1961, 2014)]]
    
    # Area => Type => years_production
    # Se la chiave non è presente nel dictionary allora la inizializzo
    if record["Area"] not in years_productions:
        years_productions[record["Area"]] = dict()
        
#    if record["Type"] not in years_productions[record["Area"]]:
#        years_productions[record["Area"]][record["Type"]] = list()
#    years_productions[record["Area"]][record["Type"]].append(years_production)
    years_productions[record["Area"]][record["Type"]] = years_production

# Correzione dati
#### I dati estrapolati vanno corretti poichè posso avere per uno stesso tipo di alimento può avere 2 produzioni che andrò a sommare tra di loro.

In [384]:
for area in years_productions.keys():
        for food_type in years_productions[area].keys():
            if len(years_productions[area][food_type].index) > 1:
                production_sum = years_productions[area][food_type].sum(axis=0)
                years_productions[area][food_type] = production_sum

# Inserimento Y*
#### Inserisco tutte li informazioni relative alla produzione annuale

In [385]:
for index, food_items in Food_items.iterrows():
     for i in range(1961, 2014):
          area = food_items["Area"]
          food_type = food_items["Type"]
          Food_items.at[index, f"Y{i}"] = years_productions[area][food_type][f"Y{i}"] * 1000 # La produzione è in unità di 1000 tonnellate moltiplico per mille per ottenere le tonnellate

Food_items

Unnamed: 0,Item,Element,Area,Prod. 1961 - 2013,Type,Tonnes,KGCO2,TonnesCO2,Total gPO4 per kilogram,Total water(lt) per kilogram,...,Y2004,Y2005,Y2006,Y2007,Y2008,Y2009,Y2010,Y2011,Y2012,Y2013
0,"Vegetables, Other",Food,"China, mainland",7962498.0,Other Vegetables,7.962498e+09,3.981249e+12,3.981249e+09,2.770949e+16,8.161560e+14,...,342420000,355102000,370047000,385873000,405387000,410276000,428552000,440137000,453590000,462432000
1,Rice (Milled Equivalent),Food,"China, mainland",4271067.0,Rice,4.271067e+09,1.708427e+13,1.708427e+10,2.947036e+15,9.603067e+15,...,110095000,108782000,111533000,111384000,115056000,117401000,117917000,121098000,120161000,120478000
2,Wheat and products,Food,"China, mainland",3521951.0,Wheat,3.521951e+09,0.000000e+00,0.000000e+00,1.235148e+17,0.000000e+00,...,92380000,93335000,95287000,95472000,94096000,95318000,99326000,113459000,112994000,114411000
3,Milk - Excluding Butter,Food,United States of America,3353075.0,Milk,3.353075e+09,9.388610e+12,9.388610e+09,2.313622e+15,2.106402e+15,...,152934000,154740000,153598000,157624000,156348000,159832000,158128000,158446000,163534000,163988000
4,Rice (Milled Equivalent),Food,India,3096326.0,Rice,3.096326e+09,1.238530e+13,1.238530e+10,1.077521e+16,6.961779e+15,...,79930000,83033000,83433000,85030000,87221000,87523000,89393000,89142000,89647000,89697000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
3617,"Fish, Liver Oil",Food,Spain,1.0,Fish (farmed),1.000000e+03,5.100000e+06,5.100000e+03,,3.691300e+09,...,2291000,2167000,2326000,2223000,2304000,2188000,2174000,2099000,2041000,2078000
3618,Grapes and products (excl wine),Food,Belize,1.0,Grapes,1.000000e+03,0.000000e+00,0.000000e+00,,0.000000e+00,...,0,0,0,0,0,0,0,0,0,0
3619,Tomatoes and products,Food,Dominica,1.0,Tomatoes,1.000000e+03,1.400000e+06,1.400000e+03,,3.698000e+08,...,0,0,0,0,0,0,0,0,1000,0
3620,Grapes and products (excl wine),Food,Mauritania,1.0,Grapes,1.000000e+03,0.000000e+00,0.000000e+00,,0.000000e+00,...,0,0,0,0,0,0,0,0,0,0


# Produzione anno per anno
#### Grafico che mostra l'incremento della produzione anno per anno.

In [386]:
# Addattare i dati per mostrare l'incremento della produzione anno per anno

# Grafico della produzione di CO2 prodotta anno per anno
#### Grafico che mostra l'incremento della produzione di CO2 anno per anno

In [387]:
# Adattare df per mostrare la produzione di CO2 anno per anno

# Grafico eutrofizzazione anno per anno
#### Grafico che mostra l'incremento di eutrofizzazione anno per anno

In [388]:
# Adattare i dati per mostrare il grafico dell'eutrofizzazione

# Grafico aumento gas serra
#### Grafico che mostra l'aumento dei gas serra anno per anno

In [389]:
# Adattare i dati per mostrare il gafico dei gas serra

# Grafico con l'estrapolazione delle risorse d'aqua anno per anno
#### Grafico che mostra l'aumento delle risorse d'acqua richieste anno per anno