In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.ticker import (AutoMinorLocator, MultipleLocator)
from matplotlib.pyplot import cm
import seaborn as sns
import ipywidgets as widgets
%matplotlib inline

In [None]:
data_frame = pd.read_csv("energy_gross_prod_UE.csv")
data_frame

In [None]:
#data_frame z produkcją energii per rok per kraj - będzie przydatne w wykresach %
gross_prod = data_frame[["country_or_area", "year", "quantity"]].groupby(by = ["country_or_area", "year"], as_index = False).sum()
gross_prod

In [None]:
#DF gross green energy production per kraj per rok
green_only = data_frame[data_frame["wide_category"] == "Green"]
gross_green_prod = green_only[["country_or_area", "year", "quantity"]].groupby(by = ["country_or_area", "year"], as_index = False).sum()
gross_green_prod

In [None]:
#dołączenie nowej kulmny do DF z sumą całkowitej energii per rok per kraj
green = pd.merge(gross_green_prod, gross_prod, on = ["country_or_area","year"], how = "right")
green

In [None]:
#zamiana NaN na 0 dla krajów, które nie mają w ogóle green energy
green["quantity_x"] = green["quantity_x"].fillna(0)
green

In [None]:
#zmiana nazw dla kolumn wskazujących ilość - kolumna gross_year_qty pokazuje całkowitą ilość produkcji energii dla danego kraju
green = green.rename(columns={"quantity_x":"quantity_green", "quantity_y":"gross_year_qty"})
green

In [None]:
#dodanie kolumny z procentowym udziałem green energy 
green["% udział"] = green["quantity_green"]/green["gross_year_qty"]
green

In [None]:
#wykres pokazujący procentowy udział energii zielonej dla wszystkich krajów UE
#kolorki już są różne dla każdego kraju, ale wykres jest bardzo nieczytelny
list_countries = green["country_or_area"].unique()

n = len(list_countries) #ilość kolorów potrzebna do wykresu

plt.figure(figsize=(15,10))
plt.xticks( fontsize=16)
plt.yticks( fontsize=16)

#definiowanie linii kolorystycznej
#https://matplotlib.org/3.3.3/gallery/color/colormap_reference.html

color = iter(cm.gist_rainbow(np.linspace(0,1,n)))

for country in list(list_countries):
    country_data = green[green.country_or_area.isin([country])].sort_values('year')
    c = next(color)
    plt.plot(country_data["year"],country_data["% udział"]*100,label=country,c=c)

plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.,fontsize=15)
plt.ylabel("Green energy %",fontsize=20)
plt.xlabel('Year',fontsize=20)
plt.title('% of green energy production per country per year',fontsize=24)
plt.xlim(1990, 2014)
plt.show()

In [None]:
#ten sam wykres co wyżej, ale dla top 10 krajów z największym udziałem procentowym 
green_top10 = green[green["year"] == 2014].nlargest(10, "% udział")
green_top10

In [None]:
list_countries = green_top10["country_or_area"].unique()

n = len(list_countries) #ilość kolorów potrzebna do wykresu

fig, ax = plt.subplots(figsize=(13, 8))
plt.xticks(fontsize=12, rotation = 90)
plt.yticks(fontsize=12)

#ustawianie osi X, żeby wyświetlała wszystkie lata po kolei, a nie co 5.
ax.set_xlim(0, 2014)
ax.xaxis.set_major_locator(MultipleLocator(1))

#tworzenie siatki, żeby wykres był bardziej czytelny
ax.grid(which='major', color='#CCCCCC', linestyle='--')
ax.grid(which='minor', color='#CCCCCC', linestyle=':')

#definiowanie linii kolorystycznej
#https://matplotlib.org/3.3.3/gallery/color/colormap_reference.html

color = iter(cm.tab10(np.linspace(0,1,n)))

for country in list(list_countries):
    country_data = green[green.country_or_area.isin([country])].sort_values('year')
    c = next(color)
    plt.plot(country_data["year"],country_data["% udział"]*100,label=country,c=c)

plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.,fontsize=15)
plt.ylabel("Green energy %",fontsize=20)
plt.xlabel('Year',fontsize=20)
plt.title('% of green energy production per top 10 countries per year',fontsize=24)
plt.xlim(1990, 2014)
plt.show()

In [None]:
#przygotowanie takiej samej analizy dla "brudnej" energii czyli Electricity_and_Heat

#DF gross green energy production per kraj per rok
bad_only = data_frame[data_frame["wide_category"] == "Electricity_and_Heat"]
gross_bad_prod = bad_only[["country_or_area", "year", "quantity"]].groupby(by = ["country_or_area", "year"], as_index = False).sum()
gross_bad_prod

In [None]:
#dołączenie nowej kulmny do DF z sumą całkowitej energii per rok per kraj
heat_and_el = pd.merge(gross_bad_prod, gross_prod, on = ["country_or_area","year"], how = "right")
heat_and_el

In [None]:
#zamiana NaN na 0 dla krajów, które nie mają w ogóle green energy
heat_and_el["quantity_x"] = heat_and_el["quantity_x"].fillna(0)
heat_and_el

In [None]:
#zmiana nazw dla kolumn wskazujących ilość - kolumna gross_year_qty pokazuje całkowitą ilość produkcji energii dla danego kraju
heat_and_el = heat_and_el.rename(columns={"quantity_x":"quantity_heat", "quantity_y":"gross_year_qty"})
heat_and_el

In [None]:
#dodanie kolumny z procentowym udziałem green energy 
heat_and_el["% udział"] = heat_and_el["quantity_heat"]/heat_and_el["gross_year_qty"]
heat_and_el

In [None]:
#wykres pokazujący procentowy udział energii "burdnej" dla wszystkich krajów UE
#kolorki już są różne dla każdego kraju, ale wykres jest bardzo nieczytelny
list_countries = heat_and_el["country_or_area"].unique()

n = len(list_countries) #ilość kolorów potrzebna do wykresu

plt.figure(figsize=(15,10))
plt.xticks( fontsize=16)
plt.yticks( fontsize=16)

#definiowanie linii kolorystycznej
#https://matplotlib.org/3.3.3/gallery/color/colormap_reference.html

color = iter(cm.gist_rainbow(np.linspace(0,1,n)))

for country in list(list_countries):
    country_data = heat_and_el[heat_and_el.country_or_area.isin([country])].sort_values('year')
    c = next(color)
    plt.plot(country_data["year"],country_data["% udział"]*100,label=country,c=c)

plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.,fontsize=15)
plt.ylabel("heat energy %",fontsize=20)
plt.xlabel('Year',fontsize=20)
plt.title('% of heat energy production per country per year',fontsize=24)
plt.xlim(1990, 2014)
plt.show()

In [None]:
#ten sam wykres co wyżej, ale dla top 10 krajów z największym udziałem procentowym 
bad_top10 = heat_and_el[heat_and_el["year"] == 2014].nlargest(10, "% udział")
bad_top10

In [None]:
list_countries = bad_top10["country_or_area"].unique()

n = len(list_countries) #ilość kolorów potrzebna do wykresu

fig, ax = plt.subplots(figsize=(13, 8))
plt.xticks(fontsize=12, rotation = 90)
plt.yticks(fontsize=12)

#ustawianie osi X, żeby wyświetlała wszystkie lata po kolei, a nie co 5.
ax.set_xlim(0, 2014)
ax.xaxis.set_major_locator(MultipleLocator(1))

#tworzenie siatki, żeby wykres był bardziej czytelny
ax.grid(which='major', color='#CCCCCC', linestyle='--')
ax.grid(which='minor', color='#CCCCCC', linestyle=':')

#definiowanie linii kolorystycznej
#https://matplotlib.org/3.3.3/gallery/color/colormap_reference.html

color = iter(cm.tab10(np.linspace(0,1,n)))

for country in list(list_countries):
    country_data = heat_and_el[heat_and_el.country_or_area.isin([country])].sort_values('year')
    c = next(color)
    plt.plot(country_data["year"],country_data["% udział"]*100,label=country,c=c)

plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.,fontsize=15)
plt.ylabel("heat energy %",fontsize=20)
plt.xlabel('Year',fontsize=20)
plt.title('% of heat energy production per top 10 countries per year',fontsize=24)
plt.xlim(1990, 2014)
plt.show()