In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
data_frame = pd.read_csv("energy_statistics_UE_.csv")
data_frame

In [None]:
#odfiltrowanie energii wiatrowej
df = data_frame[data_frame["transaction"] == "total wind production"]
df

In [None]:
#wykres dla całej UE - energia z wiatru - wersja z bajerami do sterowania wielkością wykresu
plt.figure(figsize=(13,8))
plt.xticks( fontsize=12)
plt.yticks( fontsize=12)

plt.plot(df[["quantity", "year"]].groupby(by="year").sum(),label="All UE countries")

plt.legend(fontsize=14)
plt.ylabel("Millions of Kilowatts-Hour",fontsize=20)
plt.xlabel('Year',fontsize=20)
plt.title('Total Wind production in the EU',fontsize=24)
plt.xlim(1990, 2014)
plt.show()

In [None]:
#lista krajów, które mają produkcję energii z wiatru
list_countries = df["country_or_area"].unique()
print(list_countries)

In [None]:
#tworzenie wykresu dla wszystkich krajów UE - energia z wiatru
#kolory się powtarzają - będę z tym walczyć!

plt.figure(figsize=(15,10))
plt.xticks( fontsize=16)
plt.yticks( fontsize=16)

for country in list(list_countries):
    country_data = df[df.country_or_area.isin([country])].sort_values('year')
    plt.plot(country_data["year"],country_data["quantity"],label=country)

plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.,fontsize=15)
plt.ylabel("Millions of Kilowatts-Hour",fontsize=20)
plt.xlabel('Year',fontsize=20)
plt.title('Total Wind production in the EU by country',fontsize=24)
plt.xlim(1990, 2014)
plt.show()

In [None]:
#odfiltrowanie wyników dla jednostki kWh w celu sprawdzenia czy da się wyciągnąć procent energii prod z wiatru
#wykres procentowy, nie tylko ilościowy dawałby lepszy kontekst 
df_kWh = data_frame[data_frame["unit"] == "Kilowatt-hours, million"]
df_kWh

In [None]:
#sprawdzenie jak wygląda rozkład kategorii i tranzakcji dla energii
list_category = df_kWh["wide_category"].unique()
print(list_category)

list_transaction = df_kWh["transaction"].unique()
print(list_transaction)

In [None]:
#odfiltrowanie tylko produkcji energii

#usuwanie NaN z kolumny transaction
df_kWh = df_kWh[df_kWh["transaction"].notna()] 
df_kWh

In [None]:
df_kWh_prod = df_kWh[df_kWh["transaction"].str.contains("production",case = False)]
df_kWh_prod

In [None]:
#ogólny wykres dla całej UE dla ogólnych kategorii
#najlepszy byłby stackowy, ale jeszcze mi się nie udało :D

plt.figure(figsize=(13,8))
plt.xticks( fontsize=12)
plt.yticks( fontsize=12)

for category in list(list_category):
    cat_data = df_kWh_prod[df_kWh_prod["wide_category"] == category]
    plt.plot(cat_data[["quantity", "year"]].groupby(by="year").sum(),label=category)
    
plt.legend(fontsize=14)
plt.ylabel("Millions of Kilowatts-Hour",fontsize=20)
plt.xlabel('Year',fontsize=20)
plt.title('Energy production category',fontsize=24)
plt.xlim(1990, 2014)
plt.show()

In [None]:
#udział poszczególnych źródeł w kategoriach
#nie jestem pewna co to jest gross production, net production, są tylko do kategorii Electricity and heat
list_trans = df_kWh_prod["transaction"].unique()
print(list_trans)

In [None]:
#Green category
#do sprawdzenia o co chodzi z total thermal production - czy to jakieś biofuel, dlaczego jest w kategorii green

Green_prod = df_kWh_prod[df_kWh_prod["wide_category"] == "Green"]
list_trans_green = Green_prod["transaction"].unique()

plt.figure(figsize=(13,8))
plt.xticks( fontsize=12)
plt.yticks( fontsize=12)

for tran in list(list_trans_green):
    tran_data = Green_prod[Green_prod["transaction"] == tran]
    plt.plot(tran_data[["quantity", "year"]].groupby(by="year").sum(),label=tran)
    
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.,fontsize=14)
plt.ylabel("Millions of Kilowatts-Hour",fontsize=20)
plt.xlabel('Year',fontsize=20)
plt.title('Green energy in EU by energy source',fontsize=24)
plt.xlim(1990, 2014)
plt.show()

In [None]:
#kategoria Electricity and heat
#kolejne pytanie, które dane brać gross, net czy total production, main activity?

el_prod = df_kWh_prod[df_kWh_prod["wide_category"] == "Electricity_and_Heat"]
list_trans_el = el_prod["transaction"].unique()

plt.figure(figsize=(13,8))
plt.xticks( fontsize=12)
plt.yticks( fontsize=12)

for tran in list(list_trans_el):
    tran_data = el_prod[el_prod["transaction"] == tran]
    plt.plot(tran_data[["quantity", "year"]].groupby(by="year").sum(),label=tran)
    
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', borderaxespad=0.,fontsize=14)
plt.ylabel("Millions of Kilowatts-Hour",fontsize=20)
plt.xlabel('Year',fontsize=20)
plt.title('Energy and heat energy in EU by energy source',fontsize=24)
plt.xlim(1990, 2014)
plt.show()