In [None]:
import pandas as pd
import altair as alt
from datetime import datetime
import calendar

In [None]:
df = pd.read_excel('2014-2020.xlsx')

In [None]:
df.columns = ['Time/Date', 'AES', 'TEC', 'VDE', 'TES', 'GES', 'GAES_GEN',
       'CONSUMPTION', 'GAES_PUMP', 'UK_BLR_RUS', 'UK_EURO', 'UK_MLD',
       'Unnamed: 12']

In [None]:
df['year'] = df['Time/Date'].apply(lambda x: int(x[-4:]))

df['time'] = df['Time/Date'].apply(lambda x: int(x.split('-', 1)[0]))

df['Time/Date'] = df['Time/Date'].apply(lambda x: x.split('-', 1)[1])

df['Time/Date'] = df['Time/Date'].apply(lambda x: x[:-5])
df['day_moth'] = df[['Time/Date']]

df['month'] = df['Time/Date'].apply(lambda x: int(x[-2:]))

df['Time/Date'] = df['Time/Date'].apply(lambda x: int(x[:-3]))

In [None]:
df.columns = ['Day', 'AES', 'TEC', 'VDE', 'TES', 'GES', 'GAES_GEN',
       'CONSUMPTION', 'GAES_PUMP', 'UK_BLR_RUS', 'UK_EURO', 'UK_MLD',
       'Unnamed: 12', 'year', 'time', 'day_moth', 'month']

df.drop(['Unnamed: 12'], axis = 1, inplace = True)

In [None]:
aes_df = df[['time', 'Day', 'month', 'year', 'AES']]
aes_df.columns = ['time', 'Day', 'month', 'year', 'generation']
#aes_df['type'] = 'AES'
aes_df.loc[:, 'type'] = 'AES'

tec_df = df[['time', 'Day', 'month', 'year', 'TEC']]
tec_df.columns = ['time', 'Day', 'month', 'year', 'generation']
tec_df.loc[:, 'type'] = 'TEC'

vde_df = df[['time', 'Day', 'month', 'year', 'VDE']]
vde_df.columns = ['time', 'Day', 'month', 'year', 'generation']
vde_df.loc[:, 'type'] = 'VDE'

tes_df = df[['time', 'Day', 'month', 'year', 'TES']]
tes_df.columns = ['time', 'Day', 'month', 'year', 'generation']
tes_df.loc[:, 'type'] = 'TES'

ges_df = df[['time', 'Day', 'month', 'year', 'GES']]
ges_df.columns = ['time', 'Day', 'month', 'year', 'generation']
ges_df.loc[:, 'type'] = 'GES'

gaes_df = df[['time', 'Day', 'month', 'year', 'GAES_GEN']]
gaes_df.columns = ['time', 'Day', 'month', 'year', 'generation']
gaes_df.loc[:, 'type'] = 'GAES'

data = pd.concat([aes_df, tec_df, vde_df, tes_df, ges_df, gaes_df])

In [None]:
alt.data_transformers.disable_max_rows()


**- Як змінювалась структура генерації електроенергії за роками?**

Я вибрала саме такий спосіб візуалізації, бо він показує скільки всього електроенергії вироблено, а також в ньому наглядно показано які саме електростанції виробили цю енергію. Як альтернативу я розглядала графік на якому відсотково розподілено які електростанції скільки електроенергії виробили. Проблема такого відсоткового розподілення в тому, що ми не бачимо саме число скільки електроенергії вироблено і не бачимо тенденцію, оскільки всі електростанції в сумі дають 100%.

In [None]:
alt.Chart(data).transform_filter(alt.FieldRangePredicate(field='year', range = [2014, 2020])).mark_area().encode(
    x = alt.X('year:Q'),
    y = alt.Y('generation:Q', aggregate = 'sum'),
    color = alt.Color('type:N'),
    order = alt.Order('generation:Q', aggregate='sum', sort = 'ascending')
).properties(width = 950, height = 500, background = '#F9F9F9', padding = 25)

**- Як залежить споживання електроенергії від дня року та години доби?**
Я вибрала саме такий тип візуалізації, бо на ній дуже легко наглядно показати три змінних - день, годину та споживання. В моїй візуалізації дні йдуть так як і в житті, що дозволяє побачити тенденцію споживання електроенергії протягом року, а також можна побачити патерн споживання електроенергії який повторюється кожного місяця.

In [None]:
alt.Chart(df).transform_filter(alt.FieldRangePredicate(field='year', range=[2014, 2020])).mark_rect().encode(
    x = alt.X('time:Q'),
    y = alt.Y('day_moth:N', sort = alt.SortField('order')),
    color = alt.Color('CONSUMPTION:Q', scale = alt.Scale(scheme = 'pinkyellowgreen'))
).properties(width = 950)

**- Як змінюється генерація електроенергії з різних джерел впродовж доби?**
Я вибрала саме таку візуалізацію, бо вона компактна і дозволяє одразу порівняти вироблення електроенергії з різних джерел протягом доби. Також можна подивитися як генерується енектроенершія протягом доби для конкретної електростанції. Я відсортувала електростанції від тої, яка виробляє найбільше електроенергії, до тої що найменше, що дозволило одразу бачити ці показники в загальному вигляді.

In [None]:
alt.Chart(data).transform_filter(alt.FieldRangePredicate(field='year', range=[2014, 2020])).mark_rect().encode(
    x = alt.X('time:Q'),
    y = alt.Y('type:N', sort = alt.Sort(field = 'generation', op = 'mean', order = 'descending')),
    color = alt.Color('generation:Q', scale = alt.Scale(scheme = 'pinkyellowgreen'))
).properties(width = 950)

**- Як змінюється споживання електроенергії впродовж доби у розрізі місяців року та пір року?**
Я вирішила зробити два окремих графіки - для місяців та для пір року. Графіки збудовані так само як і в минулому питанні, оскільки вони дозволяють побачити споживання електроенегрії в конкретну годину в конкретний місяць(сезон).

In [None]:
alt.Chart(df).transform_filter(alt.FieldRangePredicate(field='year', range=[2014, 2020])).mark_rect().encode(
    x = alt.X('time:Q'),
    y = alt.Y('month:N', sort = alt.SortField('order')),
    color = alt.Color('CONSUMPTION:Q', scale = alt.Scale(scheme = 'pinkyellowgreen'))
).properties(width = 950)

In [None]:
df.loc[:, 'season'] = ''
seasons = {'12':'winter', '01':'winter', '02':'winter', '03':'spring', '04':'spring', '05':'spring', '06':'summer', '07':'summer', '08':'summer', '09':'autumn', '10':'autumn', '11':'autumn'}

df['season'] = df.apply(lambda x: seasons[x['month']], axis=1)

In [None]:
alt.Chart(df).transform_filter(alt.FieldRangePredicate(field='year', range=[2014, 2020])).mark_rect().encode(
    x = alt.X('time:Q'),
    y = alt.Y('season:N', sort = alt.SortField('order')),
    color = alt.Color('CONSUMPTION:Q', scale = alt.Scale(scheme = 'pinkyellowgreen'))
).properties(width = 950)

In [None]:
df["day_of_week"] = df.apply(lambda row: calendar.day_name[datetime(row["year"], row["month"], row["Day"]).weekday()],axis=1)



**- Як змінюється споживання електроенергії впродовж тижня?**
Длі візуалізації споживання електроенергії впродовж тижня я взяла звичайний бар-чарт та посортувала значення по днях тижня. Альтернативою є звичайний графік з точками і лінією, який так само легко сприймається як і бар чарт.

In [None]:
alt.Chart(df).mark_bar().encode(
    x = alt.X('day_of_week:N', sort=['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']),
    y = alt.Y('CONSUMPTION:Q', aggregate = 'mean'),
    tooltip = alt.Tooltip('CONSUMPTION', aggregate = 'mean')
).properties(width = 800, height = 500)