Як змінюється споживання електроенергії впродовж тижня?

In [1]:
import pandas as pd
import altair as alt

In [2]:
alt.data_transformers.disable_max_rows()

DataTransformerRegistry.enable('default')

In [3]:
data = pd.read_excel("../data/2014-2020.xlsx")[["Час/Дата", "CONSUMPTION"]]
data.head()

Unnamed: 0,Час/Дата,CONSUMPTION
0,24-31.12.2020,16693
1,23-31.12.2020,17805
2,22-31.12.2020,18870
3,21-31.12.2020,19887
4,20-31.12.2020,20387


In [4]:
# перетворюємо стрічку з датою і годиною в datetime
# в даних 12 година ночі позначається як 24, pandas ця годину позначає як 0
data['date'] = pd.to_datetime(data['Час/Дата'].replace(regex=r'^24-', value='0-'), format='%H-%d.%m.%Y')
data = data.drop(columns=["Час/Дата"])

In [5]:
# виділяємо годину в окрему колонку
data.loc[data['date'].dt.hour == 0, 'date'] += pd.Timedelta(days=1)

In [6]:
data['weekday'] = data['date'].dt.dayofweek

In [7]:
data['date'] = pd.to_datetime(data['date']).dt.normalize()

In [8]:
data.head()

Unnamed: 0,CONSUMPTION,date,weekday
0,16693,2021-01-01,4
1,17805,2020-12-31,3
2,18870,2020-12-31,3
3,19887,2020-12-31,3
4,20387,2020-12-31,3


In [9]:
data.weekday.unique()

array([4, 3, 2, 1, 0, 6, 5], dtype=int64)

In [10]:
data = data.groupby(['date']).sum()
data = data[data['weekday'] % 24 == 0]
data['weekday'] //= 24
data['weekday'] = (data['weekday']).astype('int32')

In [11]:
weekday_names = ['Понеділок', 'Вівторок', 'Середа', 'Четвер', "П'ятниця", 'Субота', 'Неділя']

In [12]:
data.dtypes

CONSUMPTION    int64
weekday        int32
dtype: object

In [13]:
data['weekday_name'] = ''

for i in range(7):
    data.loc[data['weekday'] == i, 'weekday_name'] = weekday_names[i]

In [14]:
alt.Chart(data, title={'text': "Споживання електроенергії в Україні в залежності від дня тижня"}).transform_aggregate(
    mean_consumption='mean(CONSUMPTION)',
    groupby=["weekday_name"]
).mark_line().encode(
    x = alt.X('weekday_name', sort=weekday_names, axis=alt.Axis(title=' ', titleFontSize=14)),
    y = alt.Y('mean_consumption:Q', scale = alt.Scale(zero = False), axis=alt.Axis(title='Споживання енергії за тиждень в МВт', titleFontSize=14))
).properties(width = 800, height = 500, padding = 25).configure_title(fontSize=18)