# Оценка модели
Строим модель энергопотребления здания по среднему значению. Оцениваем эффективность модели через метрику
$$\LARGE RMSLE = \sqrt{\frac{\sum_{i=1}^{n}(log(p_i+1)-log(a_i+1))^2}{n}},$$
где:
- $n - число\; наблюдений;$
- $log\;- натуральный\; логорифм;$
- $p_i\;- вычисленное\; значение\; метрики;$
- $a_i\;- заданное\; значение\; метрики.$

In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split

## Загрузка данных. Выкунуть пустые дни по "meter_reading" и выделить час в отдельную колонку.
**meter_reading** - потребление энергии в кВтч (или эквивалент)

In [2]:
energy = pd.read_csv("../data/train.csv")
energy = energy[energy["meter_reading"]>0]
energy["timestamp"] = pd.to_datetime(energy["timestamp"])
energy["hour"] = energy["timestamp"].dt.hour
print(energy.head())

      building_id  meter           timestamp  meter_reading  hour
704             0      0 2016-01-30 08:00:00        43.6839     8
725             0      0 2016-01-31 05:00:00        37.5408     5
737             0      0 2016-01-31 17:00:00        52.5571    17
2366            0      0 2016-04-08 14:00:00        59.3827    14
2923            0      0 2016-05-01 19:00:00       448.0000    19


# Разделить данные на обучение и проверку
**20%** - на проверку
**80%** - на обучение

In [3]:
energy_train, energy_test = train_test_split(energy, test_size=0.2)
print(energy_train.count())

building_id      4328
meter            4328
timestamp        4328
meter_reading    4328
hour             4328
dtype: int64


## Среднее и медианное значение потребления энергии по часам

In [4]:
energy_train_hours = energy_train.groupby("hour")
energy_meter_reading = energy_train_hours["meter_reading"]
energy_train_avg = pd.DataFrame(
    {
        "Среднее": energy_meter_reading.mean(),
        "Медиана": energy_meter_reading.median(),
    }
)
print(energy_train_avg)

         Среднее   Медиана
hour                      
0     236.250213  239.2375
1     239.197365  240.9440
2     240.489979  242.3090
3     239.862129  244.3570
4     239.426143  245.7220
5     238.587809  245.0390
6     236.931783  243.3325
7     242.911185  246.4040
8     244.192190  239.5790
9     234.251060  234.4595
10    239.281397  239.5790
11    235.710792  241.6260
12    235.005884  242.3090
13    235.302622  243.6740
14    238.500560  242.3090
15    238.704127  245.3805
16    238.124020  242.9910
17    236.778358  242.3090
18    237.984778  239.5790
19    235.786653  236.8480
20    236.315886  237.5310
21    238.268022  238.8960
22    238.213548  236.8480
23    241.128928  239.5790
