In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
from os.path import join
from pathlib import Path
import os

from statsmodels.tsa.seasonal import seasonal_decompose 
from statsmodels.tsa.stattools import adfuller

from datetime import datetime, timedelta
from suntime import Sun, SunTimeException


from sklearn.model_selection import train_test_split, TimeSeriesSplit, GridSearchCV
from sklearn.linear_model import Ridge, Lasso, LinearRegression
from sklearn.ensemble import RandomForestRegressor
from lightgbm import LGBMRegressor

from sklearn.preprocessing import StandardScaler


#Метрики
from sklearn.metrics import mean_absolute_error, mean_squared_error

In [2]:
def preprocessing(x):
    ## Функция заменяет значения в столбце с осадками и делит их на 4 категории :
    ## 1) Нет осадков
    ## 2) Слабый дождь
    ## 3) Сильный дождь
    ## 4) Снег
    
    x.WW = x.WW.str.lower()
    x.WW = x.WW.fillna('нет осадков')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), дождь', 'сильный дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), дождь, снег', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), снег, дождь', 'снег')
    x.WW = x.WW.replace('ливень (ливни), снег, дождь', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) дождь', 'слабый дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) дождь, дымка', 'слабый дождь')
    x.WW = x.WW.replace('сильный(ая)(ые) ливень (ливни), снег, дождь', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) дождь', 'слабый дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) дождь, дымка', 'слабый дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), снег, дымка', 'снег')
    x.WW = x.WW.replace('ливень (ливни), дождь, снег', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) дождь, снег', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) снег', 'снег')
    x.WW = x.WW.replace('снег, дымка', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) снег, дымка', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) снег, дождь, дымка', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) снег, дождь', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), снег', 'снег')
    x.WW = x.WW.replace('ливень (ливни), снег,низовая (метель, буря) снег', 'снег')
    x.WW = x.WW.replace('сильный(ая)(ые) снег', 'снег')
    x.WW = x.WW.replace('снег, дождь, дымка', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) морось', 'слабый дождь')
    x.WW = x.WW.replace('дымка', 'слабый дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) морось, дымка', 'слабый дождь')
    x.WW = x.WW.replace('сильный(ая)(ые) ливень (ливни)', 'сильный дождь')
    x.WW = x.WW.replace('сильный(ая)(ые) ливень (ливни), снег', 'снег')
    x.WW = x.WW.replace('частичный (охватывающий часть аэродрома) туман', 'слабый дождь')
    x.WW = x.WW.replace('замерзающий(ая) (переохлажденный(ая)) туман', 'снег')
    x.WW = x.WW.replace('клочьями туман', 'слабый дождь')
    x.WW = x.WW.replace('сильный(ая)(ые) ливень (ливни), дождь, снег', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), снег, дождь, дымка', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), дождь, небольшой град и/или снежная крупа', 'снег')
    x.WW = x.WW.replace('частичный (охватывающий часть аэродрома) туман, дымка', 'слабый дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), дождь, дымка', 'сильный дождь')
    x.WW = x.WW.replace('морось, дымка', 'слабый дождь')
    x.WW = x.WW.replace('морось, дымка', 'слабый дождь')
    x.WW = x.WW.replace('дымка, дым', 'слабый дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) замерзающий(ая) (переохлажденный(ая)) морось, дымка', 'снег')
    x.WW = x.WW.replace('ливень (ливни), снег, дымка', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) гроза, дождь', 'сильный дождь')
    x.WW = x.WW.replace('ливень (ливни), дождь', 'сильный дождь')
    x.WW = x.WW.replace('снег,низовая (метель, буря) снег', 'снег')
    x.WW = x.WW.replace('клочьями туман, дымка', 'слабый дождь')
    x.WW = x.WW.replace('сильный(ая)(ые) дождь,частичный (охватывающий часть аэродрома) туман', 'сильный дождь')
    x.WW = x.WW.replace('гроза', 'сильный дождь')
    x.WW = x.WW.replace('ливень (ливни), небольшой град и/или снежная крупа', 'снег')
    x.WW = x.WW.replace('поземный туман', 'слабый дождь')
    x.WW = x.WW.replace('дымка,поземный туман', 'слабый дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) дождь, снег, дымка', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) снег,низовая (метель, буря) снег', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) замерзающий(ая) (переохлажденный(ая)) морось', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) снег, слабый(ая)(ые) замерзающий(ая) (переохлажденный(ая)) дождь', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), снег,низовая (метель, буря) снег', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), небольшой град и/или снежная крупа', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) снег,частичный (охватывающий часть аэродрома) туман, дымка', 'снег')
    x.WW = x.WW.replace('дымка,клочьями туман', 'слабый дождь')
    x.WW = x.WW.replace('дождь, дымка', 'слабый дождь')
    x.WW = x.WW.replace('сильный(ая)(ые) ливень (ливни), снег,низовая (метель, буря) снег', 'снег')
    x.WW = x.WW.replace('сильный(ая)(ые) снег,низовая (метель, буря) снег', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), дождь, туман', 'сильный дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) замерзающий(ая) (переохлажденный(ая)) дождь, дымка', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) ливень (ливни), снег, небольшой град и/или снежная крупа', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) дождь, туман', 'слабый дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) морось,частичный (охватывающий часть аэродрома) туман, дымка', 'слабый дождь')
    x.WW = x.WW.replace('слабый(ая)(ые) замерзающий(ая) (переохлажденный(ая)) дождь', 'снег')
    x.WW = x.WW.replace('слабый(ая)(ые) снег, поземок, снег', 'снег')
    x.WW = x.WW.replace('снег, поземок, снег', 'снег')
    x.WW = x.WW.replace('дым', 'слабый дождь')
    x.WW = x.WW.replace('снег, дождь', 'снег')
    x.WW = x.WW.replace('дождь, снег', 'снег')
    x.WW = x.WW.replace('туман', 'слабый дождь')
    x.WW = x.WW.replace('поземок, снег', 'снег')
    x.WW = x.WW.replace('гроза, дождь', 'сильный дождь')
    return x

In [3]:
def wind_direction(column):
    'Новые столбцы: N, S, W, E'
    if column == 'Ветер, дующий с юго-юго-запада':
        return 0, 1, 0.5, 0
    if column == 'Ветер, дующий с юго-запада':
        return 0, 1, 1, 0
    if column == 'Ветер, дующий с западо-юго-запада':
        return 0, 0.5, 1, 0
    if column == 'Ветер, дующий с запада':
        return 0, 0, 1, 0
    if column == 'Ветер, дующий с западо-северо-запада':
        return 0.5, 0, 1, 0
    if column == 'Ветер, дующий с северо-запада':
        return 1, 0, 1, 0
    if column == 'Ветер, дующий с северо-северо-запада':
        return 1, 0, 0.5, 1
    if column == 'Ветер, дующий с северо-северо-востока':
        return 1, 0, 0, 0.5
    if column == 'Ветер, дующий с севера':
        return 1, 0, 0, 0
    if column == 'Переменное направление':
        return 1, 1, 1, 1
    if column == 'Ветер, дующий с юга':
        return 0, 1, 0, 0
    if column == 'Ветер, дующий с северо-востока':
        return 1, 0, 0, 1
    if column == 'Ветер, дующий с востоко-северо-востока':
        return 0.5, 0, 0, 1
    if column == 'Ветер, дующий с востока':
        return 0, 0, 0, 1
    if column == 'Ветер, дующий с юго-востока':
        return 0, 1, 0, 1
    if column == 'Ветер, дующий с юго-юго-востока':
        return 0, 1, 0, 0.5
    if column == 'Ветер, дующий с востоко-юго-востока':
        return 0, 0.5, 0, 1
    if column == 'Штиль, безветрие':
        return 0, 0, 0, 0


In [4]:
def directions(data):
    '''
    Функция создает 4 новых признака по направлению ветра.
    N - north
    S - south
    W - west
    E - east
    '''
    data['wind'] = data['DD'].apply(wind_direction)
    data[['N', 'S', 'W', 'E']] = data['wind'].apply(lambda x: pd.Series(x))
    data.drop('wind', axis=1, inplace=True)
    return data

In [5]:
def processing_table(df):
    df.rename(columns = {'Местное время в Храброво / им. императрицы Елизаветы Петровны (аэропорт)':'date'}, inplace = True )
    df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
    df = df.sort_values(by='date')
    df = df.set_index('date')
    df = preprocessing(df)
    df = directions(df)

    return df

In [6]:
dp = Path("C:/Users/79099/Desktop/Hakaton_GlowByte/first-competition-2/data/")

In [7]:
df_true_weather = pd.read_csv(join(dp, 'da_true_weather.csv'), sep=';')
df_true_weather = processing_table(df_true_weather) 

In [8]:
df_true_weather

Unnamed: 0_level_0,T,P0,P,U,DD,Ff,ff10,WW,W'W',c,VV,Td,N,S,W,E
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1
2019-01-01 00:00:00,2.0,763.8,765.0,87.0,"Ветер, дующий с юго-юго-запада",7,,нет осадков,,Нет существенной облачности,10.0 и более,0.0,0.0,1.0,0.5,0.0
2019-01-01 00:30:00,3.0,763.1,764.3,81.0,"Ветер, дующий с юго-юго-запада",7,12.0,нет осадков,,Нет существенной облачности,10.0 и более,0.0,0.0,1.0,0.5,0.0
2019-01-01 01:00:00,3.0,762.3,763.5,81.0,"Ветер, дующий с юго-запада",8,13.0,нет осадков,,Нет существенной облачности,10.0 и более,0.0,0.0,1.0,1.0,0.0
2019-01-01 01:30:00,3.0,762.3,763.5,81.0,"Ветер, дующий с юго-запада",8,,слабый дождь,,Разорванная (60-90%) 840 м,10.0 и более,0.0,0.0,1.0,1.0,0.0
2019-01-01 02:00:00,3.0,761.6,762.8,87.0,"Ветер, дующий с юго-запада",9,14.0,слабый дождь,,"Разорванная (60-90%) 360 м, сплошная (100%) 750 м",10.0 и более,1.0,0.0,1.0,1.0,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2023-09-30 21:30:00,15.0,762.3,763.5,82.0,"Ветер, дующий с запада",5,,нет осадков,,Рассеянная (40-50%) 930 м,10.0 и более,12.0,0.0,0.0,1.0,0.0
2023-09-30 22:00:00,15.0,762.3,763.5,82.0,"Ветер, дующий с западо-северо-запада",3,,нет осадков,,Рассеянная (40-50%) 810 м,10.0 и более,12.0,0.5,0.0,1.0,0.0
2023-09-30 22:30:00,15.0,762.3,763.5,77.0,"Ветер, дующий с запада",7,,сильный дождь,,"Разорванная (60-90%) 840 м, кучево-дождевые об...",9.0,11.0,0.0,0.0,1.0,0.0
2023-09-30 23:00:00,14.0,762.3,763.5,94.0,"Ветер, дующий с западо-северо-запада",6,,сильный дождь,,"Разорванная (60-90%) 810 м, кучево-дождевые об...",9.0,13.0,0.5,0.0,1.0,0.0
