In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits import mplot3d
import seaborn as sns
import gc
from tqdm import tqdm

%matplotlib inline

PATH = '../'

In [2]:
%%time
train = pd.read_csv(PATH + 'train.csv')
test = pd.read_csv(PATH + 'Track 1/test.csv')
submission = pd.read_csv(PATH + 'Track 1/submission.csv')

Wall time: 3.26 s


### LB Score Calc

Для подсчета скора просто используйте функцию getLBScore

In [3]:
def smape(satellite_predicted_values, satellite_true_values): 
    # the division, addition and subtraction are pointwise 
    return np.mean(np.abs(satellite_predicted_values - satellite_true_values) / (np.abs(satellite_predicted_values) + np.abs(satellite_true_values)))

### Model training

In [4]:
training_columns = ['epoch', 'sat_id', 'x_sim', 'y_sim', 'z_sim', 'Vx_sim', 'Vy_sim', 'Vz_sim']
prediction_columns = ['x','y','z','Vx', 'Vy', 'Vz']
X = train.loc[:, training_columns]
y = train.loc[:, prediction_columns]
Xtest = test.loc[:, training_columns]

In [5]:
def extractTimeFeats(data):
    timeFeats = data['epoch'].apply(lambda x: str(x).split('T')[1].split('.')[0].split(':')).values
    h,m,s = [],[],[]
    for feat in timeFeats:
        h.append(feat[0]); m.append(feat[1]); s.append(feat[2])
    return h,m,s

In [6]:
h,m,s = extractTimeFeats(X)
X.loc[:, 'h'] = list(map(int, h)); X.loc[:, 'm'] = list(map(int, m)); X.loc[:, 's'] =list(map(int, s))
X.drop(columns = 'epoch', inplace = True)

h,m,s = extractTimeFeats(Xtest)
Xtest.loc[:, 'h'] = list(map(int, h)); Xtest.loc[:, 'm'] = list(map(int, m)); Xtest.loc[:, 's'] = list(map(int, s))
Xtest.drop(columns = 'epoch', inplace = True)

In [15]:
from sklearn.linear_model import LinearRegression, Lasso, Ridge
from sklearn.ensemble import RandomForestRegressor, ExtraTreesRegressor
model = ExtraTreesRegressor()
trainSize = 0.8
submissionValid = train.copy()[['id', 'sat_id', 'x', 'y', 'z', 'Vx', 'Vy', 'Vz']]
smp = []
nTargets = 6
for sat_id in Xtest['sat_id'].unique():
    satX = X[X['sat_id'] == sat_id]
    satY = y[X['sat_id'] == sat_id]
    satXtest = Xtest[Xtest['sat_id'] == sat_id]
    
    size = int(satX.shape[0] * trainSize)
    Xtr, Xval = satX.iloc[:size, :], satX.iloc[size:, :]
    ytr, yval = satY.iloc[:size, :], satY.iloc[size:, :]
    for i in range(nTargets):
        model.fit(Xtr, ytr.iloc[:, i])
        ypred = model.predict(Xval)
        smp.append(smape(ypred, yval.iloc[:, i]))
    print(np.mean(smp))
print('Final', 100*(1- np.mean(smp)))

KeyboardInterrupt: 

In [11]:
from sklearn.linear_model import LinearRegression, Lasso, Ridge
from sklearn.ensemble import AdaBoostRegressor
model = ExtraTreesRegressor()
nTargets = 6
for sat_id in tqdm(Xtest['sat_id'].unique()):
    satX = X[X['sat_id'] == sat_id].drop(columns = ['sat_id'])
    satY = y[X['sat_id'] == sat_id]
    satXtest = Xtest[Xtest['sat_id'] == sat_id].drop(columns = ['sat_id'])
    
    for i in range(nTargets):
        model.fit(satX, satY.iloc[:, i])
        ypred = model.predict(satXtest)
        submission.loc[satXtest.index, submission.columns[i+1]] = ypred



  0%|▋                                                                                                                                                                                                         | 1/300 [00:00<01:50,  2.72it/s]
  1%|█▎                                                                                                                                                                                                        | 2/300 [00:00<01:28,  3.38it/s]
  1%|██                                                                                                                                                                                                        | 3/300 [00:00<01:11,  4.14it/s]
  1%|██▋                                                                                                                                                                                                       | 4/300 [00:00<01:12,  4.06it/s]
  2%|███▎                             

 11%|██████████████████████▊                                                                                                                                                                                  | 34/300 [00:07<01:30,  2.94it/s]
 12%|███████████████████████▍                                                                                                                                                                                 | 35/300 [00:08<01:24,  3.13it/s]
 12%|████████████████████████                                                                                                                                                                                 | 36/300 [00:08<01:07,  3.89it/s]
 12%|████████████████████████▊                                                                                                                                                                                | 37/300 [00:08<01:22,  3.20it/s]
 13%|█████████████████████████▍         

 23%|█████████████████████████████████████████████▌                                                                                                                                                           | 68/300 [00:14<01:01,  3.77it/s]
 23%|██████████████████████████████████████████████▏                                                                                                                                                          | 69/300 [00:14<00:51,  4.47it/s]
 23%|██████████████████████████████████████████████▉                                                                                                                                                          | 70/300 [00:14<00:46,  4.98it/s]
 24%|███████████████████████████████████████████████▌                                                                                                                                                         | 71/300 [00:14<00:41,  5.53it/s]
 24%|███████████████████████████████████

 34%|████████████████████████████████████████████████████████████████████▋                                                                                                                                   | 103/300 [00:22<00:51,  3.85it/s]
 35%|█████████████████████████████████████████████████████████████████████▎                                                                                                                                  | 104/300 [00:23<00:41,  4.72it/s]
 35%|██████████████████████████████████████████████████████████████████████                                                                                                                                  | 105/300 [00:23<00:35,  5.44it/s]
 35%|██████████████████████████████████████████████████████████████████████▋                                                                                                                                 | 106/300 [00:23<00:32,  5.98it/s]
 36%|███████████████████████████████████

 46%|███████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                            | 137/300 [00:30<00:28,  5.73it/s]
 46%|████████████████████████████████████████████████████████████████████████████████████████████                                                                                                            | 138/300 [00:31<00:51,  3.16it/s]
 46%|████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                           | 139/300 [00:31<00:46,  3.47it/s]
 47%|█████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                          | 140/300 [00:31<00:38,  4.13it/s]
 47%|███████████████████████████████████

 58%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                    | 174/300 [00:38<00:25,  4.96it/s]
 58%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                   | 175/300 [00:39<00:24,  5.20it/s]
 59%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                  | 176/300 [00:39<00:24,  5.09it/s]
 59%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                  | 177/300 [00:39<00:22,  5.45it/s]
 59%|███████████████████████████████████

 70%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                            | 209/300 [00:47<00:26,  3.39it/s]
 70%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                            | 210/300 [00:47<00:27,  3.24it/s]
 70%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                           | 211/300 [00:48<00:23,  3.77it/s]
 71%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                          | 212/300 [00:48<00:20,  4.37it/s]
 71%|███████████████████████████████████

 82%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                    | 245/300 [00:56<00:12,  4.57it/s]
 82%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                    | 246/300 [00:56<00:11,  4.59it/s]
 82%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                   | 247/300 [00:56<00:10,  5.18it/s]
 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                  | 248/300 [00:56<00:12,  4.02it/s]
 83%|███████████████████████████████████

 93%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋             | 280/300 [01:04<00:02,  7.73it/s]
 94%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎            | 281/300 [01:04<00:03,  6.20it/s]
 94%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████            | 282/300 [01:04<00:02,  6.14it/s]
 94%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋           | 283/300 [01:04<00:02,  6.93it/s]
 95%|███████████████████████████████████

In [16]:
submission.to_csv('submission.csv', index = None)