In [1]:
import pandas as pd
import dask.dataframe as dd
import pickle

In [2]:
X_test = dd.read_parquet('X_test.parquet', engine='fastparquet')
y_train = dd.read_parquet('y_train.parquet', engine='fastparquet')

In [3]:
feature_prefix = 'ЭКСГАУСТЕР '
target_prefix = 'Y_ЭКСГАУСТЕР А/М №'

In [17]:
def feature_by_machine(data, machine_number):
    machine_columns = [column for column in data.columns if feature_prefix + str(machine_number) in column]
    return data[machine_columns]

In [18]:
def target_by_machine(data, machine_number):
    machine_columns = [column for column in data.columns if target_prefix + str(machine_number) in column]
    return data[machine_columns]

In [56]:
machine_numbers = [7, 8, 9]

In [22]:
def load_model_for_target(machine_number, feature_number):
    model_file = 'models/' + 'decision_tree_classifier_' + str(machine_number) + '_' + str(feature_number) + '.pkl'
    with open(model_file, "rb") as f:
        model = pickle.load(f)
    return model    

In [54]:
def make_predictions(feature, target):
    for number in machine_numbers:
        features = feature_by_machine(feature, number)
        features = features.fillna(0)
        targets = target_by_machine(target, number)
        for i in range(len(targets.columns)):
            model = load_model_for_target(number, i)
            predict = model.predict(features)
            filename = targets.columns[i].replace(' ', '_')
            filename = filename.replace('.', '_')
            filename = filename.replace('/', '_')
            filename = 'predictions/' + filename + '.csv'
            print(filename)
            predictions = pd.DataFrame(predict, index=X_test.index)
            predictions.to_csv(filename)

In [57]:
make_predictions(X_test, y_train)

predictions/Y_ЭКСГАУСТЕР_А_М_№7_ЭЛЕКТРОДВИГАТЕЛЬ_ДСПУ-140-84-4_ЭКСГ__№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_КОРПУС_ЭКСГ__№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_ПОДШИПНИК_ОПОРНЫЙ_№1.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_ЗАДВИЖКА_ЭКСГ__№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_ПОДШИПНИК_ОПОРНЫЙ_№2.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_РОТОР_ЭКСГ__№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_ПОДШИПНИК_ОПОРНО-УПОРНЫЙ_ЭКСГ__№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_ВК_310С_ВИБРОПРЕОБРАЗОВАТЕЛЬ_ЭКСГ_№7_Т_3.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_РЕДУКТОР_ГАЗ__ЗАДВИЖКИ_ЭКСГ__№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_ТСМТ-101-010-50М-80_ТЕРМОПРЕОБР_МАСЛО.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_ПОДШИПНИК_ОПОРНЫЙ_ЭКСГ__№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_ГСМ_ЭКСГ__№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_КОЖУХ_МУФТЫ_ЭКСГ__№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_ЭКСГАУСТЕР_А_М_№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_МАСЛОПРОВОДЫ_ЭКСГАУСТЕРА_№7.csv
predictions/Y_ЭКСГАУСТЕР_А_М_№7_МАСЛООХЛАДИТЕЛЬ__М-05-1_ЭКСГ__№7.csv
predicti