## Дерево решений

Задание
1. Там, где написано "Ваш код", нужно реализовать метод или часть метода
2. Там, где написано "Что делает этот блок кода?", нужно разобраться в блоке кода и в комментарии написать, что он делает
3. Добиться, чтобы в пункте "Проверка скорости работы" Ваша реализация работала чуть быстрее, чем у дерева из sklearn (это возможно, так как мы реализуем только малую часть функциональности)
4. Добиться, чтобы в пункте "Проверка качества работы" Ваша реализация работала так же или качественнее, чем у дерева из sklearn
5. Применить реализованное дерево решений для задачи Titanic на kaggle. Применить для той же задачи дерево решений из sklearn. Применить кросс-валидацию для подбора параметров. Сравнить с результатами предыдущих моделей. Если результат улучшился - сделать сабмит. Написать отчет о результатах.

In [1]:
from time import time

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

from scipy import optimize
from sklearn.metrics import accuracy_score
from sklearn.model_selection import KFold
from sklearn.tree import DecisionTreeClassifier

%matplotlib inline

In [21]:
class MyDecisionTreeClassifier:
    NON_LEAF_TYPE = 0
    LEAF_TYPE = 1

    def __init__(self, min_samples_split=2, max_depth=None, sufficient_share=0.99,
                 criterion='gini', max_features=None):
        self.tree = dict()
        self.min_samples_split = min_samples_split  # ограничение минимального числа объектов в листе
        self.max_depth = max_depth  # параметр max_depth ограничивает глубину дерева
        self.sufficient_share = sufficient_share
        self.num_class = -1
        if criterion == 'gini':
            self.G_function = self.__gini
        elif criterion == 'entropy':
            self.G_function = self.__entropy
        elif criterion == 'misclass':
            self.G_function = self.__misclass
        else:
            print('invalid criterion name')
            raise

        if max_features == 'sqrt':
            self.get_feature_ids = self.__get_feature_ids_sqrt
        elif max_features == 'log2':
            self.get_feature_ids = self.__get_feature_ids_log2
        elif max_features == None:
            self.get_feature_ids = self.__get_feature_ids_N
        else:
            print('invalid max_features name')
            raise

    # Набор функция для вычисления меры "нечистоты" (Impurity)
    # или меры неоднородности при разделении в узле дерева на левый и правый узлы
    # В функциях используются следующие входные параметры:
    # l_c == l_class_count - количество образцов первого и второго класса в левой части разделённого массива
    # l_s == l_sizes - размер левой части
    # r_c == r_class_count - количество образцов первого и второго класса в правой части разделённого массива
    # r_s == r_sizes - размер правой части
    # передаются массивы таких значений для всех возможных разбиений по местам изменения целевого признака
    # возвращают значения меры неоднородности для различных возможных разбиений
    
    # мера неоднородности Джини
    def __gini(self, l_c, l_s, r_c, r_s):
        l_s = l_s.astype('float')
        r_s = r_s.astype('float')
        # Общий размер левой и правой части
        size_all = l_s[0, 0] + r_s[0, 0]
        # Доля образцов, котороые принадлежат классу 1 в левом узле
        p_1_left = l_c[:, 0] / l_s[:, 0]
        # Доля образцов, котороые принадлежат классу 2 в левом узле
        p_2_left = l_c[:, 1] / l_s[:, 0]
        # Мера Джини для левого узла
        gini_left = 1.0 - np.square(p_1_left) - np.square(p_2_left)
        # Аналогично для правого узла
        p_1_right = r_c[:, 0] / r_s[:, 0]
        p_2_right = r_c[:, 1] / r_s[:, 0]
        gini_right = 1.0 - np.square(p_1_right) - np.square(p_2_right)
       
        gini_sum = (l_s[:, 0] / size_all) * gini_left + (r_s[:, 0] / size_all) * gini_right      
        return gini_sum
    
    
    # Информационная энтропия
    def __entropy(self, l_c, l_s, r_c, r_s):
        l_s = l_s.astype('float')
        r_s = r_s.astype('float')
        threshold = 1e-10
        # Общий размер левой и правой части
        size_all = l_s[0, 0] + r_s[0, 0]
        # Доля образцов, котороые принадлежат классу 1 в левом узле
        p_1_left = l_c[:, 0] / l_s[:, 0]
        # Доля образцов, котороые принадлежат классу 2 в левом узле
        p_2_left = l_c[:, 1] / l_s[:, 0]
        # Энтропия для левого узла
        entropy_left = -1.0 * (p_1_left * np.log2(np.clip(p_1_left, threshold, 1.0 - threshold)) +
                               p_2_left * np.log2(np.clip(p_2_left, threshold, 1.0 - threshold)))
        # Аналогично для правого узла
        p_1_right = r_c[:, 0] / r_s[:, 0]
        p_2_right = r_c[:, 1] / r_s[:, 0]
        entropy_right = -1.0 * (p_1_right * np.log2(np.clip(p_1_right, threshold, 1.0 - threshold)) +
                                p_2_right * np.log2(np.clip(p_2_right, threshold, 1.0 - threshold)))
       
        entropy_sum = (l_s[:, 0] / size_all) * entropy_left + (r_s[:, 0] / size_all) * entropy_right      
        return entropy_sum

    
    # Ошибка классификации (misclassification error)
    def __misclass(self, l_c, l_s, r_c, r_s):
        l_s = l_s.astype('float')
        r_s = r_s.astype('float')
        # Общий размер левой и правой части
        size_all = l_s[0, 0] + r_s[0, 0]
        # Неоднородность левой части после разделения
        # (выбираем преобладающий класс в левой части и делим на размер левой части == максимальная
        # вероятность класса в левой части после разделения)
        ME_left = 1.0 - np.max(l_c, axis=1) / l_s[:,0]
        # Неоднородность правой части после разделения
        ME_right = 1.0 - np.max(r_c, axis=1) / r_s[:,0]
        
        # Общая неоднородность левой и правой частей
        ME_sum = (l_s[:, 0] / size_all) * ME_left + (r_s[:, 0] / size_all) * ME_right   
        return ME_sum

    
    # Дла разделения в узлах могут быть выбираны не все признаки, а только несколько из них
    def __get_feature_ids_sqrt(self, n_feature):
        feature_ids = list(range(n_feature))
        np.random.shuffle(feature_ids)
        return # Ваш код
      
        
    def __get_feature_ids_log2(self, n_feature):
        feature_ids = list(range(n_feature))
        np.random.shuffle(feature_ids)
        return # Ваш код

    
    def __get_feature_ids_N(self, n_feature):
        feature_ids = list(range(n_feature))
        np.random.shuffle(feature_ids)
        return feature_ids
 

    # Выполняет сортировку признака по возрастанию. На вход передаётся один признак x
    def __sort_samples(self, x, y):  
        sorted_idx = x.argsort() 
        return x[sorted_idx], y[sorted_idx]

    
    # метод делит выборку по пороговому значению
    # выбираются те строки, где значение признака feature_id больше порогового значения (left_mask),
    # и те строки, где значение признака feature_id меньше порогового значения (rigth_mask)
    def __div_samples(self, x, y, feature_id, threshold):
        left_mask = x[:, feature_id] > threshold
        right_mask = ~left_mask
        return x[left_mask], x[right_mask], y[left_mask], y[right_mask]

    
    # Метод находит пороги (т.е. значения признака, при которых целевой признак y
    # меняет своё значение) для признака x и выбирает из них наилучшей с точки зрения
    # минимизации меры неопределённости
    def __find_threshold(self, x, y):
        # Что делает этот блок кода?
        # 1. Сортирует x и y в порядке возрастания x
        # 2. Вычисляется общее количество классов в y (в нашем случае 2 класса - 0 и 1)
        sorted_x, sorted_y = self.__sort_samples(x, y)
        class_number = np.unique(y).shape[0]
        
        # Что делает этот блок кода?
        # 1. Выбираем из массива sorted_y значения в середине, кроме первых и последних min_samples_split
        # строк (чтобы соблюсти ограничение на минимальное кол-во точек в листе дерева)
        # 2. В np.where(...) мы находим индексы в массиве y, в которых значение y изменяется
        # (сравнивается массив y и он же, но смещённый на одну позицию. Т.е. каждый элемент y сравнивается
        # со следующим элементом y). Далее индекс приводится к позиции в исходной матрице.
        # В итоге r_border_ids содержит индекс элемента в массиве sorted_y, в котором значение y изменилось
        # по сравнению со значением в предыдущем элементе
        splitted_sorted_y = sorted_y[self.min_samples_split:-self.min_samples_split]
        r_border_ids = np.where(splitted_sorted_y[:-1] != splitted_sorted_y[1:])[0] + (self.min_samples_split + 1)
        
        # Если для данного признака x целевой признак ни разу не изменяется, то такой признак 
        # не имеет смысла рассматривать для построения дерева
        if len(r_border_ids) == 0:
            return float('+inf'), None
        
        # Что делает этот блок кода?
        # 1. eq_el_count - вычисляется, как долго в массиве y сохраняется постоянное значение до очередного изменения
        # 2,3. one_hot_code - строит массив из двух столбцов с чередующимися 0 и 1, смещёнными на одну позицию
        # в первом и втором столбце (своеобразная "змейка")
        # 4. Первый столбец one_hot_code умножается на столбец eq_el_count
        # 5. К первой строке ещё добавляется поправка на количество разных классво в первых 
        # min_samples_split строках sorted_y
        # В итоге в class_increments содержится таблица, в которой показано, сколько раз сохраняется каждое
        # значение в sorted_y перед следующим изменением
        eq_el_count = r_border_ids - np.append([self.min_samples_split], r_border_ids[:-1])
        one_hot_code = np.zeros((r_border_ids.shape[0], class_number))
        one_hot_code[np.arange(r_border_ids.shape[0]), sorted_y[r_border_ids - 1]] = 1
        class_increments = one_hot_code * eq_el_count.reshape(-1, 1)
        class_increments[0] = class_increments[0] + np.bincount(sorted_y[:self.min_samples_split], minlength=class_number)
        
        # Что делает этот блок кода?
        # Вычисляются следующие показатели:
        # l_class_count - количество элементво 1-го и 2-го классов в левой части разделённого массива
        # r_class_count - количество элементов 1-го и 2-го классов в правой части разделённого массива
        # l_sizes = размер левой половины разделённого массива
        # r_sizes = размер правой половины разделённого массива
        # и, т.к. разделение возможно во всех местах изменения целевого признака y, то эти показатели
        # вычисляются для всех мест разделения
        l_class_count = np.cumsum(class_increments, axis=0)        
        r_class_count = np.bincount(y) - l_class_count
        l_sizes = r_border_ids.reshape(l_class_count.shape[0], 1)
        r_sizes = sorted_y.shape[0] - l_sizes

        # Что делает этот блок кода?
        # 1. Вычисляется мера неоднородности при разделении класса как сумма неоднородностей
        # в левой и правой половинах
        # 2. Индекс разделения, дающего минимальную неоднородность (лучшее разделение)
        gs = self.G_function(l_class_count, l_sizes, r_class_count, r_sizes)
        idx = np.argmin(gs)
    
        # Что делает этот блок кода?
        # 1. Размер левой половины разделённого массива
        # 2. Возвращает значение меры неоднородности, а также среднее значение признака x
        # слева и справа от границы разделения (пороговое значение)
        left_el_id = l_sizes[idx][0]
        return gs[idx], (sorted_x[left_el_id-1] + sorted_x[left_el_id]) / 2.0

    
    # Метод, который рекурсивно строит дерево решений
    def __fit_node(self, x, y, node_id, depth, pred_f=-1):
        # В начале проверяем, не достигнуто ли условие окончания построения дерева
        # (окончание рекурсивных вызовов)
        
        # 1. Лист ли это?
        is_it_leaf = False
        leaf_reason = 0  # причина, по которой мы определяем, что это лист (для отладки)
        
        # достигнута максимальная глубина дерева
        if (self.max_depth is not None) and (depth >= self.max_depth):
            is_it_leaf = True
            leaf_reason = 1
            
        # достигнуто минимальное количество образцов для узла дерева    
        if x.shape[0] <= self.min_samples_split:
            is_it_leaf = True
            leaf_reason = 2
            
        # если в узле доля одного класса больше порогового значения, 
        # то тогда не будем его дальше делить
        main_class_shape = np.max(np.bincount(y))*1.0 / y.shape[0]
        if main_class_shape >= self.sufficient_share:
            is_it_leaf = True
            leaf_reason = 3
        
        if is_it_leaf:  # создаём лист
            self.tree[node_id] = self.__create_leaf_node(y, leaf_reason)
            return
        else:  # иначе создаём узел и разделяем его
            # выбираем признаки для разделения (берём все столбцы из x)
            features_ids = self.get_feature_ids(x.shape[1])  

            # находим из всех признаков такой, разделение по которому обеспечивает
            # наименьшую неопределённость (наибольший прирост информации)
            impurity_list = []
            threshold_list = []
            feature_id_list = []
            
            for feature_id in features_ids:
                impurity, threshold = self.__find_threshold(x[:, feature_id], y)
                # Если threshols == None, то для данного признака x целевой признак ни разу не изменяется
                if threshold is not None:
                    impurity_list.append(impurity)
                    threshold_list.append(threshold)
                    feature_id_list.append(feature_id)

            if len(impurity_list) == 0:  # тогда это лист
                leaf_reason = 4
                self.tree[node_id] = self.__create_leaf_node(y, leaf_reason)
                return
            
            # индекс "наилучшего" признака, соответствующего минимальной impurity
            min_impurity_index = impurity_list.index(min(impurity_list))
            # id наилучшего признака
            min_impurity_feature_id = feature_id_list[min_impurity_index]      
            # порог для разделения
            feature_threshold = threshold_list[min_impurity_index]
            
            # разделяем данные в узле
            x_left, x_right, y_left, y_right = self.__div_samples(x, y, min_impurity_feature_id, feature_threshold)
            
            # если после разделения в одной из половин нет данных, то вторая половина - это лист
            # (это одно из условий окончания рекурсии)
            if y_left.shape[0] == 0 and y_right.shape[0] == 0:
                return
            if y_left.shape[0] == 0:
                leaf_reason = 5
                self.tree[node_id] = self.__create_leaf_node(y_right, leaf_reason)
                return
            if y_right.shape[0] == 0:
                leaf_reason = 6
                self.tree[node_id] = self.__create_leaf_node(y_left, leaf_reason)
                return
            # иначе создаём промежуточный узел и выполняем рекурсивный вызов для левого и правого поддеревьев
            if y_left.shape[0] > 0 and y_right.shape[0] > 0:
                self.tree[node_id] = self.__create_non_leaf_node(min_impurity_feature_id, feature_threshold)
                self.__check_main_class_left_and_right(x, y, y_left, y_right, min_impurity_feature_id, feature_threshold)
                self.__fit_node(x_left, y_left, 2 * node_id + 1, depth + 1)
                self.__fit_node(x_right, y_right, 2 * node_id + 2, depth + 1)
   

    def __create_non_leaf_node(self, feature_id, threshold):
        node = dict()
        node[0] = self.__class__.NON_LEAF_TYPE
        # feature_id 
        node[1] = feature_id
        # threshold
        node[2] = threshold
        return node
        
    
    def __create_leaf_node(self, y, reason):
        node = dict()
        node[0] = self.__class__.LEAF_TYPE
        # назначаем листу класс - наиболее часто встречающуюся в y величину
        node[1] = self.__get_main_class(y)
        # назначаем в листе долю основного класса
        node[2] = np.max(np.bincount(y))*1.0 / y.shape[0]
        # причина создания листа (для отладки)
        node[3] = reason
        # количество образцов в листе (нужно для слияния)
        node[4] = y.shape[0]
        return node
    
    
    def __check_main_class_left_and_right(self, x_before_split, y_before_split, y_left, y_right, min_impurity_feature_id, feature_threshold):
        main_class_left = self.__get_main_class(y_left)
        main_class_right = self.__get_main_class(y_right)
        if main_class_left == main_class_right:
            print("Совпадают main классы после разделения")
            print("Main class")
            print(main_class_left)
            print("y_left")
            print("size = {}".format(y_left.shape[0]))
            print(y_left)
            print("y_right")
            print("size = {}".format(y_right.shape[0]))
            print(y_right)
            print("min_impurity_feature_id")
            print(min_impurity_feature_id)
            print("feature_threshold")
            print(feature_threshold)
            print("Колонка признака до разделения")
            print(x_before_split[:, min_impurity_feature_id])
            print("Целевой признак до разделения")
            print(y_before_split)
            print("")
    
    
    def __get_main_class(self, y):
        return np.argmax(np.bincount(y))
            
        
    # после построения дерева сливаем листы потомки, если они дети одного
    # родителя и имеют одинаковый класс
    def __merge_leafs(self):
        self.__walk_tree_and_merge_leafs(0)
    
    
    def __walk_tree_and_merge_leafs(self, node_id):
        if node_id in self.tree:       
            node = self.tree[node_id]
            if node[0] == self.__class__.NON_LEAF_TYPE:    
                left_node_id = 2 * node_id + 1
                right_node_id = 2 * node_id + 2
                if left_node_id in self.tree and right_node_id in self.tree:
                    left_node = self.tree[left_node_id]
                    right_node = self.tree[right_node_id]
                    if left_node[0] == self.__class__.LEAF_TYPE and right_node[0] == self.__class__.LEAF_TYPE:
                        if left_node[1] == right_node[1]:
                            # сливаем листы, оставляя узел с меньшим id
                            # основной класс
                            main_class = left_node[1]
                            # кол-во образцов в левом и правом узлах
                            y_size_left = left_node[4]
                            y_size_right = right_node[4]
                            # доля основного класса в левом и правом узлах
                            p_left = left_node[2]
                            p_right = right_node[2]
                            # количество образцов основного класса в левом и правом узлах
                            y_max_left = p_left * y_size_left
                            y_max_right = p_right * y_size_right
                            
                            y_max_merge = y_max_left + y_max_right
                            y_size_merge = y_size_left + y_size_right
                            p_merge = y_max_merge / y_size_merge
                            
                            node_merge = dict()
                            node_merge[0] = self.__class__.LEAF_TYPE
                            node_merge[1] = main_class
                            node_merge[2] = p_merge
                            node_merge[3] = 7
                            node_merge[4] = y_size_merge
                            
                            self.tree[left_node_id] = node_merge
                            self.tree.pop(right_node_id)
                    else:
                        if left_node[0] == self.__class__.NON_LEAF_TYPE:
                            self.__walk_tree_and_merge_leafs(left_node_id)
                        if right_node[0] == self.__class__.NON_LEAF_TYPE:
                            self.__walk_tree_and_merge_leafs(right_node_id)
    
            
    def fit(self, x, y):
        self.num_class = np.unique(y).size  # количество классов признаков. В нашем случае 2 класса - 0 или 1
        self.__fit_node(x, y, 0, 0) 
        # self.__merge_leafs()

        
    def __predict_class(self, x, node_id):
        node = self.tree[node_id]
        if node[0] == self.__class__.NON_LEAF_TYPE:
            _, feature_id, threshold = node
            if x[feature_id] > threshold:
                return self.__predict_class(x, 2 * node_id + 1)
            else:
                return self.__predict_class(x, 2 * node_id + 2)
        else:
            return node[1]

        
    def __predict_probs(self, x, node_id):
        node = self.tree[node_id]
        if node[0] == self.__class__.NON_LEAF_TYPE:
            _, feature_id, threshold = node
            if x[feature_id] > threshold:
                return self.__predict_probs(x, 2 * node_id + 1)
            else:
                return self.__predict_probs(x, 2 * node_id + 2)
        else:
            return node[2]

        
    def predict(self, X):
        return np.array([self.__predict_class(x, 0) for x in X])

    
    def predict_probs(self, X):
        return np.array([self.__predict_probs(x, 0) for x in X])

    
    def fit_predict(self, x_train, y_train, predicted_x):
        self.fit(x_train, y_train)
        return self.predict(predicted_x)
    
    
    def printtree(self, indent=''):
        self.__print_node(0, '')
    
    
    def __print_node(self, node_id, indent):
        if node_id in self.tree:
            indent += ' '
            
            node = self.tree[node_id]
            if node[0] == self.__class__.NON_LEAF_TYPE:    
                print('{} {}: feature_id={}, threshold={}'.format(indent, node_id, node[1], node[2]))
                self.__print_node(2 * node_id + 1, indent)
                self.__print_node(2 * node_id + 2, indent)
            if node[0] == self.__class__.LEAF_TYPE:
                print('{} {}: reason={}, class={}, p={}'.format(indent, node_id, node[3], node[1], node[2]))
        else:
            return

In [6]:
df = pd.read_csv('./cs-training.csv', sep=',').dropna()
df.head()

Unnamed: 0,SeriousDlqin2yrs,RevolvingUtilizationOfUnsecuredLines,age,NumberOfTime30-59DaysPastDueNotWorse,DebtRatio,MonthlyIncome,NumberOfOpenCreditLinesAndLoans,NumberOfTimes90DaysLate,NumberRealEstateLoansOrLines,NumberOfTime60-89DaysPastDueNotWorse,NumberOfDependents
1,1,0.766127,45,2,0.802982,9120.0,13,0,6,0,2.0
2,0,0.957151,40,0,0.121876,2600.0,4,0,0,0,1.0
3,0,0.65818,38,1,0.085113,3042.0,2,1,0,0,0.0
4,0,0.23381,30,0,0.03605,3300.0,5,0,0,0,0.0
5,0,0.907239,49,1,0.024926,63588.0,7,0,1,0,0.0


In [7]:
x = df.as_matrix(columns=df.columns[1:])  # столбцы, кроме первого - определяющие признаки
y = df.as_matrix(columns=df.columns[:1])  # первый столбец (SeriousDlqin2yrs) - целевой признак
y = y.reshape(y.shape[0])

In [22]:
my_clf = MyDecisionTreeClassifier(min_samples_split=2, max_depth=None)
clf = DecisionTreeClassifier(min_samples_split=2)

## Проверка скорости работы

In [6]:
t1 = time()
my_clf.fit(x, y)
t2 = time()
print(t2 - t1)

t1 = time()
clf.fit(x, y)
t2 = time()
print(t2 - t1)

0.483305931091
0.962697982788


## Проверка качества работы

In [9]:
gkf = KFold(n_splits=5, shuffle=True)

In [23]:
for train, test in gkf.split(x, y):
    X_train, y_train = x[train], y[train]
    X_test, y_test = x[test], y[test]
    my_clf.fit(X_train, y_train)
    
    y_pred=my_clf.predict(X_test)
    y_true=y_test
    acc_score = accuracy_score(y_pred, y_true)
    
    print(acc_score)

Совпадают main классы после разделения
Main class
1
y_left
size = 682
[1 0 1 0 0 0 0 0 1 1 1 1 0 0 0 1 0 1 0 1 0 1 0 0 0 0 0 1 1 0 1 0 0 1 1 0 1
 0 0 0 0 1 0 1 1 1 0 1 1 1 1 0 1 0 1 1 0 1 1 0 1 1 1 0 1 0 1 0 1 0 0 1 0 0
 1 1 0 1 0 0 1 1 1 0 0 0 1 0 1 0 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 0 1 1 1
 1 1 0 1 1 1 0 0 1 1 1 1 0 1 1 1 0 0 1 1 1 0 0 0 0 0 0 0 1 0 1 1 0 0 0 1 1
 1 1 1 0 1 0 1 1 1 1 1 1 0 1 0 1 1 1 1 1 0 0 1 1 0 1 1 1 0 1 1 0 1 1 0 0 0
 0 1 1 1 1 0 0 1 0 1 1 1 1 0 1 1 1 0 0 1 1 1 1 1 1 0 1 0 0 0 1 0 0 0 1 0 1
 0 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 0 1 1 1 0 0 1 1 0 1 0 0 1 1 1 1 1 0 0 0 1
 1 1 0 0 0 0 1 1 1 0 1 1 1 0 1 1 0 1 1 0 1 0 0 0 0 1 1 1 1 1 1 0 0 1 1 1 0
 0 1 1 0 1 0 0 1 1 0 0 1 1 0 1 1 0 1 1 0 0 0 0 1 0 1 1 1 1 0 1 1 1 0 1 1 0
 0 1 1 0 1 1 1 1 0 1 0 0 1 1 1 0 1 1 1 0 0 1 1 1 0 1 1 1 0 1 0 1 0 0 1 0 0
 1 1 1 0 0 1 1 0 0 0 1 0 0 1 1 0 1 1 1 0 1 0 1 1 1 0 1 0 0 1 0 1 0 1 0 0 0
 1 0 1 1 1 1 1 0 0 1 1 0 0 1 1 1 1 0 0 1 1 1 0 0 1 1 0 1 1 1 0 1 0 1 1 1 1
 1 1 0 0 1 1 0 1 1 0 0 1 1 1 0

Совпадают main классы после разделения
Main class
0
y_left
size = 3415
[0 0 0 ..., 1 1 0]
y_right
size = 90865
[1 0 0 ..., 0 0 0]
min_impurity_feature_id
6
feature_threshold
0.5
Колонка признака до разделения
[ 0.  0.  0. ...,  0.  0.  0.]
Целевой признак до разделения
[1 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 881
[0 0 0 0 0 0 1 1 0 0 1 1 1 0 0 1 1 0 1 1 0 0 0 0 0 1 1 0 0 1 0 1 0 1 1 0 1
 1 0 1 0 1 0 0 0 1 1 0 1 0 0 0 1 1 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 1 0
 1 1 0 1 1 0 1 1 0 0 1 0 0 1 0 0 0 1 1 0 0 0 0 0 1 0 1 1 1 1 0 1 1 1 0 1 1
 1 1 1 0 0 0 0 1 1 1 1 1 1 0 1 1 1 0 0 0 1 1 1 0 0 1 1 1 1 1 1 0 0 1 0 1 0
 1 0 0 0 0 0 0 1 1 1 1 1 0 0 0 1 0 1 1 1 0 0 1 1 0 0 1 0 0 0 0 0 0 1 0 1 0
 0 0 1 0 1 0 1 1 0 1 0 0 1 0 1 1 1 0 0 1 0 1 1 0 0 0 1 1 1 0 1 0 1 0 0 1 0
 0 0 1 0 0 0 1 1 0 0 0 0 1 0 0 1 1 1 0 1 0 1 0 0 0 1 1 1 0 1 0 0 0 1 1 1 0
 1 0 0 1 0 1 1 0 1 1 1 1 0 0 0 0 1 0 1 1 0 0 1 0 0 1 1 0 1 1 1 0 0 1 0 1 0
 0 0 0 1 1 0 1 0 1 0 1 1 0 0 1 1 1 1 0 1

Совпадают main классы после разделения
Main class
0
y_left
size = 294
[1 0 0 1 1 0 0 1 1 0 0 1 1 0 1 1 1 0 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 1 0 1 1
 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 1 1 0 1 0 0 1 1 0 0 0 0 0 1 1 0 0 1 0 0 1
 0 1 1 0 0 1 0 1 1 1 1 0 0 1 0 1 0 1 0 1 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 1 1
 0 1 0 1 0 1 0 1 0 1 1 0 1 1 0 1 1 0 0 1 1 1 0 0 0 0 1 1 1 1 0 1 0 0 0 1 0
 1 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 0 0 1 0 1 0 1 0 1 1 1 1 0 0 0 0 0 0 0 0
 1 1 0 0 0 0 1 1 0 0 0 0 0 1 1 0 1 0 0 0 1 0 1 0 0 0 1 0 0 1 0 1 0 1 1 0 1
 1 0 0 0 0 0 0 0 0 1 1 0 0 1 1 1 1 1 1 1 0 0 0 1 1 0 1 0 0 0 1 1 1 1 0 0 0
 0 1 1 1 0 1 0 0 1 1 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1 0 0 1 0 1 1 0 1 0]
y_right
size = 1271
[0 0 0 ..., 1 1 0]
min_impurity_feature_id
2
feature_threshold
1.0
Колонка признака до разделения
[ 0.  0.  1. ...,  0.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 1 1 0]

Совпадают main классы после разделения
Main class
1
y_left
size = 13
[1 1 1 1 1 1 1 0 1 0 1 1 0]
y_right
size = 71
[1 1 0 1 0 0 1 1 0 

Совпадают main классы после разделения
Main class
0
y_left
size = 18866
[1 0 0 ..., 0 0 0]
y_right
size = 71999
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
0
feature_threshold
0.6167110975
Колонка признака до разделения
[ 0.76612661  0.95715102  0.23380978 ...,  0.04067386  0.29974515
  0.85028295]
Целевой признак до разделения
[1 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 1874
[1 0 0 ..., 1 0 0]
y_right
size = 16992
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
2
feature_threshold
1.0
Колонка признака до разделения
[ 2.  0.  1. ...,  1.  0.  0.]
Целевой признак до разделения
[1 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
1
y_left
size = 13
[1 1 1 1 1 1 1 1 1 1 1 1 1]
y_right
size = 90
[0 1 0 0 0 0 1 1 1 0 1 0 0 1 0 1 0 1 0 0 0 1 0 1 1 1 1 1 0 1 1 1 0 1 1 1 0
 0 1 1 0 1 1 0 0 1 0 1 1 1 0 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0 1 1 1
 1 0 1 1 1 1 0 1 0 1 0 1 1 1 1 1]
min_impurity_feature_id
3
feature_threshold
0.906692659
Колонк

5
feature_threshold
9.0
Колонка признака до разделения
[ 15.   1.   5.   6.   6.   4.   5.   7.  14.  11.   6.  18.   7.   8.   7.
   6.   5.   3.  10.  10.  15.   3.   9.   5.   5.   7.   7.  14.   7.   1.
   4.   3.  12.   1.   8.   9.  15.   4.   7.   5.  10.  14.   4.   2.   5.
   2.   3.   7.   7.   4.  11.   9.   7.   6.   7.  17.   4.   5.   2.   9.
   2.   3.  10.   3.   5.  16.   7.   2.   5.   5.  15.   3.   3.  17.   5.
   7.   8.  10.  13.   8.   8.   7.   6.   8.   3.   7.   3.   7.   7.   4.
  11.   5.   1.   7.  10.  13.  12.   6.   8.  10.  11.   9.  15.   6.   6.
   8.   3.   2.   7.   6.   1.   6.   4.   7.   6.   6.   5.   7.   2.   5.
   3.   9.   7.  14.  10.   6.   8.   8.   9.   7.   4.   3.   4.  11.   6.
   3.   8.   7.   3.  10.   6.   6.   6.   3.   7.  10.   6.   4.  18.   7.
  14.   8.  21.   9.   9.   4.   5.   1.   9.   2.   1.   8.   3.   8.   5.
   5.  10.   9.   9.  13.  17.  17.   4.   4.   6.   6.   4.   3.   7.   7.
   3.   9.  11.   2.  10.   4.   

Совпадают main классы после разделения
Main class
0
y_left
size = 1374
[0 0 1 ..., 0 0 0]
y_right
size = 68598
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
8
feature_threshold
0.0
Колонка признака до разделения
[ 0.  0.  0. ...,  0.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
1
y_left
size = 7
[1 1 1 0 1 1 1]
y_right
size = 7
[1 1 0 0 1 0 1]
min_impurity_feature_id
2
feature_threshold
0.0
Колонка признака до разделения
[ 0.  0.  0.  1.  1.  1.  0.  0.  0.  1.  1.  0.  1.  1.]
Целевой признак до разделения
[1 1 0 1 1 1 0 1 0 0 1 1 1 1]

Совпадают main классы после разделения
Main class
1
y_left
size = 3
[0 1 1]
y_right
size = 4
[1 1 1 1]
min_impurity_feature_id
0
feature_threshold
0.420232075
Колонка признака до разделения
[ 0.3776375   0.          0.14114514  0.43061838  0.40984576  0.60438288
  0.47500373]
Целевой признак до разделения
[1 1 1 0 1 1 1]

Совпадают main классы после разделения
Main class
0
y_left
size = 104
[

Совпадают main классы после разделения
Main class
0
y_left
size = 2
[0 0]
y_right
size = 90
[0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
min_impurity_feature_id
9
feature_threshold
3.0
Колонка признака до разделения
[ 0.  0.  3.  0.  1.  0.  1.  1.  0.  0.  0.  0.  0.  0.  0.  0.  0.  0.
  0.  3.  0.  0.  2.  2.  1.  0.  0.  0.  0.  0.  4.  1.  0.  0.  0.  4.
  1.  0.  1.  0.  1.  0.  2.  2.  2.  0.  2.  0.  0.  0.  0.  2.  0.  1.
  0.  3.  2.  0.  0.  2.  1.  0.  1.  0.  0.  1.  1.  3.  2.  0.  0.  1.
  0.  3.  2.  0.  2.  0.  0.  1.  0.  1.  0.  3.  2.  2.  2.  1.  1.  0.
  0.  3.]
Целевой признак до разделения
[0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0

Совпадают main классы после разделения
Main class
0
y_left
size = 69
[0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0]
y_right
size = 8951
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
7
feature_threshold
4.0
Колонка признака до разделения
[ 1.  0.  0. ...,  2.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 8
[0 0 1 0 0 1 1 1]
y_right
size = 61
[0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0]
min_impurity_feature_id
0
feature_threshold
0.532020393
Колонка признака до разделения
[ 0.39387543  0.50465711  0.59588499  0.40180424  0.30740425  0.38885747
  0.50780029  0.39699249  0.35558492  0.35067108  0.31740505  0.33012094
  0.43524356  0.5298212   0.58094522  0.44916153  0.55717712  0.38305827
  0.37524165  0.31113375  0.40414508  0.30245571  0.5600

0.0710900473934
Совпадают main классы после разделения
Main class
1
y_left
size = 683
[1 1 0 0 1 0 0 0 1 1 1 1 1 1 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 1 0 1 0 0 1 0 1
 1 1 0 0 0 1 1 0 0 0 1 0 1 1 1 1 1 1 0 0 1 0 0 1 0 1 1 1 1 1 1 0 1 1 1 0 1
 1 0 1 0 0 1 0 1 0 1 0 1 0 1 1 1 1 0 1 0 0 1 1 0 0 0 0 1 0 1 0 1 1 0 0 0 0
 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 0 1 0 0 0 1 1 1 1
 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 1 1 1 1 1 1 1 1 1 1 0 1 1 0 1 1 1 0 0 1 1 0
 1 1 1 1 0 1 0 1 1 1 1 1 0 1 0 0 0 0 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0
 0 0 0 1 0 1 1 1 0 1 0 0 1 1 1 0 1 0 0 1 0 0 1 1 1 1 1 1 1 1 0 1 1 0 1 0 1
 0 1 1 1 1 0 0 1 1 1 0 1 0 1 1 1 1 1 1 0 1 0 0 1 0 1 1 1 0 0 0 0 1 1 1 1 1
 0 0 1 1 1 0 0 1 0 0 1 0 0 1 0 1 1 0 1 1 0 1 0 1 0 0 0 1 1 0 1 1 1 0 0 1 1
 0 0 1 1 1 0 0 1 1 0 1 1 1 0 0 1 0 1 0 1 1 0 1 1 1 0 0 1 1 0 1 1 1 0 1 1 0
 1 1 0 1 1 0 1 0 1 1 1 1 1 0 0 1 1 0 0 0 0 0 1 0 1 1 0 1 0 1 1 1 0 1 0 0 0
 1 1 0 0 0 0 1 0 1 1 1 1 1 1 0 1 0 1 0 1 1 0 1 1 1 0 1 1 0 1 1 1 0 1 1 0 1
 0 1 1 1 0 0 0

Совпадают main классы после разделения
Main class
1
y_left
size = 4
[1 1 0 1]
y_right
size = 17
[1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1]
min_impurity_feature_id
5
feature_threshold
11.0
Колонка признака до разделения
[  9.   3.   8.  10.   8.   5.  14.   9.   7.  11.  14.   9.   4.   2.   4.
  13.  16.  11.   6.   8.   6.]
Целевой признак до разделения
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 1 1]

Совпадают main классы после разделения
Main class
1
y_left
size = 10
[1 1 1 1 1 1 1 1 1 1]
y_right
size = 7
[1 1 1 1 0 1 1]
min_impurity_feature_id
9
feature_threshold
0.0
Колонка признака до разделения
[ 2.  1.  3.  0.  2.  4.  2.  0.  0.  1.  0.  3.  2.  0.  0.  0.  1.]
Целевой признак до разделения
[1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1]

Совпадают main классы после разделения
Main class
1
y_left
size = 3
[1 0 1]
y_right
size = 17
[0 0 0 1 1 1 1 0 1 1 1 1 1 1 0 1 0]
min_impurity_feature_id
7
feature_threshold
1.0
Колонка признака до разделения
[ 1.  1.  1.  1.  2.  1.  1.  2.  1.  1.  1.  1.  1.  1.

Колонка признака до разделения
[ 0.  0.  0.  0.  0.  0.  0.  1.  0.  0.  0.  1.  0.  0.  0.  0.  1.  0.
  0.  0.  0.  0.  1.  0.  0.  0.  0.  0.  0.  1.  0.  0.  1.  1.  0.  0.
  0.  0.  1.  0.  0.  1.  1.  0.  1.  0.  1.  0.  0.  0.  1.  1.  0.  0.
  1.  0.  0.  0.  0.  1.  1.  0.  0.  0.  0.  0.  1.  0.  0.  0.  1.  0.
  0.  1.  0.  1.  1.  0.  1.  0.  0.  0.  0.  0.  1.  0.  1.  0.  1.  0.
  0.  0.  0.  0.  0.  0.  0.  0.  1.  0.  0.  0.  0.  0.  1.  1.  1.  0.
  1.  0.  1.  1.  0.  0.  1.  0.  1.  0.  0.  0.  1.  0.  1.  0.  0.  1.
  1.  0.  0.  1.  0.  0.  0.  1.  1.  0.  1.  0.  0.  0.  1.  0.  0.  0.
  1.  0.  0.  0.  1.  0.  1.  0.  0.  1.  1.  0.  0.  0.  0.  0.  0.  0.
  0.  1.  1.  0.  1.  0.  0.  0.  0.  0.  0.  0.  0.  1.  0.  1.  0.  1.
  0.  0.  1.  1.  0.  1.  0.  1.  1.  0.  1.  0.  0.  0.  0.  0.  0.  0.
  1.  1.  1.  0.  1.  0.  0.  1.  0.  1.  0.  1.  1.  0.  0.  1.  1.  1.
  0.  1.  0.  1.  1.  1.  0.  0.  0.  0.  1.  0.  0.  0.  0.  0.  0.  1.
  0.  0.  1.  1.  0.

Совпадают main классы после разделения
Main class
0
y_left
size = 224
[0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 1 0 1 1 0 0 0 1 0 0 1 0 0 0
 0 1 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 1 0 0 0 1 0 0 1 0 0 0
 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 1 0 0 0 0 0 0 0
 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 1 0 0 0 0 0 0 0
 1 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
 0 0]
y_right
size = 33
[0 0 0 0 0 1 1 1 0 1 1 1 1 0 0 1 0 1 0 1 1 0 0 0 1 0 0 0 1 0 1 1 0]
min_impurity_feature_id
1
feature_threshold
34.0
Колонка признака до разделения
[ 46.  52.  28.  41.  52.  44.  53.  72.  59.  43.  52.  51.  66.  38.  35.
  39.  45.  30.  54.  27.  55.  40.  33.  38.  50.  38.  50.  59.  34.  57.
  40.  50.  56.  49.  38.  57.  69.  39.  71.  51.  50.  61.  52.  86.  46.
  37.  62.  50.  64.  46.  35.  50.  55.  73.  27.  73.  32.  59.  35.  69.
  32

Совпадают main классы после разделения
Main class
0
y_left
size = 19158
[1 0 0 ..., 0 0 0]
y_right
size = 71663
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
0
feature_threshold
0.6092657575
Колонка признака до разделения
[ 0.76612661  0.95715102  0.9072394  ...,  0.29974515  0.          0.85028295]
Целевой признак до разделения
[1 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 1912
[1 0 0 ..., 1 0 0]
y_right
size = 17246
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
2
feature_threshold
1.0
Колонка признака до разделения
[ 2.  0.  1. ...,  2.  0.  0.]
Целевой признак до разделения
[1 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 327
[1 0 1 0 0 0 1 1 0 1 1 1 1 0 0 1 0 1 0 1 0 0 0 0 0 0 1 0 0 1 1 0 0 0 0 1 0
 1 0 0 0 0 0 1 1 1 1 0 1 1 0 1 0 0 1 1 0 0 1 1 1 1 0 0 0 0 1 1 1 0 1 1 0 1
 0 0 0 1 0 0 1 1 0 0 0 0 0 1 1 0 1 0 1 1 0 0 0 0 1 1 1 0 0 1 0 0 0 1 1 1 0
 0 0 1 1 0 1 0 1 1 1 1 1 1 1 1 0 0 1 0 0 0 0 1 1 0 1 0 1 0 1 0 0 1 

Совпадают main классы после разделения
Main class
0
y_left
size = 4
[0 1 1 0]
y_right
size = 16
[1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0]
min_impurity_feature_id
1
feature_threshold
53.0
Колонка признака до разделения
[ 56.  30.  52.  50.  53.  39.  40.  70.  57.  53.  52.  36.  26.  47.  60.
  53.  53.  45.  50.  49.]
Целевой признак до разделения
[0 1 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 5
[1 0 1 0 0]
y_right
size = 11
[0 0 0 0 0 0 0 0 0 0 0]
min_impurity_feature_id
9
feature_threshold
2.0
Колонка признака до разделения
[ 3.  3.  0.  1.  0.  1.  4.  0.  3.  0.  0.  0.  0.  0.  0.  4.]
Целевой признак до разделения
[1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 1074
[0 1 0 ..., 0 0 1]
y_right
size = 16172
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
8
feature_threshold
0.0
Колонка признака до разделения
[ 0.  0.  0. ...,  0.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 

y_left
size = 20
[1 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1]
y_right
size = 347
[0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0
 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
min_impurity_feature_id
5
feature_threshold
15.0
Колонка признака до разделения
[  7.  12.   7.   7.  11.   6.   2.   6.   5.   8.   6.   7.  11.  10.   8.
   8.  13.   7.   3.   8.   9.   9.   6.   8.   7.   3.   9. 

[ 13.  19.  16.  14.  11.  17.  15.  12.  19.  18.  12.  12.  11.  17.  13.
  11.  20.  16.  14.  22.  12.  12.  14.  18.  14.  11.  13.  18.  16.  15.
  20.  12.  13.  12.  20.  12.  18.  12.  11.  12.  11.  14.  15.  13.  11.
  15.  13.  14.  13.  14.  11.  17.  15.  15.  15.  12.  16.  17.  11.  15.
  15.  12.  15.  19.  14.  11.  15.  14.  12.  13.  18.  11.  22.  14.  15.
  12.  15.  12.  25.  24.  11.  12.  27.  18.  15.  13.  12.  21.  15.  13.
  12.  21.  17.  16.  12.  14.  19.  11.  12.  15.  12.  13.  11.  11.  20.
  12.  15.  15.  14.  13.  12.  17.  19.  11.  12.  19.  18.  19.  12.  11.
  11.]
Целевой признак до разделения
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 12
[0 0 0 0 0 0 0 0 0 0 0 0]
y_right
size

Совпадают main классы после разделения
Main class
0
y_left
size = 9523
[0 0 0 ..., 0 0 0]
y_right
size = 466
[0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 1 0 0 0 0 1 0 0
 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 1
 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0 0 0 1 1 1 0 0 0 1 0 0 0
 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0
 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 1 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 1 0 0 0 0 0 1
 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0
 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Совпадают main классы после разделения
Main class
0
y_left
size = 193
[1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 0 0
 1 0 0 0 1 0 1 1 1 0 1 0 1 0 1 1 0 0 0 1 1 1 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0
 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 1 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0
 0 1 1 1 0 1 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1
 0 0 0 0 0 0 1 1 1 1 0 1 0 0 1 1 0 0 0 0 0 1 1 0 1 1 0 1 1 0 0 1 0 1 0 1 1
 0 1 0 1 0 0 0 0]
y_right
size = 71470
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
8
feature_threshold
1.0
Колонка признака до разделения
[ 0.  0.  0. ...,  0.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 1926
[0 0 0 ..., 0 0 0]
y_right
size = 69544
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
2
feature_threshold
1.0
Колонка признака до разделения
[ 0.  0.  0. ...,  0.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

0.0688035254012
Совпадают main классы после раз

Совпадают main классы после разделения
Main class
0
y_left
size = 1
[0]
y_right
size = 8
[0 1 1 0 0 0 0 0]
min_impurity_feature_id
8
feature_threshold
0.0
Колонка признака до разделения
[ 0.  1.  0.  0.  0.  0.  0.  0.  0.]
Целевой признак до разделения
[0 0 1 1 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 4
[0 0 0 0]
y_right
size = 4
[1 1 0 0]
min_impurity_feature_id
5
feature_threshold
7.0
Колонка признака до разделения
[ 11.   2.   7.   7.   5.  12.   8.  14.]
Целевой признак до разделения
[0 1 1 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 61
[0 0 0 0 1 0 1 0 0 1 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1
 1 0 0 1 0 1 0 0 0 0 1 1 0 1 0 0 0 1 1 0 1 0 1 0]
y_right
size = 32
[0 1 0 1 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 0 1 1 0 1 0 1]
min_impurity_feature_id
2
feature_threshold
0.0
Колонка признака до разделения
[ 0.  2.  2.  1.  1.  1.  2.  0.  2.  2.  2.  1.  1.  1.  2.  0.  1.  0.
  1.  0.  2.  1.  0.

0.933690862227
Совпадают main классы после разделения
Main class
1
y_left
size = 403
[1 0 1 0 1 1 1 0 0 1 0 1 0 0 0 0 0 0 1 1 1 1 0 0 1 0 1 0 1 0 1 1 0 1 0 1 1
 1 1 1 0 0 1 1 1 1 0 0 1 1 0 0 1 0 1 1 1 0 0 1 0 1 1 0 1 0 1 1 1 1 1 0 0 1
 0 1 0 1 1 1 1 1 1 1 1 0 1 0 1 1 1 1 1 1 0 1 0 0 0 1 0 1 1 0 1 0 0 0 0 1 0
 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 1 0 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1
 1 1 1 0 0 0 1 0 1 1 1 1 1 1 1 1 1 0 1 1 1 0 0 0 1 0 1 1 0 0 1 1 1 0 1 0 1
 0 1 1 0 0 0 1 1 1 1 1 1 1 1 0 1 1 1 0 0 1 0 0 0 1 0 1 0 1 1 0 1 1 0 1 1 0
 0 1 0 0 1 0 0 1 1 1 1 1 1 0 1 1 0 0 1 0 1 0 1 1 1 1 1 0 1 0 1 1 1 1 1 1 0
 1 0 0 1 1 1 0 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 0
 1 1 1 1 1 0 1 1 1 0 1 1 1 1 0 0 1 1 0 1 1 1 1 1 1 1 1 0 1 1 0 1 1 1 1 1 1
 0 0 1 1 0 0 1 0 1 1 1 0 0 1 1 1 1 0 1 1 1 0 1 1 1 0 0 1 1 0 0 1 0 1 1 1 1
 1 1 1 1 1 1 1 0 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0]
y_right
size = 1533
[1 0 0 ..., 1 1 0]
min_impurity_feature_id
8
feature_threshold
1.0
Колонка пр

Колонка признака до разделения
[ 1.  1.  2.  2.  2.  3.  0.  1.  0.  0.  0.  0.  3.  0.  0.  2.  5.  0.
  1.  3.  3.  0.  2.  2.  3.  2.  1.  1.  1.  1.  2.  0.  0.  0.  2.  2.
  0.  3.  4.  0.  0.  2.  1.  3.  0.  1.  2.  0.  0.  0.  2.  0.  0.  0.
  0.  1.]
Целевой признак до разделения
[1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 0 0 0 1 1 1
 1 1 1 0 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1]

Совпадают main классы после разделения
Main class
1
y_left
size = 9
[1 1 1 1 1 1 1 1 1]
y_right
size = 24
[1 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 0 0 1 1]
min_impurity_feature_id
9
feature_threshold
2.0
Колонка признака до разделения
[ 1.  1.  2.  2.  2.  3.  1.  3.  2.  5.  1.  3.  3.  2.  2.  3.  2.  1.
  1.  1.  1.  2.  2.  2.  3.  4.  2.  1.  3.  1.  2.  2.  1.]
Целевой признак до разделения
[1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 0 0 1 1]

Совпадают main классы после разделения
Main class
1
y_left
size = 9
[1 1 0 1 1 1 1 1 0]
y_right
size = 12
[1 0 1 1 1 1 1 1 1 

 1 0 0 0 1 1 1 1 0 0 0 1 1 1 0 0 1 1 1 0 1 1 0 0 0 0 1 0 1]
min_impurity_feature_id
9
feature_threshold
3.0
Колонка признака до разделения
[  2.   2.   2.   2.   2.   2.   2.   2.   3.   3.  20.   2.   3.   2.   3.
   2.   3.   2.   3.   2.   2.   2.   3.   2.   2.   2.   2.   2.   2.   2.
   3.   3.   2.   2.   4.   3.   5.   3.   2.   3.   3.   2.   2.   3.   2.
   3.   2.   3.   3.   4.   3.   4.   4.   3.   2.   2.   2.   2.   3.   3.
   3.   4.   2.   2.   3.   2.   3.   4.   4.   2.   2.   3.   2.   3.   2.
   2.   3.   3.   2.   4.   3.   3.   2.   2.   4.   2.   2.   2.   2.   4.
   2.   2.   2.   2.   2.   4.   2.   3.   2.   2.   3.   4.   3.   3.   2.
   2.   2.   3.   3.   2.   3.   2.   2.   4.   3.   2.   3.   2.   2.   3.
   2.   2.   3.   3.   3.   3.   3.   2.   2.   3.   3.   2.   3.   3.   4.
   2.   4.   2.   2.   2.   2.   2.   3.   3.   3.   3.   3.   3.   8.   2.
   2.   2.   2.   2.   2.   3.   2.   5.   3.]
Целевой признак до разделения
[0 0 0 1 0 0 0 0 0 1 0 0

Совпадают main классы после разделения
Main class
0
y_left
size = 912
[0 0 0 0 0 1 1 0 0 1 1 1 0 0 1 1 0 0 1 1 1 1 0 0 0 1 0 1 1 0 0 1 0 1 0 0 1
 0 0 1 1 1 0 1 0 0 1 1 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 0 0 0 0 1 1 1 0 1
 1 0 1 0 1 1 0 1 0 0 0 1 0 0 1 0 0 1 1 1 0 0 0 0 0 0 1 1 1 0 0 1 1 0 1 1 1
 1 0 0 1 0 0 0 0 0 1 1 1 1 0 1 1 0 0 0 1 1 1 0 0 1 1 1 1 0 1 1 0 1 0 1 1 0
 0 1 1 1 1 0 1 1 0 0 1 1 1 1 0 0 1 0 1 1 0 0 1 1 0 1 0 0 0 0 0 1 0 0 1 0 1
 0 1 1 0 1 1 1 0 0 1 0 1 1 1 0 1 0 1 1 0 1 0 0 1 1 1 0 1 0 0 0 0 1 0 1 1 0
 0 0 1 0 1 0 0 0 1 1 1 0 1 0 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 1 0 1 0 1 0 0
 0 1 0 1 1 1 1 0 1 1 1 1 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 1 1 1 1 0 0 1
 1 0 0 0 1 0 1 1 1 1 0 0 1 1 0 0 1 1 1 0 1 1 0 1 0 0 0 1 1 1 0 0 1 1 1 1 0
 1 0 1 1 1 0 1 1 0 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 1 1 0 0 0 1
 1 1 0 0 1 0 0 0 1 0 1 0 0 0 0 1 1 0 1 0 0 0 1 1 1 1 0 1 0 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 0 1 1 0 0 0 1 0 1 0 0 1 1 0 0 1 0 1 1 1 1 1 1 0 1 0 1 1 1 0 0
 0 0 1 1 1 0 1 1 1 1 0 1 1 0 0

Колонка признака до разделения
[  8.51133750e-02   3.69590815e-01   4.36665827e-01   1.66766647e-01
   3.43954140e-02   1.58975542e-01   1.28132981e-01   1.65213329e-01
   3.62545818e-01   8.29834030e-02   4.92424242e-01   2.66495287e-01
   1.80496039e-01   7.40286299e-01   2.53757126e-01   4.56254375e-01
   9.89010990e-02   4.22368233e-01   4.91461890e-02   2.17264082e-01
   1.59107271e-01   5.86715867e-01   1.03448276e-01   1.20606155e-01
   4.44334488e-01   2.55897640e-02   4.66355800e-03   2.98447139e-01
   2.93564920e-01   3.15042926e-01   2.87476040e-02   1.66527890e-02
   2.23257090e-02   5.10992056e-01   4.82764335e-01   5.95997361e-01
   5.14305652e-01   1.96222700e-03   8.39818420e-02   9.52299830e-01
   1.79820180e-02   4.40175631e-01   1.25100000e+03   4.80584391e-01
   1.05718154e-01   0.00000000e+00   0.00000000e+00   1.03920078e-01
   6.22848700e-03   1.14855021e+00   4.65008140e-02   1.18996222e+00
   6.32122626e-01   1.27279635e-01   3.21362458e-01   4.75395987e-01
   

[0 0 1 1 1 1 0 0 1 1 0 0 0 0 0 1 0 0 0 1 0 0]
y_right
size = 37
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 1 0]
min_impurity_feature_id
3
feature_threshold
0.3777081055
Колонка признака до разделения
[  1.20651612e+00   3.53955756e-01   3.93214227e-01   2.63208306e-01
   4.81461507e-01   2.17296830e-02   6.81542306e-01   4.05832820e-01
   5.94604792e-01   1.86813190e-02   3.91240220e-02   4.31396511e-01
   2.94307590e-01   5.23104621e-01   1.17910567e-01   4.75931352e-01
   2.86823235e-01   5.72063428e-01   6.43655160e-02   5.04598015e-01
   6.63867227e-01   2.00212912e-01   3.74720191e-01   5.50855605e-01
   5.48069528e-01   8.36721093e-01   2.92505205e-01   3.61837647e-01
   1.75111678e-01   1.71273773e-01   1.25720877e-01   3.80696020e-01
   2.64900660e-02   1.83947304e-01   4.65481670e-01   4.48258620e-02
   6.95360429e-01   2.47468076e-01   1.59198441e-01   1.78154426e-01
   4.52284000e-04   1.37965509e-01   2.85264610e-02   2.34229945e-01
   4.21428571

min_impurity_feature_id
0
feature_threshold
0.8226032125
Колонка признака до разделения
[ 0.86418581  0.56062507  0.94648743  0.78102061  0.57474583  0.75161963
  0.93038972]
Целевой признак до разделения
[0 1 1 1 1 1 1]

Совпадают main классы после разделения
Main class
0
y_left
size = 55
[0 1 1 1 0 1 0 0 1 0 1 1 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 0 0 0 1 1
 1 0 1 0 0 1 1 0 1 1 0 1 0 0 1 1 0 0]
y_right
size = 59
[0 1 1 0 0 0 0 1 1 1 1 1 1 0 0 0 0 0 0 1 0 0 1 1 0 1 1 1 1 0 1 0 0 1 1 0 1
 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 1 0]
min_impurity_feature_id
2
feature_threshold
4.0
Колонка признака до разделения
[  5.   4.   6.   7.  12.   5.   6.   6.   4.   4.   5.   4.   6.   5.   5.
   4.   4.   4.   4.   5.   4.   5.   5.   5.   4.   5.   7.   5.   4.   6.
   4.   5.   4.   4.   4.   5.   4.   5.   6.   7.   4.   4.   4.   5.   4.
   4.   5.   4.   8.   5.   4.   4.   5.   4.   4.   4.   5.   4.   5.   5.
   4.   5.   4.   4.   4.   5.   5.   5.   4.   5.   5.   4.   5.   4.   5

Целевой признак до разделения
[1 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0
 0 1]

Совпадают main классы после разделения
Main class
0
y_left
size = 6
[1 0 1 0 1 0]
y_right
size = 4
[0 0 0 0]
min_impurity_feature_id
2
feature_threshold
0.5
Колонка признака до разделения
[ 0.  1.  0.  0.  1.  1.  1.  0.  1.  1.]
Целевой признак до разделения
[0 1 0 0 0 1 0 0 1 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 2
[0 1]
y_right
size = 4
[1 1 0 0]
min_impurity_feature_id
1
feature_threshold
49.0
Колонка признака до разделения
[ 49.  52.  44.  49.  56.  34.]
Целевой признак до разделения
[1 0 1 0 1 0]

Совпадают main классы после разделения
Main class
1
y_left
size = 3
[1 1 1]
y_right
size = 37
[0 1 1 0 0 1 0 1 0 0 1 0 0 0 0 1 1 1 1 1 1 0 0 1 0 0 1 1 0 1 0 1 1 1 1 0 0]
min_impurity_feature_id
7
feature_threshold
2.0
Колонка признака до разделения
[ 2.  1.  0.  1.  1.  2.  1.  2.  2.  1.  3.  0.  1.  1.  1.  0.  1.  2.
  1.  2.  1.  1.  2.  1. 

Совпадают main классы после разделения
Main class
0
y_left
size = 3025
[0 0 0 ..., 1 0 0]
y_right
size = 15204
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
2
feature_threshold
0.0
Колонка признака до разделения
[ 0.  0.  0. ...,  1.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 278
[1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 1 0 0 0 1 1 1 0 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1
 0 1 0 1 1 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0
 1 1 1 0 0 0 0 1 0 1 1 0 1 0 0 1 1 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0
 1 0 1 0 0 1 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 1 0 1 0 0 1
 0 0 0 0 0 0 0 0 1 1 1 0 1 0 0 0 1 1 0 1 0 0 0 0 0 0 1 0 0 0 1 0 1 0 0 0 0
 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 1 1 1 1 1 0 1 0 1
 1 0 0 0 1 0 0 0 0 1 1 0 1 1 1 0 0 1 0]
y_right
size = 2747
[0 0 0 ..., 1 0 0]
min_impurity_feature_id
0
feature_th

Совпадают main классы после разделения
Main class
0
y_left
size = 67
[1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 1 1 0 1 0 0 0 1 1 1 0 0 0 0 0 1 1 0 0 0 1
 0 0 0 0 1 0 1 0 0 1 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 0 0]
y_right
size = 15137
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
7
feature_threshold
5.0
Колонка признака до разделения
[ 0.  1.  0. ...,  0.  0.  2.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 45
[1 0 0 0 1 0 0 0 0 1 1 1 0 1 0 1 1 1 0 0 1 1 0 0 0 1 0 1 0 0 1 0 0 1 0 0 1
 0 0 0 0 0 0 1 0]
y_right
size = 22
[0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0]
min_impurity_feature_id
3
feature_threshold
0.6434497085
Колонка признака до разделения
[ 0.86673255  1.12324732  1.40971613  2.32316921  0.50785955  0.4789916
  1.02507799  0.690679    0.61779835  0.46267147  0.96274076  0.32427666
  0.97518825  1.08363232  1.56117815  0.74326255  0.48321131  3.66773291
  0.76420798  2.35514942  0.77683296  0.479462    0.55988094  

[ 1.  3.  2.  1.  1.  1.  1.  1.  2.  1.  1.  1.  2.  1.  2.  2.  1.  1.
  2.  1.  1.  2.  2.  1.  1.  2.  2.  1.  1.  4.  1.  2.  1.  2.  3.  1.
  1.  1.  1.  1.  1.  1.  2.  3.  1.  1.  1.  1.  1.  1.  1.  1.  1.  2.
  2.  2.  2.  1.  2.  2.  1.  2.  1.  1.  1.  2.  1.  1.  1.  2.  2.  2.
  1.  2.  2.  2.  1.  3.  1.  1.  1.  3.  2.  1.  1.  1.  1.  2.  2.  2.
  1.  1.  2.  2.  1.  1.  1.  1.  2.  2.  1.  1.  2.  1.  1.  1.  1.  2.
  1.  2.  1.  1.  1.  2.  1.  2.  2.  2.  3.  1.  2.  2.  2.  2.  1.  2.
  2.  2.  1.  2.  1.  2.  2.  1.  1.  1.  1.  1.  3.  2.  3.  2.  3.  1.
  2.  1.  3.  1.  2.  3.  4.  1.  2.  1.  1.  2.  1.  2.  1.  3.  2.  1.
  3.  2.  1.  1.  1.  1.  2.  1.  1.  1.  1.  2.  2.  2.  2.  1.  2.  2.
  2.  3.  2.  1.  2.  2.  1.  1.  2.  2.  1.  2.  1.  1.  2.  1.  3.  1.
  1.  1.  1.  1.  1.  2.  1.  2.  2.  1.  2.  1.  1.  1.  1.  1.  2.  1.
  2.  1.  3.  1.  3.  1.  1.  2.  2.  2.  2.  2.  1.  1.  1.  2.  2.  2.
  2.  1.  1.  2.  2.  1.  2.  2.  2.  2.  1.  1.  2

 0 0 0 0 0 1 0]
y_right
size = 875
[0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1
 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1
 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 

y_right
size = 100
[1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0]
min_impurity_feature_id
7
feature_threshold
2.0
Колонка признака до разделения
[ 3.  2.  2.  2.  2.  2.  2.  2.  4.  2.  3.  2.  3.  3.  3.  2.  2.  2.
  2.  3.  2.  2.  3.  2.  2.  2.  2.  4.  2.  2.  2.  2.  2.  2.  2.  2.
  2.  4.  2.  2.  2.  2.  2.  2.  2.  2.  2.  2.  3.  2.  3.  2.  2.  2.
  2.  2.  2.  2.  2.  2.  2.  2.  2.  2.  2.  3.  2.  2.  2.  2.  2.  3.
  2.  2.  2.  2.  2.  2.  2.  2.  2.  3.  2.  2.  2.  2.  2.  3.  2.  2.
  2.  3.  2.  2.  2.  2.  2.  3.  2.  2.  2.  2.  2.  3.  2.  2.  4.  2.
  2.  3.  2.  2.  2.  2.  2.  3.  2.  3.  2.  2.  2.  2.  2.]
Целевой признак до разделения
[0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0
 0 0 0 0 0 0 0 0 0

  0.08651721  0.22533937]
Целевой признак до разделения
[0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 17
[0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0]
y_right
size = 6
[1 1 0 1 0 0]
min_impurity_feature_id
3
feature_threshold
0.1796231075
Колонка признака до разделения
[ 0.14914034  0.18878401  0.25865163  2.31175536  0.31221198  0.1567373
  0.20763289  0.17284747  0.17433027  0.30215827  0.18491595  0.24898469
  0.21389305  0.17411889  0.35382309  0.15165877  0.20870477  0.22146239
  0.30637119  0.43169197  0.30439749  0.19468085  0.22533937]
Целевой признак до разделения
[1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 2
[1 0]
y_right
size = 4
[1 0 1 0]
min_impurity_feature_id
1
feature_threshold
23.0
Колонка признака до разделения
[ 23.  24.  23.  23.  24.  23.]
Целевой 

Совпадают main классы после разделения
Main class
0
y_left
size = 11
[1 0 0 0 1 0 0 1 1 1 0]
y_right
size = 1563
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
7
feature_threshold
6.0
Колонка признака до разделения
[ 1.  0.  1. ...,  0.  1.  2.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 1493
[0 0 0 ..., 0 0 0]
y_right
size = 70
[0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0
 0 0 0 0 0 0 1 1 0 0 1 0 0 0 1 0 1 1 0 0 0 0 0 1 0 0 0 1 1 1 0 0 0]
min_impurity_feature_id
1
feature_threshold
30.0
Колонка признака до разделения
[ 58.  34.  58. ...,  47.  64.  50.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 784
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0

[0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0]
y_right
size = 17
[1 1 1 0 0 1 0 1 1 0 0 0 0 0 0 0 0]
min_impurity_feature_id
4
feature_threshold
10008.0
Колонка признака до разделения
[  8550.  15833.  15000.  20000.  50000.   4500.   9983.  10200.   6000.
  20000.   2900.  18401.  12000.   4500.  14376.   1166.   8900.  20000.
   7210.   9100.  10033.  13240.  16666.   4000.  14616.   7400.   8000.
   8400.   9150.  10500.  17388.  14200.  11833.   8278.  16000.   7650.]
Целевой признак до разделения
[1 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 3
[1 0 0]
y_right
size = 16
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
min_impurity_feature_id
0
feature_threshold
0.352494327
Колонка признака до разделения
[ 0.24847741  0.02121962  0.12765745  0.05620573  0.          0.34110015
  0.          0.05960647  0.06377176  0.10912404  0.03951601  0.15394913
  0.36388851  0.3932981   0.01691938  0.07506661  0.07652627  0.

Совпадают main классы после разделения
Main class
0
y_left
size = 70
[0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
y_right
size = 463
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0
 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 1 0 0 0 0 0 

Совпадают main классы после разделения
Main class
0
y_left
size = 272
[0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 1
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 1 0 0 0 1 0 0 0 0]
y_right
size = 3085
[0 1 0 ..., 0 0 1]
min_impurity_feature_id
3
feature_threshold
0.8359560635
Колонка признака до разделения
[ 0.68104575  0.18288165  0.38444157 ...,  0.16713881  0.17340222
  0.39858953]
Целевой признак до разделения
[0 1 0 ..., 0 0 1]

Совпадают main классы после разделения
Main class
0
y_left
size = 41
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 

Совпадают main классы после разделения
Main class
0
y_left
size = 421
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0
 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0
 0 0 0 1 0 0 0 1 0 0 0 0 0 0]
y_right
size = 45656
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
7
feature_t

Совпадают main классы после разделения
Main class
0
y_left
size = 4650
[0 0 0 ..., 0 0 0]
y_right
size = 64
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0]
min_impurity_feature_id
1
feature_threshold
37.0
Колонка признака до разделения
[ 43.  56.  60. ...,  67.  61.  57.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 22
[0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0]
y_right
size = 4628
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
3
feature_threshold
2944.5
Колонка признака до разделения
[  4.30046338e-01   4.92021814e-01   4.87288997e-01 ...,   4.74080268e-01
   1.94000000e+03   3.37166427e-01]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 4312
[0 0 0 ..., 0 0 0]
y_right
size = 316
[0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0

Совпадают main классы после разделения
Main class
0
y_left
size = 283
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0
 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
y_right
size = 66
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0]
min_impurity_feature_id
0
feature_threshold
0.002744699
Колонка признака до разделения
[  2.91642360e-02   1.93877790e-02   4.05369020e-02   0.00000000e+00
   3.07859470e-02   1.17213048e-01   5.9036711

Совпадают main классы после разделения
Main class
0
y_left
size = 5396
[0 0 0 ..., 1 1 0]
y_right
size = 90820
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
6
feature_threshold
0.0
Колонка признака до разделения
[ 0.  1.  0. ...,  0.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
1
y_left
size = 860
[0 1 0 0 1 1 0 0 0 0 1 1 1 0 1 1 0 0 0 1 1 0 1 0 0 0 1 1 1 0 1 0 1 0 1 0 0
 0 0 1 0 0 0 1 1 0 0 1 0 1 1 1 0 1 1 0 1 1 1 0 1 0 1 0 1 1 1 0 0 0 1 1 1 1
 1 1 1 0 1 0 0 1 1 1 1 1 0 0 1 1 1 1 1 0 1 1 0 0 1 0 0 1 0 0 1 0 1 1 0 1 1
 1 1 1 1 0 1 1 0 1 1 1 1 0 0 1 1 1 1 1 1 0 0 0 1 1 1 1 1 0 0 1 0 1 1 1 1 0
 1 1 1 0 0 1 0 0 1 1 1 1 1 1 0 1 1 0 1 1 0 1 1 1 1 1 0 1 1 1 0 0 1 1 0 0 0
 1 0 0 0 0 1 0 1 0 1 0 1 0 1 1 0 1 1 1 1 1 0 1 0 0 1 1 1 1 1 1 1 1 1 0 1 1
 0 1 1 0 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 1 0 0 0 0 1 0 1 1 0 1 1 1 1 1
 1 1 0 0 0 1 0 1 1 0 0 0 1 0 1 0 0 1 0 1 1 0 1 0 1 1 1 1 0 1 0 1 0 1 1 1 1
 1 1 1 0 1 1 1 1 1 1 0 0 1 0 1 1 0 1 0 0

y_left
size = 3
[1 0 0]
y_right
size = 4
[0 0 0 0]
min_impurity_feature_id
1
feature_threshold
48.0
Колонка признака до разделения
[ 47.  49.  45.  46.  49.  51.  44.]
Целевой признак до разделения
[0 1 0 0 0 0 0]

Совпадают main классы после разделения
Main class
1
y_left
size = 25
[1 0 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 1 1 1 1 0 1 0 1]
y_right
size = 176
[0 0 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 1 1 1 0 1 0 1 1 1 1 0 1 1 1 0 1 1 0 0 0
 1 0 0 1 1 0 1 1 1 0 1 1 0 0 1 0 1 0 1 0 0 1 1 1 0 1 1 0 1 1 0 0 0 1 1 0 1
 1 1 0 0 1 0 1 0 0 1 0 1 0 1 1 0 1 0 1 1 1 0 1 1 1 1 0 1 0 0 0 1 1 1 0 1 0
 0 1 0 0 0 0 1 0 1 1 0 1 0 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 0 1 1
 1 1 1 1 1 0 0 0 1 0 1 1 0 1 1 1 1 1 0 0 1 0 0 1 0 0 1 0]
min_impurity_feature_id
4
feature_threshold
7039.5
Колонка признака до разделения
[  3833.   5416.   3725.   3000.   2720.   4950.   6000.   5600.   3547.
   4200.   4800.   3417.   6166.   5341.  14200.  16400.   3584.   4788.
   6979.   4376.   7385.   6400.   5000.   6800.   5500.   

min_impurity_feature_id
3
feature_threshold
0.321082428
Колонка признака до разделения
[  2.91709578e-01   5.83633309e-01   1.53382838e-01   3.11534501e-01
   5.13744655e-01   3.92871287e-01   4.18488445e-01   1.16838488e-01
   2.39084229e-01   1.08791701e-01   4.47373205e-01   1.04184171e-01
   4.48310139e-01   7.42198100e-01   2.88902666e-01   7.36427683e-01
   5.84278156e-01   5.70635410e-01   1.12313139e-01   3.39688445e-01
   1.86436098e-01   4.66685488e-01   1.96873296e-01   4.52098849e-01
   3.13665546e-01   3.96429973e-01   2.99507851e-01   2.36507360e-01
   3.14969714e-01   6.44922426e-01   3.68407898e-01   4.14296134e-01
   2.46541904e-01   1.83966552e-01   5.21244155e-01   3.13478041e-01
   2.67985221e-01   7.90949139e-01   4.38124861e-01   1.61627070e-01
   2.07512875e-01   4.45977326e-01   1.12097066e-01   3.71125775e-01
   2.61692253e-01   1.60541017e-01   3.19661625e-01   7.42925710e-02
   4.03930130e-02   9.23208923e-01   3.63251738e-01   5.51149617e-01
   5.50907978e-0

[  4.  11.   6.  11.   9.  16.   7.   6.   2.  10.   9.  14.  13.  11.   7.
   5.   9.  13.  12.  12.   8.  13.   6.   8.   5.  14.   9.  13.  10.  15.
  12.]
Целевой признак до разделения
[1 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 8
[0 0 0 0 0 0 0 0]
y_right
size = 5
[0 0 0 1 1]
min_impurity_feature_id
1
feature_threshold
46.0
Колонка признака до разделения
[ 51.  33.  66.  60.  42.  32.  45.  39.  48.  47.  68.  58.  49.]
Целевой признак до разделения
[0 0 0 0 0 0 1 1 0 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 3
[1 0 0]
y_right
size = 3
[0 1 0]
min_impurity_feature_id
1
feature_threshold
57.0
Колонка признака до разделения
[ 64.  69.  53.  59.  55.  53.]
Целевой признак до разделения
[1 0 0 0 1 0]

Совпадают main классы после разделения
Main class
1
y_left
size = 3
[1 1 0]
y_right
size = 3
[1 1 1]
min_impurity_feature_id
3
feature_threshold
0.233434809
Колонка пр

[1 0 0]
y_right
size = 3
[0 0 0]
min_impurity_feature_id
9
feature_threshold
2.5
Колонка признака до разделения
[ 2.  3.  2.  2.  3.  3.]
Целевой признак до разделения
[0 1 0 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 14
[0 0 0 0 0 0 0 0 0 0 0 0 0 0]
y_right
size = 3
[0 1 0]
min_impurity_feature_id
4
feature_threshold
3324.5
Колонка признака до разделения
[ 3500.  4000.  4200.  3700.  3666.  3200.  3316.  4497.  3500.  4460.
  4230.  4400.  3535.  3200.  3948.  3700.  3333.]
Целевой признак до разделения
[0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0]

Совпадают main классы после разделения
Main class
1
y_left
size = 2
[1 1]
y_right
size = 21
[0 0 1 1 0 1 0 1 1 1 1 0 0 1 0 1 0 1 1 0 1]
min_impurity_feature_id
9
feature_threshold
1.0
Колонка признака до разделения
[ 0.  0.  0.  1.  1.  0.  0.  1.  0.  0.  2.  0.  2.  1.  0.  0.  0.  1.
  0.  1.  1.  1.  0.]
Целевой признак до разделения
[0 0 1 1 0 1 0 1 1 1 1 1 1 0 0 1 0 1 0 1 1 0 1]

Совпадают main классы после разде

Совпадают main классы после разделения
Main class
0
y_left
size = 4
[1 0 1 0]
y_right
size = 3
[0 0 0]
min_impurity_feature_id
4
feature_threshold
6204.0
Колонка признака до разделения
[ 9116.  9016.  2530.  6908.  7487.  5500.   400.]
Целевой признак до разделения
[1 0 0 1 0 0 0]

Совпадают main классы после разделения
Main class
1
y_left
size = 3
[0 1 1]
y_right
size = 6
[1 1 1 1 1 1]
min_impurity_feature_id
9
feature_threshold
0.5
Колонка признака до разделения
[ 0.  0.  0.  1.  0.  1.  1.  0.  0.]
Целевой признак до разделения
[1 1 1 0 1 1 1 1 1]

Совпадают main классы после разделения
Main class
1
y_left
size = 8
[1 1 1 1 1 1 1 1]
y_right
size = 3
[1 1 0]
min_impurity_feature_id
7
feature_threshold
0.5
Колонка признака до разделения
[ 0.  0.  1.  1.  2.  1.  2.  1.  1.  0.  1.]
Целевой признак до разделения
[1 1 1 1 1 1 1 1 1 0 1]

Совпадают main классы после разделения
Main class
0
y_left
size = 2
[0 1]
y_right
size = 4
[0 0 0 1]
min_impurity_feature_id
2
feature_threshold
5.0
Ко

Совпадают main классы после разделения
Main class
0
y_left
size = 2
[0 0]
y_right
size = 4
[1 0 1 0]
min_impurity_feature_id
8
feature_threshold
0.0
Колонка признака до разделения
[ 0.  0.  0.  0.  1.  1.]
Целевой признак до разделения
[1 0 1 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 175
[0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 1 0 0 1 1 0 0 1 0 1 1 1 1
 0 0 1 0 0 1 0 0 0 1 0 0 0 0 1 1 0 0 0 1 0 0 0 1 1 0 1 0 0 1 1 1 0 1 0 0 0
 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 1 1 1 0 0 0 1 1 1 0 1 1 0 0 0 0 0 0 0 1
 0 1 0 0 1 1 1 0 0 0 1 0 1 0 0 0 0 1 0 1 1 0 0 0 0 0 0 1 0 1 0 1 1 0 0 0 1
 0 1 1 1 0 0 1 1 1 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 1 0 0]
y_right
size = 19166
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
8
feature_threshold
1.0
Колонка признака до разделения
[ 0.  0.  0. ...,  0.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 104
[0 0 0 0 0 0 0 1 1 0 1 0 1 1 0 1 0 1 0 0 1 1 1 1 0 1 

Совпадают main классы после разделения
Main class
0
y_left
size = 1548
[0 0 0 ..., 0 0 0]
y_right
size = 66308
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
2
feature_threshold
1.0
Колонка признака до разделения
[ 0.  0.  0. ...,  0.  0.  0.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 14
[1 0 1 1 0 0 0 1 0 1 1 0 0 0]
y_right
size = 1534
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
7
feature_threshold
6.0
Колонка признака до разделения
[ 1.  1.  0. ...,  0.  0.  1.]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 144
[0 0 0 0 0 0 0 0 0 1 0 0 1 0 1 0 1 1 0 1 0 0 0 0 1 0 0 0 0 0 0 1 1 0 0 0 0
 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
 0 0 0 1 0 1 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0 0 0 1 1 0 0 0 1 0 0 0
 1 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0]
y_right
size = 1390
[0 0 0 ..., 0 0 0]
min_impuri

Колонка признака до разделения
[ 63.  59.  69.  65.  44.  42.  49.  41.  35.  55.  65.  53.  63.  40.  41.
  45.  58.  51.  49.  60.  54.  42.  40.  51.  46.  46.  56.  46.  54.  44.
  36.  48.  56.  44.  41.  83.  63.  71.  56.  46.  64.  63.  49.  44.  54.
  49.  56.  44.  57.  67.  42.  43.  40.  59.  36.  77.  61.  44.  78.  48.
  52.  47.  50.  45.  42.  60.  38.  54.  53.  47.  35.  59.  33.  58.  59.
  55.  55.  65.  38.  59.  54.  63.  61.  40.  52.  61.  58.  48.  50.  44.
  70.  35.  69.  39.  53.  60.  63.  66.  41.  51.  36.  71.  75.  35.  53.
  44.  52.  35.  45.  61.  64.  46.  43.  59.  63.  51.  49.  51.  75.  67.
  54.  49.  50.  45.  40.  61.  41.  44.  54.  32.  48.  37.  44.  49.  34.
  67.  53.  41.  60.  65.  52.  37.  38.  52.  46.  38.  34.  52.  42.  46.
  76.  58.  53.  33.  66.  54.  40.  50.  45.  69.  43.  65.  39.  48.  47.
  59.  63.  55.  67.  39.  53.  49.  64.  51.  76.  65.  45.  46.  43.  42.
  56.  59.  41.  36.  46.  56.  45.  66.  42.  63.  62.  

Совпадают main классы после разделения
Main class
0
y_left
size = 284
[0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
 0 0 0 0 0 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0
 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
y_right
size = 4152
[0 0 0 ..., 0 0 0]
min_impurity_feature_id
0
feature_threshold
0.528014915
Колонка признака до разделения
[ 0.40119978  0.33555858  0.36319969 ...,  0.46377293  0.4002191
  0.34206902]
Целевой признак до разделения
[0 0 0 ..., 0 0 0]

Совпадают main классы после разделения
Main class
0
y_left
size = 168
[0 0 1 0 0 0 0 0 0 0 0 0 0 0

Колонка признака до разделения
[  3.84074741e-01   3.63573148e-01   1.33371226e+00   6.43000000e-01
   4.20291743e-01   4.25821711e-01   4.91100593e-01   6.71046993e-01
   5.61815106e-01   4.02091986e-01   9.26661669e-01   1.36191935e+00
   3.15203341e-01   4.77852215e-01   1.44735020e+00   5.09541082e-01
   9.86113482e-01   1.08089855e+00   6.84069441e-01   1.13233666e+00
   6.67805058e-01   1.18643813e+00   6.08809768e-01   4.22033498e-01
   6.87413235e-01   5.48762737e-01   1.00317277e+00   7.97408286e-01
   7.78447122e-01   5.62772709e-01   2.59072014e-01   3.89984401e-01
   5.83177103e-01   4.23781040e-01   1.31744709e+00   1.46868531e-01
   5.94922346e-01   2.07206955e+00   6.46168470e-01   3.64663534e-01
   4.57270612e-01   5.01300000e+03   5.64496929e-01   6.46724030e-01
   6.20941892e-01   4.60406934e-01   8.57734609e-01   1.90935060e+00
   8.16515460e-01   5.59913859e-01   5.99005671e-01   9.94278241e-01
   1.00739852e+00   2.33744856e+00   4.73825032e-01   3.10935125e-01
   

size = 14
[0 0 1 0 0 1 0 0 0 1 0 0 1 0]
min_impurity_feature_id
0
feature_threshold
0.156884395
Колонка признака до разделения
[ 0.21286031  0.18367616  0.15574221  0.18447652  0.24593085  0.20503135
  0.16783533  0.28033448  0.29437093  0.29512549  0.17808409  0.16089881
  0.20333417  0.25512761  0.17990556  0.19177938  0.16509569  0.21777832
  0.27772537  0.23865201  0.20703787  0.16126525  0.17135825  0.24412314
  0.1972545   0.29071638  0.28383888  0.16076813  0.20543387  0.25228985
  0.28062275  0.20431854  0.23735384  0.15967581  0.29121458  0.24750499
  0.28818372  0.17664995  0.1797521   0.25593984  0.22706302  0.18465303
  0.29211408  0.17044523  0.16473783  0.19240207  0.24664485  0.17851665
  0.23287517  0.25251062  0.15530073  0.22294787  0.26233144  0.25520719
  0.23539872  0.15452357  0.22592297  0.17541282  0.2938612   0.19757152
  0.28931677  0.28583571  0.25669501  0.15579979  0.17395974  0.23699315
  0.2250107   0.26618669  0.2870676   0.26629706  0.16200458  0.164805

Колонка признака до разделения
[ 39.  32.  38.  31.  38.  35.  39.  37.  34.]
Целевой признак до разделения
[0 0 0 0 0 0 0 0 1]

Совпадают main классы после разделения
Main class
0
y_left
size = 36
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0]
y_right
size = 47
[0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 1 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0]
min_impurity_feature_id
9
feature_threshold
0.0
Колонка признака до разделения
[ 2.  0.  0.  1.  0.  1.  0.  0.  4.  4.  0.  0.  2.  2.  1.  0.  0.  0.
  0.  0.  0.  1.  0.  1.  3.  2.  2.  0.  0.  1.  0.  0.  3.  0.  0.  2.
  0.  1.  0.  0.  1.  0.  0.  0.  0.  1.  0.  3.  0.  0.  0.  2.  3.  1.
  0.  1.  0.  0.  0.  0.  0.  0.  3.  2.  1.  0.  0.  1.  1.  2.  0.  0.
  0.  3.  0.  0.  3.  4.  0.  3.  2.  0.  1.]
Целевой признак до разделения
[0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0
 1 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0

К сожалению, не получилось найти ошибку. Явно виден какой-то "перескок" при определении класса. Т.е. в каких-то случаях классы предсказываются с точностью до наоборот. У меня ощущение, что это может быть связано с какой-то ошибкой округления при определнии порога, но непонятно...

In [10]:
for train, test in gkf.split(x, y):
    X_train, y_train = x[train], y[train]
    X_test, y_test = x[test], y[test]
    clf.fit(X_train, y_train)
    print(accuracy_score(y_pred=clf.predict(X_test), y_true=y_test))

0.892949197639
0.890870541282
0.892907624512
0.89452897647
0.893235771006


# Применить для задачи Titanic 

In [11]:
df_train = pd.read_csv('train.csv', index_col='PassengerId')
df_test = pd.read_csv('test.csv', index_col='PassengerId')

In [12]:
df_train = df_train.dropna()
df_test = df_train.dropna()

In [13]:
df_train = df_train[['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Survived']]
df_test = df_test[['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare']]
df_train.head()

Unnamed: 0_level_0,Pclass,Sex,Age,SibSp,Parch,Fare,Survived
PassengerId,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2,1,female,38.0,1,0,71.2833,1
4,1,female,35.0,1,0,53.1,1
7,1,male,54.0,0,0,51.8625,0
11,3,female,4.0,1,1,16.7,1
12,1,female,58.0,0,0,26.55,1


In [14]:
df_train['Sex'] = df_train['Sex'].map({'male': 0, 'female': 1})
df_test['Sex'] = df_test['Sex'].map({'male': 0, 'female': 1})

In [15]:
X_train = df_train.drop('Survived', axis=1).as_matrix()
y_train = df_train['Survived'].as_matrix()

X_test = df_test.as_matrix()

In [16]:
model = MyDecisionTreeClassifier(min_samples_split=2, max_depth=None)

In [17]:
model.fit(X_train, y_train)

In [18]:
y_predict = model.predict(X_test)
print(accuracy_score(y_train, y_predict))

0.672131147541


In [19]:
model.printtree()

  0: feature_id=1, threshold=0.5
   1: feature_id=5, threshold=10.5
    3: reason=5, class=1, p=0.963414634146
    4: feature_id=4, threshold=0.0
     9: reason=3, class=0, p=1.0
     10: reason=4, class=1, p=0.75
   2: feature_id=2, threshold=17.5
    5: reason=5, class=0, p=0.620689655172
    6: reason=3, class=1, p=1.0


Дерево получилось неглубокое. Видим, что оно делится по полу (feature_id = 1), и дальше по возрасту и стоимости билета. Точность предсказания не слишком высокая, наверное потому, что учитывается мало признаков.