## Построение дерева решений для прогноза сердечно-сосудистых заболеваний
Считаем в `DataFrame` знакомый нам набор данных по сердечно-сосудистым заболеваниям. 

In [None]:
%load_ext autoreload
%autoreload 2
%matplotlib inline

In [None]:
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score
from sklearn.tree import DecisionTreeClassifier, export_graphviz
from sklearn.ensemble import RandomForestClassifier
from source.utils import get_cardio_data

In [None]:
# загрузим данные с информацией о пациентах с сердечно-сосудистыми заболеваниями
X_train, X_test, y_train, y_test = get_cardio_data()

In [None]:
# создадим модель дерева решений
model_tree = DecisionTreeClassifier(max_depth=5,         # максимальная глубина
                                    min_samples_split=2, # минимальное число сэмплов в узле
                                    min_samples_leaf=1)  # минимальное число сэмплов в листе

In [None]:
# подготовим данные, удалив выбросы из нашей тренировочной выборки (X_train)

# Ваш код здесь
# ...

In [None]:
%%time

model_tree.fit(X_train, y_train)

In [None]:
# вычислим точность как процент правильно угаданных ответов
y_predict = model_tree.predict(X_test)

print('%7.5f - Точность в процентах' % accuracy_score(y_test, y_predict))

In [None]:
# посмотрим на значения других метрик
print('%7.5f - Чувствительность (recall)' % recall_score(y_test, y_predict))
print('%7.5f - Специфичность (precision)' % precision_score(y_test, y_predict))
print('%7.5f - F1' % f1_score(y_test, y_predict))

In [None]:
# перевзвесим классы с помощью параметра class_weight
model_tree = DecisionTreeClassifier(max_depth=5, 
                                    class_weight={0: 1, 1: 1})

In [None]:
model_tree.fit(X_train, y_train)

In [None]:
y_predict = model_tree.predict(X_test)

print('%7.5f - Чувствительность (recall)' % recall_score(y_test, y_predict))
print('%7.5f - Специфичность (precision)' % precision_score(y_test, y_predict))
print('%7.5f - F1' % f1_score(y_test, y_predict))