### Что такое решающее дерево? Как по построенному дереву найти прогноз для объекта?


- <b>Решающее дерево</b> - это дерево с решающими правилами в нелистовых вершинах (узлах) и некотором заключении о целевой функции в листовых вершинах (прогнозом). Решающее правило — некоторая функция от объекта, позволяющее определить, в какую из дочерних вершин нужно поместить рассматриваемый объект. В листовых вершинах могут находиться разные объекты: класс, который нужно присвоить попавшему туда объекту (в задаче классификации), вероятности классов (в задаче классификации), непосредственно значение целевой функции (задача регрессии)
- Чтобы дать прогноз для объекта, нужно двигаться от корня к листьям, соблюдая предикаты, то есть когда объекту дан прогноз, то для всех предикатов на маршруте соблюдается истина.

### Зачем в вершинах нужны предикаты? Какие типы предикатов вы знаете? Приведите примеры.


- Предикаты определяют, по какой ветке нужно идти дальше, чтобы дать правильый прогноз объекту. Предикат - булева функция, принимающая объект в параметр.
###### Пример:
- Предикат, который принимает в аргумент фрукт, и возвращающий истину, если он круглый, и возвращающий ложь, если фрукт овальный
<br>
- Предикат, который принимает в аргумент человека, и возвращающий истину, если рост человека больше 1.7, и возвращающий ложь в ином случае
- Предикат, который принимает в аргумент животное, и возвращающий истину, если кол-во ног животного равно 4-ём, и возвращающий ложь в ином случае

### Почему для любой выборки можно построить решающее дерево, имеющее нулевую ошибку на ней?


Элементы выборки можно рассматривать как вектора значений. Например:
<br>Человек №1.
- рост: 1.84
- вес: 70
- пол: мужской
<br>
<br>
Человек №2.
- рост: 1.76
- вес: 58
- пол: женский
<br>
Очевидно, что каждого можно записать в виде вектора из трех значений: (рост, вес, пол)<br>
В таком случае Человек №1 = (1.84, 70, 1), Человек №2 = (1.76, 58, 0)
Ну и для каждого человека можно составить цепочку из трех предикатов (рост == рост_человека, вес == вес_человека, пол == пол_человека)<br>
Такая цепочка будет истинна во всех предикатах только для конкретного человека.<br>
Такие цепочек можно составить для всех людей в выборке, таким образом ошибка будет нулевой

### Почему не рекомендуется строить небинарные деревья?

Потому что на бинарных деревьях программы работают значительно быстрее. Дело в том, что когда дерево бинарное, то работает правило исключенного третьего: если предикат дал ложь, то нужно двигаться в ветку со значением Ложь. А когда дерево небинарное, то приходится делать еще несколько проверок, чтобы определить в какую из веток двигаться. Если дерево высокое, то это замедлит работу программы

### Как устроен жадный алгоритм построения дерева? Какие у него параметры?

Строим дерево последовательно, от корня к листьям, а именно мы начинаем с пустого дерева, дальше выбираем каким-то образом корень, который разбивает нашу выборку на две, дальше разбиваем потомков этого корня и так далее. Ветвим дерево до тех пор, пока не решим, что этого достаточно.<br>
Жадный алгоритм заключается в принятии локально оптимальных решений. А что для нас оптимально? Если предикат делит выборку на равные части(в случае бинарных деревьев - пополам), то это хороший предикат.

### Зачем нужны критерии информативности?

Они нужны для оптимального разбиения при построении дерева решений