#### Типы задач

* Multiclass classification - предскзание значения категориального целевого признака.
* Multilabel classification - предсказание подмножества значений категориального целевого признака.
* Multioutput Regression - предсказание вектора чиселовых значений (многомерной целевой переменной).
* Multioutput Classification - одновременное предсказание значения нескольких категориальных целевых признаков.

Инструкция в sklearn http://scikit-learn.org/stable/modules/multiclass.html

#### Формат целевой переменной для Multilabel classification

In [3]:
from sklearn.preprocessing import MultiLabelBinarizer

y = [[2, 3, 4], [2], [0, 1, 3], [0, 1, 2, 3, 4], [0, 1, 2]]
MultiLabelBinarizer().fit_transform(y)

array([[0, 0, 1, 1, 1],
       [0, 0, 1, 0, 0],
       [1, 1, 0, 1, 0],
       [1, 1, 1, 1, 1],
       [1, 1, 1, 0, 0]])

#### Классификаторы, которые по определению могут решать задачу классификации с несколькими классами:

* Деревья решений [sklearn.tree.DecisionTreeClassifier](http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html#sklearn.tree.DecisionTreeClassifier)
* Наивный Байесовский классификатор c нормальными плотностями [sklearn.naive_bayes.GaussianNB](http://scikit-learn.org/stable/modules/generated/sklearn.naive_bayes.GaussianNB.html#sklearn.naive_bayes.GaussianNB)
* k ближайших соседей [sklearn.neighbors.KNeighborsClassifier](http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html#sklearn.neighbors.KNeighborsClassifier)
* Логистическая регрессия [sklearn.linear_model.LogisticRegression](http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression) (с параметром multi_class=”multinomial”)
* Линейный метод опорных векторов [sklearn.svm.LinearSVC](http://scikit-learn.org/stable/modules/generated/sklearn.svm.LinearSVC.html#sklearn.svm.LinearSVC) (с параметром multi_class=”crammer_singer”)
* Случайный лес [sklearn.ensemble.RandomForestClassifier](http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html#sklearn.ensemble.RandomForestClassifier)

#### One-vs-One (один против одного)

Для каждой пары меток классов строится отдельный бинарный классификатор. Когда делается предсказание, выбор классификатора производится путем голосования. Если два или более класса получили одинаковое число голосов, выбирается тот класс, который по всем классификаторам, в которые он входит, суммарная "достоверность" предсказания класса. 

Т.е. число обучаемых бинарных классификаторов в этом случае составляет $n_{classes} * (n_{classes} - 1) / 2$, где $n_{classes}$ - число классов.

В sklearn эта схема используется по умолчанию в SVM [sklearn.svm.SVC](http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC)

Также эта схема может быть реализована при помощи класса [sklearn.multiclass.OneVsOneClassifier](http://scikit-learn.org/stable/modules/generated/sklearn.multiclass.OneVsOneClassifier.html#sklearn.multiclass.OneVsOneClassifier). Например:

In [6]:
from sklearn import datasets
from sklearn.multiclass import OneVsOneClassifier
from sklearn.svm import LinearSVC
iris = datasets.load_iris()
X, y = iris.data, iris.target

OneVsOneClassifier(LinearSVC(random_state=0)).fit(X, y).predict(X)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 2, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

#### One-vs-The-Rest (One-vs-All, один против остальных)

Стратегия состоит в том, чтобы для каждого класса обучить один бинарный классификатор, где один класс соответствует выбранному классу, а второй - всем остальным классам. Эта стратегия удобна тем, что каждому классу соответствует один классификатор, по которому можно интерпретировать причины попадания объектов в соответствующий класс. Это самая часто используемая схема.

В sklearn эта схема может быть применена для следующий классифиакторов:
* Градиентный бустинг [sklearn.ensemble.GradientBoostingClassifier](http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.GradientBoostingClassifier.html#sklearn.ensemble.GradientBoostingClassifier)
* Линейный SVM [sklearn.svm.LinearSVC](http://scikit-learn.org/stable/modules/generated/sklearn.svm.LinearSVC.html#sklearn.svm.LinearSVC) (с параметром multi_class=”ovr”)
* Логистическая регрессия [sklearn.linear_model.LogisticRegression](http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression) (с параметром multi_class=”ovr”)
* Стохастический градиентный спуск [sklearn.linear_model.SGDClassifier](http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.SGDClassifier.html#sklearn.linear_model.SGDClassifier)

Для других классификаторов можно воспользоваться классом [sklearn.multiclass.OneVsRestClassifier](http://scikit-learn.org/stable/modules/generated/sklearn.multiclass.OneVsRestClassifier.html#sklearn.multiclass.OneVsRestClassifier).


In [7]:
from sklearn import datasets
from sklearn.multiclass import OneVsRestClassifier
from sklearn.svm import LinearSVC
iris = datasets.load_iris()
X, y = iris.data, iris.target

OneVsRestClassifier(LinearSVC(random_state=0)).fit(X, y).predict(X)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 2, 1, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

Класс [sklearn.multiclass.OneVsRestClassifier](http://scikit-learn.org/stable/modules/generated/sklearn.multiclass.OneVsRestClassifier.html#sklearn.multiclass.OneVsRestClassifier) также поддерживает multilabel классификацию и предсказание вероятности принадлежности классу (predict_proba).

#### Многомерная целевая переменная

Поддержка многомерной целевой переменной для задачи регрессии может быть добавлена при помощи класса [sklearn.multioutput.MultiOutputRegressor](http://scikit-learn.org/stable/modules/generated/sklearn.multioutput.MultiOutputRegressor.html).

А для задачи классификации - [sklearn.multioutput.MultiOutputClassifier](http://scikit-learn.org/stable/modules/generated/sklearn.multioutput.MultiOutputClassifier.html#sklearn.multioutput.MultiOutputClassifier).

### Оценка качества

Для таких мер качества, как точность (precision), полнота (recall), f1-мера и AUC для многоклассовой задачи есть несколько схем усреднения (с примерами для precision для двух классов).

* Micro-усреднение: $$avgprecision_{micro}=\frac{TP_1 + TP_2}{TP_1 + TP_2 + FP_1 + FP_2}$$
* Macro-усреднение: $$avgprecision_{macro}=\frac{1}{2}(Precision_1+Precision_2)$$
* Macro-усреднение с весами классов равными их поддержке: $$avgprecision_{weighted}=\frac{n_1Precision_1 + n_2Precision_2}{n_1 + n_2},$$ где $n_1$ и $n_2$ - число объектов в соответствующих классах. 
* Усреднение по объектам

В sklearn для выбора соответствующей опции необходимо при вызове функций [sklearn.metrics.precision_score](http://scikit-learn.org/stable/modules/generated/sklearn.metrics.precision_score.html#sklearn.metrics.precision_score), [sklearn.metrics.recall_score](http://scikit-learn.org/stable/modules/generated/sklearn.metrics.recall_score.html#sklearn.metrics.recall_score), [sklearn.metrics.f1_score](http://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html) и [sklearn.metrics.roc_auc_score](http://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html#sklearn.metrics.roc_auc_score) нужно вызывать с параметром:
* average='micro' для micro-усреднения
* average='macro' для macro-усреднения
* average='weighted' для взвешенного macro-усреднения
* average='samples' для усреднения по объектам